Metodos Quantitativos Aplicados A Negocios

MÉ
TO
D OS
APL QU
ICA ANTI
DO TAT
Métodos Quantitativos Aplicados a Negócios

SA IVO
NEG S
ÓC
IOS
MÉ
TO
D OS
APL QU
ICA ANTI
DO TAT
SA IVO
NEG S
ÓC
IOS
Fundação Biblioteca Nacional
ISBN 978-85-387-3091-0
Paulo Afonso Bracarense

Ubiratan Vieira Guimarães
Edição revisada
IESDE Brasil S.A.

Curitiba
2012
© 2008 – IESDE Brasil S.A. É proibida a reprodução, mesmo parcial, por qualquer processo, sem autorização por
escrito dos autores e do detentor dos direitos autorais.
CIP-BRASIL. CATALOGAÇÃO-NA-FONTE
SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ
________________________________________________________________________________
B788m
Bracarense, Paulo Afonso, 1957-

Métodos quantitativos aplicados a negócios / Paulo Afonso Bracarense, Ubiratan Vieira
Guimarães. - 1.ed., rev. - Curitiba, PR : IESDE Brasil, 2012.
320p. : 24 cm
Inclui bibliografia
ISBN 978-85-387-3091-0
1. Negócios 2. Investimentos 3. Investimentos - Análises. I. Guimarães, Ubiratan

Vieira. I. Título.
12-6746. CDD: 332.6

CDU: 336.76
17.09.12 02.10.12 039220

________________________________________________________________________________
Capa: IESDE Brasil S.A.

Imagem da capa: Shutterstock
Todos os direitos reservados.
IESDE Brasil S.A.

Al. Dr. Carlos de Carvalho, 1.482. CEP: 80730-200
Batel – Curitiba – PR
0800 708 88 88 – www.iesde.com.br
Doutor em Engenharia de Produção com con-
centração em Inteligência Artificial pela Univer-
sidade Federal de Santa Catarina (UFSC). Mestre
em Estatística e Experimentação Agrícola pela
Escola Superior de Agricultura Luiz de Queiroz
(ESALQ-USP). Bacharel em Estatística pela Uni-
versidade Federal do Paraná (UFPR). Professor
da UFPR. Diretor Superintendente da Fundação
da Universidade Federal do Paraná (Funpar).

Mestre em Administração com concentração em
Sistemas de Informação para Tomada de Deci-
são pela Universidade Federal do Rio Grande do
Sul (UFRGS). Especialista em Estatística Aplicada
e Qualidade e Produtividade pelo Instituto Bra-
sileiro de Qualidade Nuclear (IBQN). Bacharel em
Estatística pela Universidade Federal do Paraná
(UFPR). Foi diretor executivo do Ibmec Educacio-
nal em Curitiba e Coordenador Acadêmico dos
Programas Executivos – MBA e CBA do Ibmec MG.
Atuou na consultoria de grandes empresas e insti-
tuições, tais como: Electrolux S/A, Grupo Positivo,
Renault, Volvo, Spaipa, Banco Mundial, BID, V&M,
entre outras.
sumário
sumário Introdução – conceitos e aplicações
9 | Público-alvo
10 | Linguagem matemática
9
11 | Modelagem matemática dos fenômenos reais

12 | Os papéis da teoria de probabilidades e da análise de dados amostrais
13 | Organização dos capítulos do livro
19
Análise de dados
19 | Problema
23 | Conceitos fundamentais
26 | Variáveis categorizadas
29 | Variáveis quantitativas
36 | Medidas estatísticas
61
Probabilidades e distribuições de probabilidades
61 | Problema
67 | Axiomas e regras de probabilidades
70 | Probabilidades conjunta, marginal, condicional e independência
73 | Teorema de Bayes
75 | Distribuições de probabilidades discretas
80 | Variáveis aleatórias discretas
95
Amostragem
95 | Problema
99 | Tipos de amostragem
103 | Tabela de números aleatórios
105 | Principais técnicas de amostragem
111 | Tamanho da amostra
ário
129
Estimação
129 | Problema
133 | A distribuição normal
143 | Distribuição amostral das médias
146 | Distribuição amostral das proporções
148 | Estimação por ponto
151 | Intervalo de confiança
156 | Testes de hipóteses
156 | Hipótese nula versus hipótese alternativa
173
Análise de regressão e de correlação
173 | Problema
179 | Construindo a reta de regressão
188 | Verificação da bondade do modelo
201 | Predição e intervalos de predição
sumário
sumário Teoria da decisão
213 | Problema
213
216 | Critérios de escolha utilizando distribuição a priori

221 | Representação através de diagrama de decisão
223 | Estabelecimento de distribuições de probabilidades
229 | Tomada de decisões baseada na utilidade esperada
230 | Tomada de decisão com probabilidades a posteriori
249
Análise de séries temporais
249 | Problema
254 | Método dos mínimos quadrados ordinários
260 | Modelo de médias móveis
273 | Outros métodos de previsão
289
Anexos
319
Referências
ário
Apresentação
Este livro foi escrito com o objetivo de fornecer
Aplicados a Negócios
Métodos Quantitativos
elementos teóricos e técnicos para profissionais
que necessitam tomar decisões tendo como
material essencial conjuntos de dados que pre-
cisam ser analisados.
Um conjunto de dados, por si só, não passa de um
conjunto de dados. É necessário dominar uma
série de técnicas para que esses dados possam
gerar alguma informação. O patamar superior
da análise de dados é a aquisição do conheci-
mento. E ela só estará disponível se ao domínio
teórico do campo de atuação, à experiência pro-
fissional e de vida e à intuição do tomador de
decisões forem trabalhadas as técnicas quanti-
tativas necessárias para agregar a esses atribu-
tos informações provenientes de dados correta-
mente adquiridos.
O livro foi organizado de forma a cobrir toda a
base que compõe o campo de conhecimento da
Estatística. Começando por técnicas de estatísti-
ca descritiva e de análise exploratória de dados,
passando pela medição da incerteza através da
teoria de probabilidades e pela compreensão
das possibilidades indutivas da teoria clássica
da Estatística no trato com amostras.
Três técnicas úteis e bastante utilizadas na área
de negócios foram apresentadas em detalhes
balanceando-se a complexidade com a explora-
ção da intuição. O trato conceitual foi priorizado
em relação ao trabalho matemático extensivo.
Optamos por trabalhar com toda a conceituação
básica até o quinto capítulo, buscando ajudar o
leitor a desenvolver sua sensibilidade com re-
lação aos conceitos abordados. Tratamos cada
técnica com exemplos específicos e ilustrativos
na área de Negócios.
A ciência busca compreender os fenômenos
Aplicados a Negócios
Métodos Quantitativos
reais através de modelos, muitas vezes de
modelos matemáticos muito próprios para
estudos realizados em ambiente de incer-
teza. A teoria de probabilidades e a teoria
estatística clássica são ferramentas muito
úteis para ajudar o tomador de decisões em
sua opção por diferentes ações diante de
cenários postos.
Esperamos que o conteúdo do livro, acom-
panhado das aulas, possa ser de grande valia
para os leitores. Estamos certos, no entanto,
que navegar por essas águas fará com que
cada um se sinta mais confortável em viver
e trabalhar em um mundo cercado de incer-
tezas e que vale mais a pena compreender
o mundo dessa forma do que viver seguro,
acorrentado e míope na ilusão das coisas
certas e absolutas.
Introdução – conceitos
e aplicações
Por que escrever mais um livro de Estatística? De fato a literatura já forne-

ce incontáveis livros desse ramo da matemática. Alguns mais teóricos, outros
mais práticos. Há tentativas inclusive de se escrever livros de estatística sem
matemática. Há outros que se utilizam fartamente de um referencial comple-
xo na matemática para a discussão dos conceitos e das técnicas estatísticas.
A grande preocupação dos autores foi oferecer à comunidade estatística e
principalmente à não estatística elementos que as auxiliassem na tarefa da
tomada de decisões.
Público-alvo
Os livros de estatística são bem diferentes, pois tratam a mesma questão
com abordagens diversas. O que leva um autor a escolher o tipo de abordagem,
a profundidade das discussões e o quanto de ferramental matemático utilizará
depende fundamentalmente de seu público-alvo. Esta é a chave da questão.
Muito bem, dessa forma devemos então localizar nosso livro em razão do
nosso público-alvo. Este livro foi escrito para profissionais das mais diferen-
tes áreas do mundo dos negócios: economistas, contadores, engenheiros de
produção, administradores ou qualquer outro profissional chamado a tomar
decisões e que esteja no nível de gerência ou pretenda alcançá-lo. E mais, es-
peramos que o nosso público esteja realmente disposto a utilizar as técnicas
oferecidas no livro em seu dia a dia.
O livro foi composto para um curso esbelto, no sentido de que pretende

fornecer os elementos mínimos necessários para a utilização de seu conteúdo
em poucas horas. Por isso, a seleção dos assuntos oferecidos, que são somen-
te uma amostra do vastíssimo campo da Estatística, foi feita rigorosamente,
com as técnicas mais utilizadas na ação gerencial. Mas há de ficar muito claro
que não se trata de um manual de aplicações simplificado e essencialmente
prático. O grande destaque é o rigor conceitual na aplicação das técnicas que
foram apresentadas sempre através de aplicações em problemas corriquei-
ros da administração.
9
Introdução – conceitos e aplicações
Esse último destaque norteou toda a redação do livro e é fundamental

para que o tomador de decisões consiga empregar as técnicas expostas no
seu trabalho com a segurança necessária para que os resultados obtidos
possam efetivar mudanças de conduta ou aprofundamento de condutas já
empregadas. Para que a compreensão conceitual seja de fato um facilitador
da compreensão das técnicas, ousamos acreditar que seja possível aproxi-
mar do sentimento do leitor o conteúdo técnico da intuição. Por isso, além das
técnicas, “abusamos” das analogias e não economizamos nas explicações.
Evitamos o uso extensivo da matemática. Ou, de outra forma, utilizamos

a mínima matemática necessária para a apresentação dos conceitos e para
a solução dos problemas. Sempre que possível mantivemos o nível de exi-
gência matemática em patamares mais rudimentares possível. Lembrando,
no entanto, que o livro é dirigido para profissionais que buscam um nível
de especialização superior ao dos cursos de terceiro grau e, portanto, certas
resistências ao uso da matemática precisarão ser ultrapassadas. Mas preten-
demos tornar essa tarefa quase indolor.
Linguagem matemática
Toda ciência tem sua linguagem própria, assim, a Estatística tem a sua e a
Matemática também. Navegaremos por esses mares nem sempre sem turbu-
lências. Duas questões devem ser colocadas a respeito dessas linguagens.
A primeira é o reconhecimento de que o emaranhado de notações, no-

tadamente na Estatística, muitas vezes conduzem a confusões. Procuramos
amenizar um pouco essa dificuldade apresentando uma notação única para
todas as técnicas, expondo o significado de cada uma delas e mantendo-as
sempre mais próximas do que é o mais usual, de forma que estudos comple-
mentares nas bibliografias sugeridas não se tornem mais um entrave para o
aprofundamento do conhecimento dos assuntos tratados.
A segunda questão de linguagem, e isso agora diz mais respeito à mate-

mática, é que procuramos evitar a retirada de conclusões através de concei-
tos puramente matemáticos. O caminho de usar a própria matemática para
induzir ou deduzir conclusões é sim muito fértil para quem tem o domínio
dessa linguagem. O que você enxerga quando olha a expressão a2 = b2 +
c2? Se isso quer dizer mais ou menos a mesma coisa do que esta sequência
de símbolos Д Й Ж, você não deve se preocupar muito. Essas letras não são
do alfabeto grego nem são runas, são letras do alfabeto cirílico. Um mate-
10
mático ou uma pessoa habituada com a linguagem matemática enxergará

prontamente na expressão a2 = b2 + c2 um triângulo retângulo. Mas esse
nível de exigência não será cobrado neste livro.
Naturalmente, esse conhecimento pode facilitar em certos momentos

a leitura do texto que estamos apresentando, mas o que o diferenciará da
maioria dos textos estatísticos possivelmente já encontrados pelo leitor é
que neste livro não será necessário o domínio dessa linguagem. O que seria
bastante, não se pode deixar de dizer, mais confortável para quem escreve.
Mas esse desafio foi extremamente estimulante na redação do texto.
Modelagem matemática dos fenômenos reais

Os fenômenos que estudaremos estão no contexto do mundo da admi-
nistração e dos negócios. Não só eles, mas praticamente todos os fenômenos
naturais ou não naturais estão eivados de incerteza. Segundo o estatístico
alemão Schumacher, quando Deus fez o mundo e desejou colocar nele um
ser inteligente ele pensou em duas situações. A primeira, de fazer o mundo
completamente determinístico. Depois de muito refletir, concluiu que neste
mundo não haveria espaço para o homem porque tudo já estaria pré-deter-
minado e a inteligência não seria de nenhuma utilidade. Pensou então em um
mundo completamente aleatório. Verificou também que não havia porque
colocar o homem inteligente neste mundo em que nada pode ser determina-
do, em que tudo ocorre devido ao acaso. Concluiu então por um mundo que
tivesse os dois componentes: um determinístico e outro aleatório. O papel
da Estatística é o de ajudar a compreender este mundo, particularmente no
comportamento aleatório dos fenômenos.
A ciência tem procurado compreender os fenômenos da natureza através

de modelos que possam ajudar o pesquisador a construir uma certa raciona-
lidade para a sua compreensão e muitas vezes para a sua intervenção nos
fenômenos em foco. Boa parte deles é construída sob pilares matemáticos,
notadamente quando se utilizam de técnicas estatísticas. Todo modelo cons-
truído dessa forma implica fazer algumas restrições ao comportamento do
fenômeno. O que se faz então são simplificações para que se possa domar a
complexidade do mundo real. Isso tem que ficar absolutamente claro. Quanto
mais complexo for o fenômeno em estudo, mais complexo será o instrumen-
tal racional para compreendê-lo.
11
Esse limite tem que ser compreendido para não correr o risco de pensar
que o modelo possa substituir a realidade. E mais, a grande maioria dos com-
pêndios estatísticos alerta para o fato de que ela, a Ciência Estatística, é um
servidor leal quando usada com prudência e sem arrogância. Ela compõe o
espectro das peças de evidência na solução de problemas que devem auxi-
liar o tomador de decisões aliada ao conhecimento teórico da matéria em
estudo, da experiência extraestatística e mesmo da intuição de quem deseja
administrar bem ou praticar a boa ciência. Como peça de evidência, ela serve
mais para dar suporte do que fazer descobertas. Na fábula descrita pelo es-
critor escocês Andrew Lang, ele recomenda usar a Estatística como o bêbado
usa o poste, mais para apoio do que para iluminação.
A forma básica dos modelos construídos para os fenômenos que compor-

tam incerteza e são tratados através de modelagem matemática é: Y = f(x) + ε.
Nesse modelo, f(x) é a componente determinística e ε, a componente aleatória.
A tarefa do tomador de decisões é verificar, com base em alguma teoria que
envolva o assunto pesquisado, quais podem ser as alternativas para f(x) que
expliquem variações de Y, e fazer suposições sobre o comportamento de ε que
o auxiliem no entendimento das variações devidas ao acaso.
Os papéis da teoria de probabilidades

e da análise de dados amostrais
A componente aleatória, ε, é chamada de erro estatístico ou resíduo. Nela
estão todas as variáveis menos importantes que podem explicar as variações
de Y e também aquela parte genuinamente devida a oscilações ocorridas ao
mero acaso.
Quando se fala de incerteza, de acaso, fala-se tradicionalmente de proba-

bilidade. Mais recentemente, outras formas de se medir incerteza têm sido
propostas, como a lógica “fuzzy”, por exemplo, que ultrapassa os limites da
lógica clássica por admitir outros resultados, que não somente o dicotômi-
co sim ou não, base aristotélica de toda a lógica clássica a partir da qual foi
construída a teoria de probabilidades. Mas para efeito do estudo das técni-
cas apresentadas neste livro, construiremos toda a metodologia baseando-
-nos na probabilidade como medida de incerteza.
Dessa forma, a probabilidade pode ser definida como uma medida racional
de crença. Ela é definida como um número entre 0 e 1 e busca medir o grau
12
de incerteza associada a um fenômeno que no geral pode ser compreendi-

do como alguma espécie de jogo em que fazemos apostas. As decisões são
então tomadas com base em quanto estamos dispostos a pagar no caso de
perdermos a aposta realizada. Naturalmente, se as consequências de nossa
decisão errada forem muito graves, optaremos por apostar menos ou so-
mente apostar com um certo grau mínimo de incerteza.
As técnicas estatísticas utilizam-se fartamente de levantamento de dados

para a compreensão do fenômeno em estudo. Esses dados podem ser relati-
vos a toda uma população ou a uma parte dela chamada de amostra. Deseja-
mos, obviamente, que a amostra represente a população como um todo. Fa-
remos observações na amostra e a partir delas desejaremos fazer inferências
para a população. Veremos fartamente como isso pode ser feito, com rigor
científico, de forma a nos assegurarmos de que podemos compreender um
comportamento da população a partir do comportamento da amostra.
Organização dos capítulos do livro

Convém, no entanto, antes de buscarmos fazer ilações sobre a popula-
ção com base na amostra, explorar ao máximo as informações que os dados
podem fornecer. Esta tarefa pode ser facilitada com o emprego de técnicas
de estatística descritiva e de análise exploratória de dados. Esses assuntos
serão tratados no capítulo 2 deste livro. Estudaremos as melhores formas de
tabular dados, de apresentá-los em gráficos adequados e de construir medi-
das que sintetizem as informações necessárias para compreensão do fenô-
meno. Construir essas medidas tem por objetivo verificar o comportamen-
to dos dados, que valores podem representar o comportamento geral dos
dados e como eles estão distribuídos em torno de valores centrais e assim
por diante.
Quando falamos em amostragem, estamos de antemão reconhecendo

que um grau de incerteza está associado às medidas realizadas na amos-
tra como candidatas a facilitadoras da compreensão do comportamento da
população. Essa incerteza, como já especificado, será tratada tendo como
base a teoria de probabilidades, que será o tema do capítulo 3. Este capítulo
é, entre todos, o que necessitará de maior trabalho matemático. Entretanto,
essa talvez não seja a maior dificuldade do conteúdo do capítulo, mas sim a
compreensão dos limites dos cálculos que faremos.
13
No lance de uma moeda honesta, a probabilidade de sair cara em um

lance pode ser ½ ou um outro valor qualquer dependendo do que estamos
medindo. Se atirarmos a moeda cinco vezes, a probabilidade de sair cara exa-
tamente no quinto lance é sempre ½? Depende de como olhamos o proble-
ma. Se olharmos somente para o quinto lance como um lance isolado, não
há dúvidas do valor ½ para a probabilidade de sair cara. Mas se por outro
lado estivermos interessados em calcular qual a probabilidade de sair cara
no quinto lance, após quatro coroas, a probabilidade de sair cara não será
mais igual a ½, com certeza será um valor muito menor, conforme veremos
quando estudarmos o capítulo de probabilidades. Esse fato não é intuitiva-
mente tão fácil de ser percebido. E mostrar isso intuitivamente é mais difícil
do que o simples cálculo dessa probabilidade. Aqui, a linguagem matemá-
tica facilitaria enormemente a compreensão do que está ocorrendo. Vamos
tentar compor essas duas formas de encarar o problema.
Tendo então a noção da probabilidade, poderemos voltar ao trabalho

de destrinchar o comportamento dos dados através do estudo da forma de
produzi-los. Uma vez que nos deteremos fundamentalmente em retirar de
uma população uma amostra de seus indivíduos para quando estivermos
estudando-os, compreenderemos o comportamento da população. Tere-
mos que verificar quais são as melhores formas de se retirar esses dados e
de que tamanho deverá ser essa parte da população para que tenhamos
alguma segurança, medida através de probabilidades, em fazer afirmações
sobre a população.
Na matéria que será tratada no capítulo 4, estudaremos técnicas simples

mas eficientes de buscarmos amostras representativas da população. Não
temos dúvidas que após esse estudo o leitor aceitará o fato de que as pes-
quisas podem representar bem a opinião de eleitores ou de consumidores
quando falarmos de pesquisa de mercado. No momento pode ainda parecer
intuitivamente incorreto que uma amostra de tamanho 400 possa represen-
tar os eleitores de um município, mas que talvez uma amostra de 1 000 não
represente bem os eleitores de um bairro da cidade.
A nossa pretensão de falar da população com base em elementos da

amostra passa pela compreensão de que descreveremos tanto a população
como a amostra através de medidas estatísticas e da forma de comportamen-
to dos dados que serão descritos através de distribuições de probabilidades.
Rigorosamente, essas medidas estatísticas serão medidas da própria distri-
buição dos dados.
14
Essa parte da estatística é chamada de inferência estatística ou de esta-

tística indutiva. Ela será tratada no capítulo 5, sobre estimação, em que três
procedimentos serão estudados. O primeiro deles é a chamada estimação
por pontos, na qual calculamos um valor na amostra, por exemplo, a média
de uma variável, que deverá servir como uma estimativa da média da po-
pulação. O segundo procedimento, chamado de estimação por intervalos
ou construção de intervalos de confiança, consiste em criar em torno do
valor do estimador pontual um intervalo em que esse valor possa estar
contido; associaremos esse intervalo a um certo nível de confiança, rela-
cionado com uma medida de probabilidade. E o terceiro procedimento é
o de se fazer alguma afirmação sobre o valor de uma medida na popula-
ção através do estabelecimento de uma hipótese e então realizar um teste
sobre essa declaração associado a uma certa probabilidade de estar-se er-
rando na decisão. Esse procedimento é conhecido como teste de hipóteses
estatísticas.
O conteúdo até esse ponto do livro é o mínimo obrigatório a qualquer

livro que pretenda apresentar o principal da teoria que envolve a enormi-
dade de procedimentos estatísticos que podem servir de auxílio na tomada
de decisões. É a partir desse ponto que os autores de livros de estatística
devem decidir, de acordo com as necessidades do público que querem atin-
gir, quais são as técnicas úteis para cumprir o seu objetivo. Optamos por tra-
balhar com três técnicas que podem ser amplamente utilizadas no auxílio à
tomada de decisões gerenciais para profissionais interessados nos chama-
dos “negócios”.
Não pretendemos com essa opção sugerir que essas técnicas sejam su-
ficientes. Muito pelo contrário, gostaríamos de poder estimular os leitores a
buscarem um maior aperfeiçoamento com a pesquisa na literatura de outras
técnicas também úteis. Contamos que esse marco introdutório, disponível
até o capítulo 5, forneça instrumentos ao leitor para novas aventuras. No en-
tanto, a nossa prática no trabalho de aplicação de métodos estatísticos aplica-
dos a negócios nos leva a apresentar essas técnicas neste livro por compreen-
dermos que cobrem bem uma possível lacuna no gerenciamento.
Elas são apresentadas nos capítulos de 6 a 8. No capítulo 6 discutiremos

Análise de Regressão e Correlação, no capítulo 7 a Teoria de Decisão Estatís-
tica e no capítulo 8 a Análise de Séries Temporais e Modelos para Previsão de
Demanda.
15
Outras técnicas estatísticas são bastante úteis dependendo do ramo de

atuação de cada leitor. Técnicas como: Controle Estatístico de Qualidade;
Análise de Confiabilidade e de Sobrevivência; Análise de Credit Score; Plane-
jamento de Experimentos; Análise de Dados Categorizados; Análise de Dados
Longitudinais; Números Índices; Matemática Atuarial; Processos Estocásticos
e Teoria de Filas; Análise Multivariada; Análise de Variância; Testes Não Para-
métricos; Geoestatística; Estatística Espacial; Processos Estocásticos; e mais
uma infinidade de técnicas estatísticas estão disponíveis para aplicações.
Para cada um desses tópicos há uma enormidade de livros específicos,

da mesma forma que há uma enormidade de outros livros para cada um
dos capítulos que estamos apresentando. A abordagem de cada um desses
livros, o grau de complexidade dos conceitos e da matemática envolvidos é
que fazem de cada obra uma obra única.
16
Análise de dados
Problema
O departamento de Recursos Humanos da empresa ABC deseja reade-
quar os salários de seus funcionários a partir de uma nova política de cargos e
salários. A primeira providência do coordenador do departamento foi verifi-
car o perfil dos funcionários da empresa.
Solicitou para um estudo preliminar a relação dos funcionários em que

deveria constar algumas variáveis para esse primeiro estudo: ordem de con-
tratação, sexo, idade, salário e setor.
Um auxiliar administrativo apresentou o seguinte quadro como resultado:
Número de Salário
Nome Sexo Idade Setor
ordem (R$)
1 A. L. Ferraz M 49 1.714,00 Oper.
2 R. Abreu M 48 1.701,00 Oper.
3 R. S. Reis M 64 1.589,00 Oper.
4 N. Farias F 37 1.418,00 Oper.
5 J. L. Jansen F 42 1.000,00 Aux. Adm.
6 U. S. Machado M 40 3.732,00 Téc.
7 F. Nogueira F 21 1.330,00 Oper.
8 M. Pinheiro F 33 1.307,00 Oper.
9 M. A. da Silva M 39 1.282,00 Oper.
10 P. A. B. Costa F 42 1.260,00 Oper.
11 H. F. Minho F 39 975,00 Aux. Adm.
12 N. M. de Lima M 32 1.256,00 Oper.
13 C. F. Loureiro M 22 1.185,00 Oper.
19
Análise de dados
Número de Salário
Nome Sexo Idade Setor
ordem (R$)
14 M. E. M. Ferreira M 21 3.535,00 Téc.
15 J. A. Isaias F 37 2.956,00 Téc.
16 J. Martins F 24 1.179,00 Oper.
17 A. P. Ribeiro M 28 966,00 Aux. Adm.
18 L. C. Batista M 32 3.204,00 Adm.
19 A. F. dos Santos M 31 881,00 Aux. Adm.
20 C. A. Brandão F 38 3.080,00 Adm.
21 D. J. Feltrin M 23 2.872,00 Téc.
22 L. S. Prestes M 22 826,00 Aux. Adm.
23 J. L. Campos M 46 1.010,00 Oper.
24 S. I. Magalhães F 34 708,00 Aux. Adm.
25 P. R. Gonçalves M 47 2.960,00 Adm.
26 M. I. Machado M 42 2.797,00 Téc.
27 M. Paraná F 32 1.001,00 Oper.
28 U. V. Guimarães F 29 2.315,00 Adm.
29 E. M. Moreira M 41 5.572,00 Ger.
30 A. P. de Andrade M 30 2.372,00 Téc.
31 L. R. de Souza F 51 4.829,00 Ger.
32 R. T. Moraes F 23 1.826,00 Adm.
33 J. Pilloto M 20 540,00 Oper.
34 F. C. Lopes F 27 489,00 Oper.
35 C. A. Meier F 33 479,00 Oper.
36 H. O. Silveira F 22 1.904,00 Téc.
37 K. D. Almeida M 41 659,00 Aux. Adm.
38 M. J. D. Colares F 34 1.827,00 Téc.
39 R. F. L. Silvério M 24 472,00 Oper.
40 M. N. Messias F 20 640,00 Aux. Adm.
20
Análise de dados
Os dados apresentados foram organizados de forma a oferecer ao coorde-

nador do departamento de Recursos Humanos as informações que revelassem
a distribuição dos salários segundo as variáveis: (I) número de ordem, no sen-
tido que o mais antigo na casa recebeu o número 1 e o mais novo o número
40, não importando muito o tempo de contratação, uma vez que a empresa
foi constituída há pouco tempo, (II) o sexo, (III) a idade, (IV) o salário e (V)
o setor, dividindo os funcionários segundo as funções: operacional (Oper.),
auxiliar administrativo (Aux. Adm.), técnico (Téc.), administrativo (Adm.) e ge-
rência (Ger.), sendo uma gerência técnica e outra administrativa.
O coordenador analisou a tabela e verificou imediatamente que os funcio-

nários mais antigos eram na sua maioria do setor operacional, exceto dois auxi-
liares administrativos. Observou também que poucos funcionários ganhavam
menos do que R$1.000,00 e que havia uma pequena predominância de funcio-
nários do sexo masculino. Viu que o Reis de fato era o funcionário mais velho,
com 64 anos, e que a empresa não tinha nenhum funcionário com menos de 20
anos. Verificou também que ele próprio era o décimo oitavo contratado como
também que entre os administradores era o mais antigo e que o seu salário
era o maior comparado com seus pares, R$3.204,00. Concluiu, finalmente, que
da forma como os dados foram apresentados estava com dificuldade de tirar
maiores informações sobre a distribuição de cargos e salários.
Chamou um dos administradores e pediu que ele organizasse um pouco

melhor os dados e que em termos gerais não importava o nome das pessoas.
Foi prontamente atendido e recebeu o seguinte novo quadro:
Número de Salário
Sexo Idade Setor Média salarial
ordem (R$)
M 41 Ger. 29 5.572,00
F 51 Ger. 31 4.829,00 5.200,50
M 40 Téc. 6 3.732,00
M 21 Téc. 14 3.535,00
F 37 Téc. 15 2.956,00
M 23 Téc. 21 2.872,00
M 42 Téc. 26 2.797,00
M 30 Téc. 30 2.372,00
21
Análise de dados
Número de Salário
ordem (R$)
F 22 Téc. 36 1.904,00
F 34 Téc. 38 1.827,00 2.749,38
M 32 Adm. 18 3.204,00
F 38 Adm. 20 3.080,00
M 47 Adm. 25 2.960,00
F 29 Adm. 28 2.315,00
F 23 Adm. 32 1.826,00 2.677,00
M 49 Oper. 1 1.714,00
M 48 Oper. 2 1.701,00
M 64 Oper. 3 1.589,00
F 37 Oper. 4 1.418,00
F 21 Oper. 7 1.330,00
F 33 Oper. 8 1.307,00
M 39 Oper. 9 1.282,00
F 42 Oper. 10 1.260,00
M 32 Oper. 12 1.256,00
M 22 Oper. 13 1.185,00
F 24 Oper. 16 1.179,00
M 46 Oper. 23 1.010,00
F 32 Oper. 27 1.001,00
M 20 Oper. 33 540,00
F 27 Oper. 34 489,00
F 33 Oper. 35 479,00
M 24 Oper. 39 472,00 1.130,12
F 42 Aux. Adm. 5 1.000,00
F 39 Aux. Adm. 11 975,00
M 28 Aux. Adm. 17 966,00
22
Análise de dados
Número de Salário
ordem (R$)
M 31 Aux. Adm. 19 881,00
M 22 Aux. Adm. 22 826,00
F 34 Aux. Adm. 24 708,00
M 41 Aux. Adm. 37 659,00
F 20 Aux. Adm. 40 640,00 831,88
Com o novo quadro pôde verificar uma série de novas informações, tais
como média salarial e número de funcionários por categoria, e também que
havia uma certa coerência dentro de cada categoria com relação ao tempo
de serviço e salário, ou seja, funcionários mais antigos da mesma categoria
recebiam salários maiores. Mas sobre sexo e idade e as suas relações com as
demais informações ainda havia muita dificuldade em tirar conclusões.
Esse tipo de problema é colocado no dia a dia do tomador de decisões.

Os dados individuais, por mais bem organizados que estejam, trazem poucas
informações. É necessário que sejam sintetizados através de tabelas, gráficos
e medidas que possam resumir a informação de uma forma agregada.
Conceitos fundamentais
A Estatística Descritiva, que mais modernamente, com a incorporação de
novas técnicas, é chamada de Análise Exploratória de Dados, pode suprir a
necessidade de uma primeira organização dos dados de forma a transfor-
má-los verdadeiramente em informação.
As técnicas utilizadas na exploração dos dados tiveram uma evolução

muito grande com o advento da computação e particularmente de progra-
mas que facilitam essas tarefas. Para o senso comum, a Estatística resume-se
a esse trabalho. Veremos nos capítulos seguintes que esse é somente um
primeiro importante passo na organização das informações para aquisição
do conhecimento de modo a auxiliar a tomada de decisões.
Fundamentalmente, a análise de dados compreende três frentes: orga-

nização de tabelas, construção de gráficos e síntese dos dados através do
cálculo de medidas estatísticas.
23
Análise de dados
Variáveis quantitativas e categorizadas

Associadas a cada indivíduo, temos medidas e atributos que o definem.
As medidas são características de variáveis quantitativas e os atributos são
características de variáveis categorizadas ou qualitativas.
As variáveis quantitativas podem ser contínuas ou discretas. Elas são contí-

nuas quando entre dois quaisquer valores possam estar novos valores. As va-
riáveis quantitativas contínuas são frutos de medidas que podem ser expres-
sas pelos números reais. O salário dos empregados de uma empresa pode
ser considerado uma variável contínua. As variáveis são discretas quando são
fruto de contagem e podem ser expressas através de números inteiros, como
a idade dos funcionários. Uma outra característica importante das variáveis
quantitativas é que podemos fazer operações matemáticas com seus valores,
como soma, subtração, multiplicação e divisão.
As variáveis categorizadas ou qualitativas são expressas em escalas ordinais,

como é o caso da ordem em que os funcionários foram contratados, ou expres-
sas em categorias ou escalas nominais, como o sexo do funcionário ou o setor
em que ele trabalha. Não se pode, nesse caso, fazer operações matemáticas.
Valor discrepante ou outlier

Um valor discrepante ou outlier é um valor que destoa do conjunto prin-
cipal dos dados.
Tabelas e quadros estatísticos

Existe uma pequena diferença entre quadro estatístico e tabela estatística.
A tabela estatística é o resultado de alguma forma de resumo dos dados.
As linhas à esquerda e à direita de uma tabela estatística nunca devem ser
fechadas segundo as normas da ABNT. Elas são utilizadas para apresentação
de resultados estatísticos e também como ferramenta de desenvolvimento
de operações. Uma tabela bastante importante utilizada em estatística é a
distribuição de frequências.
Já o quadro serve para apresentação de dados, como os do exemplo, ou para

apresentação de resultados-resumo, como um quadro de médias, por exemplo.
O quadro pode ter seus limites à esquerda e à direita fechados por linhas.
24
Análise de dados
Apresentação gráfica
Os dados de uma tabela estatística podem ser apresentados através
de gráficos estatísticos, devendo o tipo de gráfico ser compatível com a
natureza dos dados. Os principais gráficos são: o gráfico de colunas ou de
barras, o gráfico de setores ou pizza, o gráfico de bastões, o gráfico de linhas
e o histograma.
Existem, na análise exploratória de dados, algumas apresentações grá-

ficas que auxiliam a compreensão do comportamento dos dados, como
o ramo e folhas, o esquema de cinco números e o diagrama de caixas ou
Box-plot.
O detalhamento da utilização de cada tipo de gráfico será ainda assunto

deste capítulo.
Medidas estatísticas
A utilização de medidas estatísticas serve para resumir os dados através de
valores representativos. Existem quatro tipos de medidas utilizadas: medidas
de posição, de dispersão, de assimetria e as de achatamento ou de curtose.
As medidas de posição objetivam verificar pontos que representem o con-

junto de dados. Elas podem ser medidas de tendência central, como a média,
por exemplo, que mostra em torno de que ponto os dados se concentram
ou as separatrizes, que informam o valor em que os dados se dividem em
quatro, dez ou cem partes.
As medidas de dispersão mostram a intensidade de concentração dos

dados em torno de medidas de tendência central. As principais medidas de
dispersão são a variância, o desvio-padrão e o coeficiente de variação.
As medidas de assimetria são utilizadas para verificar se os dados são simé-

tricos em relação a um valor central, e as de curtose para verificar se o gráfico
de dados concentra-se em valores próximos ao eixo X ou se distanciam dele.
Essas últimas medidas de achatamento são de menor interesse na análise de
dados, e não serão tratadas neste livro.
25
Análise de dados
Variáveis categorizadas
As variáveis categorizadas são medidas de atributos, como sexo, grau de
instrução, setor de trabalho, categoria profissional, preferência eleitoral etc.
Os indivíduos estão relacionados a alguma categoria dentro de cada variá-
vel, como sexo e categoria dos empregados da empresa ABC.
Distribuição por sexo

A tabela e os gráficos abaixo apresentam a distribuição por sexo dos indi-
víduos da empresa ABC.
Tabela 1 – Sexo dos empregados da empresa ABC

Sexo Número Perc.
Fem. 19 47,5%
Masc. 21 52,5%
Total 40 100,0%
Um gráfico estatístico objetiva dar a impressão visual da representação

dos dados. Os gráficos adequados para a representação dessa tabela são os
de colunas ou de barras e o gráfico de setores.
Gráfico de colunas
20
15
10
0
Fem. Masc.
Sexo
26
Análise de dados
Gráfico de barras
Masc.
Sexo
Fem.
0 5 10 15 20
Número
Gráfico de setores
Fem.
52% 48%
Masc.
O gráfico de setores é útil quando queremos observar o valor relativo da

participação de cada categoria no total.
Distribuição por categoria profissional
A tabela e os gráficos apresentam a distribuição dos indivíduos por cate-
goria profissional na empresa:
Tabela 2 – Categoria dos empregados da empresa ABC

Categoria Número Perc.
Gerência 2 5,0%
Adm. 5 12,5%
Téc. 8 20,0%
Aux. Adm. 8 20,0%
Oper. 17 42,5%
Total 40 100,0%
27
Análise de dados
Gráfico de colunas
Categoria dos empregados da Empresa ABC
18
16
14
12
Números
10
0
Gerência Adm. Téc. Aux. Adm. Oper.
Gráfico de setores
Categoria dos empregados da Empresa ABC

5%
13%
Gerência
42% 20% Adm.
Téc.
Aux. Adm.
Oper.
20%
28
Análise de dados
Variáveis quantitativas
As variáveis quantitativas, sejam elas discretas ou contínuas, são apre-
sentadas através da chamada distribuição de frequências. Nos dois casos po-
demos construir distribuições de frequências, que, como o próprio nome
indica, informam, através de tabelas, quais são os valores da variável e qual a
frequência de ocorrência de dados para cada um desses valores.
No caso de variável contínua, ou mesmo de variável discreta com um

grande número de possibilidades, é comum a construção de classes em que
mais de um valor é contemplado.
Distribuição de frequências
Vamos estudar inicialmente o caso de uma variável discreta através da
verificação da distribuição de frequências das idades dos funcionários. Pode
ser de interesse saber qual é a distribuição de idade dos funcionários com
menos de trinta anos. A tabela da distribuição de frequências corresponden-
te a esses dados será:
Distribuição de frequências dos

funcionários com menos de 30 anos
Idade Freq.
20 2
21 2
22 3
23 2
24 2
25 0
26 0
27 0
28 1
29 1
Total 13
29
Análise de dados
O gráfico correspondente à distribuição de frequências dessas idades é o

gráfico de bastões:
3,5
2,5
1,5
0,5
0
1 2 3 4 5 6 7 8 9 10
Diagrama ramo e folhas

Uma outra forma de representação gráfica utilizando as próprias idades é
o chamado diagrama ramo e folhas, em que o ramo representa os algarismos
relativos às dezenas e as folhas os algarismos relativos à unidade.
Ramo e folhas das idades dos 40 funcionários:
2 00112223344789
3 01222334477899
4 0112226789
5 1
6 4
Observe o aspecto da informação gráfica do diagrama ramo e folhas em

analogia ao histograma apresentado na sequência. A vantagem de sua uti-
lização é que ele mostra o desenho da distribuição sem perder a informação
detalhada.
Poderíamos, eventualmente, considerar a idade como uma variável ale-

atória contínua cuja representação está aproximada para os valores inteiros
das idades. A rigor, a variável idade é mesmo contínua, porque podería-
mos medir o tempo de vida em anos, dias e mesmo segundos. Nesse caso,
poderíamos construir classes entre certas idades de tal forma que elas repre-
sentassem um contínuo.
30
Análise de dados
Histograma
A representação gráfica da tabela da distribuição de frequências, quando
organizada em classes, recebe o nome de histograma. É um gráfico de colu-
nas adjacentes representando um contínuo.
Distribuição de frequência das idades

Idade Freq. Perc.
20 a 29 14 35,0%
30 a 39 14 35,0%
40 a 49 10 25,0%
50 a 59 1 2,5%
60 ou + 1 2,5%
Total 40 100,0%
Histograma
Distribuição de frequência das idades

16
14
12 20 a 29 anos
10 30 a 39 anos
40 a 49 anos
Freq.
8
50 a 59 anos
6
60 anos ou mais
4
0
1
Idade
31
Análise de dados
Distribuição dos salários

Salário (R$) Freq. Freq. rel.
Até 1.000,00 11 0,27
De 1.000,00 a 1.999,00 17 0,43
De 2.000,00 a 2.999,00 6 0,15
De 3.000,00 a 3.999,00 4 0,10
Acima de 4.000,00 2 0,05
Total 40 1,00
Histograma
Distribuição salarial
18
16
14
12 Até 100
Freq.
10 De 1.000 a 1.999
8 De 2.000 a 2.999
6 De 3.000 a 3.999
Acima de 4.000
4
0
1
Salários (R$)
Elementos de uma distribuição de frequências

A distribuição de frequências, como apresentada, é útil não só para apre-
sentação de dados, mas para análises um pouco mais aprofundadas. Vamos
reapresentar a distribuição de frequências dos salários de uma maneira mais
matematicamente formal.
32
Análise de dados
Salário (R$) Freq. Freq. rel.

X < 1.000,00 11 0,27
1.000,00 ≤ X < 2.000,00 17 0,43
2.000,00 ≤ X < 3.000,00 6 0,15
3.000,00 ≤ X < 4.000,00 4 0,10
X ≥ 4.000,00 2 0,05
Total 40 1,00
Observe agora que a distribuição é apresentada como um contínuo. Não

há descontinuidade entre R$1.999,00 e R$2.000,00, podemos, assim, ter a
representação de qualquer valor como R$1.999,85, por exemplo.
Definimos cinco classes. O número de classes de uma distribuição de fre-

quências não deve ser muito grande. Em torno de cinco a oito classes é um
número bastante razoável e elas devem ter igual amplitude. No nosso caso,
como temos poucos valores acima de R$4.000,00 agregaremos todos esses
valores na última classe. Cada uma delas tem um limite inferior de classe e um
limite superior. A diferença entre o limite superior e o limite inferior chama-
mos de amplitude do intervalo de classe.
Podemos ainda definir o ponto médio de cada classe. Esse valor será
útil para a determinação das medidas estatísticas quando não tivermos os
dados brutos. O ponto médio representará todos os valores da classe. Entre
R$1.000,00 e R$2.000,00 temos 17 valores. Todos eles serão considerados
como R$1.500,00. Perdemos um pouco em informação, mas ganhamos em
poder de síntese.
A frequência relativa será uma aproximação de probabilidades. A proba-

bilidade de sortearmos um dos 40 funcionários e que esse sorteado per-
ceba um salário entre R$3.000,00 e R$4.000,00 será de 4/40 ou de 0,10.
Formalmente, temos que P(3.000 ≤ X < 4.000) = 0,10. Podemos dizer, sem
perder muito o rigor, que essa probabilidade é de 10%. A probabilidade de
sortearmos um funcionário que ganhe menos do que R$2.000,00 pode ser
definida como P(X < 2.000) = 28/40 = 0,70. Também P(X ≥ 2.000) = 12/40 =
0,30. Observe que P(X < 2.000) + P(X ≥ 2.000) = 1, sempre que isso ocorre;
dizemos que essas probabilidades são complementares.
33
Análise de dados
Se considerarmos a amplitude do intervalo de classe como a unidade, a

probabilidade pode ser calculada como a área de cada retângulo, que terá
como base o valor 1 e como altura a frequência relativa. Esse cálculo de pro-
babilidades através de áreas será fundamental quando tratarmos da inferên-
cia estatística.
Outro elemento importante em uma distribuição de frequências é a cha-

mada frequência acumulada. Até R$2.000,00, temos 28 elementos, como
acabamos de ver. Até R$3.000,00, temos 34 elementos e assim por diante.
Abaixo apresentamos a tabela completa da distribuição de frequências:
Salário (R$) Freq. Freq. rel. Ponto médio Freq. acumulada

X < 1.000,00 11 0,27 500 11
1.000,00 ≤ X < 2.000,00 17 0,43 1.500 28
2.000,00 ≤ X < 3.000,00 6 0,15 2.500 34
3.000,00 ≤ X < 4.000,00 4 0,10 3.500 38
X ≥ 4.000,00 2 0,05 4.500 40
Total 40 1,00
Uma outra aproximação que podemos fazer é suavizar a apresentação

do histograma, construindo um novo gráfico que una os pontos médios das
classes. Esse novo gráfico é chamado de polígono de frequências e estará pos-
sivelmente mais próximo dos dados reais. Veja que com esse polígono de
frequências podemos determinar através do cálculo de áreas as probabili-
dades de qualquer intervalo, como, por exemplo, P(1.022,34 ≤ X < 3.087,53).
O polígono de frequências é apresentado na figura a seguir. Observe que

a área abaixo do polígono é também igual à unidade e toda área que é re-
tirada do histograma é recolocada. Podemos verificar isso através de seme-
lhança de triângulos:
34
Análise de dados
Distribuição salarial
18
16
14
12 Até 100
Freq.
10 De 1.000 a 1.999
8 De 2.000 a 2.999
6 De 3.000 a 3.999
Acima de 4.000
4
Salários (R$)
Série temporal
Muitas variáveis são medidas a intervalos de tempo. O gráfico de linhas
é a maneira mais adequada de apresentar a evolução de uma variável no
tempo. O eixo X sempre será correspondente a uma escala de tempo.
Quando não há um número demasiadamente grande de pontos, a liga-

ção entre os pontos por segmentos de retas ajuda a visualizar o padrão de
variação ao longo do tempo.
Suponha que no exemplo da empresa ABC os dados tivessem sido apre-

sentados pelo tempo de casa de cada funcionário. Uma possível organiza-
ção dos dados seria verificar quantos funcionários a empresa tinha em cada
um de seus quatro anos de existência, conforme a tabela abaixo:
Número de funcionários por ano

Anos Funcionários
Ano 1 15
Ano 2 20
Ano 3 32
Ano 4 40
35
Análise de dados
Gráfico de linhas
Número de empregados por ano
45
40
35
30
25
20
15
10
0
Ano 1 Ano 2 Ano 3 Ano 4
.
Medidas estatísticas
O objetivo de sintetização das informações tem sido realizado até aqui atra-
vés de apresentação tabular e gráfica dos dados originais ou brutos. A forma
de completar essa tarefa se dá através do cálculo das medidas estatísticas.
Trataremos de três tipos de medidas: (I) as de posição, (II) as de dispersão e

(III) as de assimetria.
Medidas de posição
Trabalharemos aqui com dois tipos de medidas, as de tendência central e
as separatrizes.
As medidas de tendência central resumem os dados no centro da distri-

buição. São medidas de tendência central a média aritmética, a mediana e a
moda.
36
Análise de dados
A média aritmética
A média aritmética ou simplesmente média é uma das medidas mais im-
portantes da Estatística. Além de resumir os dados, ela servirá enormemente
para os propósitos de estimação de características da amostra para a popu-
lação, pois possui as melhores propriedades de um estimador.
Ela é a soma dos dados dividida pelo número de observações, e sua ex-
pressão matemática é:
n
1 x1 + x 2 + ... + x n
x=
n
åxi=1
i =
n
n
Quando não houver conflito com outras expressões, apresentaremos
åi =1
x i simplesmente como Σ X.
A média aritmética representa o centro de gravidade dos dados. Alguns cuida-
dos, no entanto, devem ser tomados quando desejamos resumir os dados pelo
valor de sua média. Ela é muito sensível a valores extremos. Um único valor muito
grande ou muito pequeno pode mudar substancialmente o valor da média, po-
dendo ela perder sua representatividade. Esses valores extremos são chamados
de valores discrepantes ou outliers e quando eles aparecem em um conjunto de
dados devem receber um tratamento muito especial.
No nosso exemplo temos como valor da média das idades dos emprega-
dos da empresa ABC o valor 34 anos e a média dos salários é de R$1.791,20.
Se considerarmos a idade de 64 anos como um outlier a nova média será
de 33,2 anos, e se considerarmos os salários R$4.829,00 e R$5.572,00 como
valores muito acima dos demais, teremos uma média salarial de R$1.611,76,
quase R$200,00 de diferença com relação à primeira média.
No primeiro caso a diferença parece não ter sido de grande significância,

mas para a média salarial essa diferença pode ser considerada importante,
mesmo porque será um elemento importante na análise de cargos e salários.
Retirar o salário dos dois gerentes no cálculo da média pode ser útil para a
construção da nova política de cargos e salários.
Essa sensibilidade da média a valores extremos pode ser bem compreen-

dida com a seguinte ilustração. “Se coloco os pés próximos a uma área gelada
e a cabeça próxima a uma área quente, a temperatura média do corpo será
agradável”.
37
Análise de dados
A média ponderada
Se tivermos o seguinte conjunto de dados: (2, 2, 2, 2, 2, 3, 3, 4, 4, 4) e que-
remos calcular a sua média, a soma dos dados pode ser realizada da seguinte
forma: (2 . 5) + (3 . 2) + (4 . 3) = 10 + 6 +12 = 28. Isso porque a frequência do 2
é 5, a do 3 é 2 e a do 4 é 3. Observe que a soma das frequências é 10 (5 + 2 + 3),
igual ao número de observações. Podemos expressar esse fato por:
X=
å Xf
åf
Em que f é a frequência de cada X. Essa expressão representa a chamada
média aritmética ponderada ou simplesmente a média ponderada. Os ponde-
radores são as frequências.
Esse cálculo é muito útil quando os dados são apresentados em uma dis-
tribuição de frequências em que X será o ponto médio de cada classe e a
frequência será o ponderador. Se observarmos que a frequência relativa é
freq.
igual à frequência dividida pelo número de observações, isto é frel = ,
åf
podemos representar a média como:
X= å X .f rel
No cálculo da média ponderada das idades e dos salários, encontramos

os seguintes valores para as médias, com o auxílio das tabelas a seguir. Idade
média 34,75 anos e salário médio R$1.735,00.
Idade Ponto médio (X) frel ΣX frel

20 --- 30 24,5 0,35 8,575
30|--- 40 34,5 0,35 12,075
40|--- 50 44,5 0,25 11,125
50|--- 60 54,5 0,025 1,3625
60|---| 70 64,5 0,025 1,6125
34,75
38
Análise de dados
Salário (R$) Ponto Médio (X) frel ΣX frel

X < 1.000,00 500 0,28 140
1.000,00 ≤ X < 2.000,00 1.500 0,43 645
2.000,00 ≤ X < 3.000,00 2.500 0,15 375
3.000,00 ≤ X < 4.000,00 3.500 0,1 350
X ≥ 4.000,00 4.500 0,05 225
1.735
Os valores encontrados para os dados brutos foram idade média de 34

anos e salário médio de R$1.791,20. Os valores obtidos a partir da distribui-
ção de frequências sofreram pequenas alterações, principalmente o valor do
salário médio, em razão de considerarmos o valor dos salários dos gerentes
como R$4.500,00 na distribuição de frequências, quando de fato eles tinham
valores bem superiores ao considerado.
Essas distorções costumam desaparecer quando retiramos os outliers do

cálculo ou quando o número de observações for grande.
A mediana
A mediana é o valor que divide o rol em duas partes iguais. O rol é de-
finido como a sequência ordenada de dados. Por exemplo, para o seguinte
conjunto de dados (2, 3, 7, 7, 9) a mediana é o número 7 que divide o rol em
duas partes iguais.
Quando o número de dados é muito grande convém definir a posição da

mediana antes de sua determinação. A posição da mediana será definida por
PMed = (n + 1)/2. No exemplo acima, a posição da mediana será PMed = (5 + 1)/2 =
6/2 =3, portanto, a mediana será o terceiro elemento do rol. O valor da media-
na será o do elemento que ocupa a terceira posição, nesse caso Med = 7.
No caso de “n” ser par, o procedimento é semelhante, define-se a posição

da mediana e depois calcula-se a média aritmética dos dois números imedia-
tamente inferior e superior do valor da posição da mediana. No exemplo da
empresa ABC, em que n = 40, teremos PMed = (40 +1)/2 = 41/2 = 20,5. A mediana
será então a média entre os valores que ocupam a vigésima e a vigésima pri-
meira posições da variável em consideração.
39
Análise de dados
No nosso exemplo a idade mediana será Med = 33, porque X20 = X21 = 33. O
salário mediano será Med = R$1.318,50, porque X20 = 1.307,00 e X21 = 1.330,00.
A mediana para dados agrupados

Uma forma aproximada de determinação da mediana para dados agru-
pados consiste em localizar inicialmente a classe que contém a mediana, com
o auxílio da distribuição de frequências acumulada. Em seguida, tomar o
ponto médio da classe mediana como um valor aproximado do verdadeiro
valor da mediana.
Observe na tabela a seguir que o vigésimo e o vigésimo primeiro va-

lores estão na segunda classe que contém do décimo segundo ao vigési-
mo oitavo elementos. Podemos, por simplicidade, determinar o valor da
mediana como aproximadamente R$1.500,00, o valor do ponto médio da
classe mediana.
Essa aproximação para esse caso foi bastante razoável, como podemos
observar pela comparação do valor obtido nesse cálculo e o valor real deter-
minado pelos dados do rol. Quando a posição da mediana estiver muito pró-
xima de alguma dos limites da classe, uma interpolação deve ser realizada.
Salário (R$) Freq. Ponto médio Freq. acumulada

X < 1.000,00 11 500 11
1.000,00 ≤ X < 2.000,00 17 1.500 28
2.000,00 ≤ X < 3.000,00 6 2.500 34
3.000,00 ≤ X < 4.000,00 4 3.500 38
X ≥ 4.000,00 2 4.500 40
Total 40
A moda
A moda é o valor que ocorre com maior frequência. Para o conjunto de
dados (2, 3, 3, 3, 4), a moda será o valor 3. Quando um conjunto tem uma só
moda, ele é chamado de unimodal. Se tiver duas modas, de bimodal, e poli-
modal se tiver três modas, ou mais. Se o conjunto não tiver nenhuma moda
será chamado de amodal.
40
Análise de dados
Separatrizes
As separatrizes são medidas que dividem um rol em duas partes pro-
porcionais a certos valores. A medida que separa os dados em duas partes
iguais, ou em 50% e 50% é a mediana, como vimos a pouco.
Uma série de três medidas pode separar o rol em quatro partes iguais.
Elas são chamadas de quartis. O primeiro quartil (Q1) separa o rol em 25%
e 75%, o segundo quartil (Q2) é a própria mediana e o terceiro quartil (Q3)
divide o rol em 75% e 25%.
Da mesma forma que a mediana, para os quartis devemos inicialmente

calcular a sua posição para depois determinar o seu valor. A posição do quar-
i ( n +1)
til de ordem i, com i = 1..., 3 é dada por PQi = .
4
No nosso exemplo, se desejamos verificar o valor dos quartis para os sa-
lários, teremos PQ1 = (40 + 1)/4 = 10,25 e PQ13 = 3(40 +1 )/4 = 30,75, lembran-
do que o segundo quartil é a própria mediana. Então, verificando no rol de
dados, teremos Q1 = R$987,50 e Q3 = R$2.584,50, uma vez que o décimo salá-
rio é de R$975,00 e o décimo primeiro de R$1.000,00 e que o trigésimo é de
R$2.372,00 e o trigésimo primeiro de R$2.797,00. Esses são valores aproxima-
dos, mas podemos verificar que são aproximações bastante razoáveis.
Podemos tambem definir um conjunto de nove medidas que separam

o rol em 10 partes, chamadas de decis, e um conjunto de 99 medidas que
separam o rol em 100 partes, chamadas de percentis. Bastando, para isso,
determinar as posições de cada decil pela expressão i.(n + 1)/10 e de cada
percentil por i.(n + 1)/100. É fácil verificar que o vigésimo quinto percentil,
por exemplo, é o primeiro quartil.
Com base nas separatrizes, podemos construir duas representações que

fazem parte também da chamada análise exploratória de dados, que são: o
esquema de cinco números e o diagrama de caixa ou Box-plot.
41
Análise de dados
Esquema de cinco números

O esquema de cinco números consiste em apresentar os valores extre-
mos, os quartis e a mediana, conforme desenho a seguir:
Q1 Med Q3
Xmín Xmáx
Diagrama de caixa ou Box-plot

O Box-plot, como é corriqueiramente conhecido, constitui-se de uma caixa
ou um retângulo cujo valor à esquerda na caixa é o primeiro quartil, e o valor
à direita na caixa é o terceiro quartil. Um traço no centro da caixa representa
a mediana e os pontos extremos são mostrados fora da caixa.
+---+---+---+---+---+---+---+---+---+---+---+---+
0 1 2 3 4 5 6 7 8 9 10 11 12
No exemplo acima, o primeiro quartil (Q1) é 7, a mediana é 8,5 e o terceiro

quartil (Q3) é 9. Essas três medidas são utilizadas para a construção da caixa.
A diferença entre o terceiro e o primeiro quartis é chamada de amplitude in-

terquartílica (Aiq). Qualquer valor abaixo de Q1 – 1,5 Aiq e acima de Q3 + 1,5 Aiq é
considerado como outlier. No exemplo em foco Aiq = 9 – 7 = 2, então valores
menores do que 7 – 2(1,5) = 4 e maiores que 7 + 2(1,5) = 10 são outliers.
O valor 5 no diagrama é o menor valor dos dados que não é outlier, e o

valor 10 é o maior valor dos dados que também não é outlier. Marcamos
esses dois pontos e os unimos à caixa por um traço.
Podemos também definir outlier extremo como valores abaixo de Q1 – 3 Aiq e

acima de Q3 + 3 Aiq . O valor 3,5 é um outlier, por ser menor do que 4 e o valor
0,5 é um outlier extremo por ser menor do que 7 – 3(2) = 1. Não temos valores
de outlier à direita. Marcamos então o outlier com um asterisco (*) e o outlier
extremo com uma circunferência (°).
Esse diagrama indica que temos um conjunto de dados com uma certa
assimetria negativa.
42
Análise de dados
Medidas de dispersão
Essas medidas são úteis para que possamos verificar o quanto os dados
se dispersam, ou, mais comumente, o quanto eles se dispersam em torno da
média. São medidas de variabilidade. Podemos dizer que dados com grande
variabilidade representam um conjunto heterogêneo.
As três principais medidas de variabilidade são (I) a variância, (II) o desvio-

padrão e (III) o coeficiente de variação.
A variância
A variância mede a variabilidade média dos desvios dos valores em torno
da média ao quadrado. Pode ser representada por VAR(X) ou σ2. O quadrado é
utilizado porque a média tem sempre a propriedade que a soma dos desvios
em torno de si é igual a zero, ou seja, Σ(X – μ) = 0. Dessa forma, a variância
pode ser definida como:
∑(X – μ)2
σ2 =
N
Quando tratamos de amostra em vez de população, N é substituído por

(n – 1), cuja justificativa será apresentada no capítulo referente à Estimação,
quando tratarmos de distribuições amostrais. Nesse caso substituímos σ2
por S2. Então, para o caso de amostra, teremos:
∑(X – X)2
S =
2
n–1
Uma forma alternativa de determinar o valor da variância, derivada da

expressão acima, é dada por:
S2 =
∑X2 – nX2
n–1
ou
∑X2 – (∑nX)
2
S2 =
n–1
43
Análise de dados
A variância para dados agrupados pode ser determinada pela expressão:
S =
2 ∑(X – X)2 . f
n–1
Em que f é a frequência de cada classe, X o ponto médio de cada classe e

X a média aritmética dos dados. Ou de forma alternativa por:
2
∑X 2
.f–
(∑X . f )
n
S2 =
n–1
O desvio-padrão
Como a unidade da variância é sempre ao quadrado, a forma de represen-
tar uma medida de dispersão na mesma unidade dos dados é calculando a raiz
quadrada da variância. Essa medida é chamada de desvio-padrão e é, como
veremos, uma das medidas mais importantes da Estatística.
O coeficiente de variação
O desvio-padrão tem várias utilidades em Estatística. Uma delas é com-
parar a variabilidade entre dois conjuntos que têm a mesma média. Como o
desvio-padrão não tem um significado físico mais bem definido, o seu valor
será grande ou pequeno dependendo da dimensionalidade dos dados.
Um desvio-padrão pode ser irrisório ou imenso dependendo da dimen-

são dos dados que estamos tratando. Existe, no entanto, uma possibilidade
de comparação da variabilidade entre dois conjuntos padronizando o valor
do desvio-padrão pelo valor da média do conjunto de dados.
Ou seja, se igualarmos a média a 100 e fizermos uma regra de três simples,

obteremos:
X 100
S CV
Então,
CV = S . 100%
X
44
Análise de dados
CV é conhecido como o coeficiente de variação dos dados. Seu valor é

dado em percentagem, o que possibilita uma informação mais intuitiva da
variabilidade, e é a forma de comparar-se a heterogeneidade entre dois con-
juntos com médias diferentes.
Observe que os conjuntos A = {1, 2, 3}, B = {11, 12, 13} e C = {111, 112, 113} têm
o mesmo desvio-padrão. Nos três casos o seu valor é igual a 1. No entanto, os
valores dos coeficientes de variação são: CVA = 50%, CVB = 8,3% e CVC = 0,9%.
Verifique que esses resultados estão mesmo de acordo com a intuição.

Se cada medida dessas for uma medida de distância aferida por algum apa-
relho, é muito menor o erro entre as medidas do conjunto C do que do
conjunto A.
Medidas de assimetria
Existem várias medidas para verificar se os dados são simétricos em
torno de um valor central (a média) de um conjunto. A mais usual é a apre-
sentada abaixo:
3 (média – mediana)
A=
S
Se A < 0, dizemos que os dados têm assimetria negativa, caso contrário as-
simetria positiva. Se A = 0, o conjunto de dados é simétrico. O aspecto gráfico
de dados simétricos e assimétricos é dado abaixo:
Mo Md X X = Md = Mo X Md Mo
assimetria positiva simétrico assimetria negativa
45
Análise de dados
Atividades de aplicação
1. Uma pesquisa realizada com fornecedores de uma determinada indús-
tria tinha por objetivo atualizar alguns dados importantes para o contro-
le financeiro e administrativo. As seguintes variáveis foram observadas:
a) Nome da empresa
b) Idade da empresa
c) Faturamento anual
d) Número de funcionários
e) Localização (UF)
f) Área construída
Indique, para as variáveis acima, qual o tipo de cada uma delas.
2. Indique a letra adequada à coluna de acordo com as afirmativas abaixo:

a) Processo utilizado para selecionar elementos numa pesquisa
ou estudo.
b) Uma das formas de apresentação de dados.
c) Medida observada a partir de uma característica da amostra.
d) Característica observada em estudos ou pesquisas.
e) Medida observada a partir de uma característica da população.
(( Distribuição de frequências.
(( Estatística.
(( Amostragem.
(( Parâmetro.
(( Variável.
3. A diretoria de uma empresa, preocupada com a participação de seus
membros nas reuniões ordinárias, fez um levantamento do número
de faltas no último semestre. Os dados obtidos para os 48 membros
participantes estão apresentados a seguir:
200430010011
211111100030
002001120200
000000000010
46
Análise de dados
a) Especifique o tipo de variável estudada, classificando-a.
b) Construa um diagrama de bastões.
c) Construa uma tabela de frequências.
d) Qual a proporção de membros que faltou no máximo a duas

reuniões?
e) Determine as frequências relativas.
4. A distribuição de frequências abaixo apresenta os salários dos 120 fun-

cionários da empresa “A” .
Salários (em S. M.) fi (n.o de funcionários)

0 ---- 5 52
5 |--- 10 38
10|--- 15 17
15|--- 20 8
20|---| 50 5
Total 120
Determine:
a) A amplitude observada entre a 2.a e a 4.a classe.
b) O salário médio da 4.a classe de frequências.
c) A frequência acumulada da 3.a classe de frequências.
d) Quantos funcionários que recebe entre 5 e 15 salários mínimos?
e) Quantos funcionários que recebe pelo menos 10 salários mínimos?
5. Pesquisando-se o preço médio de fornos micro-ondas de diversas

marcas em 28 lojas e pontos de venda em Curitiba, observou-se a se-
guinte distribuição:
Preço (R$) 192,00 220,00 240,00 255,00 262,00 280,00
Lojas 1 7 11 6 2 1
47
Análise de dados
a) Calcule o preço médio do produto.
b) Calcule o preço mediano.
6. Os dados abaixo apresentam as vendas semanais em classes de salá-

rios mínimos de vendedores de gêneros alimentícios:
Vendas semanais n.º de vendedores

20 – 30 2
30 – 40 10
40 – 50 18
50 – 60 50
60 – 70 70
70 – 80 30
80 – 90 18
90 – 100 2
Total 200
a) Determine o número médio de vendas semanais.
b) Determine o desvio-padrão e o coeficiente de variação das vendas

semanais.
7. Trinta embalagens plásticas de mel foram pesadas com precisão de

decigramas. Os pesos, após convenientemente agrupados, fornece-
ram a seguinte distribuição de frequências (em gramas):
Xi 31,5 32,5 33,5 34,5 35,5 36,5
fi 1 5 11 8 3 2
Determine:
a) A média da distribuição dos pesos das embalagens.
b) A mediana dos pesos.
c) A moda dos pesos.
d) A variância dos dados.
48
Análise de dados
8. A tabela abaixo apresenta as taxas de juros do rotativo, cobradas pelos

cartões de crédito, em determinado mês.
Disponível em: Folha de São Paulo/Caderno

Dinheiro.
American Express 10,95 30 Horas Visa Gold 11,90 Federal Card Nac. 9,80
Credicard Nac. 9,20 30 Horas Visa Int. 11,90 Federal Card Int. 9,80
Credicard Intern. 9,04 Ourocard Intern. 8,50 Federal Card Gold 9,50
Diners 10,70 BFB Gold 9,90 HSBC Open Card 10,50
Bradesco Nac. 10,32 BFB Intern. 9,90 HSBC Gold 5,90
Bradesco Intern. 10,22 Sudameris Classic 10,20
Bradesco Gold 9,53 Sudameris Gold 10,20
a) Qual a taxa média cobrada no mercado?
b) Qual a taxa mediana?
c) Qual o valor do desvio-padrão das taxas? O comportamento das

taxas é homogêneo?
d) Existe algum cartão que possa ser considerado um outlier, supon-

do uma variação de 2 desvios da média?
9. A idade média dos candidatos a um determinado curso de aperfeiço-

amento sempre foi baixa, na ordem de 22 anos. Como esse curso foi
planejado para atender a todas as idades, decidiu-se fazer uma cam-
panha de divulgação. Para verificar se a campanha foi ou não eficiente,
fez-se um levantamento da idade dos candidatos à última promoção,
e os resultados estão apresentados na tabela abaixo:
Idade Número de candidatos

18 ‌– 20 18
20 ‌– 22 12
22 ‌– 26 10
26 ‌– 30 8
30 – 36 2
Baseando-se nesses resultados, você diria que a campanha produziu

algum efeito (isto é, a idade média aumentou)?
49
Análise de dados
10. Os salários dos empregados da empresa “A” são 20% maiores que os da
empresa “B”, para todos os empregados comparados individualmente.
Com base nessa informação, podemos afirmar que:
a) O desvio-padrão dos empregados é o mesmo para ambas as

empresas.
b) O desvio-padrão dos salários dos empregados da empresa “A” é
20% maior do que o dos salários da empresa “B’.
c) O desvio-padrão dos salários dos empregados da empresa “A” é
igual ao desvio-padrão dos salários dos empregados da empresa
“B”, multiplicado pelo quadrado de 1,20 .
d) Não há elementos para se comparar o desvio-padrão dos salários
dessas empresas.
Gabarito
1.
a) Qualitativa nominal.
b) Quantitativa contínua.
c) Quantitativa contínua.
d) Quantitativa discreta.
e) Qualitativa nominal.
f) Quantitativa contínua.
2. b, c, a, e, d.
3.
a) Variável quantitativa discreta, pois o número de faltas é dado por

um valor inteiro.
50
Análise de dados
b)
Diagrama de Bastões
30
25
20
Membros
15
10
0
0 1 2 3 4
Faltas
c)
Distribuição de frequências
Número de faltas Número de membros (f)

0 28
1 12
2 5
3 2
4 1
Total 48
d) No máximo duas reuniões é o mesmo que duas ou menos reuniões,

logo será a soma das frequências de 0 + 1 + 2 dividido pelo total de
casos.
28 + 12 + 5
Proporção de no máximo 2 reuniões = = 0,9375
ou 93,75% 48
51
Análise de dados
e)
Distribuição das frequências relativas
Número de faltas Frequência relativa (fr)

0 0,583
1 0,250
2 0,104
3 0,042
4 0,021
Total 1
4.
a) A amplitude entre a 2.ª e a 4.ª classes varia entre 5 (limite inferior

da 2.ª classe) e 20 (limite superior da 4.ª classe), logo a Amplitude =
20 – 5 = 15.
b) O salário médio da 4.ª classe é dado pela média entre 15 e 20, por-
tanto, o valor é 17,5.
c) A frequência acumulada da 3.ª classe será: 52 + 38 +1 7 = 107.
d) O número de funcionários que recebem entre 5 e 15 salários míni-

mos será dado pela soma dos que ganham entre 5 e 10 mais os que
recebem entre 10 e 15 s.m., portanto, 38 + 17 = 55 funcionários.
e) Pelo menos 10 s.m. é o mesmo que no mínimo 10 s.m. Sendo as-

sim, será a soma das frequências das classes a partir de 10 s.m. O
resultado será 17 + 8 + 5 = 30. Outra forma de cálculo seria subtrair
do total os que ganham menos de 10 s.m., ou seja, 120 – 90 = 30.
5.
a) Este é um caso de média ponderada, sendo assim a fórmula para a

resolução é:
X=
∑ Xf = (192).1 + (220).7 + (240).11 + (255).6 + (262).2 + (280).1
∑f 28
6.706
= X = 239,50 .
28
52
Análise de dados
b) Para obter o preço mediano do produto, é necessário verificar a

posição da mediana, ou seja:
(n + 1) (28 + 1)
PMed = , logo a PMed = = 14,5 , então a mediana será
2 2
a média entre os valores ordenados correspondentes às posi-
ções 14 e 15.
Verificando na distribuição, temos os valores; XPos14 = 240,00 e

XPos15 = 240,00. Portanto, como a média entre os valores será de
240,00, a mediana será 240,00.
6.
a) Calcula-se o ponto médio das classes e obtém-se o resultado da

média por meio da expressão:
X=
∑ Xf = 12 480 = 62, 4
∑ f 200
Vendas (X) Freq (f) X.f

25 2 50
35 10 350
45 18 810
55 50 2 750
65 70 4 550
75 30 2 250
85 18 1 530
95 2 190
TOTAL 200 12 480
Ou, de outra forma, utilizando a frequência relativa:
X = ∑ X.f rel ∴ X = 25.(0, 01) + 35.(0, 05) + ... + 95.(0, 01) = 62, 4
53
Análise de dados
Vendas (X) Freq (f) X.f F relativa X. Freq rel

25 2 50 0,01 0,25
35 10 350 0,05 1,75
45 18 810 0,09 4,05
55 50 2 750 0,25 13,75
65 70 4 550 0,35 22,75
75 30 2 250 0,15 11,25
85 18 1 530 0,09 7,65
95 2 190 0,01 0,95
TOTAL 200 12 480 1 62,4
b) Como o desvio-padrão é a raiz quadrada da variância, então pode-

mos calcular a variância através da expressão:
(∑x . f )2
∑x2 . f –
S2 = n
n–1 , em que precisamos obter os valores
de ∑x2 . f
X2 X2.f
625 1 250
1 225 12 250
2 025 36 450
3 025 151 250
4 225 295 750
5 625 168 750
7 225 130 050
9 025 18 050
∑ 813 800
Logo, temos que a variância será:
54
Análise de dados
(12 480) 2
813 800 –
S2 = 200
= 176,12 e dessa forma o resultado do
199
desvio-padrão será obtido por meio de:
S = 176,12 = 13,27
O coeficiente de variação será determinado por:

S 13,27
CV = .100% , onde CV = .100% = 21,3%
X 62, 4
7.
a) X = ∑xf = (31,5).1 + (32,5) 5 + (33,5).11 + (34,5).8 + (35,5).3 + (36,5).2 =

∑f 30
= 1018 X = 33,93.
30
(n + 1) (30 + 1)
b) PMed = = = 15,5, logo, a mediana será a média entre os
2 2
valores de X na posição 15 e na posição 16. O resultado da mediana
33,5 + 33,5
será dado por Md = = 33,5.
2
c) A moda é representada pelo valor de maior frequência, e nesse
caso a Mo = 33,5.
(∑X . f )2
∑X2 . f – n
d) A variância será expressa por: S2 = , em que
n–1
obtemos os valores dos somatórios na tabela:
Xi i Xi.fi X2 X2.fi
31,5 1 31,5 992,25 992,25
32,5 5 162,5 1 056,25 5 281,25
33,5 11 368,5 1 122,25 12 344,75
34,5 8 276,0 1 190,25 9 522,00
35,5 3 106,5 1 260,25 3 780,75
36,5 2 73,0 1 332,25 2 664,50
1 018,00 34 585,50
55
Análise de dados
Logo:
(1 018)2
34 585,5 –
S2 = 30 = 1,43
29
8.
1 n
a) x = ∑ xi , em que
n i=1
1 187,96
x= (10,95 + 9,20 + 9,04 + ... + 10,50 + 5,90) = = 9,89.
19 19
b) Após a ordenação dos valores, encontramos a posição da mediana
(n + 1) (19 + 1)
dada por PMed = = = 10, em que o valor de X na posição
2 2
10 corresponde a uma mediana igual a 9,9.
c) O desvio-padrão será obtido pela raiz quadrada da variância, logo,

a variância é:
(∑x)2
∑X2 –
S2 = n
n–1 e obtendo os somatórios através da
tabela a seguir:
Taxas (X) X2
10,95 119,9025
9,2 84,64
9,04 81,7216
10,7 114,49
10,32 106,5024
10,22 104,4484
9,53 90,8209
11,9 141,61
56
Análise de dados
Taxas (X) X2
11,9 141,61
8,5 72,25
9,9 98,01
9,9 98,01
10,2 104,04
10,2 104,04
9,8 96,04
9,8 96,04
9,5 90,25
10,5 110,25
5,9 34,81
187,96 1 889,486
(187,96)2
1 889,49 –
Temos: S2 = 19 = 1,67, logo o desvio-padrão
18
será dado pela 1, 67 = 1,29.
Para verificarmos se o grupo de dados é homogêneo, calcula-

mos o coeficiente de variação (CV). Normalmente, grupos com
dispersão relativa até 30% são considerados homogêneos. O
S
cálculo do coeficiente de variação é dado por: CV = .100% ∴
X
1,29
CV = .100% = 13, 07%
9, 89
Logo, as taxas cobradas no mercado são homogêneas.
d) Será considerado um cartão outlier aquele em que a taxa cobrada do

rotativo exceda os limites de X ± 2S, ou seja, 9,89 ± 2.(1,29). Sendo
assim, os limites estarão entre 7,31 e 12,47. Dessa forma, o único valor
fora desse intervalo corresponde a 5,90 do cartão HSBC Gold.
57
Análise de dados
9. Utiliza-se o ponto médio das classes como valor de X na classe (obser-

ve que as classes têm amplitudes diferentes) e através da expressão
∑xf
X= obtém-se a média das idades. Então,
∑f
19.(18) + 21.(12) + 24.(10) + 28.(8) + 33.(2)
X= = 22,48
50
Logo, a campanha não surtiu efeito, pois a idade média permanece

em torno de 22 anos.
10. B
58
Probabilidades e
distribuições de probabilidades
Problema
A Companhia de Seguros ABC deseja acionar uma empresa de ônibus
para indenizar a viúva de um cliente, que foi morto em um acidente com um
dos ônibus da empresa. Deseja, para isso, construir peças de evidências que
demonstrem imperícia do motorista e, portanto, culpabilidade da empresa.
Entre as peças de evidências, a Companhia ABC pretende demonstrar que a
chance de quatro testemunhas que depuseram a favor do motorista mora-
rem em casas do mesmo quarteirão dele e estarem no ônibus no evento do
acidente é muito pequena.
O acidente ocorreu no meio da tarde de um dia de semana. Um casal de

pessoas idosas desceu do ônibus em um determinado ponto do itinerário e
o homem foi atropelado pelo próprio ônibus. A viúva garantiu que o ônibus
arrancou antes que o seu esposo tivesse alcançado a calçada.
O motorista alegou que esse fato não ocorreu e apresentou em sua defesa
o depoimento de quatro testemunhas que teriam acompanhado o acidente
por estarem no ônibus naquele momento.
O advogado da companhia de seguros tinha ouvido falar que as empre-

sas de transporte coletivo só contratavam motoristas se os mesmos apresen-
tassem juntamente com os documentos pessoais uma relação de pessoas
que deporiam a seu favor em caso de acidentes, uma vez que as empresas
estavam tendo um prejuízo muito grande com causas judiciais.
Diante das circunstâncias, o advogado levantou o endereço das testemu-

nhas e do motorista e constatou que todos moravam em um mesmo quar-
teirão do bairro para o qual o ônibus se dirigia.
Como então determinar a probabilidade de as testemunhas de fato não

serem forjadas? O advogado procurou um consultor estatístico e solicitou
a ele que determinasse essa probabilidade, mesmo que fosse de forma
aproximada.
61
Depois de alguma reflexão, o estatístico pensou que poderia aproximar

essa situação através de um procedimento clássico em Estatística: o de tirar
bolas coloridas de uma caixa. O experimento aleatório consiste em misturar
em uma caixa bolas de duas cores. Por exemplo, colocar seis bolas azuis em
uma caixa com 20 bolas brancas, misturar bem e retirar dessa caixa, sem
olhar, uma amostra de quatro bolas. Calcular então a probabilidade que duas
dessas quatro bolas sejam azuis.
Essa probabilidade pode ser calculada da seguinte forma: de quantas ma-

neiras pode-se retirar quatro bolas sem reposição de um total de 26? Esse
número é igual a C26,4. Dentre todas essas combinações, de quantas manei-
ras pode-se retirar duas bolas brancas das 20 contidas na caixa? Da mesma
forma, C20,2. E as outras duas azuis de seis? C6,2. Então, a probabilidade de se
retirar duas bolas azuis na situação exposta é dada por:
C6,2C20,2
P (X = 2) =
C26,4
190 . 15
O cálculo dessa probabilidade resulta em P(X = 2) = = 0,1906,
14 950
então a probabilidade de se retirar duas bolas azuis em uma amostra sem
reposição de uma caixa com 26 bolas, sendo 20 brancas e 6 azuis, é de 0,19
ou 19%.
Se o bairro em que mora o motorista e suas testemunhas for a caixa que

contém um número N de moradores, o número de habitantes do quarteirão
for N1, correspondentes ao número de bolas azuis na caixa e a lotação do
ônibus for a amostra n, qual é a probabilidade que dessa amostra n, n1 sejam
de moradores do quarteirão?
A expressão geral para o cálculo dessa probabilidade é:
CN1,n C(N – N1), (n – n )

P (X = n1) = 1 1
CN,n
Resta, então, verificar os valores de N, N1, n e n1. Depois de um trabalho

intenso de levantamento de dados, o estatístico chegou às seguintes informa-
ções. O bairro é composto por 112 quarteirões, os quarteirões têm em média
20 casas e cada casa uma média de quatro moradores, portanto, o número de
habitantes do bairro era de N = 8 960. No quarteirão em que moravam o mo-
torista e suas testemunhas havia 20 casas com também quatro moradores em
cada casa, um total de N1 = 80 moradores no quarteirão. A lotação do ônibus
62
é de 30 lugares sentados, ou seja, n = 30, e queremos calcular a probabilidade

de que cinco moradores do mesmo quarteirão (o motorista e as quatro teste-
munhas) estivessem juntos no ônibus, isto é, P(X = n1) = P(X = 5).
O cálculo dessa probabilidade é então:
C80,5C8880,35
P (X = 5) = = 0,00002
C8960,40
Ou seja, uma chance em 50 000. De fato, muito pequena.
Na avaliação feita, todos os benefícios de aproximação foram feitos a favor

do motorista. O ônibus tinha lotação completa, quando se pode verificar que
nesse horário da tarde ela nunca está completa. O número de pessoas que o
ônibus servia era maior do que somente o seu bairro terminal. O número de
pessoas por residência em bairros da periferia é normalmente maior do que
a média de um casal com dois filhos. Todos esses fatores foram colocados a
favor do motorista. E ademais, há que se supor que todos os quatro passa-
geiros estivessem prestando atenção ao acidente.
Esse é um problema típico de modelagem com probabilidades. Há muitos

outros tipos de exemplo. Mas, talvez mais importante do que a aplicação direta
de probabilidades na solução de problemas seja a sua grande utilidade como
instrumento para se trabalhar com inferência estatística e com as técnicas de
tomada de decisões aplicadas nos últimos três capítulos do livro.
A teoria de probabilidades foi desenvolvida para solucionar jogos de azar
durante o século XVII, mas somente no início do século XX, graças ao mate-
mático russo A. Komolgorov, que formulou toda a teoria a partir de axiomas
básicos, a teoria de probabilidades ganhou status próprio como um ramo
autônomo da matemática. Existem várias propostas de como medir a incer-
teza. Entre elas, a mais desenvolvida é a da teoria de probabilidades. Mesmo
assim, há diferentes escolas que propõem diferentes meios de acessar valores
de probabilidades. Há, portanto, alguma controvérsia sobre os fundamentos
da teoria. Discutiremos três enfoques conceituais diferentes, mas que, inde-
pendentemente das diferentes definições, usam as mesmas regras matemá-
ticas como medidas objetivas de incerteza. Os três enfoques são o da proba-
bilidade clássica, o da frequência relativa de ocorrências e o da probabilidade
63
subjetiva, que apesar do nome trata a probabilidade como uma medida ob-
jetiva, embora a forma de sua determinação seja subjetiva. Aqui a palavra
objetiva significa uma medida exata que se submete ao corpo axiomático da
teoria de Komolgorov.
Esses três enfoques foram apresentados porque serão usados indistinta-

mente na solução dos problemas colocados no livro. As diferenças possíveis
decorrentes da diferença de enfoques serão discutidas toda vez que pude-
rem causar algum tipo de dúvida ou desconforto.
Iniciaremos com a apresentação de uma série de definições básicas que

ajudarão na construção de toda a teoria de probabilidades necessária para a
solução dos problemas apresentados nos demais capítulos.
Experimento aleatório
Experimento aleatório é um experimento no qual sabe-se que resultados
podem ocorrer, mas não se sabe de antemão que resultado ocorrerá. Pode-se,
no entanto, determinar a probabilidade associada a cada resultado. Por exem-
plo, no lance de um dado honesto sabe-se que os resultados possíveis são 1, 2,
3, 4, 5 ou 6 na face superior, cada resultado com probabilidade 1/6.
Como determinar a probabilidade de sair um número par? Pela teoria

clássica de probabilidades verificamos que há seis resultados possíveis. A pro-
babilidade de sair um número par é determinada pela razão entre o número
de casos favoráveis e o número de casos possíveis, ou seja, 3 casos favoráveis
sobre 6 casos possíveis, então essa probabilidade é de 3/6 ou ½.
Do ponto de vista frequentista, essa probabilidade pode ser calculada

com o lance de um dado 1 000 vezes, verificando-se quantas vezes saiu um
número par e dividindo-se esse valor por 1 000.
Também se pode determinar intuitivamente, através de probabilidade

subjetiva, que o resultado “sair um número par no lance de um dado” é equi-
valente a “sair cara no lance de uma moeda”, e que, portanto, pela experiência
do tomador de decisões, ele pode concluir que essa probabilidade seja ½.
Evento
Eventos são cada um dos resultados possíveis de um experimento alea-
tório. O evento de sair cara no lance de uma moeda é chamado de evento
64
simples, porque estamos interessados em um resultado singular do experi-

mento aleatório. O evento “sair um número par no lance de um dado” é um
evento composto, porque o resultado está associado a três possíveis eventos
simples.
Aos eventos no geral associa-se um conjunto, e a notação utilizada será a

da teoria dos conjuntos, que estabelece denotar o conjunto com letras maiús-
culas, e quando necessário, os elementos do conjunto com letras minúscu-
las. Então o evento sair um número par pode ser representado pelo conjunto
A = {2, 4, 6}.
Também podemos pensar no caso da moeda, que o resultado do lance

pode ser 1 no caso de sucesso em sair uma cara e 0 no caso de fracasso em
sair uma coroa. Assim, se X é o resultado do lance de uma moeda, X = 1 re-
presenta cara e X= 0 representa coroa.
Espaço amostral
Podemos definir de forma simples o espaço amostral como o conjunto
de todos os resultados possíveis de um experimento aleatório ou de outra
forma o conjunto de todos os eventos simples de um experimento aleatório.
No geral, o espaço amostral é denominado por S (space, em inglês) ou pela
letra grega Ω (ômega).
No lance de um dado o espaço amostral será o conjunto S = {1, 2, 3, 4, 5,

6}. No lance de uma moeda o espaço amostral será S = {C, K}, em que C re-
presenta cara e K, coroa. Em muitos livros traduzidos encontramos o espaço
amostral para esse experimento aleatório como S = {H,T}. Aqui H representa
cara e T coroa, porque o jogo cara ou coroa em inglês é chamado de head or
tail, cabeça ou rabo.
Observe que o espaço amostral é o conjunto de todos os elementos, ou o

conjunto universo da teoria de conjuntos.
Evento certo e eventos mutuamente exclusivos

Um evento é dito certo quando não há possibilidade de ocorrência de
outro evento. Também evento impossível é aquele que não tem qualquer
possibilidade de ocorrência. No lance de um dado, um número de 1 a 6 apa-
recer na face superior do dado é um evento certo. No lance de dois dados, a
65
soma das faces superiores ser 15 é um evento impossível. Essa definição será
útil um pouco mais tarde quando tratarmos de probabilidades.
Eventos mutuamente exclusivos são aqueles cujos elementos não podem

pertencer a dois conjuntos ao mesmo tempo. Segue um exemplo de eventos
não mutuamente exclusivos com relação ao número que aparece na face
superior do lançamento de um dado. Seja o evento A sair um número par e
o evento B um número menor do que 4. Então A e B não são mutuamente
exclusivos porque o evento 2 ocorre em ambos os conjuntos. A = {2, 4, 6} e
B = {1, 2, 3}.
Eventos complementares
Dois eventos são complementares quando os seus elementos pertencem
a eventos mutuamente exclusivos e a reunião de todos os elementos é igual
ao espaço amostral. Por exemplo, no lance de um dado o evento A = {1, 2} é
complementar ao evento B = {3, 4, 5, 6}. Também o evento sair um número
par na face superior no lançamento de um dado é complementar ao evento
sair um número ímpar.
É usual denotar o evento complementar de A como Ā ou Ac.
Probabilidade
Probabilidade é uma medida de incerteza que pode assumir valores entre
0 e 1. Não existe probabilidade negativa nem maior do que 1. A probabilidade
de sair cara no lance de uma moeda é igual a ½ ou 0,5 e não 50%.
Embora probabilidade e percentagem sejam medidas de naturezas di-

ferentes, não é incomum que se utilize percentagem com o sentido de pro-
babilidade. Quando isso não nos atrapalhar, utilizaremos indistintamente as
duas acepções.
A probabilidade de um evento A pode ser definida como o número de

elementos favoráveis sobre o número de elementos possíveis. O cardinal do
conjunto A, denotado por #A, representa o número de elementos favoráveis
do evento A e o #S o número de elementos do espaço amostral, então:
P (A) = #A
#S
66
No evento número par no lance de um dado, A = {2, 4, 6}, cujo número de

elementos é dado por #A = 3 e S = {1, 2, 3, 4, 5, 6} com #S = 6, então:
P (A) = #A = 3 = 1 = 0,5
#S 6 2
Probabilidade, chance e verossimilhança

Esses três termos são muitas vezes utilizados indistintamente, mas de fato
representam fenômenos de natureza distinta.
Dizemos que a chance de se ganhar na mega-sena é de aproximadamente

1 para 50 milhões se jogarmos um bilhete com 6 números. A ideia de chance
está relacionada a jogo. É curioso notar que a teoria de probabilidade em
seus primórdios era denominada nos meios acadêmicos como a teoria das
chances, somente mais tarde se distinguiu chance de probabilidade, tendo
sido reservada para essa última a primazia de denominar a teoria que se en-
carrega de medir incerteza.
Por outro lado, a palavra verossimilhança também não tem o mesmo sig-
nificado de probabilidade. Por exemplo, é bem sabido que se em uma noite
de inverno o frio for intenso e o céu estiver estrelado, a possibilidade de
ocorrência de geada na manhã do dia seguinte é bastante grande. Devemos
dizer que é verossímil e não que é provável a ocorrência de geada. Essa pala-
vra é muito pouco utilizada coloquialmente em português e por isso falamos
em provável ou verossímil indistintamente.
Na língua inglesa, a palavra correspondente à verossimilhança é likelihood,

bastante comum no uso coloquial. Então, em muitos livros de estatística tra-
duzidos do inglês para o português, o tradutor prefere utilizar probabilida-
de nos locais em que aparece likelihood e isso pode trazer alguma confusão
conceitual. Forçaremos um pouco o uso correto e distinto de probabilidade
e verossimilhança quando for necessário no texto.
Axiomas e regras de probabilidades

As regras para o uso de probabilidades, muitas vezes apresentadas como
teoremas, partem de um conjunto de princípios que leva em conta a natu-
reza da medida de probabilidade. Esse conjunto de princípios é conhecido
67
como os Axiomas de Kolmogorov, o matemático russo que as estabeleceu no

início do século XX.
Axiomas de Kolmogorov
Seja A um evento e S o espaço amostral de um experimento aleatório, então:
(I) 0 ≤ P(A) ≤ 1;
(II) P(S) = 1;
(III) P(A B) = P(A) + P(B) – P(A B), se A e B não são eventos mutuamente
exclusivos.
O primeiro axioma define probabilidade como uma medida não nega-

tiva e não maior que a unidade. Então, é um número definido no intervalo
de 0 a 1 e não uma percentagem. Ela pode ser apresentada em forma de
fração 4/10, com o numerador sempre menor ou igual ao denominador,
ou em forma decimal 0,4. Não teremos preferência neste livro na forma
de apresentação final das probabilidades calculadas, mas sempre convém
fazer as operações através de frações para não haver acúmulo de erros
devido a arredondamentos.
O segundo axioma informa que a probabilidade do espaço amostral é

sempre 1. O espaço amostral pode ser tomado como o evento composto
certo. Por outro lado, o evento complementar a S é o conjunto vazio, denota-
do por { } ou ø.
O terceiro axioma diz que a probabilidade da união de dois eventos é a

soma das probabilidades dos eventos menos a probabilidade de sua inter-
seção. Se A e B são mutuamente exclusivos, então A B = ø. Vejamos um
exemplo de eventos não mutuamente exclusivos.
No lance de um dado, seja A o evento sair um número par e B o evento

sair um número menor que 4. Então, A = {2, 4, 6} e B = {1, 2, 3}, a união dos
dois eventos A B = {1, 2, 3, 4, 6} e a interseção e A B = {2}. Então P (A B)
= 1/2 + 1/2 – 1/6 = 5/6, uma vez que P (A) = 1/2; P (B) = 1/2 e P(A B) = 1/6.
Verifique que de fato o cardinal de A B é #(A B) = 5.
É necessário fazer a subtração porque caso contrário o elemento 2 en-

traria duas vezes, enquanto na união ele só entra uma vez, apesar de ser
elemento dos conjuntos A e B.
68
Regras de probabilidades
Algumas regras úteis derivadas dos axiomas de probabilidades serão
apresentadas sem prova. Em um contexto formal elas poderiam ser apre-
sentadas como teoremas com as devidas provas, mas esse não é o interesse
neste texto.
Eventos complementares
Se A é um evento e Ā é o seu evento complementar, então P(A) + P(Ā) =
1, ou ainda P(Ā) = 1 – P(A). Um caso particular ocorre para o caso do conjun-
to vazio, sabidamente complementar ao conjunto universo. P(ø) = 1 – P(S),
então como P(S) = 1, P(ø) = 0.
Regra da adição
Se A e B são eventos mutuamente excludentes, isto é, A B = ø , então
P(A B) = P(A) + P(B), haja vista que P(ø) = 0.
Sejam os eventos A ={2, 4} e B { 3, 5} e S = {1, 2, 3, 4, 5, 6}, então P(A B) =

P(A) + P(B) = 2/6 +2/6 = 4/6, verifique que A B = {2, 3, 4, 5}, cujo cardinal e
#( A B) = 4.
A B
2 5
4 3
6
1
S
Regra da diferença
Se A e B são dois conjuntos quaisquer, podemos definir a diferença entre
os dois conjuntos, A\B como o conjunto de todos os elementos que perten-
cem a A e que não pertencem a B. Então P(A\B) = P(A) – P(A B).
Sejam os eventos A ={2, 4} e B { 2, 3, 5} e S = {1, 2, 3, 4, 5, 6}, então P(A\B) = P(A)

– P(A B) = 2/6 – 1/6 = 1/6. Verifique que A\B = {4} cujo cardinal é #(A\B) = 1.
69
A B
5
4 2
3
6
1
S
Probabilidades conjunta,
marginal, condicional e independência
Probabilidade conjunta
Em muitas aplicações, estaremos interessados na probabilidade de ocor-
rência conjunta de dois ou mais eventos. Considere uma pesquisa de merca-
do em que dois produtos, A e B, foram apresentados para uma amostra de 1
000 pessoas, 500 homens e 500 mulheres. Os resultados das preferências são
apresentados na tabela a seguir:
Sexo Prefere produto A Prefere produto B Total

Masculino (M) 200 300 500
Feminino (F) 100 400 500
Total 300 700 1 000
O evento, quando um homem prefere o produto A, é representado por

(M e A), quando uma mulher prefere o produto A por (F e A) e assim por
diante, e a probabilidade associada ao primeiro é representada por P(M
e A). Essa probabilidade pode ser determinada por P(M e A) = 200/1 000
= 0,2. Então, podemos construir uma tabela de probabilidades conjuntas,
conforme a seguir:

Masculino (H) 0,2 0,3 0,5
Feminino (M) 0,1 0,4 0,5
Total 0,3 0,7 1,0
70
Probabilidade marginal
Adicionalmente às probabilidades conjuntas, é possível determinar as
probabilidades marginais com respeito ao sexo e à preferência por produto.
Essas probabilidades são chamadas de probabilidades marginais ou de pro-
babilidades incondicionais. Por exemplo, a probabilidade marginal de que
um indivíduo escolhido aleatoriamente seja homem é de P(H) = 0,5 e a pro-
babilidade que o produto A seja escolhido é de P(A) = 0,3.
Observe que a probabilidade de que o produto A seja escolhido é a soma

de duas probabilidades mutuamente excludentes: P[(A e H) ou (A e M)] = P(A
e H) + P(A e M) = 0,2 + 0,1 = 0,3.
Probabilidade condicional
Se estivermos interessados na probabilidade de ocorrência de um evento
uma vez que outro evento já ocorreu, podemos definir probabilidades condi-
cionais. Por exemplo, podemos estar interessados em saber qual é a proba-
bilidade de ocorrência do evento “preferência pelo produto A” dado que o
elemento sorteado foi um homem.
Definimos então, P(A/H) como a probabilidade condicional e diz-se “pro-

babilidade de A dado H”:
P(A H) 0,2 2
P(A/H) = = = = 0,4
P(H) 0,5 5
Na verdade restringimos nosso espaço amostral para o evento “ocorreu

homem”. Podemos também restringir o espaço amostral por preferência por
produto. Assim, podemos determinar a probabilidade de escolhermos um
homem dado que o produto preferido foi o produto A, desejamos então cal-
cular P(H/A):
P(H A) 0,2 2
P(H/A) = = = = 0,67
P(A) 0,3 3
Independência
Verificamos que a probabilidade de preferência do produto A dado que
um homem foi sorteado é igual a 0,4. Então:
P(A M) 0,2 2
P(A/M) = = = = 0,4
P(M) 0,5 5
71
Podemos concluir desse fato que a preferência pelo produto A depende

do sexo da pessoa sorteada. Definimos assim que dois eventos são esta-
tisticamente independentes quando a ocorrência de um evento não afeta a
ocorrência do outro. E, portanto, se C e D são independentes, denotamos
(C D), então:
P(C/D) = P(C)
Alguns exemplos interessantes de eventos independentes: Evento C,
sexo do segundo filho e evento D, sexo do primeiro filho. Evento C, resulta-
do do lance da segunda moeda, e evento D, resultado do lance da primeira
moeda. Evento C, sorteio do número correspondente à dezena da loteria
federal, e evento D, resultado do número correspondente à unidade da lo-
teria federal.
Então, a probabilidade de o segundo filho ser homem, dado que o pri-
meiro foi mulher, é igual à probabilidade de o segundo filho ser homem.
Regra da multiplicação
Quando dois eventos são independentes, temos que P(C/D) = P(C). Ob-
serve também que
Se P(C/D) = P(C D)/P(D) então P(C D) = P(C/D) P(D).
Utilizando a afirmação de independência, temos então que: se C e D são
eventos independentes:
P(C D), = P(C) P(D)

Verifique que para o exemplo da pesquisa de mercado a seguir os even-
tos preferência por um produto e sexo são independentes.

Masculino (H) 0,08 0,32 0,4
Feminino (M) 0,12 0,48 0,6
Total 0,20 0,80 1,0
P(A/H) = 0,08/0,4 = 8/40 = 1/5 = 0,2 e P(A/M) = 0,12/0,6 = 12/60 = 0,2.

Nesse caso, pode-se verificar que o produto das probabilidades marginais
correspondentes é igual à probabilidade conjunta. P(A) P(H) = 0,2 . 0,4 = 0,08
= P(A e H). Normalmente, denota-se P(A e H) como a probabilidade da inter-
seção, então: P(A H) = P(A) P(H).
72
Teorema de Bayes
O objetivo do teorema de Bayes é o de fazer revisão de probabilidades
com base em novas peças de evidência. Vamos apresentar o teorema a partir
de um exemplo prático. A Companhia de Petróleo ABC deseja verificar qual
é a probabilidade de haver petróleo no litoral paranaense, uma vez que foi
descoberto petróleo no litoral sul de São Paulo. Especialistas da Companhia
acreditam que devido às circunstâncias geográficas há uma probabilidade
de 70% de haver petróleo no Paraná.
Contratam, então, uma empresa de prospecção que realiza pesquisas

amostrais. Da experiência passada dessa empresa com a realização desse
teste, ela garante uma sensibilidade do teste de 90%, isto é, em 90% das
vezes em que ele fornece resultado positivo, de fato há petróleo. E garantem
também uma especificidade de 80%, ou seja, em 80% das vezes em que o
teste fornece resultado negativo, de fato não há petróleo. Com esses dados,
a empresa fará uma revisão da probabilidade de haver petróleo, estimada
em 70% pelos técnicos da Companhia ABC.
Para equacionar o problema, vamos chamar o evento “ter petróleo” de A,

de tal forma que A1 representará resultado positivo e A2 resultado negativo.
Assim, P(A1) = 0,7 e P(A2) = 0,3. Chamaremos essas probabilidades de proba-
bilidades a priori.
O evento B representará o teste. Então, se o teste fornece resultado positi-

vo quando há petróleo em 90% das vezes, podemos representar essa proba-
bilidade como P(B/A1) = 0,9. E se o teste fornece resultado negativo quando
não há petróleo em 80% das vezes, significa que em 20% fornece resultado
negativo quando há petróleo, portanto P(B/A2) = 0,20.
Da definição de probabilidade condicional, temos que se P(B/A1) =

P(A1 B) /P(A1) então P(A1 B) = P(A1) P(B/A1).
Assim, P(A1 B) = (0,7).(0,9) = 0,63. E P(A2 B) = (0,3).(0,2) = 0,06.
Observamos que se B = {(A1 B) U (A2 B)}, então P(B) = P(A1 B) + P(A2 B).
Então P(B) = 0,63 + 0,06.
Por outro lado, P(A1/B) = P(A1 B)/ P(B). Logo, P(A1/B) = 0,63/0,69 = 0,90.
Então, a probabilidade de haver petróleo no Paraná, dado o resultado posi-
tivo do teste, é de 91%. Assim, a probabilidade de 70% de haver petróleo foi
atualizada para 91%.
73
Esses cálculos podem ser mais bem acompanhados através da tabela a

seguir:
Probabi-
Probabilida- Probabilidade Probabilida-
lidade a
de a priori condicional de conjunta
posteriori
Eventos Ai P(Ai) P(x2/θi) P(θi) P(x2/θi) P(θi/x2)

A1 = tem petróleo 0,7 0,9 0,63 0,91
A2 = não tem petróleo 0,3 0,2 0,06 0,09
Total 1,0 0,69 1,0
Verifique que a distribuição conjunta dos eventos pode ser dada por:
Teste positivo Teste negativo

Total
(B) (Bc)
A1 = tem petróleo 0,63 0,07 0,7
A2 = não tem petróleo 0,06 0,24 0,3
Total 0,69 0,31 1,0
Confira na tabela a probabilidade P(B/A1) = P(B A1)/P(A1) = 0,63/0,7 = 0,9,

que é o valor da sensibilidade de 90%. Todas as outras probabilidades podem
ser verificadas.
Como reforço, vamos deduzir uma expressão geral para o teorema de

Bayes, a partir da análise do seguinte diagrama de Venn e da definição de
probabilidade condicional.
A2
A1
Pela definição de probabilidade condicional, temos que P(A 1/B) =

P(A1 B)/P(B).
74
Mas também P(B/A1) = P(A1 B)/P(A1). Então P(A1 B) = P(A1) P(B/A1).

Substituindo essa última expressão na primeira, teremos:
P(A1) P(B/A1)
P(A1/B) =
P(B)
Como P(B) = P(A1 B) + P(A2 B) = P(A1)P(B/A1)+ P(A2)P(B/A2)
Temos a expressão geral do Teorema de Bayes para o caso de dois eventos:
P(A1) P(B/A1)
P(A1/B) =
P(A1) P(B/A1) + P(A2) P(B/A2)
Deduzimos, através de um exemplo de desenvolvimento matemático, a

expressão do Teorema de Bayes quando temos dois eventos, cada um com
dois elementos. Uma expressão mais geral pode ser demonstrada, e sua ex-
pressão é:
P(Ai) P(B/Ai)
P(A1/B) =
∑P(Ai) P(B/Ai)
Distribuições de probabilidades discretas
Variável aleatória
Podemos definir aproximadamente variável aleatória como uma variá-
vel que assume valores numéricos em função do acaso. Rigorosamente, do
ponto de vista matemático, uma variável aleatória é uma função consistindo
de elementos de um espaço amostral associados a números reais relaciona-
dos a esses elementos.
São exemplos de variáveis aleatórias: sair cara no lance de uma moeda,

a soma dos números das faces superiores no lançamento de dois dados, o
faturamento de uma empresa no final de um período, o rendimento de apli-
cação de uma dada carteira e assim por diante.
Qualquer variável que seja função de resultados que dependem de incer-

teza podem ser consideradas como variável aleatória.
75
Distribuição de probabilidades de uma variável aleatória

Podemos associar os valores possíveis de uma variável aleatória a um
certo nível de probabilidade. A tabela formada por esse conjunto é chamada
de distribuição de probabilidades.
Por exemplo, distribuição de probabilidades dos preços de um determi-

nado produto em estoque:
Preço dos produtos em R$ (X) Probabilidade de X P(X = x)

67 0,10
68 0,25
69 0,50
70 0,10
71 0,05
A probabilidade de sortearmos um produto no estoque e que ele custe

R$69,00 é igual a ½. Ou P(X = 69) = ½.
A representação gráfica de uma variável aleatória pode ser feita através

de um gráfico de bastões.
0,6
0,5
Probabilidades
0,4
0,3
0,2
0,1
0
1 2 3 4 5
Preço dos produtos
76
Propriedades de uma variável aleatória discreta

Uma variável aleatória discreta X tem duas propriedades:
(I) P(X = x) ≥ 0
(II) P(X = x) =1
Também podemos representar P(X = x) por f(x), então, as condições acima

poderiam também ser expressas da seguinte forma:
(I) f(x) ≥ 0
(II) f(x) =1
Função de distribuição acumulada

Dada uma variável aleatória X, o valor da função de distribuição acumu-
lada no ponto x, denotada por F(x), é a probabilidade que X tome valores
menores ou iguais a x. Ou seja:
F(x) = P(X ≤ x)
No exemplo dos preços dos produtos em estoque teremos:
Preço dos produtos Probabilidade de X Probabilidade acumulada

(X) em R$ P(X = x) P(X ≤ x) = F(x)
67 0,10 0,10
68 0,25 0,35
69 0,50 0,85
70 0,10 0,95
71 0,05 1,00
Esperança e variância
de uma variável aleatória discreta
A esperança de uma variável aleatória discreta, também chamada de ex-
pectância ou valor esperado, é a média aritmética ponderada pelas probabili-
dades. Ela pode ser definida como:
μ = E(X) = Σ X P(X = x)
77
A variância de uma variável aleatória discreta é definida como:
σ2 = VAR(X) = Σ (X – μ)2 = E(X2) – [E(X)]2
onde, E(X2) = Σ X2 P(X = x).
Para o exemplo dos produtos em estoque, temos:
X P(X = x) X P(X = x) X2 X2 P(X = x)

67 0,10 6,70 4 489 448,90
68 0,25 17,00 4 624 1 156,00
69 0,50 34,50 4 761 2 380,50
70 0,10 7,00 4 900 490,00
71 0,05 3,55 5 041 252,05
Total 68,75 4 727,45
E(X) = 68,75
VAR(X) = E(X2) – [E(X)]2 = 4 727,45 – (68,75)2 = 0,8875.
O valor médio dos produtos em estoque é de R$68,75 e sua variância é

igual a 0,8875.
Distribuição conjunta de probabilidades

Quando temos mais de uma variável aleatória em consideração, pode-
mos construir uma distribuição conjunta de probabilidades.
Seja, por exemplo, um distribuidor que vende seu produto para duas em-
presas. A tabela abaixo representa as vendas por dia para cada empresa e as
probabilidades associadas:
Empresa X
Empresa Y 0 1 2 P(Y = y)
0 0,1 0,1 0,0 0,2
1 0,1 0,5 0,0 0,6
2 0,0 0,0 0,2 0,2
P(X = x) 0,2 0,6 0,2 1,0
78
Definimos como distribuição de probabilidades marginais as distribuições

de Y e de X conforme tabelas a seguir:
Empresa Y P(Y = y)
0 0,2
1 0,6
2 0,2
P(Y = y) 1,0
Empresa X P(X = x)
0 0,2
1 0,6
2 0,2
P(X = x) 1,0
Podemos definir também distribuições de probabilidades condicionais. Por

exemplo, a distribuição de probabilidades de X dado que Y = 1.
Empresa X P(X = x / Y = 1)
0 0,1/0,6 = 0,17
1 0,5/0,6 = 0,83
2 0,0
P(Y = y) 1,0
Dessas distribuições de probabilidades podemos calcular suas médias e

suas variâncias:
E(X) = XP(X = x) = (0).(0,2) + (1).(0,6) + (2).(0,2) = 0,6 + 0,4 = 1,0
Var(X) = E(X2)–[E(X)]2 = (0)2.(0,2) + (1)2.(0,6) + (2)2.(0,2) – (0,4)2 = 0,6 + 0,8 –

0,16 = 1,24
A esperança condicional de X dado Y = 1 será:
E(X/Y=1) = (0).(0,17) + (1).(0,83) + (2).(0) = 0,83.
79
Covariância e correlação
Definimos covariância e correlação conforme segue:
Cov(X,Y) = E(X,Y) – E(X)E(Y) e
Corr(X, Y) = = Cov(X, Y)
x, y
Var(X) Var(Y)
E(X,Y) XYP(X = x, Y = y) = 0.0.0,1+ 0.1.0,1+ 0.2.0 + 1.0.0,1 + 1.1.0,5 + 1.2.0 +

2.0.0 + 2.1.0 + 2.2.0,2 = 0,5 + 0,8 = 1,3
E(X) = E(Y) = 1
Cov (X,Y) = 1,3 – 1.1 = 1,3 – 1 = 0,3
X,Y
= 0,3 / 1,24 = 0,24
A correlação mede a força do relacionamento das variáveis X e Y. Pode variar

em módulo de 0 a 1. Correlação igual a 0 significa que não há correlação entre as
variáveis e correlação 1 resulta de relação muito forte entre X e Y.
Variáveis aleatórias discretas

Existem algumas distribuições de probabilidades discretas que têm ca-
racterísticas especiais e são muito utilizadas na prática. Faremos uma expo-
sição de cada uma delas, evitando o desenvolvimento teórico que exigiria
certa manipulação matemática que temos evitado.
Estudaremos as distribuições uniforme, binomial, multinomial, hipergeo-

métrica e de Poisson.
Distribuição uniforme
Algumas vezes, todos os valores possíveis da variável aleatória assumem
o mesmo valor. Tal distribuição de probabilidades é chamada de distribuição
uniforme e tem a seguinte distribuição de probabilidades:
P(X = x) = f(x) = 1 , x = 0 ,..., N

N
E(X) = ΣX =μ
N
Var(X) = 1 [( X2) – (X)2 ] = σ2
N
80
Exemplo:
Lance de um dado não viciado. A função de probabilidade (ou função

densidade de probabilidades) é dada por:
1
P (X = x) =
6
E(X) = 3,5
VAR(X) = 2,92
Exemplo:
Um voo internacional está escalado para chegar ao Aeroporto Interna-
cional de Cumbica em São Paulo às 7h30min da manhã. Um estudo mostrou
que a hora real de chegada é uniformemente distribuída por minutos no
intervalo de 7h05min às 8h40min. Seja X = 1 a chegada às 7h05min, X = 2 a
chegada às 7h06min, e assim por diante.
a) Escreva a expressão matemática de f(x) = P(X = x).
b) Qual é a probabilidade que o voo se atrase?
c) Qual é a probabilidade que o voo chegue depois das 8h00?
d) Qual é a probabilidade que o voo chegue às 8h00 ou depois das

8h00?
e) Qual é probabilidade que o voo chegue antes das 7h30min?
Entre 7h05min e 8h40min existem 96 minutos, então:
a) f(x) =1/96, x = 1, ... , 96.
b) A probabilidade que o voo se atrase é a probabilidade que ele chegue

depois das 7h30min. Entre 7h31min e 8h40min existem 70 minutos,
então:
70
P(7h31min ≤ X ≤ 8h40min) = P(7h30min < X ≤ 8h40min) = = 0,729.
96
c) A probabilidade que o voo chegue depois das 8h00 e P(X > 8h00) = 40
= 0,417. 96
d) A probabilidade que o voo chegue às 8h00 ou depois das oito é

P(X ≥ 8h00) = 41 = 0,427.
96
e) Entre 07h05min e 07h30min existem 25 minutos.
25
Então, P(7h05min ≤ X ≤ 7h30min) = = 0,260.
96
81
Distribuição binomial
Na distribuição binomial há dois resultados possíveis em cada experimen-
to aleatório. E uma das distribuições mais importantes por suas aplicações na
área de negócios e de ciências sociais. O processo que se utiliza da distribui-
ção binomial é conhecido como prova de Bernoulli ou processo de Bernoulli,
matemático suíço que pela primeira vez deu sentido ao uso da distribuição
binomial.
As seguintes suposições devem ser feitas para o uso da distribuição

binomial:
(I) em cada processo há dois possíveis resultados mutuamente exclusivos,

que são chamados de “sucesso” ou “fracasso”;
(II) a probabilidade de “sucesso”, denotada por “p”, permanece constante du-

rante todo o processo. A probabilidade de “fracasso”, denotada por “q” é
igual a 1 – p;
(III) cada passo do processo é independente do anterior.
A distribuição binomial tem a seguinte distribuição de probabilidades:
P(X = x) = f(x) = Cn,x px qn-x
E(X) = n.p
VAR(X) = n.p.q
O exemplo clássico do uso da distribuição binomial é o cálculo da proba-

bilidade de, por exemplo, saírem duas caras no lance de seis moedas hones-
1
tas. Nesta situação, n = 6, p = e X = 2. Então:
2
P(X = 2) = C6,2 (1/2) .(1/2) = (15).(0,015625) = 0,2344
2 4
A tabela abaixo fornece toda a distribuição de probabilidades para o ex-

perimento acima:
X 0 1 2 3 4 5 6
P(X = x) 0,0156 0,0938 0,2344 0,3125 0,2344 0,0938 0,0156
E(X) = n.p = 6 . 1 = 3
2
V(X) = n.p.q = 6 . 1 . 1 = 1,5
2 2
82
A distribuição binomial é aplicável em situações de amostragem de uma

população finita com reposição ou de uma amostragem com uma população
infinita com ou sem reposição.
Exemplo:
A gerência de Atendimento ao Cliente dos Correios é responsável por

expedir a correspondência atrasada. Da experiência passada, essa Gerência
sabe que em 90% das vezes as correspondências são entregues sem atraso.
Da tabela A da distribuição binomial acumulada retire os valores para deter-
minar as probabilidades de que em 10 remessas:
a) três ou menos correspondências serão entregues com atraso.
b) entre três e cinco correspondências serão entregues com atraso.
c) três ou mais correspondências serão entregues em dia.
d) exatamente duas correspondências serão entregues com atraso.
e) sete ou mais correspondências serão entregues com atraso.
Seja X a variável aleatória correspondente à entrega com atraso da corres-

pondência. Então, podemos estabelecer p = 0,10. Repare que a ação corres-
pondente a “sucesso” é a entrega com atraso. Então, q = 0,90 e n = 10.
a) Da tabela A, temos que F(3) = 0,9872

3
Essa probabilidade corresponde a calcular P(X≤3) = F(3) = ∑ C10,X (0,10)X
x=0
(0,90)10 – X
Ou ainda P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X =2) + P( X = 3), esses valores

podem ser encontrados na tabela B da distribuição de probabilidades bino-
mial para n = 10, p = 0,10.
P(X ≤ 3) = 0,3487 + 0,3874 + 0,1937 + 0,0574 = 0,9872.

b) P(3 ≤ X ≤ 5) = P(X ≤ 5) – P(X < 3) = P(X ≤ 5) – P(X ≤ 2) = F(5) – F(2) =
= 0,9999 – 0,9298 = 0,0701.
c) três ou mais “fracassos” correspondem a sete ou menos “sucessos”.
Lembrando que “fracasso” aqui é entregar a correspondência em dia.
Então, precisamos calcular P(X ≤ 7) = F(7) = 1,0000.
d) A probabilidade de exatamente dois “sucessos” é P(X ≤ 2) – P(X ≤ 1) =
F(2) – F(1) = 0,9298 – 0,7361 = 0,1937, esse valor pode ser confirmado
na tabela B para P(X = 2).
e) P( X ≥ 7) = 1 – P(X ≤ 6) = 1 – F(6) = 1 – 1 = 0.
83
Distribuição multinomial
No caso da distribuição binomial havia dois possíveis resultados para o
processo, “sucesso” ou “fracasso”. No caso da distribuição multinomial, pode-
mos ter mais do que dois resultados possíveis. A sua distribuição de probabi-
lidades é dada pela expressão:
P(X1 = x1, X2 = x2, ..., Xn = xn) = f(x) = [n!/x1!x2!...xn!] p1x1 p2x2 ...pnxn
E(Xi) = ni.pi
VAR(Xi) = ni.pi.qi
Exemplo:
A loja ABC está liquidando o seu estoque, distribuindo roupas de tama-

nhos diferentes em três salas. Uma sala para manequim pequeno, outra para
médio e outra para grande. Uma pessoa entra na sala de roupas médias e
escolhe 10 peças. Por causa de um erro de classificação das peças, 15% delas
na sala de roupas médias eram grandes, e 5% eram pequenas, as demais
eram de fato roupas de tamanho médio.
a) Qual é a probabilidade de que a pessoa que escolheu as peças na sala de

roupas de tamanho médio, tenha pegado exatamente cinco roupas de ta-
manho médio, uma de tamanho grande e quatro de tamanho pequeno?
b) Qual é a probabilidade de ela ter pego sete roupas de tamanho médio,

duas de tamanho grande e uma de tamanho pequeno?
Aplicando a expressão da distribuição multinomial, teremos:
a) f(5,1,4) = [10!/5!1!4!].(0,80)5.(0,15).(0,05)4 = 0,0004
b) f(7,2,1) = [10!/7!2!1!].(0,80)7.(0,15)2.(0,05) = 0,0849.
Distribuição hipergeométrica
A distribuição binomial foi utilizada para amostragens de populações fi-
nitas com reposição. Em muitas situações práticas, as amostragens são rea-
lizadas sem reposição e, nesse caso, o modelo adequado é o da distribuição
hipergeométrica.
84
Suponha que temos bolas de duas cores em uma caixa com N bolas,
sendo que N1 são brancas e N – N1 são azuis. Uma amostra de tamanho n é
retirada da caixa e desejamos saber qual a probabilidade que x dessas bolas
sejam brancas.
A expressão para o cálculo de x “sucessos” na amostra aleatória de tama-

nho n sem reposição é dada por:
CN ,xC(N – N1), (n, x)

f(x) = P(X = x) = 1 para x = 0,1, ...
CN, n
O exemplo do início do capítulo que diz respeito à probabilidade de cinco

pessoas que moram no mesmo quarteirão estarem em um mesmo ônibus é
uma aplicação da distribuição hipergeométrica.
Distribuição de Poisson
A distribuição de Poisson tem uma grande aplicação em situações como
demanda por produtos, número de telefonemas que chegam a uma central,
número de acidentes, números de tráfego de chegadas (como caminhões
em um terminal, aviões em aeroportos, navios nos portos etc.) e número de
defeitos observados em linhas de produção.
Todas essas situações têm dois pontos em comum:
(I) as ocorrências podem ser descritas por uma variável aleatória que
toma valores como 0, 1, 2 e assim por diante;
(II) existe um índice do número de ocorrências por intervalo de tempo ou

espaço.
Algumas suposições são feitas para a utilização dessa distribuição, que são:
(I) a probabilidade de exatamente uma ocorrência acontecer em um subin-

tervalo é um número pequeno que é constante em cada subintervalo;
(II) a probabilidade de duas ou mais ocorrências em um subintervalo é

tão pequena que é considerada igual a zero;
(III) o número de ocorrências em um subintervalo não depende onde este

subintervalo está localizado;
85
(IV) o número de ocorrências em um subintervalo não depende do núme-

ro de ocorrências em qualquer outro subintervalo.
A distribuição de Poisson pode ser descrita pela função densidade de

probabilidade:
P(X = x) = f(x) = (μ . e ) , ... para x = 0, 1, 2.......

x –μ
x!
A esperança e a variância de X são iguais. E(X) = VAR (X) = μ.
Exemplo:
Seja X a variável aleatória “número de chamadas telefônicas por minuto”
durante um dado período de tempo. Então μ = 0,4 chamadas por minuto é
o parâmetro da distribuição de probabilidades de Poisson. A probabilidade
que certo número de chamadas chegará à central é dada pela expressão da
função densidade. Então:
Para X = 0
(0,4)0.e–0,4
P(X = 0) = f(0) = = 0,670.
0!
Para X = 1
(0,4)1.e–0,4
P(X = 1) = f(1) = = (0,4)(0,670) = 0,268.
1!
Para encontrar esses e outros valores de f(x), pode-se consultar direta-
mente a tabela C dos valores da função de distribuição acumulada para a dis-
tribuição de Poisson.
c
F(c) = P(X ≤ c) = ∑
x=0
f(x)
A distribuição de Poisson
como aproximação da distribuição binomial
Quando n é muito grande, o uso da distribuição binomial pode tor-
nar--se tedioso. Para evitar essa situação podemos tomar a distribuição
de Poisson como uma aproximação da distribuição binomial, quando n é
muito grande e p muito pequeno.
86
Se na distribuição binomial n cresce sem limites e p se aproxima de zero

de tal maneira que np permaneça constante, podemos tomar n . p = μ como
o parâmetro da distribuição de Poisson.
Exemplo:
Calcular a probabilidade de não se sortear nenhuma criança em uma

amostra de tamanho 5 de uma população com 950 adultos e 50 crianças.
Os parâmetros da distribuição binomial neste exemplo são p = 0,05 e n =

5, então:
(0,25)0 . e–0,25
F(0) = = 0,779
0!
Resolvendo esse problema através da distribuição binomial teríamos
P(X = 0) = 0,774, bem próximo ao encontrado pela distribuição de Poisson.
1. Determine o complemento para cada um dos seguintes eventos:
a) Obter 2 ou 3 na jogada de um dado.

b) Extrair uma carta de copas de um baralho de 52 cartas.
c) Retirar menos de 10 defeituosos.
d) Retirar pelo menos 5 defeituosos.
2. Considere o lançamento de dois dados. Considere os eventos A: “soma

dos números obtidos é igual a 9”, e B: “número no primeiro dado maior
ou igual a 4”.
a) Enumere os elementos de A e B.
b) Obtenha A B, A B e Ac.
3. Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15.

a) A e B são mutuamente exclusivos? Explique.
b) Determine P(Bc).
c) Determine P(A ou B).
87
4. Um grupo de 12 homens e oito mulheres concorre a três prêmios através

de um sorteio, sem reposição de seus nomes. Qual a probabilidade de:
a) nenhum homem ser sorteado?

b) um prêmio ser ganho por homem?
c) dois homens serem premiados?
5. Uma remessa de 1 500 componentes eletrônicos contém 400 defei-

tuosos e 1 100 perfeitos. Duzentos componentes são escolhidos ao
acaso (sem reposição) e classificados.
a) Qual é a probabilidade que sejam encontrados exatamente 90

componentes defeituosos?
b) Qual é a probabilidade que se encontrem ao menos dois compo-

nentes defeituosos?
6. Certo curso de treinamento aumenta a produtividade de certa popu-

lação de funcionários em 80% dos casos. De 10 funcionários quais-
quer que participam desse curso, encontre a probabilidade de:
a) exatamente sete funcionários aumentarem a produtividade.
b) pelo menos três não aumentarem a produtividade.
7. O processo de parametrização no Aeroporto Internacional tem apre-

sentado um índice de 70% de ocorrências de sinal verde (mercadoria
liberada sem a necessidade de vistoria física e documental), 20% de
sinal amarelo (vistoria documental) e 10% de sinal vermelho (neces-
sidade de vistoria física e documental). Supondo num dia qualquer a
chegada de oito lotes de produtos, determine a probabilidade de:
a) todos serem liberados sem nenhuma vistoria.
b) pelo menos dois lotes sofrerem inspeção física e documental.
c) no máximo três apenas passarem pela vistoria documental.
8. Está sendo planejado um novo hospital para uma cidade no interior

do Nordeste, dentro de uma comunidade que ainda não tem hospital
próprio. Sabe-se que essa cidade tem uma média de 2,3 nascimentos
por dia, determine a probabilidade de que, em um dia qualquer, o nú-
mero de nascimentos seja:
88
a) nenhum.
b) exatamente 2.
c) pelo menos 1.
9. Num processo de fabricação de certo tipo de componentes, a taxa

de defeituosos é de 6%. Esses componentes são acondicionados em
caixas com cinco unidades para a venda no mercado. A empresa fa-
bricante paga uma multa de R$10 por caixa em que tenha algum com-
ponente defeituoso. Num lote de 5 000 caixas, qual o valor esperado
para pagamento de multas?
10. Certo departamento de uma empresa está dimensionado de forma a

poder atender, no período normal, até cinco pedidos de serviços. Se
chegarem mais que cinco pedidos, o pessoal deve recorrer a horas ex-
tras para cumprir o atendimento. Sabendo-se que o número médio de
pedidos que chegam diariamente é de 4,2, calcular:
a) a probabilidade de ocorrência de horas extras num dia qualquer.
b) sendo o custo diário de horas extras de R$375,00, qual será o custo

médio mensal estimado com horas extras (considerar 22 dias)?
Gabarito
1.
a) O complemento será {1,4,5,6}.
b) O complemento será extrair uma carta de ouros ou de espadas ou

de paus.
c) O complemento será retirar 10 ou mais defeituosos.
d) O complemento será retirar no máximo quatro defeituosos (ou menos

de cinco).
2.
a) A:{(3,6)(4,5)(5,4)(6,3)}
B:{(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)(6,1)(6,2)
(6,3)(6,4)(6,5)(6,6)}.
89
b) Os elementos de A B serão os elementos de A mais os elemen-

tos de B A B={(3,6)4,1)(4,2)(4,3)(4,4)(4,5)(4,6)(5,1)(5,2)(5,3)(5,4)
(5,5)(5,6)(6,1)(6,2)6,3)(6,4)(6,5)(6,6)}
Os elementos de A B serão aqueles comuns aos dois conjun-

tos, logo:
A B = {(4,5) (5,4) (6,3)}.
Os elementos do complemento de A serão aqueles que não perten-

cem a A, mas pertencem aos demais conjuntos do espaço amostral:
(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)(3,1)(3,2)(3,3)(3,4)
Ac =
(3,5)(4,1)(4,2)(4,3)(4,4)(4,6)(5,1)(5,2)(5,3)(5,5)(5,6)(6,1)(6,2)(6,4)(6,5)(6,6)
3.
a) Não são mutuamente exclusivos, pois existe A B = 0,15.
b) O complemento de B é dado por: P(Bc) = 1 – P(B), logo P(Bc) =

1 – 0,80 = 0,20.
c) P(AUB) = P(A) + P(B) – P(A∩B) ... P(AUB) = 0,30 + 0,80 – 0,15 = 0,95.
4.
C 83 .C120
a) 3
= 0, 049
C 20

C 82 .C12
1
b) 3
= 0,295
C 20

C 81 .C122
c) 3
= 0, 463
C 20

5.
90 110
C 400 .C1100
a) 200
C1500
 C 400
0 200
.C1100 + C 400
1 199
.C1100 + C 400
2 198
.C1100 
b) 1 −  200 
 C1500 
90
6.
a) Esse é um caso de uma distribuição binomial, em que p = 0,80 e

n = 10, sendo assim:
P(X = 7) = C10.7(0,8)7.(0,2)3 ∴ P(X = 7) C10,7(0,8)7.(0,2)3 =

120.(0,2097).(0,008) = 0,2013
b) Nesse caso, o valor de p = 0,20 (probabilidade de não aumentar),

então pelo menos 3 não aumentarem é a P(X ≥ 3) = 1 – P(X < 3),
ou seja, P(X ≥ 3) = 1 – [P(X = 0) + P(X = 1) + P(X = 2) ∴ P(X ≥ 3) = 1
– [C10,0 (0,2)0.(0,8)10 + C10,1(0,2)1.(0,8)9 + C10,2 (0,2)2.(0,8)8] ∴ P(X ≥ 3) =
1 – [0,1074 + 0,2684 + 0,3020] ∴ P(X ≥ 3) = 1 – [0,6778] = 0,3222
7. Esse problema é um caso de distribuição binomial em que o valor de p

se altera em função do evento solicitado e n = 8, sendo assim em:
a) P(todos receberem o sinal verde) com p = 0,7 e n = 8, logo,
P(X = 8) = C8,8 (0,7)8.(0,3)0 = 0,0576.
b) P(pelo menos 2 lotes receberem o sinal vermelho) com p = 0,10

en=8
P(X ≥ 2) = 1 – P(X < 2) = 1 – [P (X = 0) + P(X = 1)]
P(X ≥ 2) = 1 – [C8,0 (0,1)0.(0,9)8 + C8,1 (0,1)1.(0,9)7]
P(X ≥ 2) = 1 – [0,4305 + 0,3826] = 0,1869.
c) P(no máximo 3 receberem o sinal amarelo) com p = 0,2 e n = 8
P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)
P(X ≤ 3) = [C8,0 (0,2)0.(0,8)8 + C8,1 (0,2)1.(0,8)7 + C8,2 (0,2)2.(0,8)6 + C8,3

(0,2)3.(0,8)5]
P(X ≤ 3) = [0,1678 + 0,3355 + 0,2936 + 0,1468] = 0,9437.
8. Esse problema trata de uma distribuição de Poisson, com média de 2,3

ocorrências por dia. Sendo assim, temos que:
(2,30 . ε–2,3)
a) P(X = 0) = = 0,1002 ou 10,02%.
0!
91
(2,32 . ε–2,3)
b) P(X = 2) = = 0,2652 ou 26,52%.
2!
c) P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) ∴ P(X ≥ 1) = 1 – 0,1002 = 0,8998
ou 89,98%.
9. É uma aplicação da distribuição binomial. Inicialmente, devemos ob-

ter a probabilidade de ocorrer algum componente defeituoso numa
caixa, ou seja:
P(X ≥1) com n = 5 e p = 0,06 ∴ P(X ≥1) = 1 – P(X < 1) = 1 P(X = 0). Logo:
P(X ≥1) = 1 – [C5,0 (0,06)0 (0,94)5] ∴ P(X ≥ 1) = 1 – [0,7339] = 0,2661

ou 26,61%.
Como a empresa paga R$10,00 por caixa com algum componente de-
feituoso e o lote contempla 5 000 caixas, então a multa esperada será
dada por:
E(multa) = P(caixa com algum componente defeituoso) x total de cai-

xas x R$10,00
E(multa) = 0,2661 x 5.000 x R$ 10,00 em que E(multa) = R$13.305,00.
10. É um caso de aplicação de uma distribuição de Poisson, com média de

4,2 pedidos/dia.
a) P(X ≥5) = 1 – P(X < 5) = 1 – [P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) +

P(X = 4)]
é 4,20 e-4 ,3 4,21 e-4 ,3 4,22 e-4 ,3 4,23 e-4 ,3 4,24 e-4 ,3 ù
= 1 ê + + + + ú
ê 0! 1! 2! 3! 4 ! úû
ë
= 1 – [0,5704] = 0,4296 ou 42,96%.
b) E(custo horas extras/mês) = P(realizar horas extras) x custo/dia x

número de dias/mês em que E(custo horas extras/mês) = 0,4296 x
R$375,00 x 22 = R$3.544,20.
92
Amostragem
Problema
A empresa ABC tem uma administração participativa e decidiu que os
funcionários devem eleger os chefes de seção. No almoxarifado, dois can-
didatos apresentam-se. João parece ter a preferência de seus pares, mas
Pedro acredita que pode superar João se fizer uma boa campanha. Resol-
ve então fazer uma pesquisa de opinião para compreender quais são os
principais anseios de seus colegas e quer aproveitar a pesquisa para ver o
nível de aceitação de seu nome. Como o número de empregados do almo-
xarifado é muito grande, opta por fazer um levantamento através de um
processo de amostragem.
Para tanto, elabora um plano amostral e um questionário para realizar o

seu levantamento. Faz parte de seu planejamento a determinação do tipo de
sorteio que realizará, a determinação do tamanho da amostra e a estratégia
do trabalho de campo.
Ele sabe que o tamanho da amostra dependerá fundamentalmente de duas

determinações; a precisão do resultado e o erro amostral. Resolve, então, que
deseja ter uma grande precisão que implique um desvio de mais ou menos 3%
com um nível de confiança de 95%, ou seja, um erro amostral de 5%.
Assim, se ele tiver 40% das intenções de voto, saberá, então, com 95% de
confiança, que em uma eleição com todos os funcionários, sua proporção de
votos estará entre 37% e 43%. Ou, de outra forma, a proporção de votos que
ele terá na população estará dentro desse intervalo e, uma vez que a pesqui-
sa foi feita por amostragem, esse intervalo será construído através de uma
amostra que poderá ser representativa da população ou não, e a chance que
esse sorteio retire uma amostra não representativa é de 5%, porque o nível
de confiança e o erro amostral representam probabilidades complementa-
res, ou seja, a sua soma é sempre 100%. Se o levantamento for realizado com
um erro amostral de 2%, então o nível de confiança será de 98%.
Comumente os resultados de pesquisas como essa falam em margem de

erro de mais ou menos 2 ou 3%. O que se publica como margem de erro é
95
Amostragem
na verdade o desvio. O desvio está relacionado com a precisão que se deseja

obter. Quanto menor o desvio, maior a precisão.
Essa declaração pode ser escrita em termos matemáticos através do se-

guinte intervalo de confiança:
Pr ( 37% < P < 43%) = 0,95
Pr (40 – 3 < P < 40 + 3) = 1 – 0,05
De forma genérica, o intervalo de confiança de uma proporção é dado

pela seguinte expressão:
Pr ( p – d < P < p + d ) = 1 – α
Nessa expressão, Pr significa probabilidade, P (p maiúsculo) é a proporção

de votos de Pedro na população, p (p minúsculo) é a proporção de votos de
Pedro na amostra, d é o desvio e α é o erro amostral. Portanto, (1 – α) é defi-
nido como o nível de confiança.
Rigorosamente, segundo a Teoria Estatística Clássica, uma vez que P é um

parâmetro da população, portanto, um valor exato, não se pode falar em
probabilidade de um parâmetro estar dentro de um intervalo. E mais, a in-
terpretação de um intervalo de confiança é a de que, se fossem retiradas 100
amostras, em 95 delas o parâmetro deveria pertencer ao intervalo. Mas essa
simplificação não atrapalha o raciocínio realizado.
Um levantamento amostral ou através de amostragem é uma pesqui-
sa realizada em parte de uma população com o objetivo de calcular uma
medida na amostra que sirva de estimativa dessa medida na população.
No exemplo acima, a proporção de votos de Pedro na amostra serve como
uma estimativa da proporção de seus votos na população. Além da propor-
ção, outras medidas muito comuns realizadas na amostra como estimado-
res dos parâmetros populacionais são a média e o desvio-padrão.
Formalizando alguns conceitos:
96
Amostragem
População
População é um conjunto de pessoas, animais, objetos ou coisas que têm
uma característica em comum e que sejam objeto de investigação.
Exemplos:
população de pessoas que habitam uma cidade;
população de eleitores de uma cidade. Nesse caso, são consideradas

somente as pessoas cadastradas no tribunal regional eleitoral das
zonas eleitorais do município em questão. Não importa se a pessoa de
fato reside na cidade ou não. Muitos eleitores de curitiba residem nas
cidades da região metropolitana;
população de empregados de uma empresa, ou de um setor de uma

empresa;
população de cachorros de rua de uma cidade;
população de refrigeradores produzidos por uma indústria no ano y;
população das carteiras de uma escola.
As medidas observadas em uma população são chamadas de parâmetros.

No geral, são apresentadas por caracteres maiúsculos ou por letras gregas.
Tamanho da população – N.
Media da população – μ (letra grega mi).
Desvio-padrão da população – σ (letra grega sigma).
Um levantamento realizado com todos os elementos de uma população

é chamado de censo. Os primeiros censos de que se tem notícia foram reali-
zados na China. Mais tarde ficaram famosos os censos do Império Romano,
cujo objetivo era conhecer o tamanho de seu domínio. Um desses censos foi
realizado no ano do nascimento de Jesus Cristo. Os cristãos acreditam que
esse censo foi realizado justamente para identificar a figura de uma criança
que mais tarde se tornaria o filho de Deus.
97
Amostragem
Os censos populacionais são realizados em todo o mundo, de dez em

dez anos, por recomendação da Organização das Nações Unidas. No Brasil,
o primeiro censo foi organizado pelo estatístico Italiano Giorgio Mortara, em
1940, que também foi o fundador do IBGE (Instituto Brasileiro de Geografia e
Estatística). Hoje, o IBGE é considerado um dos maiores e mais competentes
institutos do gênero ao redor do mundo. O IBGE trabalha com técnicas esta-
tísticas complexas e sofisticadas.
Na realização do censo, existem dois questionários. Um questionário

básico que todas as famílias brasileiras respondem e um questionário com-
pleto que é respondido por uma amostra de 10% da população. Ou seja, uma
em cada 10 famílias deve responder o questionário completo. Até o censo de
1991 essa amostra era de 25%. Mas com a evolução das técnicas estatísticas
de estimação pode-se diminuir o tamanho da amostra. Na maioria dos países
com tradição em realização de levantamentos amostrais, como, por exemplo,
os Estados Unidos, o censo serve somente para a contagem da população,
todas as outras determinações são realizadas através de amostragens.
Observe-se que os censos devem ser realizados nos anos de final zero. O
censo de 1990 foi realizado com um ano de atraso por dificuldades operacio-
nais durante o governo de Fernando Collor de Melo. Essa defasagem causa
problemas de ordem técnica bastante graves quando se deseja realizar es-
timativas baseadas nos resultados do censo. As séries temporais que deve-
riam ter uma mesma amplitude de dez em dez anos passaram a ter nesse
período uma defasagem de onze e depois nove anos.
Curiosidade
Giorgio Mortara dizia que os estatísticos são como os músicos. Onde todos
veem cifras musicais, o músico escuta uma canção. Da mesma forma onde
todos veem números, os estatísticos enxergam a realidade.
Amostra
Amostra é um subconjunto de uma população que pretende representá-la.
As medidas realizadas em uma amostra são chamadas de estatísticas.

Como elas pretendem estimar o valor da mesma medida na população, os
seus valores calculados são chamados de estimativa. A expressão utilizada
para calcular a medida é chamada de estimador.
98
Amostragem
No exemplo anterior, a proporção de votos de Pedro na população é um pa-

râmetro. A proporção de votos na amostra é um estimador desse parâmetro. O
seu valor, no caso em tela, 40% é uma estimativa do valor do parâmetro.
A média da amostra é um estimador da média da população, mas não é o

único estimador possível. A mediana da amostra, por exemplo, pode ser um
estimador da média da população. Ocorre que a média da amostra é um es-
timador da média da população que tem certas propriedades que a tornam
um estimador melhor do que a mediana amostral.
As medidas realizadas na amostra são representadas por letras minús-

culas ou através de caracteres especiais. Quando é um estimador, também
podem ser representadas através da mesma letra do parâmetro que desejam
estimar acrescentada de um acento circunflexo que é chamado de chapéu.
Tamanho da amostra – n.
^
Média da amostra – X, µ .
Desvio-padrão da amostra – S, s, σ.
Tipos de amostragem
Quanto à repetição de elementos da amostra

Uma amostra pode ser retirada da população podendo os elementos
dessa população aparecerem mais de uma vez na amostra, ou não. Se todos
os elementos da amostra são diferentes, ou seja, um mesmo elemento não
pode participar duas vezes da amostra, a amostragem é dita ser amostra sem
reposição. Caso contrário, a amostra é dita ser com reposição.
No processo de sorteio da loteria federal, por exemplo, quando são sor-

teados seis números de 0 a 9 para formar uma centena de milhar, a amostra-
gem é com reposição. Sorteia-se de um globo uma bola que representará a
unidade. Esse número é verificado e colocado novamente no globo para o
sorteio da dezena e assim por diante até o sorteio da bola correspondente à
centena de milhar. Na verdade, o sorteio é feito com seis globos, o que equi-
vale ao processo descrito acima. Então esse sorteio é com reposição.
No processo de sorteio da mega-sena, por outro lado, o processo é sem

reposição, porque se sorteiam seis bolas de um globo que tem um total de
60 bolas numeradas.
99
Amostragem
Em um processo sem reposição, a probabilidade de um número ser sorte-

1
ado de uma população de tamanho N é . Em um processo com reposição,
N
a probabilidade de n números especiais participarem da amostra é 1 .
CN, n
Curiosidade
Se um vendedor de bilhetes da loteria federal tiver somente duas opções

de bilhetes para a venda, a cobra 333 333 ou o cachorro 234 320, qual deles
tem maior probabilidade de ser o bilhete vencedor? Qual você compraria?
A tendência imediata de qualquer apostador seria que intuitivamente o

segundo bilhete tem maior chance de ocorrer. No entanto, como em muitos
outros casos, a intuição da probabilidade é enganosa. A chance de ocorrer
3 ou 0 no sorteio da unidade é idêntica e igual a 1/10. Da mesma forma, a
chance de ocorrer 3 ou 2 no sorteio da dezena também é idêntica e igual
a 1/10. Os sorteios são com reposição e independentes. A chance final dos
dois bilhetes serem vencedores é idêntica e igual a (1/10)6, ou uma chance
em 1 000 000 (um milhão). De fato uma probabilidade bem pequena.
1
A probabilidade de se ganhar na mega-sena é C que é igual a 1 em
60, 6
50 063 860, ou seja, uma chance em cinquenta milhões, uma probabilida-
de bem menor que a da loteria federal. E se jogar dois bilhetes na mega-
-sena? A probabilidade então será 2 em 50 milhões, ou uma chance em 25
milhões. Ainda muito difícil de ganhar. Então seria melhor jogar em sete
números? Bom, aí a probabilidade de se acertar seis números é de uma
chance em 7 151 980, aproximadamente uma em 7 milhões. Exatamente
sete vezes maior do que jogar somente em seis números. Por isso se o bi-
lhete de aposta com seis números custa R$1,50 o bilhete de apostas com
sete números custa R$10,50, exatamente sete vezes mais.
Quanto à representatividade
Uma amostra pode ser probabilística ou não probabilística. Para efeito
de inferência, isto é, se o propósito é o de estimar valores de parâmetros
da população, somente amostras probabilísticas conseguem ser úteis. Ou
seja, só é possível fazer inferências para a população através de observa-
ções da amostra se os elementos forem escolhidos através de algum pro-
cesso de sorteio.
100
Amostragem
Em um processo de amostragem probabilístico há que se poder calcular

o valor da probabilidade de um elemento da população que participa da
amostra.
Amostragens não probabilísticas servem para se fazer sondagens sem

propósitos inferenciais. Nesses casos, os procedimentos que envolvem com-
parações estatísticas que impliquem cálculos científicos não são válidos.
Processos de amostragem não probabilísticos
Amostragem por cotas

Esse procedimento é muito utilizado e às vezes confundido com o pro-
cesso de amostragem estratificada proporcional, que será estudado mais
adiante. Consiste em buscar repetir na amostra a proporção de elementos
de cada estrato da população. Então, se a população é composta de 50%
de homens, 20% de jovens e assim por diante, a amostra terá também essa
composição. O que diferencia a amostragem por cotas da amostragem estra-
tificada proporcional é que, no primeiro caso, os elementos da amostra não
são selecionados através de sorteio.
Muitos institutos de pesquisa utilizam esse tipo de levantamento. Fazem

entrevistas na rua, por exemplo, em que o agente de campo vai escolhen-
do as pessoas até que complete cada uma das cotas. O processo não serve
para propósitos de inferência porque pode ser contaminado pela escolha
realizada pelo agente. No geral, pessoas com pressa ou mais sisudas acabam
não participando da amostra, embora possam representar uma parcela im-
portante de opinião, dependendo do objeto da pesquisa. Pesquisas de mer-
cado, por exemplo, podem ter resultados completamente tendenciosos em
razão da escolha da amostra.
Por outro lado, em pesquisas eleitorais, candidatos podem forçar a par-

ticipação de assessores ou cabo eleitorais em pesquisas de rua com o pro-
pósito de fazer da pesquisa uma peça de campanha. Embora não se tenha
comprovação científica ainda, supõe-se que eleitores indecisos votem em
candidatos com maior chance de vitória para “não perderem o seu voto”. No
processo de eleição americana, bastante diferente do brasileiro, o Instituto
Gallup verificou que os resultados das pesquisas eleitorais não afetam de
forma importante o resultado final da eleição. É bom lembrar, no entanto,
101
Amostragem
que o voto nos Estados Unidos não é obrigatório e que as eleições são reali-
zadas de forma indireta através de delegados partidários.
Amostragem de voluntários
Nesse tipo de amostragem, os elementos da amostra são definidos pela
opção do próprio elemento em participar do processo. Ele é muito comum
em publicações de revistas ou jornais ou então na opinião de usuários de
certos serviços, como restaurantes, por exemplo.
Muitas revistas colocam em determinados números encartes em que

o leitor deve opinar sobre a qualidade da revista e de certas seções es-
pecíficas. O que ocorre no geral é que a grande maioria das pessoas que
respondem ao questionário, o fazem porque não estão satisfeitas com a
publicação ou pelo menos com parte dela. Essa sondagem pode ser útil
para os editores da revista porque terão uma ideia do que podem melhorar,
mas não há como se fazer estimativas acerca do que a maioria dos leitores
pensa da publicação. O mesmo ocorre em restaurantes ou em conferências
quando os comensais ou os participantes das conferências são instados a
responderem questionários.
Amostragem intencional
Aqui o pesquisador busca na população uma parte dela que lhe inte-
ressa. Os participantes da amostra são escolhidos por terem alguma ca-
racterística que interessa ao pesquisador. Da mesma forma que os outros
processos não probabilísticos, nesse caso não há como se fazer inferências
para toda a população.
Uma pesquisa sobre qualidade de atendimento hospitalar pode ser re-

alizada em um setor do hospital. Podem ser escolhidos para participarem
da amostra pacientes desse setor. Naturalmente os resultados obtidos dessa
forma não podem ser estendidos para todo o hospital.
Amostragem a esmo
Muitas vezes este processo é confundido com uma amostragem aleatória.
A palavra aleatória vem de alea (de sorte do latim – todos lembram de alea
102
Amostragem
jacta est, “a sorte está lançada”, de Júlio César ao invadir Roma). No contexto
da estatística, a palavra aleatória está relacionada com processo de escolha
por sorteio. Em contextos específicos a palavra aleatória é substituída pela
palavra estocástica.
Escolher a esmo, portanto, não é processo científico de escolha de ele-

mentos da população para participarem da amostra.
Processos de amostragem probabilísticos

As amostragens que têm valor científico são aquelas em que se conse-
gue de alguma forma determinar a probabilidade de um elemento da po-
pulação em participar da amostra. Não necessariamente todos os elementos
da população devam ter a mesma chance de participar da amostra, como
no caso da amostragem estratificada proporcional (por exemplo, como será
visto logo a seguir), mas, repetindo, há que se conseguir determinar qual a
probabilidade de participação na amostra.
As principais técnicas de amostragem probabilística serão estudadas na

seção que segue. São elas: amostragem aleatória simples, amostragem es-
tratificada proporcional, amostragem sistemática, amostragem por conglo-
merados e amostragem em dois estágios. Antes, porém, será conveniente a
apresentação da Tabela de Números Aleatórios.
Tabela de números aleatórios

As tabelas de números aleatórios são tabelas de algarismos geradas em
computador para auxiliar o pesquisador a sortear números de elementos
da população que deverão participar da amostra. Na verdade, elas simulam
uma urna na qual bolas ou papéis são colocados com números de 1 a N,
onde N é o último elemento numerado de uma população.
Essas tabelas podem ser geradas em programas simples, como o Excel,

por exemplo. Elas são especialmente úteis quando se deve fazer o sorteio
sem que se tenha um computador em mãos ou mesmo uma máquina de
calcular científica. Muitas delas têm um módulo para sorteio de números ale-
atórios. Um exemplo de tabela é a apresentada a seguir:
103
Amostragem
1 2 3 4 5 6 7 8 9
1 5 7 5 1 8 1 9 6 1
2 2 6 6 5 9 1 2 4 5
3 4 5 3 6 1 7 4 7 9
4 7 2 8 3 2 3 9 7 4
5 5 6 9 6 0 5 5 4 6
6 0 6 8 7 3 7 1 2 1
7 6 9 2 0 3 1 7 2 8
8 4 1 5 6 3 6 0 1 5
9 7 2 4 7 1 3 8 3 1
10 7 5 1 1 7 3 1 3 6
11 1 7 0 3 5 7 8 3 5
12 4 6 2 8 3 1 4 5 6
13 5 5 6 6 5 2 4 8 8
14 5 2 4 4 6 2 3 6 5
15 5 6 8 8 7 4 7 8 6
16 4 4 6 0 6 8 4 4 2
17 8 2 1 0 5 6 9 6 2
18 9 9 5 9 4 3 7 9 8
19 8 2 9 4 3 5 4 5 3
20 9 7 8 8 6 4 9 2 2
21 2 3 2 7 4 9 0 6 7
22 4 6 5 8 2 8 8 1 4
23 3 0 1 8 1 1 7 5 9
24 3 8 1 6 4 4 5 2 3
25 1 3 8 3 4 7 7 7 7
26 5 1 0 0 3 8 6 6 3
27 3 0 1 4 4 5 1 2 6
28 3 5 8 7 7 5 3 7 6
29 1 3 3 5 1 7 6 8 1
30 9 6 4 9 5 2 3 1 9
104
Amostragem
A tabela gerada possui 30 linhas e 9 colunas. Suponhamos que se deseje

sortear um número de um componente de uma população com 80 elemen-
tos numerados de 1 a 80. Primeiramente, devemos escolher uma linha e uma
coluna para início do processo. Vamos tomar uma data qualquer para iniciar o
processo. Dia 16 de abril, data de nascimento de Charles Chaplin e do Cardeal
Ratzinger, atual Papa Bento 16. Quando olhamos a tabela verificamos na linha
16 e coluna 4 que o dígito sorteado foi o zero. Mas como precisamos de um
número com dois dígitos tomaremos o 0 e o seu vizinho imediatamente à di-
reita para compor o número sorteado. Então o número sorteado foi o 06. Como
a população está numerada de 01 a 80, tomamos o elemento de número 6 e
verificamos o valor da variável de interesse correspondente àquele elemento.
Se for a idade, por exemplo, verificamos qual é a idade do elemento 6.
Principais técnicas de amostragem
Amostra aleatória simples

O processo de amostragem aleatória simples (AAS) é o processo mais
simples. Nele, todos os elementos da população têm a mesma probabilida-
de em participar da amostra. No exemplo em tela, se a população tem 80
elementos, então a probabilidade de um elemento da população vir a parti-
cipar da amostra é de 1/80.
Se desejamos tomar uma amostra maior e o processo for com reposição,

essa probabilidade permanece 1/80 para cada etapa do sorteio. Se for sem
reposição, na segunda etapa a probabilidade é de 1/79, a seguinte 1/78 e
assim por diante. Mas a chance de que cada elemento participe da amostra
é a mesma.
Supondo agora que desejamos sortear uma amostra de tamanho 10,

então, teremos que tomar 10 elementos da população numerada de 1 a 80.
Utilizando a mesma entrada, linha 16 e coluna 4, já tínhamos verificado que
o primeiro elemento a participar da amostra era o de número 6. Estabelecen-
do o critério de tomar os números a seguir para baixo na tabela, o próximo
número sorteado é o 05. O número seguinte é o 94, que é maior que 80 e,
portanto, não serve. Não há ninguém da população com esse número.
Selecionamos, então, o próximo, que é o número 43, e assim por diante

até completar os dez números. Já temos três números, mas ainda faltam sete
105
Amostragem
para completarmos o tamanho estabelecido para a amostra. Continuando

na tabela, os próximos números menores que 80 são 74, 64, 34, 03, 44 e 51,
quando termina a tabela. Ainda nos falta um número. Retomamos o pro-
cesso da linha 1, colunas 5 e 6. Aparecem os números 81, 91 e 17. Os dois
primeiros não servem, então o último número sorteado é o 17. Dessa forma,
completamos o processo e os números sorteados foram:
06, 05, 43, 74, 64, 34, 03, 44, 51 e 17.
Como não há nenhum número repetido, não precisamos nos preocupar

se o sorteio era com ou sem reposição. No geral, essa determinação é feita
antes do sorteio e, na maior parte das vezes, nos interessam sorteios sem
reposição. Quando nada é dito a respeito, supõe-se que o sorteio seja sem
reposição, ou seja, todos os elementos devem ser diferentes.
O trabalho agora consiste em verificar o valor da variável ou do atributo

de interesse de cada um dos elementos. Sua idade, seu sexo e sua intenção
de voto, por exemplo.
Amostra estratificada proporcional

Esse tipo de amostragem é semelhante ao processo de amostragem por
cotas, com a diferença de que nesse caso os elementos são escolhidos atra-
vés de algum tipo de sorteio. Assim, se a população pode ser dividida em
estratos e estes se constituem em diferenças de características que podem
afetar o resultado da pesquisa, a proporção que cada estrato tem na compo-
sição da população deve ser repetida na amostra.
O cuidado que se deve tomar aqui é o de que a divisão em estratos deve

fazer sentido para a pesquisa que se deseje realizar. Se, por exemplo, o obje-
tivo é fazer uma pesquisa sobre a inteligência de um grupo, que será mensu-
rada através da medida do QI (quoeficiente de inteligência), e, supondo que
essa possa ser uma boa medida, apesar das críticas que recebe, não parece
razoável dividir a população em estratos por sexo. Não há nenhuma com-
provação científica de que as mulheres sejam mais inteligentes do que os
homens, muito embora essa seja a impressão geral.
Por outro lado, se desejamos fazer um estudo antropométrico de uma

população através da medida da altura média dessa população, parece bas-
tante razoável dividi-la em estratos segundo o sexo. E por que devemos fazer
isso? Suponha que somente 20% da população em questão seja de mulheres.
106
Amostragem
Como é sabido, os homens são, de uma forma geral, mais altos do que as mu-
lheres, e se fizermos um sorteio através de uma amostra aleatória simples,
poderemos correr o risco de termos na amostra 40% de mulheres ou mais, o
que nos levaria ao final a subestimar a altura média daquela população.
Suponha que tal pesquisa seja realizada em uma população com 60 pes-
soas e que uma amostra de tamanho 10 deva ser retirada de uma população
com 12 mulheres e 48 homens.
Primeiramente, verifica-se a proporção de homens e mulheres na popula-

ção. A proporção de mulheres (pm) é dada por:
Nm
Pm =
N
onde Nm é o numero de mulheres e N o total da população. Assim:
Pm = 12 . 100 = 20%
60
Se a amostra é de tamanho 10, então o número de mulheres na amostra

será dado por:
nm = n . pm = 10 . 20% = 10 . (20/100) = 2
Então, o número de homens será de 8. De fato, 8 representa 80% da amos-

tra, da mesma forma que 48 representa 80% de 60. Em uma tabela, teríamos:
Sexo População Amostra

Homens Nh nh
Mulheres Nm nm
Total N n
Para uma população com a composição acima, o número de mulheres na

amostra é determinado por:
nm = (Nm/N) . n
E o número de homens por:
nh = (Nh/N) . n
107
Amostragem
Exemplo:
Deseja-se fazer uma estimativa do salário médio dos empregados de uma

empresa através de uma amostra de tamanho 10, em um sorteio sem repo-
sição, utilizando a tabela de números aleatórios a partir da linha 29 coluna 3,
correspondente a 29 de março, dia do aniversário de Curitiba.
A tabela a seguir corresponde à divisão dos funcionários segundo os seus

cargos na empresa:
Setor Empregados
Técnico 20
Administrativo 60
Operacional 120
Total 200
Supondo que os valores dos salários dos técnicos sejam maiores do que
o de pessoal administrativo, que por sua vez é maior do que o dos empre-
gados do setor de operações, faz sentido fazer uma amostragem estratifi-
cada proporcional.
O primeiro passo é determinar o número de funcionários de cada setor

que irá compor a amostra de tamanho 10, respeitadas as proporções de cada
setor na população. Então:
Setor População Amostra

Técnico 20 (20/200) . 10 = 1
Administrativo 60 (60/200) . 10 = 3
Operacional 120 (120/200) . 10 = 6
Total 200 10
Determinado o tamanho de cada estrato na amostra, procede-se o

sorteio. Antes, porém, é necessário numerar os empregados de 1 até 200.
Pode-se, então, atribuir aos empregados do setor técnico a numeração de
1 a 20. Para os do setor administrativo, de 21 a 80 e para os do setor opera-
cional, de 81 a 200.
108
Amostragem
Setor Amostra Números sorteados

Técnico [1;20] 1 015
Administrativo [21;80] 3 031, 068, 056
Operacional [81;200] 6 181,173,174,138,117,176
Total 10
Sorteados os números dos empregados, deve-se verificar qual é o salário

de cada um deles e depois calcular a média salarial da amostra, cujo valor
estimará a média salarial de todos os empregados da empresa.
Amostra sistemática
A amostra sistemática é utilizada quando a população já se encontra or-
ganizada em alguma forma de arquivo.
Suponha que desejamos fazer uma revisão tipográfica em um livro de

400 páginas através de uma amostra de tamanho 10. O processo consiste em
determinar o valor da fração amostral, que é dada por:
f= N
n
O primeiro passo é sortear o primeiro elemento da amostra através da

tabela de números aleatórios. O segundo será determinado pela soma do
primeiro número com a fração amostral. O terceiro é o segundo mais a fração
amostral e assim por diante até completar o tamanho da amostra.
No exemplo dado, a fração amostral é igual a 400/10 = 40. Vamos deter-

minar a entrada pela linha 1 coluna 1, primeiro dia do ano, que corresponde
à página 57.
A segunda página será 57 + 40 = 97. A terceira, 137, e na sequência as pági-

nas 177, 217, 257, 297, 337, 377. A seguinte seria a página 417, mas ela supera o
número de páginas do livro. Subtraímos então 400 de 417 e a página sorteada
será a de número 17. A próxima seria a página 57, mas que já foi sorteada, o
processo, então, se completa com a determinação da décima página, que é a de
número 17. As páginas que serão verificadas são, então, as de números:
17, 57, 97, 137, 177, 217, 257, 297, 337 e 377.
109
Amostragem
Observe que esse é um processo circular no qual não importa onde seja
o início. A amostra sistemática é um caso particular de uma amostra estrati-
ficada proporcional, em que cada estrato corresponde a um conjunto de 40
páginas e que de cada estrato se sorteia um elemento.
Esse processo é o utilizado pelo IBGE na determinação de quem responde-

rá o questionário completo com uma fração amostral igual a 10. Seleciona-se
uma casa para fazer o questionário completo e a cada dez casas ele é repas-
sado para a família que o responderá. Esse processo é também utilizado para
a realização de pesquisas eleitorais. Sorteia-se uma quadra, determina-se a
primeira residência em que uma pessoa será entrevistada (no geral, a que
atende a porta ou a de aniversário mais próximo, desde que seja eleitor no
município), salta-se o número de casas correspondentes à fração amostral e
a nova entrevista será feita na casa determinada por esse processo.
Amostra por conglomerados

Na amostragem por conglomerados divide-se a área a ser pesquisada em
setores bem definidos, sorteia-se uma certa quantidade desses setores atra-
vés de uma amostra aleatória simples e pesquisa-se todos os elementos da
sua população.
Na amostragem por conglomerados, quanto mais os elementos dentro

do setor forem “parecidos” com a população como um todo, melhor será o
resultado obtido. Isto é, se a variância interna dentro do setor for alta, a varia-
bilidade total será menor. Exatamente o oposto do que ocorre com a amos-
tra estratificada proporcional, em que as variâncias dentro de cada estrato
devem ser pequenas.
Amostragens por conglomerados são bastante utilizadas em pesquisas

de campo que envolvem a opinião de moradores de uma cidade. Os setores
podem ser as zonas eleitorais em uma pesquisa de intenção de votos ou os
setores censitários do IBGE, que são áreas bem definidas com cerca de 300
domicílios, os quais são utilizados para fazer o censo demográfico.
A principal vantagem de uma amostra por conglomerados é a facilidade

de realização do trabalho de campo, que pode implicar uma economia bas-
tante grande de recursos empregados para a realização da pesquisa.
110
Amostragem
Amostragem em dois estágios

Quando os elementos de um setor têm grande homogeneidade, a efici-
ência da amostragem por conglomerados pode ficar comprometida. Uma
forma de se contornar esse problema é a realização de sorteio entre os ele-
mentos de cada setor já sorteado na amostragem por conglomerados. No
geral, ambos os sorteios são realizados através de uma amostra aleatória
simples, ou o primeiro através de uma amostra aleatória simples e o segundo
através de uma amostra sistemática.
O procedimento de amostragem em dois estágios ou em duplo estágio

consiste em:
organização da população em setores (conglomerados);
sorteio de alguns conglomerados através de uma amostra aleatória

simples;
dentro de cada setor, sorteio dos elementos que participarão da amos-

tra através de um processo de amostragem aleatória simples ou amos-
tragem sistemática.
Tamanho da amostra
A determinação do tamanho da amostra é uma das tarefas mais comple-
xas em um processo de pesquisa e requer um trabalho bastante cuidadoso.
Vários aspectos devem ser considerados no seu cálculo e uma falácia deve
ser definitivamente abandonada, que é a ideia de que se pode determinar
o tamanho da amostra através de uma determinação percentual em rela-
ção ao tamanho da população. Por exemplo, tomar uma amostra de 5% da
população ou de 10% da população como representativa dela; esse proce-
dimento só pode ter alguma validade se a partir dele forem determinados o
erro estatístico e o desvio dos valores dos parâmetros obtidos.
De outra forma, vale dizer que uma amostra de 0,5% da população pode
ser representativa dela e que uma amostra de 10% pode não ser, dependen-
do do tamanho da população e da técnica de amostragem utilizada.
Outra consideração fundamental na determinação do tamanho da amostra

é o limite imposto pela quantidade de recursos disponíveis para a realização
111
Amostragem
do levantamento amostral. Esse fator limitante pode inclusive inviabilizar o

trabalho de pesquisa, como veremos um pouco mais adiante.
Três fatores técnicos são considerados no cálculo do tamanho da amos-

tra: a precisão, o nível de confiança e a variabilidade da amostra.
A precisão é determinada pelo desvio do valor da estimativa na amostra

em relação ao verdadeiro valor do parâmetro na população, também conhe-
cido como margem de erro.
O nível de confiança é um valor de probabilidade complementar ao erro

estatístico. O erro estatístico, por sua vez, é a probabilidade em que a amos-
tra sorteada não represente a população.
Em relação à variabilidade da amostra, podemos dizer que, quanto mais

homogênea a população, menor será a necessidade de uma amostra grande.
Poucos elementos representam bem a amostra.
Uma última consideração deverá ser feita com relação ao tamanho da

amostra, que diz respeito ao tamanho da população. Para populações pe-
quenas, há que se fazer uma correção na determinação do tamanho da
amostra, chamada de correção para populações finitas.
A “margem de erro”
O que é chamado de “margem de erro” ou “erro máximo da estimativa”
é na verdade a diferença máxima provável entre a medida do estimador
observado na amostra e o verdadeiro valor do parâmetro da população.
Trata-se, portanto, do desvio entre o valor calculado na amostra e o verda-
deiro valor do parâmetro da população.
Na pesquisa amostral do exemplo da eleição do chefe do setor, se Pedro

tem 40% da intenção de votos, mais ou menos 3% – esses 3% são o desvio do
valor central de 40% que a pesquisa se propôs a admitir – com certa probabi-
lidade de que a amostra selecionada não represente a população, chamada
de erro estatístico.
Reforçando, a “margem de erro” ou “desvio” tem natureza absolutamente

diferente do chamado erro estatístico. Enquanto o desvio é uma percenta-
gem, ou uma medida na unidade em que se está observando os valores (cm,
anos, m2 etc), o erro estatístico é uma medida de probabilidade.
112
Amostragem
No exemplo da eleição de Pedro, temos 95% de confiança (erro estatístico

de 5%) que ele terá entre 37% e 43% dos votos, se a eleição fosse realizada
no momento da pesquisa, contra 57% a 63% de João. Qualquer resultado
dentro deste intervalo pode acontecer. É preciso que se compreenda isso
para não cometer erros de interpretação dos resultados.
Suponha que a estimativa da proporção de votos de Pedro fosse de 48%

e, portanto; a de João 52%. Será que realmente João está na frente de Pedro?
A resposta tem que ser um peremptório não.
De fato, o que a pesquisa amostral informa é que a proporção de votos de

Pedro na população, salvo o erro amostral, estará dentro do intervalo [45%,
51%] e que a proporção de João estará no intervalo [49%, 55%]. Assim, qual-
quer resultado dentro desses intervalos é admissível, como, por exemplo,
51% para Pedro e 49% para João, e, embora aparentemente João estivesse na
frente, ele pode perder a eleição. Esse fato é conhecido como “empate técni-
co” ou “empate estatístico”. Convém a João saber fazer a leitura da pesquisa.
Mas será que João não está ao menos um pouquinho à frente de Pedro?
Com base no resultado da pesquisa, pode-se afirmar categoricamente que
não necessariamente.
Uma pesquisa que antecedeu uma eleição para prefeito de Curitiba

trouxe como resultado as seguintes intenções de voto com um nível de
confiança de 95%:
Candidato A – 58%
Candidato B – 09%
Candidato C – 08%
Candidato D – 07%
Candidato E – 07%
Candidato F – 05%
Candidato G – 05%
Candidato H – 01%
O instituto que realizou a pesquisa afirmou que entrevistou 405 eleitores

em um certo dia e que a “margem de erro” de sua pesquisa foi de mais ou
menos 5%. O que se pode concluir da pesquisa?
113
Amostragem
Em primeiro lugar, o Candidato A seria virtualmente eleito no primeiro

turno com no mínimo 53% dos votos.
E mais, não há como se saber qual dos seis candidatos teria mais votos se
a eleição fosse realizada naquele dia. O candidato B, por exemplo, poderia
ter 4% dos votos e o candidato H poderia ter 6% dos votos. Essa é a leitu-
ra correta do resultado da pesquisa de intenção de votos realizada. Não há
outra leitura possível.
O que aconteceu então? A amostra de 405 é muito pequena para garantir

melhor precisão.
Um resultado como esse pode ser útil para informar que no momento
o Candidato A seria eleito no primeiro turno. Só isso. Em momentos mais
próximos da eleição essa margem de erro terá que ser necessariamente
diminuída, com o consequente aumento do tamanho da amostra.
Também em situações em que os candidatos estão mais próximos, uma

pesquisa como essa pode ser não informativa. Um candidato com 55% dos
votos pode perder para um candidato com 45% dos votos, por exemplo.
Quanto maior a precisão desejada, maior deve ser o tamanho da amostra.
De outra forma, quanto menor a margem de erro, maior será o tamanho

da amostra.
A determinação da margem de erro é feita antes da realização da pes-

quisa para se calcular o tamanho da amostra. A margem de erro é escolhida
pelo pesquisador e será do tamanho necessário para que possa discriminar
as medidas que serão realizadas. Não adianta tomar uma amostra pequena
que não consiga ser sensível de observar pequenas diferenças. No entanto,
se essa escolha implicar em uma amostra muito grande em que não se tenha
recursos para a realização da pesquisa, ela pode ficar inviabilizada.
Porque dizer que um candidato terá 60% dos votos, mais ou menos
30% de precisão, significa dizer que o candidato pode ter entre 30% e 90%
dos votos. Esse é um resultado que realmente não interessa porque não é
informativo.
114
Amostragem
Matematicamente pode-se dizer que o desvio é inversamente proporcio-

nal ao tamanho da amostra, lembrando, no entanto, que essa não é uma
relação linear. Se d é o desvio e n o tamanho da amostra, temos a relação:
d n
O erro estatístico
O erro estatístico é a probabilidade de sortear uma amostra que não seja
representativa da população. Toda vez que se faz um sorteio o risco de que a
amostra não represente a população está presente.
Para ilustrar essa ideia, suponha uma população de tamanho quatro,

composta pelos elementos A, B, C e D, colocados assim em ordem crescente
de medida. Suponha que estes quatro elementos são pessoas em que A é o
mais novo e D, o mais velho.
Quantas amostras de dois elementos são possíveis de serem sorteadas?
Esse número pode ser calculado através da determinação da combinação

de quatro elementos dois a dois: C4,2 = 6.
As possíveis combinações são:
AB, AC, AD, BC, BD, CD
Qual é a probabilidade de cada uma delas serem sorteadas? É de 1 em

6, ou 1/6. As amostras derivadas das combinações AB e CD parecem não re-
presentarem bem a população. A primeira subestimaria a média de idade da
população e a segunda a superestimaria. As melhores combinações seriam
possivelmente AD e BC, mas também AC e BD poderiam trazer resultados
bastante razoáveis.
Então, qual seria a probabilidade de tomar-se uma amostra “ruim”, que

não representa a população? Seriam 2/6, correspondentes às amostras AB e
CD. Essa probabilidade é de 1/3 = 0,33. Então, o nível de confiança associado
a essa amostragem é de 67% (100 – 33) e o erro estatístico é de 0,33.
115
Amostragem
Um erro estatístico de 33% é muito alto. É claro que isso é só uma simu-
lação para ilustrar o significado de erro estatístico. Com uma população tão
pequena não faz qualquer sentido fazer um procedimento de amostragem.
No entanto, a informação que se tira dessa discussão é a de que quanto
menor for o erro estatístico, maior deverá ser o tamanho da amostra. Ou,
ainda, quanto maior for a confiança desejada, maior deverá ser o tamanho
da amostra.
O erro estatístico está relacionado com o escore “z” da tabela da distribui-

ção normal padrão. Quanto menor o erro, maior será “z” e, por consequência,
maior será o tamanho da amostra. Se o erro estatístico for designado por “α”, o
nível de confiança será (1 – α)x 100%. Maior confiança implica maior tamanho
da amostra. Matematicamente, podemos estabelecer a seguinte relação:
α (1 – α) z n
Que valor deve ser estabelecido para o erro estatístico? Essa determi-
nação depende da gravidade de cometer-se tal erro. Em uma pesquisa de
verificação da qualidade de componentes de avião em uma fábrica, pode-
-se fazer uma inspeção de qualidade nas mesinhas de lanche do avião com
um erro estatístico mais dilatado do que de um componente de vedação da
janela. Nesse último caso, o erro deve ser igual a zero e, portanto, a inspeção
deve ser realizada em todas as unidades. Nesse caso, a amostra deverá ser do
tamanho da população.
Em pesquisas eleitorais é muito comum trabalhar-se com um erro de 5%

ou uma probabilidade de 1/20 de que a amostra não seja boa, o que repre-
senta uma probabilidade muito pequena. Para construir uma ideia intuitiva
por comparação, a probabilidade de acertar o número na face superior de
um dado é de 1/6. Imagine um dado de 20 lados.
Mas ainda com um erro tão pequeno, é possível tomar uma amostra ruim
ou não representativa da população? É possível sim, mas muito raro. O pes-
quisador mais experiente percebe nas primeiras determinações dos resulta-
dos da amostragem se a amostra pode ser ruim. Se em uma pesquisa eleito-
ral, a grande maioria dos entrevistados for muito jovem, ou se, por exemplo,
a amostra contemplou um número excessivamente grande de homens ou
de mulheres, por exemplo, em torno de 80%, deve-se desconfiar do proces-
so amostral, haja vista que é sabido que as mulheres são somente um pouco
mais do que 50% da população.
116
Amostragem
A variabilidade
A variabilidade é um componente importante na determinação do ta-
manho da amostra. Talvez o mais simples processo de amostragem seja o
de exame de sangue. Tira-se uma pequena amostra do sangue e determina-
ções completas sobre o tipo de sangue, o fator RH, a saúde da pessoa, entre
outras verificações, podem ser feitas. Isso porque o sangue é uma substân-
cia homogênea e uma simples gota representa todo o volume de sangue
do corpo humano.
Por outro lado, populações heterogêneas exigirão maior número de ele-

mentos da amostra para que ela possa captar as diferenças entre esses com-
ponentes da população.
A variabilidade pode ser medida através da variância ou do desvio-pa-

drão, sua raiz quadrada. Matematicamente pode-se estabelecer uma relação
direta entre o tamanho da amostra e o desvio-padrão, ou seja:
σ n
O problema aqui está em determinar um valor estimativo para o desvio-

-padrão, porque uma vez que a pesquisa ainda não foi feita e precisaremos
dessa medida para o cálculo do tamanho da amostra, enfrentamos um pro-
blema circular. Existem algumas soluções de contorno para esse problema.
A primeira é “emprestar” o resultado de uma pesquisa anterior semelhante
a que se está realizando. A segunda é buscar uma estimativa para o desvio-
-padrão através da realização de uma amostra piloto. E a terceira é obter essa
informação através de algum tipo de simulação. Há varias possibilidades
para isso. Apresentaremos duas.
A primeira simulação consiste em considerar um intervalo onde aproxi-

madamente 95% dos elementos da população estariam concentrados. Esse
intervalo pode ser associado à quantidade ± 1,96 σ da tabela normal padrão.
Então, o comprimento desse intervalo seria de aproximadamente 4 σ. Tería-
mos aí então uma forma indireta de obter um valor aproximado para σ.
Uma outra simulação é possível quando se trata de obter uma estimativa

para o desvio-padrão ou a variância em uma pesquisa que envolve propor-
ções. Nesse caso, a variância é dada pelo produto de p por (1–p). O maior
valor possível para esse produto é quando p for igual a 0,5. Observe, por
117
Amostragem
exemplo, que se p for igual a 0,3, então (1–p) = 0,7 e o produto será 0,21.
Assim, quando tomamos 0,5 . 0,5 = 0,25 obtemos maior valor possível para a
variância, garantindo então que no mínimo o tamanho da amostra calculado
terá os valores de “desvio” e “erro de amostragem” estabelecidos a priori.
Essa simulação vale para o caso em que o confronto ocorre entre dois
candidatos, pois aí se tem uma distribuição Bernoulli, cuja expressão da vari-
ância é dada pelo produto de p por (1–p). Quando se tem um maior número
de candidatos, esse cálculo pode ser aprimorado pela determinação da vari-
ância máxima de uma distribuição multinomial. Mas essa aproximação pela
distribuição Bernoulli pode ser realizada se for feita a consideração de um can-
didato contra todos os demais. No geral, não há uma mudança muito grande
na determinação do tamanho da amostra ao se fazer essa consideração.
Determinação do tamanho da amostra

Estabelecidos os principais componentes para a determinação do tama-
nho da amostra, podemos construir uma expressão matemática de forma
intuitiva a partir das relações de proporcionalidade verificadas.
Vimos que o tamanho da amostra é diretamente proporcional ao nível de

confiança (que pode ser expresso através do valor “z” da distribuição normal
padrão), também é diretamente proporcional ao desvio-padrão (σ) e inver-
samente proporcional ao valor estabelecido pelo desvio (d). Dessa forma,
uma possível expressão para o tamanho da amostra seria:
n = (z.σ)
d
Mas essa relação não é linear e é, portanto, necessária uma determinação

mais técnica da expressão para o cálculo do tamanho da amostra.
Partiremos do intervalo de confiança estabelecido inicialmente:
Pr ( p – d < P < p + d ) = 1 – α
Essa expressão é conhecida da inferência estatística, em que o desvio

pode ser expresso como:
d= z.σ
n
118
Amostragem
Isolando o valor de n da expressão anterior, teremos
n= z.σ 2
Essa é a expressão inicial para o cálculo do tamanho da amostra.

Exemplo:
Calcular o tamanho de uma amostra para uma pesquisa eleitoral na
cidade do Rio de Janeiro, com nível de confiança de 95% e desvio de mais
ou menos 5%.
Então, z = 2; σ2 = 0,5 e d = 0,05
2
n = 2 . 0,5 = 400
0,05
A rigor para exatos 5% de erro estatístico o valor de z é igual a 1,96, por-

tanto, o tamanho da amostra poderia ser de 385 pessoas que as margens
estabelecidas estariam asseguradas.
Como havia sido afirmado anteriormente, a relação entre o tamanho da
amostra e o erro estatístico, a “margem de erro” e a variabilidade não são line-
armente proporcionais. Pode-se verificar essa propriedade através de exemplos
em que a “margem de erro” ou o erro estatístico variem nas diferentes direções.
Exemplo:
Calcular o tamanho da amostra para “margens de erro” de 1%, 2%, 3%, 5%
e 10% e erros estatísticos de 1%, 5% e 10%.
Aplicando a expressão acima para esses dados e tendo os valores de z
correspondentes a 1%, 5% e 10%, respectivamente, 2,58, 1,96 e 1,64, obte-
mos os seguintes valores para o tamanho da amostra:
Margem Erro estatístico

de erro 0,01 0,05 0,1
0,01 16641 9604 6724
0,02 4160 2401 1681
0,03 1849 1067 747
0,05 666 384 269
0,10 166 96 67
119
Amostragem
Observe na tabela o valor encontrado anteriormente de 384 eleitores

para “margem de erro” de 5% e nível de confiança de 95% e compare com os
resultados vizinhos.
Custo da pesquisa
Supondo que a produção de cada entrevista seja em torno de R$10,00,
sendo já inseridos todo o trabalho de campo, seguros para os pesquisadores,
planejamento, análise dos dados, impressão e impostos. Uma pesquisa com
384 eleitores, ± 5% de desvio e nível de confiança de 95% custaria em torno
de R$3.840,00.
Em uma situação mais adequada, mudando somente a “margem de erro”

para ± 2% de desvio, o custo da pesquisa subiria para R$24.000,00. Mesmo
que se pudesse admitir um erro estatístico de 10%, ou seja, uma confiança
de 90%, o custo da pesquisa para um desvio de ± 2% seria de R$16.810,00.
De fato, o fator custo é extremamente limitante da potencialidade da pes-

quisa. Mas essa discussão chama a atenção para que a leitura da pesquisa
seja feita sempre olhando o nível de confiança e a “margem de erro” e não só
a estimativa pontual das percentagens.
No caso da pesquisa eleitoral discutida anteriormente, com a margem de

erro de 5% e nível de confiança de 95%, justifica-se pelo acerto do instituto
em verificar que a eleição se resolveria no primeiro turno. Para os demais
candidatos, que não o vencedor Candidato A, a pesquisa não informa com
precisão as suas situações.
Em datas mais próximas da eleição, quando o quadro pode tender a

uma aproximação dos demais candidatos, o instituto deverá modificar
sua estratégia, melhorando a precisão e consequentemente o volume da
amostra, resultando fatalmente num aumento do custo da pesquisa.
Há expressões estatísticas apropriadas que já embutem o custo da pes-

quisa no próprio cálculo do tamanho da amostra, mas é uma sofisticação
que pode ser contornada com um estudo comparativo como o que foi feito.
Há livros de estatística teórica que apresentam essas circunstâncias para o
caso de necessidade de aprofundamento da discussão.
Correção para populações finitas

As considerações realizadas até o momento não tomam em conta o tama-
nho da população. Ocorre que esses cálculos não mudam substancialmente
120
Amostragem
quando as populações são muito grandes. Os cálculos realizados para For-

taleza ou para São Paulo indicarão que não haverá mudança significativa no
cálculo do tamanho das amostras. Para efeito de cálculos estatísticos, essas
populações são consideradas infinitas.
A estratégia de campo pode sim ser modificada e dependendo do tipo de

amostragem a ser realizada o tamanho da amostra pode mudar um pouco.
Essa forma de cálculo do tamanho da amostra é adequada para quando

se realiza uma amostra aleatória simples, muito embora as mudanças para
outros tipos de amostragem possam não modificar de forma importante
essa determinação, ao menos de estudos particulares sobre a variabilidade
interna de estratos ou de conglomerados. Porém, esse estudo está fora do
escopo do presente livro.
Para populações finitas e sem reposição, é necessário que se proceda uma

correção. Ela é chamada de correção para populações finitas. A expressão do
desvio é modificada para
d= z.σ . N–n
n N–1
N–n
Esse último fator, , é a correção para a população finita. Pode-se
N–1
verificar que o cálculo de n pode então ser determinado por:
n= [N . σ2 . z2]
[(N – 1) . d2 + σ2 . z2]
De outra forma, pode-se determinar pela expressão original n’ e depois

corrigi-la multiplicando o valor obtido pela correção para população
finita. Então:
n’ = z.σ 2
N–n
n = n’ .
N–1
121
Amostragem
Exemplo:
Calcular o tamanho da amostra para uma pesquisa com 95% de confiança

e “margem de erro” de 5% para uma população de eleitores de (a) 5 000 e (b)
1 000 000:
O calculo de “n’ ” para os dois casos será de 384 eleitores. A correção para
uma população de 5 000 eleitores será de 0,9898 e o tamanho da amostra
corrigido será de 380 eleitores. Para a população de 1 000 000 a correção será
de 0,999 e o novo cálculo do tamanho da amostra será de 383,62, ou aproxi-
madamente 384 eleitores, não implicando, portanto, nenhuma modificação
no tamanho da amostra, uma vez que o fator de correção para populações
infinitas é praticamente igual à unidade.
1. Foi encomendado um estudo para avaliação de uma instituição de
Ensino Superior. Para isso, aplicou-se um questionário e foram obtidas
as respostas de 110 alunos.
Indique:
a) a variável em estudo;
b) a população em estudo;
c) a amostra escolhida.
2. Supondo que a variável escolhida de uma pesquisa seja nominal e a

população finita de 600 indivíduos (em que 60% dos indivíduos são
mulheres), e deseja-se trabalhar com um alfa (α) 5% e um erro amos-
tral de 7%. Calcule o tamanho da amostra.
3. Indique o tipo de amostragem realizada em cada um dos casos a seguir:
a) um fornecedor de peças para automóveis obtém uma amostra

de todos os itens de cada um de 12 fornecedores selecionados
aleatoriamente;
122
Amostragem
b) um fabricante de automóveis faz um estudo de mercado compre-

endendo testes de direção feitos por uma amostra de 30 homens
em quatro diferentes faixas etárias;
c) num processo de fabricação de certo componente de refrigera-

dores, o inspetor retira os 20 primeiros componentes fabricados e
os inspeciona.
4. Um jornal americano realizou uma pesquisa solicitando a resposta dos

leitores a esta questão: “ Você apoia o desenvolvimento de armas atômi-
cas que poderiam matar milhões de pessoas inocentes?” Relata-se que 20
pessoas responderam à pergunta, sendo 87% com não e 13% com sim.
Identifique as 4 maiores falhas da pesquisa.
5. Retirada uma amostra sistemática de 35 elementos a partir de uma po-

pulação ordenada formada de 2 590 elementos, qual ou quais dos ele-
mentos a seguir seria escolhido para pertencer à amostra, sabendo-se
que o elemento de ordem 1 546 (1 546.º) a ela pertence?
242.º 636.º 2 323.º 1 028.º 1 841.º 592.º
6. Uma população se encontra dividida em três estratos, com tamanhos,

respectivamente, N1 = 80, N2 = 120 e N3 = 60. Realizada uma amostra-
gem estratificada proporcional, 12 elementos foram retirados do pri-
meiro estrato. Qual o número total de elementos da amostra?
7. Uma indústria especializada em montagens de equipamentos indus-

triais recebeu 70 dispositivos de controle do fornecedor A e outros 30
dispositivos do mesmo tipo do fornecedor B. O aspecto relevante, que
se deseja controlar nesses dispositivos, é a resistência elétrica de certo
componente crítico. Vamos admitir que os 100 dispositivos recebidos
foram numerados de 1 a 100 ao darem entrada no almoxarifado, e
que os 70 primeiros foram aqueles recebidos do fornecedor A. Vamos
admitir, também, que os valores reais da variável de interesse (a resis-
tência elétrica do componente crítico) dos 100 dispositivos recebidos
sejam os seguintes, respectivamente na ordem de entrada no almoxa-
rifado (lê-se seguindo as linhas, tal como se lê um livro):
123
Amostragem
33 38 34 34 34 31 36 35 32 37
35 34 30 37 36 33 34 34 32 39
35 33 33 34 31 32 36 33 29 36
34 35 34 33 31 35 35 35 37 32
34 34 36 35 34 33 32 38 34 33
33 32 34 35 37 35 35 30 35 34
36 36 33 34 33 32 31 37 35 34
39 40 40 42 39 38 40 40 40 40
40 41 45 41 40 39 41 41 40 42
39 40 41 40 40 42 39 39 38 40
a) Retire uma amostra aleatória simples de 10 dispositivos, sem repo-

sição, utilizando a tabela de números aleatórios (do livro) a partir
da interseção da quinta linha com a oitava coluna. A seguir, calcule
a resistência elétrica média da amostra obtida.
b) Imagine que se pensasse em fazer uma amostragem estratificada.

Em sua opinião, seria isso razoável? Em caso afirmativo, indique
como você procederia, ainda utilizando os números aleatórios. Su-
ponha que o total de dispositivos a examinar na amostra continue
sendo 10.
c) Considere agora que tivesse sido utilizada uma amostragem estra-

tificada uniforme, num total ainda de 10 dispositivos examinados,
e que a média para o primeiro estrato foi 33,8 e para o segundo,
40,2. Em quanto você estimaria a média da população de 100 dis-
positivos?
d) Suponha agora que dos 70 dispositivos provenientes do fornece-

dor A tenha sido obtida uma amostra sistemática de 10 disposi-
tivos, sendo constante o período de retirada dos elementos para
a amostra e sendo conhecido que o segundo dispositivo a entrar
no almoxarifado (cujo valor da resistência é 38) pertencia a essa
amostra. Calcule a média para os valores observados.
124
Amostragem
Gabarito
1.
a) A avaliação da instituição.
b) Os alunos da instituição.
c) Os 110 alunos respondentes.
2. Como p = 0,6, N = 600, d = 0,07 e z = 1,96, então como a população é

finita, temos:
2 2
 z  1, 96 
n ' =   p.(1− p )∴ n´ =  (0, 6)(0, 4) = 189 ∴em que devemos
 d  0, 07 

aplicar o fator de correção para populações finitas, de tal forma que:
 ( N − n)   (600 − 189) 
n = n '.   onde n = 189.   ∴ n –157.
 (N − 1)   (600 − 1) 
3.
a) Conglomerados.
b) Estratificada.
c) Conveniência.
4.
a) O texto da questão é tendencioso e induz à resposta negativa.
b) O tamanho da amostra é pequeno (20 unidades).
c) Os entrevistados foram autosselecionados, ou seja, não houve

uma seleção aleatória por parte do jornal.
d) Como apenas 20 entrevistados responderam, os percentuais obri-

gatoriamente devem ser múltiplos de cinco. Logo, 87% e 13% não
são resultados possíveis.
125
Amostragem
N 2.590
5. Como a fração amostral será , então f.a. = = 74, isso significa
n 35
que os elementos da amostra foram retirados num intervalo de
74 unidades. Sendo assim, pertencerá à amostra o elemento Xi em
1 546 - X
que =número inteiro (corresponde ao número de intervalos
74
de 74 unidades distante do valor 1 546). Logo, o único elemento que
satisfaz essa condição é o 1 028º, conforme se observa no cálculo:
1 546 -1 028
=7
74
6. Existem várias formas de solução para essa questão, mas basicamente

a ideia é que a amostra mantenha a representatividade da população.
Sendo assim, temos que:
População Amostra
N1 = 80 n1 =12
N2 = 120 n2 =?
N3 = 60 n3 =?
N = 260 n =?
80 12
Então: PropN1 = = 0,3077, logo n1 = 0,3077 de n ∴ n = = 39,
260 0,3077
então:
120
como PropN2 = = 0, 4615, logo n2 = 0,4615 de n ∴ n = (0,4615).39
260
= 18.
Portanto, n2 = 18 e n3 = 39 – 12 – 18 = 9.
7.
a) Números selecionados: 46 21 28 15 31 36 35 56 88 65.
Resistências: 33 35 33 36 34 35 31 35 41 33.
Resistência média =
33 + 35 + 33 + 36 + 34 + 35 + 31+ 35 + 41+ 33 346
= = = 34, 6.
10 10
126
Amostragem
b) Sim, pois os valores das resistências correspondentes ao fornece-

dor B têm uma diferença clara em relação aos do fornecedor A, no
entanto, o comportamento é homogêneo dentro de cada um dos
fornecedores. Sendo assim, podemos tratar como dois estratos.
O procedimento para a estratificação seria manter na amostra

a representatividade observada na população, ou seja, 70% de
componentes do fornecedor A e 30% de componentes do forne-
cedor B. Dessa forma, teríamos numa amostra de tamanho 10 a
inclusão de sete componentes do fornecedor A e três componen-
tes do fornecedor B. No processo de seleção por meio da tabela de
números aleatórios, os componentes ordenados de 01 a 70 seriam
do fornecedor A e de 71 a 100 (00) do fornecedor B. Partindo da
quinta linha com a oitava coluna, obteríamos a seguinte amostra:
Números selecionados: 46(A) 21(A) 28(A) 15(A) 31(A) 36(A) 35(A).

Como já estão contemplados sete componentes do fornecedor A,
somente nos interessa, a partir de agora, a obtenção dos componen-
tes do fornecedor B. Logo, apenas participarão da amostra elemen-
tos que estejam entre 71 e 100 na sequência da tabela de números
aleatórios. Sendo assim, encontraremos os números 88, 86 e 98.
Resistências: : 33 35 33 36 34 35 31 41 39 39.
33 + 35 + 33 + 36 + 34 + 35 + 31+ 41+ 39 + 39 356
= = = 35, 6.
10 10
c) Nesse caso, foi utilizada uma amostra com cinco componentes de
A e 5 de B. O procedimento correto para realizar a estimativa da
média populacional seria corrigir os valores médios em função da
representatividade na população, ou seja:
(33, 8).70 + (40,2).30
Resistência média ( X ) = = 35,72 .
100
d) Como o 2.º elemento pertence à amostra e como a fração de amostra-
gem é sete , então a amostra é composta dos seguintes elementos:
Números selecionados: 02 09 16 23 30 37 44 51 58 65.
Resistências: 38 32 33 33 36 35 35 33 30 33.
38 + 32 + 33 + 33 + 36 + 35 + 35 + 33 + 30 + 33 338
= = = 33, 8.
10 10
127
Amostragem
128
Estimação
Problema
A Empresa ABC de Engenharia, Construções e Empreendimentos prima
pela qualidade de seus edifícios. Entre outros padrões, estabeleceu que a
resistência do concreto utilizado em suas construções nunca deverá ser infe-
rior a 200 Kgf/cm2. Todo o concreto a ser utilizado deverá então ser submeti-
do a um teste de resistência.
Ocorre que os testes de resistência do concreto são testes destrutivos e,

portanto, a única forma de realizá-los é através de um processo amostral em
que pequenas partes do concreto são submetidas a testes de ruptura. Para
cada betoneira são retiradas 10 quantidades de concreto que formarão os
corpos de prova. A média da resistência desses corpos de prova é determi-
nada e se supõe que o resultado encontrado seja representativo da média de
todo o concreto.
Como esse processo envolve certo nível de incerteza, não se pode garantir
de forma absoluta que o valor encontrado para a média de resistência dos
corpos de prova seja igual ao valor da resistência de toda a população.
Dois procedimentos podem ser realizados a partir do resultado amostral.

O primeiro é construir um intervalo em torno do valor da média amostral no
qual se possa afirmar, com certo nível de confiança, que o verdadeiro valor
da média populacional pertença a esse intervalo. O segundo procedimento
é o de testar se, com base na média amostral, o valor mínimo estabelecido de
resistência do concreto pode ser aceito.
Então, três procedimentos de estimação foram estabelecidos. O primeiro

é chamado de estimação pontual, em que o valor da média amostral é uma
estimativa da média populacional; a partir dele constroem-se os outros dois
procedimentos, um de estimação por intervalo, ou construção de um interva-
lo de confiança, e o último de testagem de hipóteses estatísticas.
De acordo com um importante conceito teórico da Estatística, o Teore-

ma Central do Limite, a distribuição de probabilidade amostral da média para
129
Estimação
tamanhos adequados das amostras pode ser assumida como tendo distri-
buição normal, independentemente da forma da distribuição populacional.
A distribuição normal joga então um papel central para a realização de testes
de hipóteses. Ela tem a mesma importância na construção de intervalos de
confiança.
O estudo das distribuições amostrais antecede então o estudo da

estimação.
No geral, estamos interessados em verificar como uma variável de uma deter-
minada população se comporta. Em um estudo de mercado sobre a aceitação de
um novo artigo alimentar, pode ser interessante conhecer variáveis que caracte-
rizem o estado nutricional da população a quem o produto possa estar destina-
do. O peso da população, por exemplo, pode ser uma dessas variáveis.
A caracterização do peso da população pode ser feita através de uma

distribuição de frequências que pode aproximar uma distribuição de probabi-
lidades. Essa distribuição tem algumas características importantes, como o
valor da média, do desvio-padrão e da forma da distribuição, além de poder
ser discreta ou contínua. No capítulo anterior, estudamos as distribuições
discretas. Neste capítulo, estudaremos algumas distribuições contínuas de
grande utilidade para se fazer inferência. Vamos nos restringir às distribui-
ções contínuas mais importantes para o propósito de estimação contido
neste capítulo: a distribuição normal e a distribuição “t” de Student.
Quando fazemos um processo de amostragem, verificamos em uma

única amostra o valor de uma estatística, a média do peso dos elementos
da amostra, por exemplo, e tentamos inferir algo sobre o parâmetro da po-
pulação, nesse caso, a média da população. Então, a média da amostra é um
estimador da média da população.
Para fazermos isso, precisamos conhecer algumas propriedades teóri-

cas do estimador e a forma de fazer esse estudo é através de simulações
de várias amostragens. Reforçando o conceito: na prática, só retiramos uma
amostra, mas para construir um corpo teórico que nos auxilie a inferir sobre
o parâmetro, construímos teoricamente várias amostragens.
130
Estimação
Se fizéssemos várias amostragens, cada amostra teria possivelmente um

valor diferente como sua média. Teríamos, assim, uma população de médias
amostrais. Podemos calcular dessa população de médias amostrais a sua
média e o seu desvio-padrão e também verificar qual é a distribuição dessas
médias. Construímos, assim, a distribuição de probabilidades das médias
amostrais, que como toda distribuição tem sua média e seu desvio-padrão.
Distribuição amostral
A distribuição amostral é a distribuição de probabilidades de alguma esta-
tística de cada amostra. Assim, podemos determinar a distribuição amostral
das médias, a distribuição amostral das proporções e ainda a distribuição
amostral das variâncias ou dos desvios-padrões.
Média e variância da
distribuição amostral das estimativas
Cada distribuição dessas tem uma média e uma variância. A média da dis-
tribuição amostral das estimativas também é conhecida como valor espera-
do da distribuição amostral das estimativas. O desvio-padrão da distribuição
amostral das estimativas, que é a raiz quadrada da variância da distribuição
amostral das estimativas, é conhecido como erro-padrão das estimativas.
Essas estimativas podem ser os valores assumidos pelas médias ou pelas

proporções, por exemplo.
Estimação por ponto

Uma estimativa pontual é um simples valor de um estimador utilizado para
estimar o verdadeiro valor do parâmetro correspondente. A média amostral
é um estimador da média populacional. Poderíamos eventualmente usar a
mediana para estimar a média populacional, mas a média da amostra é um
estimador com qualidades que a mediana da amostra não tem.
Estimação por intervalo

A estimativa intervalar de um parâmetro populacional é um intervalo
entre dois valores, o limite inferior e o limite superior do intervalo, entre os
quais temos certo nível de confiança que o parâmetro estará.
131
Estimação
Nível de confiança e erro amostral

O erro amostral é a probabilidade de que a amostra não represente a po-
pulação. No geral, é representado pela letra grega α. O nível de confiança é o
complemento do erro amostral, no geral é dado em percentagem e, portan-
to, sua representação é (1 – α) . 100%. Um erro amostral de 0,05 tem como
correspondente de nível de confiança o valor 95%.
Teste de hipóteses estatísticas

O teste de hipóteses é realizado com o estabelecimento de duas hipóteses
contrapostas. Cada hipótese é constituída de uma declaração acerca do valor
do parâmetro. Elas são chamadas de hipótese nula e hipótese alternativa.
A hipótese nula, denotada por H0, é a hipótese de que o parâmetro em

questão seja igual a certo valor. Por exemplo, H0 = Um automóvel tem um
consumo médio de 10km/litro, ou seja, H0: μ = 10km/litro. A hipótese alter-
nativa, denotada de H1, pode ser bilateral, H1: μ ≠ 10km/litro, ou unilateral, H1:
μ > 10 km/litro. O teste será unilateral ou bilateral dependendo do contexto
do problema. Se tivermos alguma informação sobre o comportamento dos
dados a partir de uma base teórica, devemos realizar um teste unilateral.
Estatística do teste
Os dados da amostra fornecerão os valores das estimativas dos parâme-
tros. A partir da determinação desses valores e utilizando-se a base teórica
da distribuição amostral estabeleceremos uma estatística para o teste. Ve-
rificaremos em que nível de probabilidade poderemos rejeitar H0 ou não. Esse
procedimento será explicado em detalhes mais adiante no capítulo.
Erro tipo I e erro tipo II

A probabilidade de cometer-se erro tipo I é associada ao erro estatístico, e,
portanto, chamada de α. É também a probabilidade de rejeitarmos H0 quando
a hipótese nula é verdadeira. O erro tipo II, chamado de β, é a probabilidade de
aceitarmos H0 quando a hipótese nula é falsa. No geral, controla-se o erro tipo
I por ser considerado o mais grave e por isto é o mais utilizado para o cálculo
do tamanho da amostra.
132
Estimação
Região crítica e p-valor

Associado à estatística do teste, podemos estabelecer uma região crítica
para a aceitação de H0 através do cálculo de valores críticos associados a um
nível preestabelecido do tamanho do erro aceitável.
Alternativamente, podemos, depois de calcular o valor da estatística do

teste, verificar o nível de erro associado através da determinação do p-valor. Os
dois procedimentos se assemelham e serão discutidos mais tarde no capítulo.
A distribuição normal
Como vimos no tratamento de dados, quando construímos uma distri-
buição de frequências a partir de observações, podemos aproximá-la a uma
distribuição de probabilidades. Os dados podem levar a diferentes tipos de
distribuição, uma delas exerce um papel central na teoria e na prática esta-
tísticas. É a distribuição normal.
Propriedades da curva normal

A distribuição normal é uma distribuição contínua. Enquanto as distribui-
ções discretas assumem valores a partir de números inteiros, as distribuições
contínuas assumem todos os valores entre os números inteiros, ou seja, seu
domínio é o dos números reais. A distribuição normal, particularmente, tem
como domínio qualquer valor real entre menos infinito e mais infinito.
Uma característica importante da distribuição normal é que ela é uma

função de x que pode ser inteiramente determinada com o conhecimen-
to dos valores da média e do desvio-padrão. Fala-se que X tem distribuição
normal com média µ e desvio-padrão σ. A sua expressão matemática é dada
pela função:
–1/2
x–μ
f(x) = 1 .ξ σ
σ 2π ,–∞≤x≤∞
Nessa equação, a média μ e o desvio-padrão σ, que determinam o ponto

central e a dispersão da distribuição em torno da média, são os dois parâme-
tros da distribuição normal. Então, substituindo x por seus valores obtém-se
os valores de f(x) e pode-se, então, traçar o gráfico da função.
133
Estimação
O seu aspecto é o de um sino, por isso muitas vezes é chamada de curva

do sino.
f(x)
μ x
O valor central é o da média μ, e a curva é simétrica em relação a μ. A área

total sob a curva é igual à unidade. Nos pontos de inflexão de cada lado da
curva temos o valor de X igual a μ – 1σ e μ + 1σ. E a curva é assintótica ao
eixo X, ou seja, ela se aproxima do eixo X em – ∞ e em + ∞. Representamos
essa distribuição como X ~ N(μ;σ). Em muitos livros, a representação leva em
conta o valor da variância. Nesses casos, a notação fica X ~ N(μ;σ2).
Áreas abaixo da curva normal

Como a área abaixo da curva é igual a 1, podemos associar áreas a valores
de probabilidade, a exemplo do que fizemos com o histograma. Assim, a pro-
babilidade de sortearmos um elemento da população cujo valor da variável
seja maior do que μ e de 0,5 ou 50%. Da mesma forma que 50% da área da
curva está associada a valores menores do que μ. Esses fatos podem ser des-
critos através das expressões:
P( X ≤ μ ) = 0,5 e P(X ≥ μ) = 0,5
f(x)
μ μ + 1σ x
Observe que essas probabilidades são complementares.
134
Estimação
Dessa forma, se pudermos calcular as áreas entre dois pontos da curva,

essa área será igual à probabilidade de sortearmos um elemento cujo valor
esteja entre esses dois pontos.
Vejamos algumas probabilidades associadas a algumas áreas particulares:
P(– ∞ ≤ X ≤ μ + 1 σ) = 0,8413, isto é, a área sob a curva entre – ∞ e μ + 1 σ

é sempre de 84,13%, independente dos valores de μ e de σ.
f(x)
μ + 1σ x
Outras probabilidades particulares importantes:
P(– ∞≤ X ≤ μ + 2 σ) = 0,9772
f(x)
μ + 2σ x
P(– ∞≤ X ≤ μ + 3 σ) = 0,9987
f(x)
μ + 3σ x
135
Estimação
P(– ∞ ≤ X ≤ μ + 4 σ) = 0,9999
f(x)
μ + 4σ
x
Observe que embora X varie de – ∞ até + ∞, praticamente 100% da área

da curva está entre – ∞ e + 4 σ. Observaremos mais tarde que, na verdade, o
intervalo (– 4 σ, + 4 σ) abrange quase 100% de toda área.
Exemplo:
Considerando o exemplo do estudo nutricional, se a variável considerada

for o peso da população com média 70kg e desvio-padrão 10kg, ao sortear-
mos um elemento ao acaso dessa população, poderemos calcular algumas
probabilidades, por exemplo:
Probabilidade de sortearmos uma pessoa com mais de 70kg, P(X ≥

70) = 0,5.
f(x)
70 x
Probabilidade de sortearmos uma pessoa entre 60kg e 80kg, P(60 ≤ X ≤

80) = P(70 –10 ≤ X ≤ 70 + 10) = P(μ – 1σ ≤ X ≤ μ + 1σ) = P( – ∞ ≤ X ≤ μ + 1σ) –
P( – ∞ ≤ X ≤ μ – 1σ ).
136
Estimação
Mas, P( – ∞ ≤ X ≤ μ + 1σ) = 0,8413 e P( – ∞ ≤ X ≤ μ – 1σ) = 1 – 0,8413 =

0,1587, veja que as áreas são simétricas ao ponto central μ.
P(60 ≤ X ≤ 80) = 0,8413 – 0,1587 = 0,6826
f(x)
60 80 x

80) = P(70 ≤ X ≤ 70 + 10) = P(– ∞ ≤ X ≤ μ + 1σ) – P(– ∞ ≤ X ≤ μ) = 0,8413 – 0,5
= 0,3413. Lembre-se novamente que as áreas são simétricas em relação a μ,
então P(– ∞ ≤ X ≤ μ) = 0,5.
f(x)
70 80 x
Probabilidade de sortearmos uma pessoa com menos de 60kg, P(X ≤ 60)

= P(X ≤ 70 – 10) = P(X ≤ μ – 1σ) = 1 – 0,8413 = 0,1587.
f(x)
60 x
137
Estimação

90) = P(70 – 10 ≤ X ≤ 70 + 20) = P(μ – 1σ ≤ X ≤ μ + 2σ) = P(– ∞ ≤ X ≤ μ + 2 σ)
– P(– ∞ ≤ X ≤ μ – 1σ) = 0,9772 – 0,1587 = 0,8185.
f(x)
60 90 x

100) = P(70 – 10 ≤ X ≤ 70 + 30) = P(μ + 1σ ≤ X ≤ μ + 3σ) = P( – ∞ ≤ X ≤ μ + 3σ)
– P( – ∞ ≤ X ≤ μ + 1σ) = 0,9987 – 0,8413 = 0,1574.
f(x)
80 100 x
Duas observações devem ser feitas nesse ponto:
(I) A probabilidade em um ponto em uma distribuição contínua é sempre

igual a zero. Não há como calcularmos área. Então, por ser indiferente de-
terminamos por convenção que no cálculo dessas probabilidades, usa-
remos um intervalo aberto à esquerda. Isto é, P(μ – 1σ ≤ X ≤ μ + 1σ) = P(μ
– 1σ < X ≤ μ + 1σ). E essa convenção vale para todos os intervalos.
(II) Precisamos sempre verificar a quantos desvios-padrões está o valor de

X em relação à média. Seja X ~ N(70,10). Então em P(60 ≤ X ≤ 90) = P(70
– 10 ≤ X ≤ 70 + 20) = P(70 – 1 σ ≤ X ≤ 70 + 2 σ). Para determinar o valor
“z” de quantos desvios-padrões 90 está distante da média, fazemos 90
= μ + zσ. Isolando “z”, temos z = (90 – μ)/σ. Como μ = 70 e σ = 10, temos
que z = (90 – 70)/10 = 2. Ou seja, “z” é o número de desvios-padrões
que separam a média do valor desejado.
138
Estimação
Normal padrão
Vimos que se soubermos quantos desvios-padrões separam a média dos
valores para os quais desejamos determinar as probabilidades, basta saber a
área associada ao número de desvios-padrão. Isso equivale a trabalhar com
uma distribuição normal com média 0 e desvio-padrão 1. Essa distribuição
é chamada de distribuição normal padrão e a representamos por Z ~ N(O,1),
em que z = (X – μ)/σ.
A forma como foram determinadas as probabilidades fornecidas anterior-

mente, entre – ∞ e a média mais um desvio-padrão, entre – ∞ e a média mais
dois, três e quatro desvios-padrões é a forma usual no cálculo de áreas de
funções, que é o cálculo da integral da função entre – ∞ e μ + 1σ da função
normal padrão para o primeiro caso. O mesmo vale para os demais casos. A
área entre – ∞ e μ + 2σ foi determinada pelo cálculo da integral definida da
função f(x) da expressão da distribuição normal padrão, tendo como limites
– ∞ e μ + 2σ.
Então, a probabilidade P(X ≤ 60) = P(X ≤ μ – 1 σ ) = P(– ∞ ≤ X ≤ μ – 1 σ) =

P(– ≤ Z ≤ 1) e a integral definida de f(x) de – ∞ e – 1 fornecerão o valor exato
dessa probabilidade. Está claro que esse cálculo seria tedioso, além de envol-
ver um procedimento altamente complexo de cálculo de integrais.
Aqui vale ressaltar uma característica importantíssima da distribuição

normal. Independentemente dos valores da média e do desvio-padrão,
essas áreas são sempre as mesmas. Queremos dizer com isso que para qual-
quer população normal a área entre – ∞ e μ – 1 σ será sempre a mesma. Se
temos duas populações normais, a primeira X com média 70 e desvio-padrão
10 e a segunda Y com média 20 e desvio-padrão 2, as probabilidades P(X ≤ 60)
e P(Y ≤ 18) serão iguais, porque ambas representam P(X ≤ μ – 1 σ) = P(Z ≤ 1).
Se a área entre – ∞ e 1 σ é 0,8413, área correspondente à função de distribui-

ção acumulada, então a área entre μ e (μ + 1 σ) será 0,8413 – 0,5 = 0,3413.
f(x)
μ μ + 1σ x
139
Estimação
Função de distribuição
acumulada da distribuição normal
Como vimos, a área acumulada entre – ∞ e um certo valor de Z pode
ser utilizada para calcularmos as probabilidades correspondentes. Então, se
queremos P(μ – 1 σ ≤ X ≤ μ + 2 σ), devemos calcular P(X ≤ μ + 2 σ ) – P(X ≤
μ – 1 σ). Essa diferença é igual a P(Z ≤ 2) – P(Z ≤ – 1) = F(2) – F(–1).
f(x)
–1 2 x
A tabela D representa as áreas de uma distribuição normal padrão acumula-

da. No exemplo anterior temos que F(2) – F(1) = 0,9772 – 0,1587 = 0,8185.
Refazendo o exemplo do estudo nutricional, se a variável considerada for

o peso da população com média 70kg e desvio-padrão 10kg, e se sortearmos
um elemento ao acaso dessa população, poderemos calcular probabilidades
utilizando a tabela D, por exemplo:
Probabilidade de sortearmos uma pessoa com mais de 70kg:
P(X ≥ 70) = 1 – P(X ≤ 70) = 1 – P[(X – μ)/ σ ≤ 70 – μ)/ σ] = 1 – P[Z ≤ 70 – 70)/

10] = P(Z ≤ 0) = F(0) = 0,5.
f(x)
70 x
140
Estimação
Probabilidade de sortearmos uma pessoa entre 60kg e 80kg:
P(60 ≤ X ≤ 80) = P[(60 – μ)/ σ ≤ (X – μ)/ σ ≤ 80 – μ)/σ] = P[(60 – 70)/10 ≤ Z ≤

(80 – 70)/10] = P(– 1 ≤ Z ≤ 1) = F(1) – F(– 1) = 0,8413 – 0,1587 = 0,6826.
f(x)
60 80 x
Probabilidade de sortearmos uma pessoa entre 70kg e 80kg:
P(70 ≤ X ≤ 80) = P[(70 – 70)/10 ≤ Z ≤ (80 – 70)/10] = P(0 ≤ Z ≤ 1) = F(1) –

F(0) = 0,8413 – 0,5 = 0,3413.
f(x)
70 80 x
Probabilidade de sortearmos uma pessoa com menos de 60kg:
P(X ≤ 60) = P[Z ≤ (60 – 70)/10] = P(Z ≤ – 1) = 0,1587.
f(x)
60 x
141
Estimação
Probabilidade de sortearmos uma pessoa entre 60kg e 90kg: P(60 ≤ X ≤

90) = P[(60 – 70)/10 ≤ Z ≤ (90 – 70)/10) = P(– 1 ≤ Z ≤ 2) = F(2) – F(– 1) = 0,9772
– 0,1587 = 0,8185.
f(x)
60 90 x
Probabilidade de sortearmos uma pessoa entre 80kg e 100kg: P(80 ≤ X ≤

100) = P[(80 – 70)/10 ≤ Z ≤ (100 – 70)/10] = P(1 ≤ Z ≤ 3) = F(3) – F(1) = 0,9987
– 0,8413 = 0,1574
f(x)
80 100 x
Observe que podemos calcular qualquer probabilidade, mesmo que os

números não sejam redondos. Por exemplo:
P(56,5 ≤ X ≤ 64,8) = P[(56,5 – 70)/10 ≤ Z ≤ (64,8 – 70)/10] = F(– 0,52) –

F(–1,35) = 0,3015 – 0,0885 = 0,2130.
f(x)
56,5 64,8 x
142
Estimação
Distribuição amostral das médias

Vamos utilizar, a partir de agora, o conhecimento adquirido no estudo
do cálculo de probabilidades de uma distribuição normal na discussão da
distribuição amostral de algumas estatísticas, começando pela distribuição
amostral das médias.
Se em uma fábrica de lâmpadas desejamos fazer inferências para toda a

produção de lâmpadas de um lote, retiramos uma única amostra de lâmpa-
das e verificamos alguma variável de interesse, o tempo de vida média das
lâmpadas, por exemplo.
Para fazermos estimativas acerca dessa variável, utilizando uma só amos-

tra, precisamos construir um corpo teórico sobre o comportamento dessa
amostra. Se tirarmos várias amostras de tamanho 10, por exemplo, e calcu-
larmos a vida média de cada uma dessas amostras, poderemos construir uma
distribuição das médias amostrais chamada de distribuição amostral empíri-
ca. No entanto, se retirarmos todas as amostras possíveis de tamanho 10 e
calcularmos a média de cada amostra, poderemos determinar a distribuição
amostral teórica. O estudo dessa distribuição amostral teórica é que nos aju-
dará a construir o corpo teórico para a realização da estimação do parâmetro
vida média das lâmpadas de todo o lote.
Amostragem de populações normais

A primeira amostra de 10 elementos terá certa média de vida igual a X 1,
a segunda amostra, X 2, e assim por diante. Podemos calcular a média dessas
médias e o desvio-padrão delas. Se a variável vida útil das lâmpadas for distri-
buída normalmente com média μ e desvio-padrão σ, então a variável aleatória
“média X de uma única amostra aleatória de tamanho n” será também normal-
mente distribuída com média μ X = μ e desvio-padrão igual a:
σ = σ
X n
O desvio-padrão da distribuição amostral da estimativa é chamado de

erro-padrão da estimativa.
143
Estimação
Observe que se o tamanho de cada amostra for 100 ao invés de 10, o erro
padrão σ terá o seu valor diminuído, uma vez que o denominador da razão
X
que o caracteriza ficará aumentado. Isso ocorre porque amostras maiores
tenderão a representar melhor a média da população.
Amostragem de populações não normais

Muitas das distribuições na área de economia e negócios não têm distri-
buição normal. Qual é, então, a natureza da distribuição amostral de X?
Essa resposta pode ser estabelecida pelo talvez mais importante teore-
ma da Estatística, o Teorema Central do Limite (TCL). É bom deixar claro que
embora muitas traduções falem em Teorema do Limite Central, quem é cen-
tral é o teorema e não o limite, por isso a primeira denominação parece ser
a mais adequada.
Esse teorema estabelece que se uma variável aleatória X, seja discreta ou

contínua, tem média μ e desvio-padrão finito σ, então a distribuição de pro-
babilidades de X se aproxima da distribuição normal com média μ e desvio-
-padrão σ/ n à medida que n cresça ilimitadamente.
Uma outra forma de estabelecer-se o teorema é dizer que a distribuição de
z = (X – μ)
σ tem distribuição normal padrão à medida que n cresça
n
σ
ilimitadamente, em que é σX .
n
Duas observações são importantes nesse momento:
(I) para distribuições que não são extremamente assimétricas, valores de

n aproximadamente iguais a 30 já garantem a normalidade;
(II) estamos falando da distribuição de X quando n é uma grande amos-

tra e não de X, a variável aleatória original. Muitas variáveis aleatórias,
como já foi afirmado, nunca terão distribuição normal por mais que
a amostra cresça. Veja, por exemplo, o caso da distribuição de renda,
que tem uma distribuição exponencial negativa. Por mais que tome-
mos uma amostra imensa, a distribuição da variável aleatória renda
nunca terá uma distribuição normal.
144
Estimação
Exemplo para população normal:
Um gerente de produção de uma gráfica está pensando em comprar

uma nova impressora para cartões. Em média, essas máquinas podem im-
primir 1 900 cartões por dia com um desvio-padrão de 200. Assuma que o
número de cartões impressos por dia tenha uma distribuição normal.
a) Determine a probabilidade em que uma máquina possa imprimir me-

nos do que 1 850 cartões por dia.
b) Se 25 máquinas são escolhidas aleatoriamente da revendedora, deter-

mine a probabilidade que o número médio de cartões impressos por
dia seja menor que 1 850.
Antes de calcularmos os valores das probabilidades acima, vamos tentar

verificar intuitivamente qual das duas probabilidades será a menor. O valor do
desvio-padrão é conhecido, e no primeiro caso estamos trabalhando com σ; no
segundo caso, trabalharemos com σ = σ . Então, a dispersão em torno

X
n
da média no primeiro caso será maior do que no segundo e a área abaixo de
um dado valor de X será maior do que para uma distribuição mais concentra-
da, como é o segundo caso. Logo, esperamos que a primeira probabilidade
seja maior do que a segunda. Vejamos:
a) P(X ≤ 1 850) = P((X – μ) / σ ≤ (1 850 – 1 900) / 200) = P(Z ≤ – 50/200) =

P(Z ≤ – 0,25) = 0,4013.
b) P(X ≤ 1 850) = P((X – μ) / (σ/√ 25) ≤ (1 850 – 1 900) / (200/5) = P(Z ≤ –

50/40) = P(Z ≤ – 1,25) = 0,1056.
De fato, a nossa intuição estava correta.
Exemplo para população não normal:
Um gerente de vendas está considerando uma nova campanha de vendas.

É sabido que a média de consumo por cliente é de R$200,00 com desvio-pa-
drão de R$15,00. Sabe-se que a distribuição das vendas não se comporta se-
gundo uma distribuição normal; uma amostra de 36 clientes foi escolhida
aleatoriamente. Determine a probabilidade em que a média de consumo
será maior do que R$204,00.
145
Estimação
P(X > 204) = 1 – P(X ≤ 204) = 1 – P(Z ≤ (204 – 200) / (15/ 36 )) = 1 – P(Z ≤
1,6) = 1 – 0,9452 = 0,0548
Distribuição amostral das proporções

Muitas vezes é conveniente considerar a proporção de ocorrências. Pode-
mos converter o número de ocorrências X para proporções, dividindo-o pelo
tamanho da amostra. A proporção amostral será denotada por p. Então:
p= x
n
Suponha o seguinte exemplo: Em uma sorveteria entraram cinco pesso-

as. Elas podem comprar sorvetes com probabilidade p = 0,10, ou não com-
prar. Isso constitui um ensaio de Bernoulli. A distribuição de probabilidades
que associa o número de pessoas que podem comprar sorvete é dada na
tabela a seguir, cujas probabilidades foram retiradas da tabela B da distribui-
ção binomial:
X 0 1 2 3 4 5
f(X) 0,59 0,33 0,07 0,01 0,00 0,00
Então, por exemplo, a probabilidade de que das cinco pessoas que en-
traram na sorveteria duas comprem sorvetes é de 0,07, destacado na tabela
acima.
Essa mesma distribuição de probabilidades poderia ser apresentada pela

proporção de pessoas que compraram sorvetes. Verifique que duas em cinco
pessoas significa 40% das pessoas comprando sorvete, indicado por 0,40:
p 0 0,20 0,40 0,60 0,80 1,00
f(p) 0,59 0,33 0,07 0,01 0,00 0,00
Observe que o número de ocorrências em uma amostra de tamanho n é

dada por X = n. p. Vale chamar a atenção para a diferença de significado de
“p” da distribuição binomial e p a proporção na amostra.
Calculando a esperança (média) e o desvio-padrão das duas distribuições

de probabilidades acima, temos:
146
Estimação
Para X = n . p
E(X) = E(n . p) = (1).(0,33) + (2).(0,07) + (3).(0,01) = 0,50
VAR(X) = VAR(n . p) = E(X2) – (E(X))2 = (1)2.(0,33) + (2)2.(0,07) + (3)2.(0,01) –

(0,5)2 = 0,67
Lembrando que E(X) = E(n . p) = n . p = (5).(0,1) = 0,5 e VAR(X) = VAR(n . p)
= n . p . q = 5 . (0,1).(0,9) = 0,67, conferindo com o resultado acima.
Para x = p
n
E(p) = (0,2).(0,33) + (0,4).(0,07) + (0,6).(0,01) = 0,10 = 10%
VAR(p) = (0,2)2.(0,3) + (0,4)2.(0,07) + (0,6)2.(0,01) – (0,1)2 = 0,0168 = 1,68%
Podemos verificar também que E(p) = E x = 1 E(X) = 1/5(0,5) = 0,1 = p

n n
p.q
e VAR(p) =
n
Podemos utilizar uma notação um pouco diferente que:
Variável aleatória Média Desvio-padrão
Número de ocorrências np μnp = n.p σnp = n.p.q
μp=p p.q
Proporção de ocorrências p σp =
n
Uma derivação do Teorema Central do Limite, considerando a aproximação

da distribuição binomial pela normal, pode ser estabelecida da seguinte forma:
Se X tem uma distribuição qualquer e o tamanho da amostra “n” for

grande, a estatística Z dada a seguir tem distribuição normal padrão:
z = X – (np) = X – (n.p)
σnp n.p.q
Também tem distribuição normal padrão a estatística Z dada a seguir:
(p – μ p )
z= = p–p
σp p.q
n
147
Estimação
Exemplo:
Segundo uma teoria que relaciona estoque e mercado, se em uma semana

o mercado como um todo declina, então, na semana seguinte, 70% do es-
toque apresentará um crescimento de preço. Supondo que a teoria esteja
correta e que em uma determinada semana uma amostra aleatória dos es-
toques de 60 empresas foi observada, qual é a probabilidade de 36 ou mais
deles apresentarem um crescimento de preço?
Considerando a proporção de sucessos solução:
Pelos dados do problema: μ = p = 0,7, σ = σ p = p.q = (0,7).(0,3) =

n 60
0,05916, então Z = (0,60 – 0,70)/0,05916 = – 1,69. Na tabela da distribuição
normal verificamos que P (p ≥ 0,60) = P(Z ≥ – 1,69) = 1 – P(Z ≤ – 1,69) = 1 –
0,0455 = 0,9545.
Considerando o número de sucessos solução:
Pelos dados do problema: μ = n.p = (60).(0,7) e σ = σ = n.p.q =

60.(0,7).(0,3) = 3,55, então Z = (36 – 42)/3,55 = – 1,69. Na tabela da distri-
buição normal, verificamos que P(X ≥ 36) = P(Z ≥ – 1,69) = 1 – P(Z ≤ – 1,69) =
1 – 0,0455 = 0,9545.
Estimação por ponto

Temos verificado até aqui alguns tópicos sobre como tirar informações de
uma amostra para fazer declarações sobre uma população da qual a amostra
provém. Essas declarações dizem respeito a estimativas de parâmetros e à
forma da distribuição de estatísticas e populações.
Para a média populacional μ temos trabalhado com a média amostral,

como seu estimador.
Devemos reforçar esse conceito. Estimador é uma expressão matemática. O

seu valor para uma particular amostra é chamado de estimativa. Uma amostra é
também chamada de uma particular realização de uma variável aleatória.
Quando falamos de forma genérica, costumamos designar o parâmetro

por θ, e o seu estimador por θ^ .
Já comentamos que poderíamos estimar a média da população através

do cálculo de uma outra medida como a mediana da amostra, por exemplo,
148
Estimação
ou mesmo através de um palpite. Mas qual desses estimadores é o mais ade-

quado? Qual deles reúne melhores propriedades matemáticas para o propó-
sito de estimação?
Vamos verificar três propriedades de um bom estimador, não vício, con-

sistência e eficiência.
Estimador não viciado

Um estimador é dito ser não viciado ou não tendencioso se E( ) = .
Vamos tomar uma simulação bem simples para mostrar sobre o que es-
tamos falando. Seja uma população com três elementos, X1 = 2, X2 = 4 e X3 =
6. Essa população com N = 3 tem como média E(X) = μ = 4 e com variância
VAR(X) = σ2 = 8/3.
Dessa população podemos tomar as seguintes amostras com reposição

(2 = 9 amostras) e calcular os valores das médias e das variâncias de cada
3
uma dessas nove amostras, conforme mostrado na tabela a seguir:
Amostras Médias = X Variâncias = S2

(2,2) 2 0
(2,4) 3 2
(4,2) 3 2
(4,4) 4 0
(2,6) 4 8
(6,2) 4 8
(4,6) 5 2
(6,4) 5 2
(6,6) 6 0
N=9 μ X = E(X ) = 4 E(S2) = μS2
Calculamos para a variável X sua média, E(X) = 4 e VAR(X) 4/3. Para o cál-
culo da VAR(X), utilizamos a fórmula da variância para a população porque se
trata de uma população de médias. Dividimos, então, a soma ao quadrado
dos desvios por N = 9.
149
Estimação
σ2 4
Podemos verificar que E(X) = μ = 4 e que VAR(X) = = . Usamos aqui
n 3
n = 2 porque é o tamanho de cada amostra.
Calculamos para a variável S2 cada variância de uma amostra de tamanho

2. Dividimos, portanto, por n – 1 , n = 2. S2 é chamada de variância amostral. A
média das nove medidas de S2 e a E(S2) = 8/3, valor igual ao de σ2, a variância
populacional.
Tiramos três conclusões dessa simulação:
(I) E(X) = μ
σ2
(II) VAR( X ) =
n
(III) E(S2) = σ2
De (I) e de (III) concluímos que a média amostral X e que a variância amos-

tral S2 são estimadores não viciados para μ e para σ, respectivamente, em
que S2 é dado por:
1
S2 =
(n − 1)
∑ ( X − X )2
Poderíamos usar algum outro estimador para σ2 a variância populacional?

A resposta é sim. Poderíamos, por exemplo, utilizar o seguinte estimador:
1
σ2 =
n
∑ ( X − X )2
Ocorre, no entanto, que esse último estimador de σ2 não é um estimador

não viciado do parâmetro σ2. E está aí a razão de utilizarmos o denominador
“n – 1” quando calculamos o valor da variância amostral.
Para formalizar, se 1 = μ e E( 1) = 1, então o estimador 1 é dito ser não vicia-

do para 1. O mesmo vale para 2 = σ2 e o seu estimador não viciado 2 = S2.
Estimador consistente e eficientes

Um estimador é dito consistente se o seu valor aproxima-se do valor do
parâmetro à medida que a amostra cresce.
150
Estimação
Um estimador é mais eficiente do que outro se a sua variância for menor

do que a variância do estimador concorrente. O estimador eficiente é o que
possui a menor variância.
Pode-se demonstrar que além de não viciado, a média amostral é um es-

timador consistente e eficiente para estimar a média populacional.
Intervalo de confiança
Como verificado no estudo de amostragem, a estimativa pontual de um
parâmetro nem sempre é suficiente. Como se trata de um processo que en-
volve amostragem, e incerteza, muitas vezes queremos estimar um valor do
parâmetro adicionando a essa estimativa um intervalo para o qual tenhamos
um certo nível de confiança que o parâmetro possa pertencer.
No caso de estarmos estimando a proporção da preferência entre dois pro-

dutos que competem no mercado, podemos concluir, através de um proces-
so de amostragem, que a proporção da preferência pelo produto A pode ser
maior do que a do produto B, mas que, no entanto, essa diferença possa ocorrer
somente devido a variações daquela amostra particular que foi tomada. Nesse
caso, caracterizamos o fenômeno do empate técnico ou empate estatístico.
Devemos construir, então, em torno do valor estimado pontualmente um

intervalo de confiança.
Fornecemos a seguir as expressões para o cálculo de intervalos de con-

fiança para diversas situações que ocorrem na prática, sem entrar nas consi-
derações matemáticas que levam à construção destes intervalos.
Intervalo de confiança para a

média com σ conhecido
Se o desvio-padrão é conhecido, utilizamos o seu valor para o cálculo do
intervalo, além do valor da média e da estatística Z da distribuição normal.
P(X – z . σ X ≤ µ ≤ X + z . σ X ) = 1 – α
σ
Em que o erro-padrão σ X = e (1 – α) é o nível de confiança da
declaração. n
151
Estimação
Exemplo:
Uma empresa fabricante de pneus deseja verificar, através de uma amos-

tra de 100 pneus retirada de um grande lote, a vida média desse produto.
Sabe-se que o desvio-padrão da população é de 3 000km. Para a amostra de
100 pneus, a vida útil dos pneus foi verificada em 32 500km para rodar com
segurança.
Desejamos construir para todo o lote um intervalo de confiança de 95% no

sentido de que o verdadeiro valor da vida média possa estar nesse intervalo.
Para construir esse intervalo, que terá como limites X z.σ X , sabemos que
σ 3 000
X = 32 500 e que σ X = = = 300 .
n 100
O valor de Z pode ser buscado na tabela D da distribuição normal padrão.
Construiremos, então, três regiões na curva normal, a primeira correspon-
dendo à probabilidade de 0,025, a segunda a 0,95 e a terceira também a
0,025. Buscando dentro da tabela da normal padrão o valor 0,025, encon-
tramos Z = – 1,96. Como a curva é simétrica, o valor de Z correspondendo a
0,975 será Z = 1,96.
f(x)
–1,96
95%
1,96 x
Portanto, o intervalo construído será: [32 500 – (1,96).(300), 32 500 +

(1,96).(300)], cujo valor é então (31 912km, 33 088km).
Pode-se concluir, assim, que temos uma probabilidade de 0,95 de que o

verdadeiro valor da vida média dos pneus estará no intervalo (31 912km,
33 088km)? Rigorosamente não. O valor de μ é um dado real, portanto μ não
é uma variável aleatória e, portanto, no contexto da estatística clássica, um
parâmetro não tem distribuição de probabilidade nem se pode atribuir uma
probabilidade a ele.
A interpretação de intervalo de confiança é a de que se construirmos

100 intervalos baseados em 100 amostras, o valor do parâmetro deve estar
dentro de 95 desses intervalos.
152
Estimação
Para efeitos práticos, no entanto, não estaremos muito errados ao afirmar

que temos uma confiança aproximada de 95% de que o parâmetro esteja
dentro do intervalo construído a partir de uma única amostra. Essa interpre-
tação é mais do que suficiente para que possamos tomar as decisões cabí-
veis ao trabalho realizado.
para a média com σ desconhecido
Na maior parte das aplicações práticas, o valor do desvio-padrão não é conhe-
cido. A forma de se construir o intervalo de confiança da média é feita através da
estimação do valor de σ. O desvio-padrão populacional pode ser estimado pelo
valor do desvio-padrão da amostra, S, que é a raiz quadrada da variância. Já vimos
as boas propriedades da estatística S2 como estimador de σ2. Elas valem também
para S como estimador de σ.
X –µ
Mas aqui surge um outro problema: vimos que σ tem distribuição
n
normal padrão e, por isso, quando σ é conhecido, podemos utilizar a estatís-
tica Z na determinação do intervalo de confiança.
Até aqui nada sabemos sobre a distribuição de X – µ .

S X –µ
n
Pode-se demonstrar teoricamente que a distribuição da estatística S
n
é muito parecida com a distribuição normal e que é chamada de distribui-
ção “t” de Student que é devida a um químico e matemático inglês chamado
Gosset que a desenvolveu trabalhando na cervejaria Guinness. Student era
o seu pseudônimo, porque a cervejaria não permitia que seus empregados
divulgassem qualquer tipo de estudo.
Quando a amostra for muito grande, os valores da distribuição “t” se apro-

ximam muito da distribuição normal e, por isso, nessa situação, será indife-
rente o uso de uma ou de outra. No caso de amostras menores, é necessário
calcular o valor de “t” que é sempre referenciado pelos graus de liberdade do
erro-padrão. No caso da média, trabalharemos sempre com n – 1 graus de
liberdade. Então, se a amostra tem tamanho 20, buscamos na tabela E da dis-
tribuição “t” o valor de “t” correspondente ao nível de confiança do intervalo
(1 – α) com os graus de liberdade correspondentes.
153
Estimação
Na tabela “t” verificamos na parte superior as probabilidades chamadas

de bicaudal. Então, se queremos um intervalo de 95% de confiança, bus-
camos na tabela o valor de 0,05. Para o caso de uma amostra de tamanho
20, o valor de “t0,95” é de 2 093. Esse valor pode ser verificado na tabela E.
Veja também que para amostras muito grandes o valor de “t” se aproxima
dos valores de “Z” da distribuição normal padrão. Veja essa indicação na
própria tabela.
Exemplo:
Vamos considerar o mesmo exemplo da empresa fabricante de pneus

que deseja verificar, através de uma amostra de 100 pneus retirada de um
grande lote, a vida média deles. Não se conhece o desvio-padrão da popu-
lação. Para a amostra de 100 pneus, a vida útil foi determinada como 32 500km
para rodar com segurança, e o desvio-padrão amostral foi calculado em
3 000km.
Desejamos construir para todo o lote um intervalo de confiança de 95% no

sentido de que o verdadeiro valor da vida média possa estar nesse intervalo.
Para construir esse intervalo que terá como limites X t . SX , sabemos que
S 3 000
X = 32 500 e que S X = = = 300. O valor de “t” pode ser buscado na
n 100
tabela E da distribuição “t” de Student com 99 graus de liberdade. Esse valor
será de aproximadamente 1,98.
Portanto, o intervalo construído será: [32 500 – (1,98).(300), 32 500 +

(1,98).(300)] cujo valor é então (31 906km, 33 094km). Veja que esses valores
não diferem muito do resultado obtido para σ conhecido.
Mas e se a amostra for pequena, digamos n = 36? Em primeiro lugar, o valor

S 3 000
de S X = = = 500. O valor de “t” para 95% e 35 graus de liberdade
n 36
é aproximadamente igual a 2,030. Então o intervalo será determinado por:
[32 500 – (2,03).(500), 32 500 + (2,03).(500)] = (31 485km, 33 515km).
Veja que nesse caso a precisão da estimativa dos limites do intervalo é

ainda menor do que no caso de amostras de tamanho 100 e no caso do des-
vio-padrão conhecido. É bastante intuitivo perceber que quanto menor é o
nosso nível de informação menos precisas serão as estimativas.
154
Estimação
Intervalo de confiança para outros parâmetros

Ficou claro da exposição anterior que para construirmos um intervalo de
confiança precisamos saber quem é o estimador do parâmetro, quem é o
erro-padrão da estimativa e qual é a estatística associada ao estimador.
Tendo essas informações, podemos construir o intervalo de confiança para

o parâmetro , sabendo quem é ô, quem é o seu erro-padrão σô ou o seu es-
timador Sô e qual é a estatística associada. E o intervalo, no geral, terá como
limites:
± z σ ou ± t S
O quadro seguinte apresenta os principais elementos para a construção
de intervalos de confiança:
Parâmetro Parâmetro θ Estimador ô Erro-padrão Estatística
Média s
μ X Z
σ conhecido n
Média σ desco- S
μ X tn-1
nhecido n
pq
Proporção P p Z
n
Diferença de æ s12 s22 ö÷

médias com σ1 e X1 – X2 çç + ÷÷
σ2 conhecidos μ1 – μ2 ççè n
1 n ÷ø 2
Z
Diferença de
médias com σ1 æ S12 S22 ö÷
X1 – X2 çç + ÷ tn
e σ2 desconhe- ççè n ÷
μ1 – μ2 1 n ÷ø 2
1 + n2 – 2
cidos
Diferença de æ p1q1 p2q2 ö÷

P1 – P2 çç ÷ Z
proporções
p1 – p2 ççè n + n ÷ø÷
1 2
Outros intervalos de confiança podem ser construídos como o interva-

lo de confiança para a variância e para a razão de duas variâncias, as distri-
buições de probabilidades associadas a esses intervalos são a distribuição
qui-quadrado e a distribuição “F” de Fisher-Snedecor, que pelo pouco uso no
contexto deste livro, não foram incluídas. Qualquer livro de estatística inter-
mediária traz esses intervalos para o caso de algum leitor necessitar.
155
Estimação
Testes de hipóteses
Uma outra forma de se fazer inferência sobre parâmetros da população
com base em dados da amostra é através da escolha de uma entre duas pos-
sibilidades de ação, minimizando o risco na tomada de decisões.
Hipótese nula versus hipótese alternativa

Um teste de hipótese estatística consiste em fazer declarações sobre o pa-
râmetro e submetê-las às evidências amostrais. Duas hipóteses então são
estabelecidas: a hipótese da nulidade ou hipótese nula versus uma hipótese
alternativa.
A hipótese nula é denotada por H0, na qual se faz uma suposição sobre o
valor do parâmetro, e na hipótese alternativa denotada de H1, que se contra-
põe à hipótese nula, podendo-se afirmar que o parâmetro é diferente, maior
ou menor que o valor estabelecido pela hipótese da igualdade. A represen-
tação formal de um teste é dada por:
Teste bilateral:
H0: θ = c
H1: θ ≠ c
Teste unilateral à direita:
H0: θ = c
H1: θ > c
Teste unilateral à esquerda:
H0: θ = c
H1: θ < c
A escolha de qual dos três tipos de teste deve proceder depende da quan-
tidade e qualidade de informação que se tenha antes da coleta dos dados. No
caso de ter informação suficiente sobre a direção do teste, os testes unilaterais
são preferíveis aos bilaterais pela maior força de seu resultado.
No exemplo de abertura do capítulo, quando o construtor deseja que

seu concreto tenha resistência mínima de 200kgf/cm2, o mais adequado é o
teste unilateral à direita. Reflita sobre essa afirmação.
156
Estimação
Erro tipo I e erro tipo II

Como o teste está associado à amostragem e, portanto, à incerteza, exis-
tem quatro possíveis resultados. Rejeitar H0 incorreta ou corretamente e não
rejeitar H0 incorreta ou corretamente. O quadro a seguir apresenta essas
quatro possibilidades:
Ação com relação a H0 H0 é verdadeira H0 é falsa

Não rejeitar H0 Decisão correta Erro tipo II
Rejeitar H0 Erro tipo I Decisão correta
O tamanho de cada tipo de erro é dado pela sua probabilidade de ocor-

rência. A probabilidade de se cometer o erro tipo I é chamada de α e a proba-
bilidade de se cometer o erro tipo II é chamada de β.
Para o cálculo do tamanho da amostra e para a tomada de decisões, no
geral controla-se o erro tipo I por ser considerado o mais grave. Uma analo-
gia pode ser feita em um julgamento. A hipótese nula é a de que o réu é
inocente. Pergunta-se: o que é mais grave, rejeitar H0 quando H0 é verdadeira,
que significa condenar um inocente, ou não rejeitar H0 quando ela é falsa, que
significa absolver um culpado? Do ponto de vista ético parece ser mais grave
condenar um inocente.
O erro tipo I é também chamado do erro do consumidor. Um laboratório
testa um novo medicamento. Rejeitar H0 significa que esse medicamento é
melhor do que o que está na praça. Se de fato ele não for, isto é, H0 é verda-
deiro, o consumidor estará sendo prejudicado. O erro tipo II é chamado de
erro do produtor, ele ocorre quando o novo medicamento é melhor, deve-
ria ser rejeitado o H0, mas, no entanto, os testes não permitem rejeitar H0,
ou seja, o fabricante terá prejuízo por não colocar um novo medicamento
melhor que o tradicional no mercado.
Procedimento de testagem
de hipóteses para a média populacional μ
Vamos expor o procedimento de testagem de hipóteses através de uma
aplicação.
Suponha que a renda média das famílias de certo município foi determi-
nada através do Censo como sendo igual a R$2.000,00 para um particular
ano, e dois anos depois desejamos verificar se houve alguma mudança na
renda familiar através de um levantamento amostral.
157
Estimação
No Brasil, as PNADs, Pesquisas Nacionais por Amostra de Domicílios, cum-

prem esse papel entre os Censos que são realizados a cada dez anos.
Devemos estabelecer as duas hipóteses estatísticas. A hipótese nula é de

que a renda média familiar continua sendo de R$2.000,00. A hipótese alter-
nativa pode tomar uma de três formas. Se não há qualquer informação adi-
cional de que a renda média possa ter aumentado ou diminuído, toma-se
como alternativa a hipótese de que a renda média é diferente de R$2.000,00.
Os dados dirão se ela aumentou ou diminuiu e se esta mudança foi significa-
tiva ou se a diferença pode ter ocorrido por pequenas variações do acaso.
Se algum novo empreendimento foi realizado no município, pode-se

supor que houve um aumento do nível de emprego, gerando maior renda
média familiar. Então a hipótese alternativa pode ser construída como: a
média é maior do que R$2.000,00.
Por outro lado, se alguma indústria deixou a cidade ou se houve movi-

mentos migratórios importantes, como a chegada de pessoas de municípios
mais pobres ou a saída de força de trabalho para centros maiores, a hipótese
alternativa pode ser a de que a média é menor do que R$2.000,00.
Vamos ficar inicialmente com a primeira possibilidade. Então, o primeiro

passo é o de estabelecer as hipóteses estatísticas para um teste bilateral:
H0: μ = 2 000
H1: μ ≠ 2 000
Suponha então que uma amostra de 25 famílias foi pesquisada e que a

média amostral da renda familiar foi calculada em R$2.200,00. Pergunta-se,
com base nesse dado e sabendo-se que o desvio-padrão da renda familiar
foi determinado no censo como tendo o valor de R$500,00, se há uma dife-
rença significativa da renda média familiar nesses dois anos.
X –µ
Precisamos agora estabelecer a estatística do teste. Sabemos que σ
tem distribuição normal padrão, Z. Então: n
2.200 - 2.000 200

Z= = =2
500 100
25
158
Estimação
Precisamos agora verificar qual é a área sob a curva normal padrão entre
– 2 e 2, por ser este um teste bilateral.
P(– 2 < Z ≤ 2) = F(2) – F(– 2) = 0,9772 – 0,0228 = 0,9544. Essa probabilida-

de está associada a um valor de α = 1 – 0,9544 = 0,0456. Ela é chamada de
p-valor.
Para a tomada de decisão, precisamos compreender o significado desse

p-valor. O p-valor é a probabilidade de rejeitarmos H0 quando ele é verdadei-
ro. Ou seja, dizemos que μ ≠ 2 000 quando de fato não é. Nesse caso temos
uma probabilidade de 4,56% de estarmos errando se afirmarmos que a renda
média familiar mudou nesses dois anos.
Por outro lado, podemos dizer que temos uma confiança de 95,44% de
que houve mudança na renda média familiar do município. O que decidir?
Tradicionalmente, quando o p-valor for menor do que 5%, decidimos por

H1. Nessas circunstâncias diríamos que houve sim uma mudança na renda.
Esse padrão de 5%, porém, não deve ser tomado de forma absoluta. A deci-
são deve depender das consequências da gravidade da admissão da possi-
bilidade de se estar cometendo um erro. Se as consequências forem graves,
talvez o tomador de decisões resolva ser mais rigoroso e só admitir H1 se o
p-valor for menor do que 0,01, por exemplo. Isto é, ele deseja uma confiança
de no mínimo 99% para rejeitar H0.
Mas se as consequências da tomada de decisão incorreta forem menos

traumáticas, ele pode admitir tomar a decisão com 90% de confiança. Por-
tanto, somente se o p-valor for maior do que 0,10 ele não admitirá a hipó-
tese alternativa.
Esse é o procedimento-padrão para testagem de hipóteses estatísticas.
Variações no procedimento de testagem

de hipóteses para a média populacional μ
Nesse procedimento adotado, duas variações importantes podem acon-
tecer: (I) pode-se supor no exemplo que haveria uma mudança para maior
na renda média mensal e um teste unilateral deveria ter sido feito e (II) não
se conhece o valor de σ.
159
Estimação
Analisando os dados para a suposição (I), devemos fazer o teste unilateral.

Então, as hipóteses estatísticas seriam estabelecidas como:
H0: μ = 2 000
H1: μ > 2 000
A estatística do teste é a mesma e o seu valor determinado com base nos

valores amostrais foi de Z = 2. Agora (1 – α) compreende toda a área da curva
normal de – ∞ até 2, que corresponde à P( Z ≤ 2) = 0,9772. Então α ou o p-
-valor = 1 – 0,9772 = 0,0228.
O tomador de decisões tem agora um risco menor em afirmar que a renda

familiar aumentou. O seu nível de confiança subiu para 97,7%. Por que isso
ocorreu no teste unilateral? O nível de confiança cresceu porque foi agrega-
da maior quantidade de informação através do direcionamento do teste. Já
supúnhamos que haveria aumento da renda.
Para o caso de não se conhecer o valor de σ, ele deve ser estimado a partir
dos dados da amostra, tendo como estimador o desvio-padrão amostral, S.
Vamos supor que o valor calculado de S na amostra tenha sido de R$500,00.
Tomamos o mesmo valor dos primeiros dois exemplos só a título de compa-
ração. Há que ficar bem claro que o valor de S da amostra não tem qualquer
correspondência com algum valor determinado no Censo.
Vamos manter o teste unilateral, a exemplo do último exercício:
H0: μ = 2 000
H1: μ > 2 000

X –µ
A estatística do teste agora muda. A distribuição de σ não é mais
n
normal. Ela é uma estatística “t” com n – 1 graus de liberdade. O valor de “t”
será determinado com base em dados amostrais como:
2.200 - 2.000 200

t= = =2
500 100
25
O nível de significância de t = 2 com 24 graus de liberdade é aproximada-

mente 0,028. Esse valor pode ser determinado por interpolação ou através
da ajuda de uma planilha eletrônica para a função distribuição “t”.
160
Estimação
Com p-valor de 0,028, o nível de confiança para a rejeição de H0 será de

97,21%. Observe que esse valor é a favor de H1, mas com menos força do que
o 97,7% para o caso de conhecermos o valor de σ (ao conhecer o seu valor,
temos mais informação agregada).
Se o teste “t” tivesse sido realizado para a hipótese bilateral, o p-valor seria
igual a 0,057 e o nível de confiança, de 94,3%, visto que não teríamos nem a
informação de σ nem a informação fornecida pelo direcionamento do teste.
Testes de hipóteses para outros parâmetros

Estudamos como realizar testes de hipóteses para a média populacional
μ. O procedimento passo a passo seguido foi:
(I) estabelecimento das hipóteses estatísticas;
(II) cálculo da estatística do teste (θ – θ) ;

σθ
(III) determinação do p-valor.
Esse procedimento vale para as testagens de hipótese sobre os parâme-

tros estabelecidos na tabela a seguir, a exemplo do que foi realizado com
intervalos de confiança.
Parâmetro Parâmetro θ Estimador Erro-padrão Estatística
s
Média σ conhecido μ X n Z
Média σ desconhe- S
μ X n tn-1
cido
pq
Proporção P p n Z
Diferença de médias æ s12 s22 ö÷

çç +
com σ1 e σ2 conheci- μ1 – μ2 X1 – X2 ççè n ÷÷
1n ÷ø 2 Z
dos
Diferença de médias æ S12 S22 ö÷

çç + ÷
com σ1 e σ2 desco- μ1 – μ2 X 1 – X2 ççè n ÷ tn1 + n2 – 2
1n ÷ø 2
nhecidos
æ p1q1 p2q2 ÷ö
Diferença de propor- çç + ÷÷
P1 – P2 p1 – p2 çèç n n ø÷ Z
ções 1 2
161
Estimação
Para efeito de ilustração, construiremos um exemplo de testagem de hi-

póteses para a diferença entre duas médias.
Exemplo:
Uma firma de consultoria foi contratada para verificar se os níveis salariais de

trabalhadores não qualificados de uma indústria eram diferentes com relação
ao sexo. Suponhamos que as mulheres tivessem uma média salarial menor que
a dos homens. Uma amostra estratificada proporcional por sexo foi retirada e os
dados resultantes do levantamento amostral seguem na tabela abaixo:
Salário médio Desvio-padrão

Sexo Tamanho da amostra
amostral amostral
Feminino X 1 = R$590,00 S1 = R$8,00 n1= 10
Masculino X 2 = R$600,00 Ss = R$9,00 n2 = 20
Hipóteses estatísticas:
H0: μ1 = μ2
H1: μ1 < μ2
Essas hipóteses podem ser reescritas como:
H0: μ1 – μ2 = 0
H1: μ1 – μ2 < 0
Estatística do teste:
( X1 − X 2 ) − ( µ1 − µ2 )
t= “t” com 10+20–2 = 28 g.l.
 S12 S22 
 n + n 
1 2
(590 − 600) − (µ1 − µ 2 ) −10

Cálculo do p-valor: t= = = −3, 09
 82 92  3,233
 10 + 20 
p-valor = 0,0022
Conclusão: com nível de confiança de 99,8%, podemos concluir que de

fato o nível salarial das mulheres da indústria pesquisada é menor que o
nível salarial dos homens.
162
Estimação
1. Seja Z ~ N(0,1), calcule:
a) P(0 < Z ≤ 1,2)
b) P(–0,9 ≤ Z ≤ 0)
c) P(1,21 ≤ Z < 1,75)
d) P(Z > –0,75)
e) P(Z ≤ 1,35)
f) P(–1,44 < Z < 0)
2. Determinar z0 tal que:
a) P(Z > z0) = 0,5
b) P(Z < z0) = 0,8645
c) P(–z0 ≤ Z ≤ z0) = 0,90
3. Suponha que a renda de uma comunidade possa ser razoavelmente

aproximada por uma distribuição normal com média de R$1.500,00 e
desvio-padrão de R$300,00.
a) Que porcentagem da população terá renda superior a R$1.860,00?
b) Em uma amostra de 50 pessoas dessa comunidade, quantos pode-

mos esperar com renda inferior a R$1.050,00?
4. Uma fábrica de automóveis calcula que os motores de sua fabricação

têm duração com distribuição normal de média 150 000km e desvio-
-padrão de 10 000km.
a) Qual é a probabilidade que um automóvel, escolhido aleatoria-

mente entre os fabricados pela empresa, tenha um motor que
dure entre 140 000 e 165 000km?
b) Se a fábrica substitui o motor que apresenta duração inferior à

garantia, qual deve ser essa garantia para que a percentagem de
motores substituídos seja inferior a 0,2%?
163
Estimação
5. Uma equipe de pesquisadores deseja estudar as condições de vida

dos habitantes dos 15 000 domicílios de uma cidade-dormitório.
Devido à dificuldade de pesquisar todos os domicílios, a equipe op-
tou por selecionar aleatoriamente 36. Uma das variáveis de interes-
se, no estudo em questão, era o número de pessoas que residem
em cada domicílio. Para os selecionados foram obtidas as seguintes
informações sobre o número de residentes:
563323334
432743421
544334331
243424535
a) Os pesquisadores desejam saber o número médio de pessoas que

residem em cada domicílio. Como eles podem utilizar as informa-
ções obtidas para estimar esse valor? Determine a estimativa.
b) Qual o estimador utilizado e sua distribuição de amostragem?
c) Considerando que, pelo último censo, o número médio de pessoas

em cada domicílio é 5 com variância 12,96, determine:
I. P(X > 4)
II. P(X ≥ 6,5)
III. P(X = 2)
IV. P(3,5 < X ≤ 5)
6. Uma amostra consiste em 75 aparelhos de TV adquiridos há vários

anos. Os tempos de substituição desses aparelhos têm média de 8,2
anos e desvio-padrão de 1,1 ano.
a) Construa um intervalo de 90% de confiança para o tempo médio

de substituição de todos os aparelhos de TV daquela época.
b) Em sua opinião, o resultado poderia ser aplicado aos aparelhos de

TV que estão sendo vendidos atualmente? Justifique.
164
Estimação
7. Em um estudo sobre a aplicação do tempo em serviços, constatou-

-se que para uma amostra de 20 administradores selecionados alea-
toriamente, o tempo gasto em média por dia de trabalho em serviços
burocráticos é de 2,4 horas com desvio-padrão de 1,3 horas. Os dados
apresentam uma distribuição normal. Construa um intervalo de con-
fiança de 95% para o tempo médio gasto com serviços burocráticos
para todos os administradores.
8. Uma amostra aleatória de 625 pessoas, selecionadas de uma popu-

lação de 6 500 pessoas, revelou que 440 delas preferiam o detergen-
te de marca X. Através dessas informações, construa um intervalo de
confiança de 90% para a proporção de pessoas na população que pre-
ferem o detergente da marca ABC.
9. Sabe-se que o consumo mensal per capita de um determinado pro-

duto tem distribuição normal, com desvio-padrão de 2kg. A diretoria
de uma empresa que fabrica esse produto resolveu que o retiraria da
linha de produção se a média de consumo per capita fosse menor que
8kg. Caso contrário, continuaria a fabricá-lo. Foi realizada uma pesqui-
sa de mercado tomando-se uma amostra de 36 indivíduos e verificou-
-se que ∑Xi = 284kg, onde Xi representa o consumo mensal do i-ésimo
indivíduo da amostra.
a) Com base nos resultados da amostra e com um risco de 5%, qual

deveria ser a decisão da diretoria?
b) Se a diretoria tivesse fixado = 0,10, a decisão seria a mesma? Justi-

fique sua resposta.
10. Uma companhia de cigarros anuncia que o índice médio de nicotina

dos cigarros que fabrica apresenta no máximo 23mg por cigarro. Um
laboratório realiza 6 análises, obtendo as seguintes quantidades de
nicotina: 27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina se dis-
tribui normalmente. Pode-se aceitar, ao nível de 10% de significância,
a afirmação do fabricante?
165
Estimação
Gabarito
1.
a) P(0 < Z < 1,2) = P(Z < 1,2) – P(Z < 0) = 0,8849 – 0,50 = 0,4849 ou
48,49%.
b) P(–0,9 ≤ Z ≤ 0) = P(Z < 0) – P(Z < –0,9) = 0,50 – 0,1841 = 0,3159 ou

31,59%.
c) P(1,21 ≤ Z < 1,75) = P (Z < 1,75) – P(Z < 1,21) = 0,9599 – 0,8869 =
0,073 ou 7,3%.
d) P(Z > –0,75) = 1 – P(Z < –0,75) = 1 – 0,2266 = 0,7734 ou 77,34%.
e) P(Z ≤ 1,35) = 0,9115 ou 91,15%
f) P(–1,44 < Z < 0) = P(Z < 0) – P(Z < –1,44) = 0,50 – 0,0749 = 0,4251
ou 42,51%.
2.
a) Na tabela D, encontramos o valor z0 = 0
b) A área abaixo de z0 é 0,8645. Logo, a área entre 0 e z0 será de 0,8645

– 0,50 = 0,3645. Sendo assim, na tabela encontraremos z0 = 1,1.
c) A área abaixo de z0 é 0,95. Logo, a área entre 0 e z0 será de 0,95 –

0,50 = 0,45. Sendo assim, na tabela encontraremos z0 = + 1,645.
3.
a) μ = 1.500 e σ = 300, então, desejamos encontrar a P(X > 1.860).

X – µ = 1.860 – 1.500 = 1,2
Calculamos o valor de Z, em que Z = .
σ 300
Sendo assim, a
P(X >1.860) = P(Z >1,2) ... P(Z >1,2) = 1 – P(Z < 1,2) = 1 – 0,8849 =
0,1151 ou 11,51%.
b) E (pessoas com renda inferior a R$1.050,00) = n. P(X<1.050).

X −µ
A P(X < 1.050) = P( Z < ), em que P(X<1.050) =
σ
1.050–1.500
P Z< . Sendo assim, a
300
166
Estimação
P(X < 1.050) = P(Z< –1,5) = 0,067. O número esperado de pessoas

com renda inferior a R$1.050,00 será de 50 x 0,067 = 3,35, ou seja,
três pessoas.
4. Sendo μ = 150 000 e σ = 10 000, então:
a) P(140 000 ≤ X ≤ 165 000) + P(X ≤ 165 000) – P(X ≤ 140 000), em que
140 000 − 150 000 165 000 − 150 000
z1 = = −1 e z 2 = = 1,5, logo a
10 000 10 000
P(140,00 ≤ X 165 000) = P(–1 ≤ Z ≤ 1,5) – P(Z ≤ 1) = 0,9332 – 0,1587
= 0,7745 ou 77,45%.
b) Área abaixo do valor de X corresponde a 99,8%. Área entre

0 e z0= 0,998 – 0,50 = 0,498. Sendo assim, o valor de z0 = 2,88 e
dessa forma encontramos o valor de X por meio da expressão:
X − 150 000 ou seja, X = 178 800km.
2, 88 =
10 000
5.
a) Baseado no resultado obtido através da média amostral, essa esti-

mativa terá como valor 3,44.
σ2
b) O estimador utilizado é X com distribuição normal ( µ ).
n
c) Como μ – 5 e σ2 = 12,96, então:
4 −5
I. P(X > 4) = 1 – P(X < 4) ∴ z = = −1, 67, logo, P(X > 4) =
12, 96 / 36
P(z > –1,67) = 1 – P(z ≤ –1,67) = 1 – 0,0475 = 0,9525 ou 95,25%.
6,5 − 5
II. P(X ≤ –6,5) ∴ z = = 2,5 , logo, P(X ≤ 6,5) = P(z ≤ 2,5) ∴
12, 96 / 36
P(z ≤ 2,5) = 0,9938 ou 99,38%.
III. P(X = 2) = 0, pois numa distribuição contínua não é possível calcu-

lar a probabilidade no ponto exato.
3,5 − 5
IV. P(3,5 < X ≤ 5) = P(X ≤ 5) – P(X < 3,5) ∴ z1 = e
12, 96 / 36
5−5
z2 = , então
12, 96 / 36
z1 = –2,5 e z2 = 0. Dessa forma, P(3,5 < X ≤ 5) = P(–2,5 < Z ≤ 0) =
P(Z ≤ 0) – P(Z < – 2,5) = 0,50 – 0,0062 = 0,4938 ou 49,38%.
167
Estimação
6.
a) n = 75; X = 8,2; S = 1,1. Como o tamanho da amostra é maior que

30, utilizaremos a estatística z para a construção do intervalo de
confiança com 1 – α = 0,90. O valor de z será 1,645. Então:
P( X − z.S X ≤ µ ≤ X + z.S X ) = 1− α
1,1 1,1
P(8,2 − (1, 645) ≤ µ ≤ 8,2 + (1, 645) ) = 0, 90 ∴
75 75
P(8,2 – 0,21 ≤ μ ≤ 8,2 + 0,21) = 0,90.
P(7,99 ≤ μ ≤ 8,41) = 0,90
Com 90% de confiança podemos afirmar que os aparelhos de te-

levisão dessa população têm um tempo médio para substituição
entre 7,99 anos e 8,41 anos.
b) Não, pois o estudo foi restrito aos aparelhos adquiridos há vários

anos.
7. n = 20; X = 2,4; S = 1,3. Sendo o tamanho da amostra menor do que 30

e o desvio-padrão da população desconhecido, utilizaremos a estatísti-
ca "t" de Student para a construção do intervalo de confiança com 1 – α
= 0,95. Nesse caso, o valor de t será dado por t1 – α; n – 1 = t0,95; 19 = 2,093. Des-
sa forma, o intervalo de confiança será obtido por meio da expressão:
P( X − t.S X ≤ µ ≤ X + t.S X ) = 1− α
1,3 1,3
P(2, 4 − (2, 093) ≤ µ ≤ 2, 4 + (2, 093) ) = 0, 95 ∴
20 20
P(2,4 – 0,61 ≤ μ ≤ 2,4 + 0,61) = 0,95 ∴
P(1,79 ≤ μ ≤ 3,01) = 0,95.
Ou seja, com 95% de confiança podemos afirmar que o tempo médio

gasto por dia com serviços burocráticos dos administradores dessa
população estará entre 1,79 horas e 3,01 horas.
168
Estimação
f 440
8. N = 6.500, n = 625, f = 440 e 1 – α = 0,90, então p = = = 0,704 e
n 625
z = 1,645. O intervalo de confiança será dado pela expressão:
P( p – z . S p ≤ P ≤ p + z . S p ) = 1 – α
Nela, Sp = p .(1− p ) (N − n) . A inclusão do fator de correção para

.
n (N − 1)
populações finitas,. (N − n) se deve ao fato de n > 5% da população
(N − 1)
(N). Sendo assim, o valor de S p será 0,704.(0,296) . (6500 − 625) =
625 (6500 − 1)
0,017. Portanto, o intervalo de confiança será:
P[0,704 – (1,645).(0,017) ≤ P ≤ 0,704 + (1,645).(0,017)] = 0,90∴
P[0,676 ≤ P ≤ 0,732] = 0,90.
Ou seja, com 90% de confiança podemos afirmar que, das pessoas dessa
população, entre 67,6% e 73,2% preferem o detergente da marca ABC.
9.
284
a) α = 5%, n = 36, X = = 7, 89 e σ conhecido é igual a 2.
36
Hipóteses:
H0: μ = 8
H1: μ < 8
É um teste unilateral à esquerda, em que o valor crítico de z será

–1,645. A estatística calculada será obtida por:
X − µ 7, 89 − 8
z calc = = = −0,33.
σ 2
n 36
Decisão: como o valor de z calculado é maior que z crítico, não se

rejeita H0, de maneira que a empresa deve continuar fabricando o
produto.
b) Caso tivéssemos α = 10%, o valor de z crítico seria igual a –1,282.

Logo, manteríamos a decisão encontrada anteriormente para 5%,
ou seja, ainda assim não rejeitaríamos H0.
169
Estimação
10.
Dados: (145)2
3531−
27 + 24 + 21+ 25 + 26 + 22 6
X= = 24,17 e S = = 2,32.
6 5
Hipóteses:
H0: μ0 = 23
H1: μ1 > 23
α – 10%; Como n < 30 e σ é desconhecido, então utilizaremos a esta-

tística "t" de Student com cinco graus de liberdade e 90% de confiança
para um teste unilateral. Neste caso o valor de t será 1,476.
O valor de t calculado será dado por X − µ0 , em que

24,17 − 23 S
t= = 1,235 .
2,32 n
6
Decisão: como o valor de t calculado, 1,235, é inferior ao valor do t
crítico, 1,476, não se rejeita H0. A afirmação do fabricante de cigarros
procede, portanto, ao nível de 10% de significância.
170
Análise de regressão
e de correlação
Problema
A inovação tecnológica tem tido papel central na economia de países de-
senvolvidos e de países que têm crescido a taxas em torno de 10% nas últimas
décadas. O investimento em pesquisa e desenvolvimento (p&d) nas empresas
de base tecnológica tem sido apontado como fator determinante do cresci-
mento desses países em consequência também da melhoria dos resultados de
produção das empresas de setores estratégicos.
Uma pesquisa foi realizada com 15 empresas que oferecem produtos de

informática para o mercado. Pretende-se verificar se o resultado da aplicação
de recursos em p&d em um determinado ano implicou em ganhos significa-
tivos de receita no ano seguinte.
A tabela a seguir apresenta as aplicações em milhões de reais dessas em-

presas e os resultados das receitas no ano seguinte:
Faturamento (2007) Gastos em p&d (2006)

Empresa
em milhões de reais em milhões de reais
A 221 15,0
B 83 8,5
C 147 12,0
D 69 6,5
E 41 4,5
F 26 2,0
G 35 0,5
H 40 1,5
I 125 14,0
J 97 9,0
173
Faturamento (2007) Gastos em p&d (2006)

Empresa
em milhões de reais em milhões de reais
K 53 7,5
L 12 0,5
M 34 2,5
N 48 3,0
O 64 6,0
Algumas questões são prontamente apresentadas para o estudo dessa

relação. A primeira verificação a ser realizada é se de fato essa relação não é
espúria, ou seja, se a relação entre investimento em p&d e faturamento pode,
teoricamente, ter uma relação causal. Essa determinação pertence muito
mais ao campo da teoria econômica que ao da teoria estatística.
Supondo que essa relação causal possa mesmo ser estabelecida, então
uma série de questões pode ser levantada para verificação através de pro-
cedimentos estatísticos como: (I) existe um modelo matemático que possa
descrever analiticamente essa relação? (II) se o modelo existe, que modelo
melhor ajusta os dados de gastos com p&d e o faturamento de empresas
desse setor? (III) qual é a força dessa relação? Ou de outro modo, qual é o
poder do modelo construído com base nos dados amostrais, para se fazer
previsões? (IV) uma vez construído o modelo, qual é a margem de erro das
previsões? (V) é possível e necessário incorporar novas variáveis que possam
explicar o faturamento além dos investimentos em p&d?
A tarefa de fazer predições é inerente a muitos dos aspectos do geren-
ciamento e do planejamento da produção de empresas com administração
profissionalizada. Previsões de vendas, compras, custos, produção, contra-
tação de pessoal e aplicação de capital fazem parte dos fundamentos do
planejamento e controle atual das empresas.
Existe uma enormidade de técnicas matemáticas, estatísticas e economé-

tricas para a realização dessa tarefa de predição. Muitos modelos determinís-
ticos e muitos modelos não determinísticos se propõem a realizar essa tarefa.
Uma das ferramentas mais importantes para a construção de modelos que
envolvem certo grau de incerteza, inerente a levantamentos amostrais, é o
174
modelo de regressão, cuja análise está sempre associada a um processo de

verificação da força da relação entre as variáveis envolvidas e que é chamado
de análise de correlação.
A análise de regressão consiste em construir uma função matemática a

partir de observações amostrais que relacione uma ou mais variáveis indepen-
dentes a uma variável dependente. As variações da variável dependente são
decorrentes em grande medida das variações da variável independente ou
das variáveis independentes. Essa função pode ser uma função linear ou não,
dependendo da forma da relação entre as variáveis.
Análise de regressão
Consiste fundamentalmente em construir, a partir dos dados amostrais,
uma função matemática que relacione uma variável independente a uma
outra variável que dependa desta e que é chamada de variável dependente.
A forma geral adotada para descrever essa relação é Y = f(X) + ε, em que X é
a variável independente, Y a variável dependente e ε é o erro estatístico. Essa
relação possui, portanto, uma componente determinística f(X) e uma compo-
nente aleatória ε.
Análise de regressão linear

Se a relação entre a variável independente e a variável dependente puder
ser expressa através de uma função que descreva a equação de uma reta,
então o modelo em questão é um modelo de regressão linear. A expressão
geral desse modelo é Y = α + βX + ε, α e β são os parâmetros do modelo. Como
a construção do modelo é baseada em observações amostrais, esses parâ-
metros nunca são conhecidos. Eles são os verdadeiros valores do modelo do
mundo real, mas, repetindo, nunca são conhecidos. Eles devem, portanto,
ser estimados através de estimadores estatísticos, cujas expressões são deter-
minadas por algum critério de minimização do erro estatístico e cujos valo-
res são calculados com base nos dados amostrais.
Análise de regressão não linear

A relação entre duas ou mais variáveis nem sempre pode ser expressa
através da equação de uma reta, porque essa relação pode ser não linear.
175
Muitos outros modelos, como o exponencial, o potencial, o logístico, entre

outros, podem descrever melhor a relação entre as variáveis.
Análise de regressão simples

Quando somente duas variáveis estão envolvidas na construção do modelo,
dizemos que ele é um modelo de regressão simples. Assim, só participarão do
modelo uma variável independente e outra variável dependente, além do erro
estatístico, é claro. Um modelo de regressão simples pode ser linear ou não. Se
a relação entre as variáveis puder ser bem descrita através da equação de uma
reta, eles são ditos lineares, conforme definição acima.
Análise de regressão múltipla

Se a variável dependente estiver relacionada a mais de uma variável in-
dependente, então o modelo de regressão é conhecido como modelo de re-
gressão múltipla. Da mesma forma que no caso anterior, a relação entre as
variáveis independentes e a variável dependente pode ser linear ou não. No
caso da relação ser linear, o modelo a ser construído será o de um plano, no
caso de estarem envolvidas duas variáveis independentes, ou de hiperpla-
nos, se mais de duas variáveis independentes estiverem sendo utilizadas na
construção do modelo.
Um modelo de regressão linear múltipla, por exemplo, pode ser expresso

através da seguinte função: Y = β0 + β1X1 + β2 X2 + ... + βpXp + ε. A troca de α
por β0 é feita aqui somente por comodidade de notação. No caso de termos
somente duas variáveis independentes, estaremos construindo a equação
de um plano.
Erro estatístico
O termo ε é definido como o erro estatístico ou resíduo e é a componente
aleatória do modelo. Ele precisa ser bem compreendido. Vale sempre lem-
brar que esses modelos são construídos através de observações amostrais, e
sempre que se faz um levantamento de dados através de amostra os resul-
tados obtidos estarão associados a certo grau de imprecisão, que nos mode-
los estatísticos são considerados de natureza aleatória, ou seja, associados a
certa distribuição de probabilidades.
176
Os modelos de regressão têm, portanto, uma parte aleatória e outra de-

terminística. Na parte determinística estão todas as variáveis independentes
que explicam as variações da variável dependente. Esse modelo deve ser o
mais esbelto possível, desde que possa explicar bem a relação entre as va-
riáveis independentes e a variável dependente. Na componente aleatória
estão, além das variações devidas ao acaso, todas aquelas variáveis que têm
importância reduzida na explicação da variável dependente.
Alguns pressupostos são impostos ao erro para que se possa construir o

modelo de regressão através dos critérios propostos de redução de funções
do erro, conforme será visto mais adiante no capítulo.
Critério dos mínimos quadrados ordinários

Existem vários critérios propostos para a minimização de funções do erro.
O mais comumente utilizado é o chamado critério dos mínimos quadrados or-
dinários, que objetiva minimizar a função Σε2 (soma dos erros ao quadrado),
conforme será visto um pouco mais adiante.
Gráfico de dispersão
Os gráficos de dispersão apresentam os valores da variável independente
no eixo (X) das abscissas e o valor da variável dependente no eixo (Y) das or-
denadas. O gráfico a seguir é o dos dados de investimento das 15 empresas
de informática em planejamento e desenvolvimento em 2006 relacionados
com o faturamento de cada empresa no ano seguinte. Eles são muito úteis
para uma impressão visual do relacionamento entre as variáveis.
Gráfico de dispersão
250
200
Faturamento (y)
150
100
50
0
0 2 4 6 8 10 12 14 16
Gastos com p&d (x)
177
Variáveis independente e dependente

Conforme exposto acima, a variável dependente depende da variável inde-
pendente, que, a rigor, para a análise em questão, não depende de ninguém.
No caso em tela, o faturamento supostamente depende dos gastos em p&d.
A variável independente recebe também o nome de preditor e é sempre

apontado no eixo X das abscissas; a variável dependente, que recebe o nome
de resposta, é sempre plotada no eixo Y das ordenadas.
O que se pode observar inicialmente do gráfico é que a relação entre X e

Y pode ser aproximada por uma reta que passe pelo “meio” dos pontos, mas
que não é uma relação perfeita, no sentido de que não é possível construir-
mos uma reta que passe por todos os pontos amostrais. Talvez uma curva
não linear possa também ser ajustada aos dados. O estudo da escolha da
forma da curva (ou reta) será feito mais adiante.
Reta de regressão
Para o caso de um modelo de regressão linear simples, o objetivo será o de se
construir uma reta que “passe pelo meio” dos pontos amostrais através de uma
expressão determinada pelas estimativas de α e de β no modelo Y = α + βX + ε.
Essa reta será chamada de reta de regressão e terá como sua expressão analítica a
forma Ŷ = a + bX, em que o coeficiente linear “a” é o estimador de α, o coeficiente
angular “b” é o estimador de β e Ŷ (y chapéu), e será o valor da estimativa do
verdadeiro valor de Y observado na amostra para cada um dos pontos de X. Um
exemplo da construção da reta de regressão é dado na figura a seguinte.
O significado desses estimadores e a forma de encontrá-los serão estuda-

dos em seguida neste capítulo.
Reta de regressão
250
200
Faturamento (y)
150
100
50
0
0 2 4 6 8 10 12 14 16
Gastos com p&d (x)
178
Construindo a reta de regressão

Como vimos até aqui, um dos objetivos da análise de regressão é a cons-
trução de um modelo matemático que relacione a variável dependente e a va-
riável independente. Se o modelo é o de regressão linear simples, a tarefa é
determinar a equação da reta que melhor aproxime os pontos observados dos
dados amostrais. Vale a pena fazer um pequeno estudo da equação de uma
reta para melhor compreendermos o significado do que iremos construir.
Equação da reta
Uma reta é representada através da função Y = a + bX em que “a” e “b” são,
respectivamente, o coeficiente linear e o coeficiente angular da reta em questão.
Suponha que a reta em discussão seja dada pela expressão Y = 2 + X. Então, o
coeficiente linear da reta é o valor 2 e o coeficiente angular da reta é o valor 1.
Vamos fazer um estudo dessa reta começando por verificar os valores de Y para
diferentes valores de X. Então, se Y = 2 + X, os valores a seguir são pontos da reta:
X Y
0 2
1 3
2 4
3 5
4 6
O gráfico correspondente a estes valores é:
Reta y = 2 + x
7
4
y
0
0 1 2 3 4 5
179
Com base nesses dados e no gráfico, podemos analisar agora o significa-

do do coeficiente linear e o significado do coeficiente angular.
O coeficiente linear “a” é o ponto em que a reta corta o eixo Y. Isso ocorre
para o valor de X = 0. Valores negativos de “a” implicam que a reta cruza o
eixo Y abaixo da origem enquanto valores positivos de “a” implicam que a
reta corta o eixo Y acima da origem.
O coeficiente angular “b” é a inclinação da reta, ou seja, é o valor da tangen-

te do ângulo θ formado pelo eixo X e a reta. Ele representa também a variação
da variável Y para cada variação de um ponto de X. Se tomarmos um pequeno
triângulo de base unitária, verificaremos que a altura desse triângulo defini-
do pela reta Y = 2 + X também será unitário. Tomando então a razão entre o
cateto oposto e o cateto adjacente desse triângulo retângulo, verificaremos
que a tg θ = 1. Ou seja, a inclinação da reta é igual a 1 e o ângulo correspon-
dente será de 45º.
Valores positivos de “b” significam que a reta crescerá na medida em que

X cresce, e valores negativos de “b” significam que a reta decrescerá em Y
quando X cresce. Ou seja, no primeiro caso a relação entre X e Y é de propor-
cionalidade direta, enquanto no segundo caso a relação entre as variáveis é
de proporcionalidade indireta.
Significado dos elementos da reta na regressão

Os coeficientes da reta têm a mesma interpretação na regressão que na
geometria analítica adicionado da interpretação do fenômeno em estudo.
Supondo que a reta construída com os dados dos gastos em p&d versus
faturamento das empresas fosse a reta estudada acima, Ŷ = 2 + X. Algumas
conclusões imediatas poderiam ser tomadas, quais sejam:
se o valor de “a” é igual a 2, isso significa que se não houver qualquer

investimento em p&d, o faturamento esperado será de duas unidades
monetárias, no nosso caso 2 milhões de reais;
o valor positivo de “a” indica que, se não houver investimento em p&d,

ainda assim o faturamento será positivo. Um valor negativo de “a” im-
plicaria prejuízo. Vale a pena observar que a interpretação do coefi-
ciente linear pode não ter sentido dependendo do problema tratado;
180
para o valor de “b”, no coeficiente angular, teríamos como resultado que

para cada variação de uma unidade de X teríamos a variação de uma
unidade em Y. Ou seja, para o investimento de cada real em p&d, o retor-
no em termos de faturamento seria o do acréscimo de mais um real;
como o valor de “b” é positivo, significa que a relação entre as variáveis

é de proporcionalidade direta, isto é, o aumento do investimento em
p&d implica aumento do faturamento;
podemos calcular o valor esperado de faturamento (Ŷ) para certo in-

vestimento em p&d (X). Por exemplo, se aplicarmos três milhões em
p&d, o faturamento esperado será de Ŷ = 2 + X, ou Ŷ = 2 + 3 = 5, cinco
milhões de faturamento.
Um pouco mais adiante determinaremos o valor da reta de regressão para

os dados do problema em questão. Por ora, o objetivo é o de compreender o
significado da reta de regressão e de seus elementos.
O método dos mínimos quadrados ordinários

No gráfico a seguir verificamos que para cada valor do eixo X (Xi) há um
correspondente valor de Y (Yi) e um valor de Ŷi. Os valores Yi são os verdadei-
ros valores observados na amostra, os valores de Ŷi são os valores estimados
pela substituição do valor de Xi na reta de regressão. A diferença entre o valor
observado e o valor estimado é chamado de erro estatístico ou resíduo. Assim,
podemos definir cada erro de observação como:
εi = Yi – Ŷi
y
yi
εi
yi
x
181
Como a reta de regressão é uma “reta média”, de acordo com o que ve-
remos adiante, a soma dos desvios em relação à reta de regressão é igual a
zero. Isto é, Σεi = 0.
O critério dos mínimos quadrados ordinários sugere que a determinação

da expressão da reta média se dê pela minimização da soma dos quadrados
dos erros. Ou seja, o critério expresso em termos matemáticos é:
Min Σεi2
Com esse procedimento, encontra-se a expressão da reta que passa mais

perto do conjunto dos pontos amostrais.
O processo de minimizar a função Σ(Y – Ŷ)2 = Σ [Y – (a + bX)]2 consiste

em encontrar as derivadas parciais desta função em relação aos coeficientes
“a” e “b” e igualar cada expressão resultante a zero. É fácil demonstrar que o
resultado dessas derivadas parciais será o sistema de duas equações e duas
incógnitas apresentado a seguir:
ΣY = n a + b ΣX
ΣXY = a ΣX + b ΣX2
Assim, podemos verificar nas equações supracitadas que os valores de ΣY,

n, ΣX, ΣXY, e ΣX2 podem ser calculados diretamente dos valores da amostra,
ficando por determinar os valores das incógnitas “a” e “b”, que são os valores
dos coeficientes da reta Ŷ = a + bX, resolvendo assim o nosso problema.
O último sistema de equações citado pode ser rearranjado de forma a

facilitar o cálculo de “a” e de “b” através das expressões:
a = Y – bX

 ∑ XY −
(∑ X ∑Y )
 n 
b= 
 ∑ (X ) 
2
∑ X 2 −
n 
 
Embora muitos pacotes estatísticos estejam disponíveis para o cálculo

direto da reta de regressão e mesmo alguns aplicativos do Excel possam
182
calcular a expressão da reta, é conveniente mostrar esse processo para a

compreensão do engenhoso método de construção da equação da reta de
regressão a partir dos dados amostrais.
Determinação da equação
da reta para o problema dos gastos em p&d
A partir dos dados das 15 empresas, vamos determinar através do método
de mínimos quadrados ordinários a equação da reta que explica a relação
entre os gastos em planejamento e desenvolvimento (X) e o faturamento de
empresas de informática (Y).
A tabela a seguir apresenta os cálculos necessários para a determinação

de “a” e de “b”:
Empresa X Y XY X2 Y2
A 15,00 221,00 3 315,00 225,00 48 841,00
B 8,50 83,00 705,50 72,25 6 889,00
C 12,00 147,00 1 764,00 144,00 21 609,00
D 6,50 69,00 448,50 42,25 4 761,00
E 4,50 41,00 184,50 20,25 1 681,00
F 2,00 26,00 52,00 4,00 676,00
G 0,50 35,00 17,50 0,25 1 225,00
H 1,50 40,00 60,00 2,25 1 600,00
I 14,00 125,00 1 750,00 196,00 15 625,00
J 9,00 97,00 873,00 81,00 9 409,00
K 7,50 53,00 397,50 56,25 2 809,00
L 0,50 12,00 6,00 0,25 144,00
M 2,50 34,00 85,00 6,25 1 156,00
N 3,00 48,00 144,00 9,00 2 304,00
O 6,00 64,00 384,00 36,00 4 096,00
Total 93,00 1 095,00 10 186,50 895,00 122 825,00
183
Assim, os valores de “a” e de “b” são determinados por:
a = Y – bX
Y=
∑ Y = 1 095 = 73
n 15
X=
∑ X = 93 = 6,2
n 15
a = 73 – (6,2).b
O cálculo de “a” se completará após o cálculo do valor de b, que é dado por:

 ∑ XY −
(
∑ X ∑Y )
 n 
b= 
 ∑ (X ) 
2
∑ X 2 −
 n 

(93) . (1 095)
10 186,5 –
15
b)
(93)2
895 –
15
b = 10,67054
Retornando ao cálculo de “a”, teremos:
a = 73 – (6,2).(10,67054) = 6,842651
Portanto, a reta de regressão calculada terá a forma:
Ŷ = 6,84 + 10,67 X
A partir da qual se podem fazer predições para o valor do faturamento em

relação a um dado valor de investimento em p&d, bastando para isso substi-
tuir X pelo valor da aplicação em pesquisa e desenvolvimento. Por exemplo,
se uma empresa fizer um investimento de R$2 milhões em p&d, deverá ter
um faturamento de Ŷ = 6,84 + 10,67 . (2) = 28,18, ou R$28.180.000,00. Observe
que a empresa F que fez um investimento de R$2 milhões teve um fatura-
mento de R$26.000.000,00, bem próximo do esperado.
184
Essa diferença entre o valor de faturamento estimado para a firma F e o re-

almente realizado é devida ao acaso. Distorções maiores poderiam acontecer.
Mais na frente, construiremos intervalos de confiança para essas previsões.
Do modelo ainda podemos concluir que se não houver investimento

em p&d, uma empresa do ramo deve ter um faturamento aproximado de
R$6,84 milhões, no caso de X = 0. E ainda, para cada R$1 milhão aplicado
em pesquisa e desenvolvimento, o retorno esperado no faturamento é de
R$10,67 milhões.
Pressupostos da análise
de regressão linear (base teórica do modelo)
Existem fundamentalmente duas razões para se estudar os pressupos-
tos do modelo de regressão linear simples: (I) quando falamos em erro es-
tatístico, reta média, método dos mínimos quadrados ordinários e outros
termos, que já foram apresentados anteriormente, é necessário que saiba-
mos que há algumas restrições no seu uso. O modelo de regressão é um
modelo matemático que objetiva descrever um fenômeno real através de
uma expressão matemática. Naturalmente isso implica em uma simplifica-
ção da realidade e por isso fazemos restrições para que essa simplificação
funcione matematicamente; (II) a verificação da bondade do ajustamento,
ou de outra forma, da força de representação do modelo com relação ao
fenômeno que se está estudando implica, entre outros procedimentos, a
realização de testes de hipóteses estatísticas, que só podem ser realizados
se conhecermos a forma da distribuição dos erros e dos valores de Y.
Reta de regressão populacional

O uso de uma variável para predizer os valores de outra variável deve ser
visto como um problema de inferência estatística. A população consiste de
todos os pares de observações das variáveis independentes e variável de-
pendente. As estimativas são realizadas através de somente uma amostra
dessa população. No nosso exemplo selecionamos apenas uma amostra de
15 empresas de informática que investiram em planejamento e desenvolvi-
mento, mas desejamos fazer predições para todas as empresas com caracte-
rísticas semelhantes e muitas delas não foram contempladas na amostra.
185
O gráfico a seguir mostra a relação entre as duas variáveis envolvidas:
P(X = x)
A figura mostra que a relação populacional entre as duas variáveis é linear.

Observe que quando o valor do investimento é igual a R$2 milhões (X = 2), Y
pode assumir qualquer valor ao longo da reta paralela ao eixo Y. Da mesma
forma para X = 4 ou para outro qualquer valor.
A reta real passa exatamente pelo ponto que representa a média da distri-
buição de Y quando X assume um particular valor, seja ele 2, 4 ou algum outro
valor. Esse fato pode ser representado através de uma distribuição condicio-
nal de Y dado um particular X [ f(Y/X = 2) ], cuja média ou esperança matemá-
tica é dada por E(Y/X = 2), justamente o ponto em que a reta corta a paralela
ao eixo Y. Assim, o fenômeno real pode ser representado por uma série de
distribuições condicionais paralelas.
Essa reta é então chamada de reta de regressão populacional ou reta de

regressão verdadeira.
Para cada valor de X temos então uma distribuição de probabilidades

associada a esse valor, e como toda distribuição de probabilidades ela tem
uma determinada média e um determinado desvio-padrão (tem também, é
claro, uma variância associada).
A média pode ser representada por E(Y/X = x) ou μY.X e o desvio-padrão

pode ser representado por σY.X, cujo quadrado é a variância.
186
A reta Y = α + βX passa então pelos diversos valores das médias das dis-
tribuições e os seus parâmetros populacionais α e β devem ser estimados
através de dados amostrais.
As distribuições condicionais de probabilidades descrevem a variação de

Y para cada valor de X. A reta que liga os pontos das médias das distribuições
μY.X é a reta de regressão populacional que pode ser mais adequadamente
apresentada como E[Y/X] = α + βX.
Pressupostos do modelo de regressão linear

Em adição à suposição de relação linear entre as variáveis, as seguintes
três suposições estão envolvidas no modelo de regressão linear:
(I) os valores de Y são independentes entre si;
(II) as distribuições de probabilidades condicionais de Y dado X são nor-

mais;
(III) os desvios-padrões σY.X são iguais para todos os valores de X.
A primeira suposição significa que existe independência entre as obser-

vações. Isso pode significar, por exemplo, que um baixo valor para Y na pri-
meira observação não implique também em baixo valor de Y na segunda.
A segunda suposição significa que para cada valor de X estamos assu-

mindo que os valores de Y são normalmente distribuídos em torno de μY.X.
Como veremos adiante, essa suposição é útil para fazermos declarações de
probabilidades acerca das estimativas da variável dependente Y.
A terceira suposição implica que existe a mesma quantidade de variabili-

dade em torno da reta de regressão para cada valor da variável independen-
te X. Essa característica é chamada de homocedasticidade. Note que somente
Y é considerada uma variável aleatória enquanto X é considerado como fixo.
Então, o valor de Y é que está sujeito a erro, uma vez que assumimos que X
é conhecido.
Vale a pena observar que nem sempre essas três suposições são encon-
tradas no mundo real. Mas muitas vezes são aproximadamente verdadeiras,
o que permite o uso do modelo.
187
Verificação da bondade do modelo

Retornamos ao exemplo da aplicação de recursos em p&d e o faturamen-
to de empresas de informática. Até aqui determinamos a equação da reta de
regressão, verificamos o significado dos coeficientes angular e linear e fize-
mos uma estimativa pontual de valores de faturamento (Y) para um certo
investimento em p&d (X).
É conveniente neste ponto verificar se o modelo ajustado é adequado para

descrever a relação entre X e Y. Para esse propósito necessitaremos que os pres-
supostos expostos acima sejam obedecidos. Faremos essa verificação através
de alguns procedimentos. Calcularemos os coeficientes de determinação e de
correlação e faremos testes de hipóteses para verificar se o modelo é estatistica-
mente significativo. Testaremos a significância do coeficiente de correlação e do
coeficiente angular e faremos um teste F para verificar todo o modelo.
Coeficiente de determinação
O cálculo do coeficiente de determinação ou coeficiente de explicação será
útil para dizer o quanto da variação de Y pode ser explicado pela variação de
X.
Vamos verificar exatamente de que forma o coeficiente de determinação

(r2) pode auxiliar na tarefa de verificação da bondade do modelo. A interpre-
tação será feita em termos da variação na variável dependente Y. A figura
que se segue, em que somente um ponto será considerado, fornece uma
interpretação gráfica da situação.
Y
Y Y
Y–Y
Y–Y
Y–Y
Y
188
Nesse contexto, três pontos e três distâncias serão considerados. O ponto

Y é o valor real observado para um determinado X. O ponto Ŷ é o valor da es-
timativa de Y para o valor de X considerado. E o ponto Y é a média dos valo-
res de Y. Se o modelo não fosse significativo, a reta de regressão estaria muito
próxima da reta Ŷ = Y, paralela ao eixo X. Ou seja, a mudança dos valores de X
não implicariam mudanças em Y. Esse conceito será reforçado no estudo do
coeficiente de correlação.
Para o ponto considerado, podemos pensar que a variação total (Y – Y) é

a soma das parcelas correspondentes à variação devida à regressão (Ŷ – Y)
e a variação devida ao acaso (Y – Ŷ).
A variação devida à regressão ou explicada pela regressão pode ser ex-

pressa pela diferença (Ŷ – Y) porque, se não houvesse regressão, o valor de Ŷ
seria a própria média de Y, Y.
A variação devida ao acaso é o erro estatístico ou resíduo, conforme

já apresentado anteriormente. Se o modelo fosse determinístico, todos os
pontos estariam sobre a reta de regressão e Y seria igual a Ŷ, de forma que a
diferença Y – Ŷ seria igual a zero.
Se considerarmos todos os pontos amostrais, poderíamos estabelecer

então a seguinte relação:
∑(Y – Y)2 = ∑ (Ŷ – Y)2 + ∑(Y – Ŷ)2
Variação total, variação explicada e variação não explicada.

( )
2
A razão
∑ Yˆ − Y
, entre a variação explicada pela regressão e a variação
∑ (Y − Y )
2
total, é a proporção da variação que é explicada pelo modelo. Esse valor é

conhecido como coeficiente de explicação ou coeficiente de determinação.
∑ (Ŷ – Y)2
r2 = Variação explicada =
Variação total ∑(Y – Y)2
Pode-se observar que r2 varia de zero até um.
Se não houver regressão, todos os pontos estimados estarão sobre a reta

Y e, portanto, a soma Σ (Ŷ – Y)2 será igual a zero. Se o denominador for igual
189
a zero, significa que r2 também será igual a zero. Neste caso, a variação total
será igual somente à variação não explicada. Ou, ainda, qualquer variação na
observação de Y será devida ao acaso e, portanto, o modelo matemático não
explicará nada. Esse é o menor valor possível para r2. O modelo explica zero
por cento da variação de Y.
Por outro lado, se todos os pontos de Y observados estiverem sobre a

reta, não há nenhuma variação devida ao acaso. Toda variação é explicada
pelo modelo e nesse caso a variação explicada é igual à variação total e assim
r2 = 1. Ou seja, 100% da variação total é devida à regressão.
Uma forma simplificada de realizar esse cálculo é através da expressão:
a Y + b XY − n (Y )2 
∑ ∑
r2 =  
 Y − n (Y ) 
∑
2 2
No nosso exemplo,
é(6, 84).(1 095) + (10, 67).(10 186,5) - (15).(73)2 ù 36 244,75

ê úû
r =ë
2
= = 0, 845
é(122 825) - (15).(73) ù
2
42 890
êë úû
Assim, concluímos que 84,5% da variação de Y (faturamento) é explica-

da por X (gastos em p&d). Os outros 15,5% da variação do faturamento são
explicados por outras variáveis, como investimento em propaganda, con-
corrência de empresas estrangeiras etc. Podemos também afirmar que o
modelo de regressão construído tem alto poder de explicação. Esta última
afirmação pode ser confirmada através da Análise de Correlação e da testa-
gem de hipóteses que serão feitas na sequência.
Quando a população é pequena, o coeficiente de determinação pode ser

afetado pelo tamanho da amostra. Nesse caso, sugere-se o cálculo do coe-
ficiente de determinação ajustado. Lembrar que uma regressão realizada so-
mente com dois pontos amostrais terá sempre coeficiente de determinação
igual a 1.
A expressão para o cálculo do coeficiente de determinação ajustado é

dada a seguir:
190
* * 1)1) 
 (n(n− −
r 2r 2= =1−1−   . 1−1−r r 
2 2
(
 n(n− −
2 )
2 )

No nosso problema, o valor do coeficiente de determinação ajustado é igual

a 0,833, que não difere de forma substancial do primeiro valor encontrado.
Coeficiente de correlação
O coeficiente de correlação é uma medida da relação entre as variáveis X e
Y. Ele varia entre os valores –1 e 1, passando pelo zero.
Se não existe correlação entre as variáveis X e Y, o coeficiente de corre-

lação será igual a zero. Se a relação entre X e Y for perfeita, isto é, se todos
os pontos amostrais estiverem sobre a reta de regressão, o coeficiente de
variação terá valor igual a 1, no caso de a correlação ser perfeita e positiva,
ou seja, se o crescimento de X implicar crescimento de Y e será igual a –1
se a correlação perfeita for negativa, ou seja, o crescimento de X implica em
decrescimento de Y.
No caso da correlação igual a zero, não haverá tendência da reta, ela será
paralela ao eixo X. O diagrama de dispersão se constituirá de uma nuvem
de pontos em torno da reta de regressão paralela ao eixo X, conforme o
seguinte gráfico.
191
Se a correlação for perfeita e positiva, o coeficiente de correlação será

igual a 1.
Se a correlação for perfeita e negativa, o coeficiente de correlação será

igual a –1.
O que ocorre na prática, no entanto, é que o coeficiente de correlação

assume valores intermediários entre os extremos expostos acima. Não há uma
regra única para se avaliar a força da relação através do coeficiente de correla-
ção. No entanto, há indicativos que podem orientar a decisão sobre a força de
uma relação. Uma proposta bem aceita é a presente na seguinte tabela:
Coeficiente de correlação (r) Força da relação

r=0 Não há correlação
0 < |r| ≤ 0,5 Correlação fraca
0,5 < |r| ≤ 0,75 Correlação moderada
0,75 < |r| ≤ 0,9 Correlação forte
192
Coeficiente de correlação (r) Força da relação

0,9 < |r| < 1 Correlação muito forte
r =1 Correlação perfeita
Os gráficos a seguir apresentam algumas das situações expostas na tabela:
Correlação forte e negativa
Correlação forte e positiva
Correlação não linear
193
Correlação fraca e positiva
Como vimos, o coeficiente de correlação pode ser calculado como a raiz

quadrada do coeficiente de determinação. Uma outra forma de determinar di-
retamente o valor do coeficiente de correlação é através da expressão:
 
 ∑ XY − 
(∑ X) . (∑ Y ) 
  n  
r=  
( X) ( Y)
2 2
∑ (X )− ∑
2
n
∑ (Y )− ∑
2
Uma forma tecnicamente mais avançada para verificar se existe relação

entre as variáveis em estudo é através da realização de um teste de hipóte-
ses sobre o coeficiente de correlação populacional representado pela letra
grega ro (ρ). O coeficiente de correlação amostral é r.
As hipóteses nula e alternativa podem ser expressas como segue:

H0: ρ = 0 (não há correlação linear significativa)
H1: ρ ≠ 0 (correlação linear significativa)
A estatística do teste é dada por:
r
t=
(1− r ) 2
(n − 2)
que tem distribuição “t” de Student com n-2 graus de liberdade.

194
Para o problema do investimento em planejamento e desenvolvimento

em estudo neste capítulo, verificamos que o valor do coeficiente de corre-
lação é de 0,919, portanto, um valor que revela uma relação positiva e forte
entre as variáveis em estudo. Uma observação importante a ser feita neste
ponto é o de que o sinal do coeficiente angular tem que ser o mesmo do
coeficiente de correlação. Neste caso, ambos positivos indicando uma cor-
respondência direta entre as variáveis investimento em p&d e faturamento
de empresas de informática.
A estatística do teste de significância para o coeficiente de correlação é:
0, 919
t= = 8, 42
(1− 0, 845)
(15 − 2)
Esse valor de “t”, com 13 graus de liberdade, está associado a um nível de

significância de 0,0000013. Ou seja, podemos afirmar com nível de confiança
de praticamente 100% que o coeficiente de correlação é diferente de zero,
ou ainda, a correlação entre as variáveis X e Y é altamente significativa.
Uma observação de ordem teórica importante deve ser feita nesse ponto.
Embora na regressão somente a variável Y seja uma variável aleatória, por-
tanto X é fixo, na Análise de Correlação supõe-se que ambas as variáveis
sejam variáveis aleatórias. Se X de fato é fixado de antemão, não se aplica
essa testagem de hipóteses e a avaliação deve ser feita somente para o valor
de r e de r2.
Um outro alerta deve ser feito: a testagem de hipóteses para o coeficiente

de correlação é feita somente para a hipótese ρ = 0, que pode ser bilateral
ou unilateral, mas não pode ser feita para qualquer outro valor diferente de
zero. Assim, muitas vezes o teste resulta em significância do coeficiente de
correlação, mas ele pode ainda ser fraco e, portanto, dependendo de sua
dimensão, vale a pena fazer a análise somente através do coeficiente de
determinação.
Teste de hipóteses
para o coeficiente angular da reta (β)
Para que o modelo de regressão seja significativo, o ângulo entre a reta de
regressão e o eixo X tem que ser bem maior do que zero, ou, de outra forma, a
195
sua tangente representada pelo coeficiente angular tem que ser bem maior
que zero. Vimos que quando a reta de regressão é paralela ao eixo X não há
correlação entre as variáveis independente e dependente, isto é, a variação
dos valores de X não implica nenhuma ou pouca variação dos valores de Y.
Dessa forma, uma maneira de verificar se o modelo de regressão é signifi-

cativo é através da verificação da seguinte hipótese estatística:
H0: β = 0
H1: β ≠ 0
A estatística associada a esse teste é:
(b − β )
t=
Sb
Esta tem distribuição “t” de Student com n – 2 graus de liberdade, em que Sb

é o erro-padrão da estimativa do coeficiente de regressão e é dado por:
SY,X
Sb =
∑ (X − X )
2
E Sy.x, o desvio-padrão dos resíduos é o estimador de σY.X, o desvio-padrão

da reta de regressão populacional. Sy.x é o erro-padrão da estimativa da vari-
ância condicional dos valores de Y em torno da reta de regressão populacio-
nal. Sua expressão é:
SY,X =
∑ (Y − Yˆ )2
n−2
Ou de uma forma mais simples de cálculo:
 ∑ Y 2 − a∑ Y − b ∑ XY 
SY,X = 
n−2
196
É importante distinguir a diferença entre SY.X de SY e de SX. O SY.X diz respei-

to à dispersão dos dados em relação à reta de regressão e, portanto, envolve as
duas variáveis Y e X. A soma Σ(Y –Ŷ)2, pode ser expressa como Σ(Y – (a + bX))2
uma vez que Ŷ = a + bX.
Já SY diz respeito à dispersão dos valores de Y em torno de sua média e sua

expressão é:
∑ (Y − Y )
2
SY =
n −1
Da mesma forma, SX diz respeito à dispersão dos valores de X em torno de

sua média e sua expressão é:
∑ (X − X )
2
SX =
n −1
Para o problema do investimento em p&d buscaremos investigar se o

modelo proposto é significativo através do teste de hipóteses apresentado
anteriormente:
H0: β = 0
H1: β ≠ 0
Através da estatística:
t=
(b − β )
Sb
Como vimos, a estatística acima tem distribuição “t” de Student com

(n–2) graus de liberdade.
Para determinação de “t”, devemos calcular o valor de Sb:
SY,X
SSY,XY,X SY,X
SSY,XY,X
SbSS=
b b== = ==
(X((X−X−X−X)X)) ∑∑∑
∑∑∑
2 22
X XX− −
n(−n(2 22
.X
Xn() X) ) 2 22
Onde,
 ∑ Y 2 − a∑ Y − b ∑ XY 
SY,X = 
n−2
197
Retomando os dados originais, temos:
Empresa X Y XY X2 Y2
A 15,00 221,00 3 315,00 225,00 48 841,00
B 8,50 83,00 705,50 72,25 6 889,00
C 12,00 147,00 1 764,00 144,00 21 609,00
D 6,50 69,00 448,50 42,25 4 761,00
E 4,50 41,00 184,50 20,25 1 681,00
F 2,00 26,00 52,00 4,00 676,00
G 0,50 35,00 17,50 0,25 1 225,00
H 1,50 40,00 60,00 2,25 1 600,00
I 14,00 125,00 1 750,00 196,00 15 625,00
J 9,00 97,00 873,00 81,00 9 409,00
K 7,50 53,00 397,50 56,25 2 809,00
L 0,50 12,00 6,00 0,25 144,00
M 2,50 34,00 85,00 6,25 1 156,00
N 3,00 48,00 144,00 9,00 2 304,00
O 6,00 64,00 384,00 36,00 4 096,00
Total 93,00 1 095,00 10 186,50 895,00 122 825,00
Y=
∑ Y = 1 095 = 73
n 15
X=
∑ X = 93 = 6,2
n 15
a = 6,842651
b = 10,67054
198
Assim,
122
122
122
122
825
825−−
825
825−−(6,
(6, (6,
842651).(1
(6,842651).(1
842651).(1
842651).(1
095)
095)
095)−−
095) −−(10,
(10,(10,
(10,
67054)(10
67054)(10
67054)(10
67054)(10
. 186,5)
186,5)
186,5)
186,5)
SY,X =
Y,X=
SSY,X
SY,X == = ===510,53
510,53= =22,59483
510,53
510,53 ==22,59483
22,59483
22,59483
1515−
15−
15 2−−222
22,5949
Sb = = 1,266
895 − 15.(6,2)2
10, 67054
t= = 8, 427
1,266
O nível de significância (p – valor) correspondente a t = 8,427 com 13

graus de liberdade é igual a 0,00000126, altamente significativo.
Concluímos, então, com 99,99% de confiança, que o modelo proposto

representa bem a relação entre as variáveis investimento em p&d e fatura-
mento de empresas de informática.
Complementarmente podemos construir um intervalo de confiança para

o parâmetro β, escolhendo o nível de confiança e o valor de “t” associado a
esse nível fazendo b ± t Sb.
Se quisermos construir um intervalo de confiança de 95% para β, verifica-

mos que para 13 graus de liberdade o valor de t será igual a 2,16, obtemos para
b ± t Sb os valores 10,67 ± (2,16)(1,266) =10,67 ± 2,74. Assim, temos então uma
confiança de 95% que o verdadeiro valor de β estará entre 7,93 e 13,41.
Análise de variância da regressão

Um procedimento semelhante a testar a significância de β no modelo de
regressão linear simples é a realização da Análise de Variância da Regressão,
que consiste fundamentalmente em trabalhar com o modelo de variações
dado pela expressão a seguir, já estudada no contexto do coeficiente de
determinação:
∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
2 2 2
199
Variação total/variação explicada/variação não explicada
Fonte de Graus de Soma de Quadrados

Estatística F
variação liberdade quadrados médios
2
∑ (Yˆ − Y ) Q.M. Modelo
( )
2
Modelo 1 ∑ Ŷ − Y
1 Q.M. Resíduo
2
2 ∑ (Y − Yˆ )
Resíduo n–2 (
∑ Y − Yˆ )
n−2
2
Total n–1 ∑ (Y − Y )
Os graus de liberdade do modelo correspondem ao número de variáveis

independentes (no caso da regressão linear simples, um só X). Os graus de
liberdade total são sempre iguais a n – 1 e o do resíduo é a diferença entre o
g.l. total e g.l. do modelo.
Substituindo os valores derivados dos dados na tabela, teremos:
Fonte de Graus de Soma de Quadrados

Estatística F
variação liberdade quadrados médios
Modelo 1 36 253,16 36 253,16 71,011
Resíduo 13 6 636,84 510,53
Total 14 42 890,00
O nível de significância da estatística F para 1 e 13 graus de liberdade é de

0,00000126. Altamente significativo. Então o teste F para o modelo conduz
à conclusão de que o modelo como um todo explica muito bem a relação
entre as duas variáveis consideradas.
Nesse ponto, algumas observações são pertinentes:
o nível de significância para o teste “t” para o parâmetro β (0,00000126)

é exatamente igual ao nível de significância para o teste “F” da Análise
de Variância;
o valor de F = 71,011 é o quadrado do valor de t = 8,427. Isso sempre

ocorre na regressão linear simples. Este é um resultado teórico de ope-
rações entre distribuições de probabilidade, cuja complexidade está
fora do contexto do presente livro;
200
o valor do Quadrado Médio do Resíduo, 510,53 é igual ao quadrado

do valor do quadrado do erro-padrão da estimativa SY,X = 22,59483.
Esse resultado não é coincidência. O quadrado de SY,X é a estimativa
da variabilidade total.
Predição e intervalos de predição

Como vimos anteriormente, a reta de regressão é um instrumento útil
para se fazer predições. Ou seja, podemos, através da substituição de va-
lores de X na equação da reta Ŷ = a + bX, fazer previsões para valores da
variável dependente Y. No exemplo das empresas de informática, podemos
fazer predições de faturamento tendo em conta os investimentos em pes-
quisa e desenvolvimento.
Como trabalhamos em um ambiente de incerteza, a estimativa pontual não

é uma informação suficiente. Em torno dos valores estimados pontualmente
devemos construir intervalos nos quais os parâmetros devam pertencer.
Duas situações então são postas. A primeira diz respeito à construção

de um intervalo de confiança para a média populacional do faturamento das
empresas de informática e a segunda, à construção de um intervalo de con-
fiança para uma empresa individual. A diferença é que na primeira estimativa
estamos preocupados com o faturamento médio de empresas que investem
certo valor fixado em p&d. No segundo caso, o foco é para uma particular
empresa.
Intervalo de confiança da
estimativa da média populacional
Assumindo que a variável dependente é normalmente distribuída, pode-
mos calcular os limites superior e inferior de um intervalo de confiança para a
média de Y através de:
Y ± tSY
SY
Em que SY = e “t” é o valor da estatística da distribuição “t” de Student
n
com n – 1 graus de liberdade.
201
O valor de SY é dado pela expressão SY = ∑ (Y − Y )

, conforme visto
2
n −1
anteriormente. Esse valor pode ser calculado mais facilmente através da
expressão SY = ∑
Y 2 − n . (Y )2
.
n −1
No exemplo das empresas de informática, temos:
Ybarra = 73
12 2825 − 15.(73)2
SY = = 55,34954
14
SY 55,34954
Em que SY = = = 14,29
n 15
T13g.l. = 2,160
O intervalo de confiança de 95% será então:
73 ± (2,160) . (15,3512) = 73 ± 33,16
Os limites inferior e superior para a predição da média serão, respectiva-

mente, 39,84 e 106,16. O valor médio esperado de faturamento será de R$73
milhões, podendo-se afirmar com 95% de confiança que esse valor não será
inferior a R$39,84 milhões nem superior a R$106,16 milhões.
Se substituirmos em Ŷ = 6,842651 + 10,67054X a reta de regressão X pelo

valor de sua média X, teremos Ŷ = 6,842651 + (10,67054)(6,2) = 73. Esse fato
decorre da propriedade que a reta de regressão passa pelo ponto (X, Y).
Esses são os limites da previsão média de faturamento para todas as em-

presas do setor.
Mas se um grupo de empresas investe em p&d um outro valor de X0, diga-

mos R$2 milhões, ou se uma empresa investe em média esse valor, o interva-
lo de confiança para o seu faturamento será dado por:
Ŷ ± t SŶ
Em que o erro-padrão da estimativa SŶ, será dado por:
 1
  + (X 0 − X )
2
n
SYˆ = SY,X .
∑ ( X − X )2
202
Aplicando os valores do problema das firmas de informática para X0 = 2

nessas expressões, obteremos:
Ŷ = 6,842651 + 10,67054X = Ŷ = 6,842651 + 10,67054.(2) = 28,18373
Uma vez que SY,X = 22,59483 e que SŶ pode ser expresso pela expressão
mais conveniente:
 1
  + (X 0 − X )
2
n
SYˆ = SY,X
 ∑ X 2 − n . ( X )2 
Temos que:
 1
  + (2 − 6,2)
2
15
SYˆ = 22,59483. = 5,328328
895 − (15) . (6,2)2 
Sabendo que t13g.l. = 2,160, o intervalo de confiança de faturamento para a

média de investimento de R$2 milhões, terá como limites inferior e superior
os seguintes valores:
Limite inferior será igual a 28,18 – (2,160) . (6,64) = 28,18 – 14,34 =

13,84, e o limite superior será igual a 28,18 + (2,160) . (6,64) = 28,18 +
14,34 = 42,52.
Concluímos, então, que em média o faturamento das empresas que in-

vestirem R$2 milhões em p&d será de aproximadamente R$28,18 milhões, e
ainda podemos afirmar com 95% de confiança que esse valor não será infe-
rior a R$13,84 milhões nem superior a R$42,52 milhões.
da estimativa de um valor individual de Y
Se estivermos interessados na estimativa de faturamento de uma única
empresa que aplicou R$2 milhões em p&d, a forma de determinar o intervalo
de confiança muda um pouco. Na realidade, o que muda no procedimento é
o cálculo do erro-padrão da estimativa, que será dado por:
203
 1
1+   + (X 0 − X )
2
 n
SYˆ individual = SY,X
∑ ( X − X )2
No nosso problema:
 1
1+   + (2 − 6,2)
2
 15 
SYˆ = 22,59483. = 5, 4767
895 − 15.(6,2)2 
Mais uma vez utilizando t13g.l. = 2,160, o intervalo de confiança de fatu-

ramento de uma empresa individual para um investimento de R$2 milhões
terá como limites inferior e superior os seguintes valores:
Limite inferior será igual a 28,18 – (2,160) . (5,4767) = 28,18 – 11,83 = –

16,35, e o limite superior será igual a 28,18 + (2,160) . (5,4767) = 28,18 +
11,83 = 40,01.
Observe que o intervalo de confiança para a estimativa do faturamento

de uma empresa individual é muito mais extenso do que o intervalo para a
estimativa da média do investimento, isso porque para a média de investi-
mento temos mais informação do que no caso de uma empresa individual.
O gráfico a seguir ilustra as duas situações.

y
y
média uma empresa
1. Uma cadeia de supermercados financiou um estudo dos gastos com
mercadorias para famílias de quatro pessoas. A pesquisa se limitou a
famílias com renda entre R$10.000,00 e R$20.000,00. Obteve-se a se-
guinte equação:
Y = –400 + 0,10X
204
Suponha que a equação proporcione um ajustamento razoavelmente

bom e que os dados tenham sido obtidos por métodos de amostra-
gem aleatória.
a) Estime a despesa de uma família de quatro pessoas com renda

anual de R$15.000,00.
b) Um dos vice-presidentes da empresa ficou intrigado com o fato de

a equação aparentemente sugerir que uma família com R$4.000,00
de renda não gaste nada em mercadorias. Qual a explicação?
2. Uma determinada ação apresentou o seguinte comportamento du-

rante a última semana:
Preço 21,00 20,94 20,78 20,56 20,49
Dia Seg Ter Qua Qui Sex
a) Ajuste a equação de regressão linear para o valor da ação no de-

correr da semana.
b) Determine estatisticamente qual o valor da ação para a terça-feira

da próxima semana.
3. Uma empresa, estudando como varia a demanda de certo produto (em

unidades) em função do preço de venda (em R$), obteve a seguinte equa-
ção: Ŷ = 1 028,07 – 2,90X . Por meio dessa informação, deseja-se saber:
a) Qual a influência do preço sobre a demanda, ou seja, o que ocorre

com a demanda a cada R$1,00 de aumento no preço?
b) Ao preço atual de venda, a quantidade mensal absorvida pelo mer-

cado é de 80 unidades menos que a capacidade atual de produção
da empresa. Estime em quanto deve ser reduzido o preço de ven-
da para que a empresa possa utilizar toda a capacidade total.
4. Um jornal quer verificar a eficácia de seus anúncios na venda de carros

usados. A tabela a seguir mostra o número de anúncios publicados e o
correspondente número de carros vendidos por seis companhias que
usaram apenas esse jornal como veículo de propaganda.
205
Companhia A B C D E F
Anúncios 74 45 48 36 27 16
Carros vendidos 139 108 98 76 62 57
a) Ajuste a equação de regressão para o modelo.
b) Interprete o coeficiente de explicação R2.
c) Para uma venda de 200 carros, quantos anúncios devem ser feitos,
segundo o modelo?
d) Como você argumentaria com a companhia F para que ela aumen-

tasse o número de anúncios?
5. Num estudo realizado com famílias domiciliadas em São Paulo, veri-

ficou-se, para as variáveis gastos com seguro de vida e número de fi-
lhos, uma correlação 0,92. Essa informação indica que:
a) a correlação é forte entre os gastos com seguro e o número de filhos.
b) a correlação é negativa entre os gastos com seguro e o número
de filhos.
c) não há correlação entre os gastos com seguro e o número de filhos.
d) a correlação é moderada entre os gastos com seguro e o número
de filhos.
6. Uma grande rede de supermercados deseja determinar o efeito de

uma promoção sobre a concorrência relativa. Para isso, obteve dados
de 15 estados sobre as despesas de promoções relativas de um con-
corrente vulto (despesas do concorrente = 100) e sobre as vendas des-
se concorrente (vendas do concorrente = 100).
a) Você deve informar ao gerente se há alguma relação entre as des-

pesas promocionais relativas e as vendas relativas.
b) Ajuste a equação de regressão das vendas com as despesas pro-

mocionais.
c) Se a companhia igualasse o concorrente em termos de despesas

promocionais (se as despesas promocionais fossem 100), qual se-
ria a venda relativa da companhia?
d) Interprete o r2 resultante.
206
Tabela 1 – Despesa promocional relativa e vendas relativas por estado
Estado Despesa promocional relativa Vendas relativas
1 95 98
2 92 94
3 103 110
4 115 125
5 77 82
6 79 84
7 105 112
8 94 99
9 85 93
10 101 107
11 106 114
12 120 132
13 118 129
14 75 79
15 99 105
Gabarito
1.
a) P(0 < Z < 1,2) = P(Z < 1,2) – P(Z < 0) = 0,8849 – 0,50 = 0,4849 ou
48,49%.
b) P(–0,9 ≤ Z ≤ 0) = P(Z < 0) – P(Z < –0,9) = 0,50 – 0,1841 = 0,3159 ou

31,59%.
c) P(1,21 ≤ Z < 1,75) = P (Z < 1,75) – P(Z < 1,21) = 0,9599 – 0,8869 =
0,073 ou 7,3%.
d) P(Z > –0,75) = 1 – P(Z < –0,75) = 1 – 0,2266 = 0,7734 ou 77,34%.
e) P(Z ≤ 1,35) = 0,9115 ou 91,15%
f) P(–1,44 < Z < 0) = P(Z < 0) – P(Z < –1,44) = 0,50 – 0,0749 = 0,4251
ou 42,51%.
207
2.
a) Na tabela D, encontramos o valor z0 = 0
b) A área abaixo de z0 é 0,8645. Logo, a área entre 0 e z0 será de 0,8645

– 0,50 = 0,3645. Sendo assim, na tabela encontraremos z0 = 1,1.
c) A área abaixo de z0 é 0,95. Logo, a área entre 0 e z0 será de 0,95 –

0,50 = 0,45. Sendo assim, na tabela encontraremos z0 = + 1,645.
3.
a) μ = 1.500 e σ = 300, então, desejamos encontrar a P(X > 1.860).
X – µ = 1.860 – 1.500 = 1,2
Calculamos o valor de Z, em que Z = .
σ 300
Sendo assim, a
P(X >1.860) = P(Z >1,2) ... P(Z >1,2) = 1 – P(Z < 1,2) = 1 – 0,8849 =
0,1151 ou 11,51%.
b) E (pessoas com renda inferior a R$1.050,00) = n. P(X<1.050).

X −µ
A P(X < 1.050) = P( Z < ), em que P(X<1.050) =
σ
1.050–1.500
P Z< . Sendo assim, a
300
P(X < 1.050) = P(Z< –1,5) = 0,067. O número esperado de pessoas
com renda inferior a R$1.050,00 será de 50 x 0,067 = 3,35, ou seja,
três pessoas.
4. Sendo μ = 150 000 e σ = 10 000, então:

a) P(140 000 ≤ X ≤ 165 000) + P(X ≤ 165 000) – P(X ≤ 140 000), em que
140 000 − 150 000 165 000 − 150 000
z1 = = −1 e z 2 = = 1,5, logo a
10 000 10 000
P(140,00 ≤ X 165 000) = P(–1 ≤ Z ≤ 1,5) – P(Z ≤ 1) = 0,9332 – 0,1587
= 0,7745 ou 77,45%.
b) Área abaixo do valor de X corresponde a 99,8%. Área entre

0 e z0= 0,998 – 0,50 = 0,498. Sendo assim, o valor de z0 = 2,88 e
dessa forma encontramos o valor de X por meio da expressão:
X − 150 000 ou seja, X = 178 800km.
2, 88 =
10 000
208
5.
a) Baseado no resultado obtido através da média amostral, essa esti-

mativa terá como valor 3,44.
σ2
b) O estimador utilizado é X com distribuição normal ( µ ).
n
c) Como μ – 5 e σ = 12,96, então:
2
4 −5
I. P(X > 4) = 1 – P(X < 4) ∴ z = = −1, 67, logo, P(X > 4) =
12, 96 / 36
P(z > –1,67) = 1 – P(z ≤ –1,67) = 1 – 0,0475 = 0,9525 ou 95,25%.
6,5 − 5
II. P(X ≤ –6,5) ∴ z = = 2,5 , logo, P(X ≤ 6,5) = P(z ≤ 2,5) ∴
12, 96 / 36
P(z ≤ 2,5) = 0,9938 ou 99,38%.
III. P(X = 2) = 0, pois numa distribuição contínua não é possível calcu-

lar a probabilidade no ponto exato.
3,5 − 5
IV. P(3,5 < X ≤ 5) = P(X ≤ 5) – P(X < 3,5) ∴ z1 = e
12, 96 / 36
5−5
z2 = , então
12, 96 / 36
z1 = –2,5 e z2 = 0. Dessa forma, P(3,5 < X ≤ 5) = P(–2,5 < Z ≤ 0) =
P(Z ≤ 0) – P(Z < – 2,5) = 0,50 – 0,0062 = 0,4938 ou 49,38%.
6.
a) n = 75; X = 8,2; S = 1,1. Como o tamanho da amostra é maior que

30, utilizaremos a estatística z para a construção do intervalo de
confiança com 1 – α = 0,90. O valor de z será 1,645. Então:
P( X − z.S X ≤ µ ≤ X + z.S X ) = 1− α
1,1 1,1
P(8,2 − (1, 645) ≤ µ ≤ 8,2 + (1, 645) ) = 0, 90 ∴
75 75
P(8,2 – 0,21 ≤ μ ≤ 8,2 + 0,21) = 0,90.
P(7,99 ≤ μ ≤ 8,41) = 0,90
Com 90% de confiança podemos afirmar que os aparelhos de te-

levisão dessa população têm um tempo médio para substituição
entre 7,99 anos e 8,41 anos.
209
b) Não, pois o estudo foi restrito aos aparelhos adquiridos há vários

anos.
7. n = 20; X = 2,4; S = 1,3. Sendo o tamanho da amostra menor do que 30

e o desvio-padrão da população desconhecido, utilizaremos a estatísti-
ca "t" de Student para a construção do intervalo de confiança com 1 – α
= 0,95. Nesse caso, o valor de t será dado por t1 – α; n – 1 = t0,95; 19 = 2,093. Des-
sa forma, o intervalo de confiança será obtido por meio da expressão:
P( X − t.S X ≤ µ ≤ X + t.S X ) = 1− α
1,3 1,3
P(2, 4 − (2, 093) ≤ µ ≤ 2, 4 + (2, 093) ) = 0, 95 ∴
20 20
P(2,4 – 0,61 ≤ μ ≤ 2,4 + 0,61) = 0,95 ∴
P(1,79 ≤ μ ≤ 3,01) = 0,95.
Ou seja, com 95% de confiança podemos afirmar que o tempo médio

gasto por dia com serviços burocráticos dos administradores dessa
população estará entre 1,79 horas e 3,01 horas.
f 440
8. N = 6.500, n = 625, f = 440 e 1 – α = 0,90, então p = = = 0,704 e
n 625
z = 1,645. O intervalo de confiança será dado pela expressão:
P( p – z . S p ≤ P ≤ p + z . S p ) = 1 – α
Nela, Sp = p .(1− p ) (N − n) . A inclusão do fator de correção para

.
n (N − 1)
populações finitas,. (N − n) se deve ao fato de n > 5% da população
(N − 1)
(N). Sendo assim, o valor de S p será 0,704.(0,296) . (6500 − 625) =
625 (6500 − 1)
0,017. Portanto, o intervalo de confiança será:
P[0,704 – (1,645).(0,017) ≤ P ≤ 0,704 + (1,645).(0,017)] = 0,90∴
P[0,676 ≤ P ≤ 0,732] = 0,90.
Ou seja, com 90% de confiança podemos afirmar que, das pessoas dessa
população, entre 67,6% e 73,2% preferem o detergente da marca ABC.
210
9.
284
a) α = 5%, n = 36, X = = 7, 89 e σ conhecido é igual a 2.
36
Hipóteses:
H0: μ = 8
H1: μ < 8
É um teste unilateral à esquerda, em que o valor crítico de z será

–1,645. A estatística calculada será obtida por:
X − µ 7, 89 − 8
z calc = = = −0,33.
σ 2
n 36
Decisão: como o valor de z calculado é maior que z crítico, não se

rejeita H0, de maneira que a empresa deve continuar fabricando o
produto.
b) Caso tivéssemos α = 10%, o valor de z crítico seria igual a –1,282.

Logo, manteríamos a decisão encontrada anteriormente para 5%,
ou seja, ainda assim não rejeitaríamos H0.
10.
Dados: (145)2
3531−
27 + 24 + 21+ 25 + 26 + 22 6
X= = 24,17 e S = = 2,32.
6 5
Hipóteses:
H0: μ0 = 23
H1: μ1 > 23
α – 10%; Como n < 30 e σ é desconhecido, então utilizaremos a esta-

tística "t" de Student com cinco graus de liberdade e 90% de confiança
para um teste unilateral. Neste caso o valor de t será 1,476.
O valor de t calculado será dado por X − µ0 , em que

24,17 − 23 S
t= = 1,235 .
2,32 n
Decisão: 6como o valor de t calculado, 1,235, é inferior ao valor do t
crítico, 1,476, não se rejeita H0. A afirmação do fabricante de cigarros
procede, portanto, ao nível de 10% de significância.
211
Teoria da decisão
Problema
A empresa ABC está fabricando um novo equipamento que deseja dispo-
nibilizar para o mercado. É sabido que o investimento em propaganda pode
trazer um grande retorno se a vendagem do produto for alta. No entanto, o
investimento tem um custo elevado e se a quantidade vendida do produto
não for alta, esse investimento em propaganda pode trazer prejuízo para a
empresa. A questão colocada para a diretoria é se ela deve ou não proceder
ao investimento em propaganda.
Duas ações, então, são possíveis de serem tomadas. A primeira é não in-
vestir em propaganda e a segunda é realizar o investimento. Uma pesquisa
extensiva foi realizada e os cenários que foram apresentados para a diretoria
representavam três possibilidades de venda (forte, moderada e fraca). Os re-
sultados financeiros podiam variar como segue.
No caso de investimento em propaganda, se as vendas do novo produ-

to forem fortes, o retorno financeiro pode chegar a R$90.000,00 por mês. Se
as vendas forem moderadas, o retorno pode chegar a R$30.000,00 e se as
vendas forem fracas a empresa, pode ter um prejuízo de R$4.000,00. Na hipó-
tese de não se fazer o investimento em propaganda, os retornos esperados
para as três situações de venda serão R$60.000,00, R$10.000,00 e R$2.000,00,
dependendo de as vendas serem fortes, moderadas ou fracas.
Diante desse quadro de possibilidades, qual a ação que a diretoria deve

tomar de forma a potencializar as suas possibilidades de lucro?
A tabela abaixo resume as situações de retorno expostas:
A1 = Investir em A2 = Não investir

Eventos
propaganda (R$) em propaganda (R$)
θ1 = venda forte 90 60
θ2 = venda moderada 30 10
θ3 = venda fraca -4 2
213
Teoria da decisão
Observa-se que nenhuma das ações é preferível em todos os eventos ou

estados da natureza. A ação de investir em propaganda é preferível nos casos
de futuras vendas fortes ou moderadas, mas se a venda for fraca a ação pre-
ferida é não investir em propaganda.
Se a diretoria soubesse com certeza qual evento ocorreria, o processo de

decisão seria simples. Bastaria olhar para a linha que representasse maior
ganho e selecionar a ação que produzisse o melhor rendimento. No entanto,
a incerteza de que evento ocorrerá torna o problema mais interessante.
Vários diferentes critérios de seleção da melhor ação podem ser sugeri-

dos. Se houvesse ainda a possibilidade de agregar mais informações sobre
as probabilidades de ocorrência de cada um dos eventos, a tomada de de-
cisão poderia ser realizada com base nessas informações, o que seria muito
desejável.
A tomada de decisão gerencial tem crescido em complexidade e os ins-
trumentos da Teoria de Decisão Estatística têm se tornado um importante
modelo para se fazer escolhas racionais entre ações alternativas quando a
informação é incompleta e sob ambiente de incerteza. O problema de de-
cisão sob estudo pode ser representado por um modelo que compreende
cinco elementos.
O tomador de decisão
É o agente a quem cabe a responsabilidade por tomar as decisões. O to-
mador de decisões pode ser um indivíduo, uma corporação, uma agência
governamental e assim por diante.
Ações
A decisão envolve uma seleção entre duas ou mais alternativas de ações.
O problema é escolher a melhor entre essas ações alternativas. Algumas
vezes o tomador de decisões deve escolher a melhor das estratégias dispo-
níveis, em que cada estratégia é uma regra de decisão que indica qual ação
deve ser tomada em resposta a um tipo específico de informação amostral
ou experimental.
214
Teoria da decisão
Eventos
Os eventos estão fora do controle do tomador de decisões, que não
sabe ao certo qual evento de fato ocorrerá. Os eventos se constituem de
um conjunto de resultados mutuamente exclusivos, isto é, um e somente
um deles ocorrerá. Os eventos também são chamados de estados da natu-
reza ou simplesmente resultados.
Ganho
É a medida do resultado da opção por uma ação específica. Os ganhos são
apresentados em tabelas de ganhos ou matrizes de ganho, que apresentam as
consequências de cada ação selecionada e cada evento que possa ocorrer.
Incerteza
A falta de definição de qual evento ou estado da natureza irá ocorrer
é definido como incerteza. Essa incerteza será indicada em termos de pro-
babilidades associadas aos eventos. Uma das características da Teoria Esta-
tística de Decisão é o assinalamento de probabilidades para a ocorrência
desses eventos. Entre os tipos de probabilidades utilizadas está a probabili-
dade subjetiva.
A tabela de ganhos é expressa em termos genéricos. Assumimos que

existem “n” ações alternativas A1, A2 ... An e “m” possíveis eventos ou estados
da natureza denotados por θ1, θ2 ... θm. Os resultados de ganhos possíveis são
denotados pela letra “u” com os indicadores respectivos de ações e eventos.
A letra “u” está sendo usada por sua associação com “utilidade”, conforme
será mais bem explicado adiante. A matriz a seguir resume as relações acima
descritas:
Ações
Eventos A1 A2 ... An
θ1 u11 u12 ... u1n
θ2 u21 u22 ... u2n
... ... ... ... ...
θm um1 um2 ... umn
215
Teoria da decisão
Como essas utilidades podem ser determinadas será assunto para este
capítulo. Em síntese, a utilidade de se selecionar ação A2 e ter o resultado
do evento θ1 é denotada por u12 e assim por diante. A utilidade uij se refere à
ação “j” e o evento “i”.
Se de antemão for sabido com certeza que o evento que irá ocorrer é o
θ3, então basta ao tomador de decisões olhar ao longo da linha correspon-
dente qual é a maior utilidade e assim definir que ação deve ser tomada. No
entanto, no mundo real, uma vez que o estado da natureza não é de domínio
do tomador de decisões, ele não sabe com certeza qual específico evento irá
ocorrer. A escolha da melhor ação a ser tomada em face de um ambiente de
incerteza é o problema central da tomada de decisão.
Critérios de escolha
utilizando distribuição a priori
Muitos diferentes critérios existem para selecionar a melhor ação. O crité-
rio mais imediato é conhecido como o critério maximin de ganho. Outros três
critérios simples também são bastante utilizados, são normalmente conhe-
cidos como: ganho esperado sob incerteza, perda esperada de oportunidade e
critério minimax da perda de oportunidade.
Critério maximin de ganho

No método chamado critério maximin, o tomador de decisões assume
que uma vez que uma ação seja escolhida, a natureza será malevolente e
escolherá o estado da natureza que minimize o rendimento de sua escolha.
O tomador de decisões escolhe a ação que maximize o rendimento sob a
pior perspectiva.
Em outras palavras, o melhor do pior é uma forma de proteção. No exem-

plo do investimento em propaganda, a matriz de rendimentos é apresentada
a seguir:
A1 = Investir em A2 = Não investir

Eventos
propaganda (R$) em propaganda (R$)
θ3 = venda fraca –4 2
216
Teoria da decisão
Se os diretores escolherem a ação A1, a natureza provocará a ocorrência

de θ3 e o resultado será um prejuízo de R$4.000,00. Se o tomador de decisões
escolher a ação A2, também a natureza provocará a ocorrência de θ3 e o lucro
será de R$2.000,00.
Sendo assim, o tomador de decisões deverá escolher a ação que produza

o maior rendimento, no caso a ação A2. Isto é, a empresa não deve inves-
tir em propaganda. Então, o objetivo desse processo de decisão é escolher
aquela ação que produza o máximo entre os mínimos rendimentos, por isso,
o termo maximin.
Naturalmente, o critério maximin é um tipo de critério pessimista. Não

é razoável supor que um executivo tomaria decisões ou deveria tomar de-
cisões dessa forma. Na maioria das situações o critério maximin congelaria
o tomador de decisões em completa paralisia e implicaria que seria melhor
que ele mudasse de ramo de atividade.
Parece ser razoável que um tomador de decisões deva levar em conta

as probabilidades de ocorrência dos diferentes possíveis estados da natureza.
Se, no exemplo acima, a probabilidade de vendas fracas for muito pequena,
não há porque concentrar-se sobre a possibilidade dessa ocorrência. Os pró-
ximos procedimentos procurarão dar conta dessa alternativa.
Ganho esperado sob incerteza

Em um problema real de tomada de decisão, deve-se esperar que o toma-
dor de decisões tenha alguma ideia sobre a probabilidade de ocorrência dos
vários estados da natureza e que esse conhecimento possa ajudar na escolha
da melhor ação a ser tomada.
No exemplo em questão, se a diretoria percebe que as vendas do novo

produto serão fracas e que não compensarão o investimento em propagan-
da, deve-se decidir pela ação A1. No entanto, se a diretoria percebe que o
produto pode ter uma boa aceitação, talvez valha a pena fazer um investi-
mento em propaganda.
Se o número de eventos e o número de ações possíveis passarem a ser

muito grandes, o problema pode tornar-se muito complexo, e o tomador
de decisões necessitará de outro tipo de método para processar as informa-
ções relevantes. No entanto, os procedimentos apresentados neste capítulo
cobrem uma grande gama de problemas de tomada de decisão.
217
Teoria da decisão
Voltando ao problema do investimento em propaganda. Nesse caso, a maxi-

mização consiste em selecionar a ação que produza o maior ganho esperado.
Vamos assumir que a diretoria da empresa ABC tome o seguinte procedi-

mento de assinalamento de probabilidades para cada um dos eventos. Com
base em uma extensiva pesquisa da experiência passada com produtos seme-
lhantes e de acordo com a opinião de especialistas, a diretoria conclui que as
vendas podem ser moderadas (evento θ2) em uma razão de 50 para 50. E mais,
concluem que é um pouco menos provável que as vendas aumentem com
investimento em propaganda (evento θ1) do que as vendas sejam pequenas
(evento θ3). Com base nessa perspectiva, a diretoria estabelece a seguinte dis-
tribuição de probabilidades subjetivas para os eventos em questão:
Evento Probabilidade
θ1 = venda forte 0,2
θ2 = venda moderada 0,5
θ3 = venda fraca 0,3
Total 1
Para determinar a base de escolha entre investir em propaganda (Ação

1) e não investir em propaganda (Ação 2), é necessário calcular o ganho es-
perado para cada ação. Como indicado na tabela a seguir, o ganho é tratado
como uma variável que toma diferentes valores dependendo de que evento
ocorra. O valor esperado de cada ação será a média ponderada dos resultados
sob cada ato, em que os pesos são as probabilidades de que cada evento
possa ocorrer.
Ação 1: investir em Ação 2: não investir em

propaganda propaganda
Evento
Probabi- Resultado Probabili- Resultado
Resultado Resultado
lidade ponderado dade ponderado
θ1 0,2 90 18,0 0,2 60 12,0
θ2 0,5 30 15,0 0,5 10 50,
θ3 0,3 –4 –1,2 0,3 2 0,6
Total 1,0 31,8 1,0 17,6
Resultado esperado: R$31.800,00 Resultado esperado: R$17.600,00
218
Teoria da decisão
Verifica-se dos cálculos realizados que a diretoria pode esperar um resul-

tado de R$31.800,00 de retorno de vendas se investir em propaganda e de
R$17.600,00 caso não invista em propaganda. Para maximizar o ganho espe-
rado, a diretoria deveria selecionar a ação A1 e investir em propaganda.
Perda de oportunidade esperada

Um conceito útil na análise de decisão sobre incerteza é o da perda de
oportunidade. A perda de oportunidade é a perda causada pela falha em es-
colher a melhor ação. As perdas de oportunidade são calculadas separada-
mente para cada evento que pode acontecer.
Da ocorrência de um específico evento pode-se determinar a melhor

ação possível. Para um dado evento, a perda de oportunidade é a diferença
entre o ganho daquele ato e o ganho para o melhor ato que poderia ter sido
selecionado.
No exemplo do investimento em propaganda, se o evento θ3 ocorrer

(vendas fortes), a melhor ação é a A1, para a qual o ganho é de R$90.000,00.
A perda para esta ação é 90 – 90 = 0. O ganho para a ação A2 é R$30.000,00
e a perda de oportunidade da ação A2 é a quantidade que o ganho para
a melhor ação, ou seja, R$90.000,00 excedem os R$30.000,00 de ganho da
ação A2, que é, portanto, R$90.000,00 – R$30.000,00 = R$60.000,00.
A tabela das perdas de oportunidade para o problema em questão é:

Tabela de ganhos Tabela de perda de
(R$) oportunidades (R$)
Evento A1 A2 A1 A2
θ1 = venda forte 90 60 0 30
θ2 = venda moderada 30 10 0 20
θ3 = venda fraca –4 2 6 0
Pode-se calcular agora as perdas de oportunidades esperadas, levando-

se em conta a distribuição de probabilidades subjetivas estimadas de maneira
análoga ao que foi feito com o ganho esperado sob incerteza. O objetivo
será o de escolher aquela ação com menor perda de oportunidade esperada.
As seguintes quantidades podem então ser definidas POE(A1) e POE(A2)

como perda de oportunidade esperada para a ação de investir em propagan-
da e a perda de oportunidade esperada ao não se investir em propaganda:
219
Teoria da decisão
Ação : investir em propaganda Ação 2: não investir em propaganda

Evento Probabi- Resultado Probabili- Resultado
Resultado Resultado
lidade ponderado dade ponderado
θ1 0,2 0 0,0 0,2 30 6,0
θ2 0,5 0 0,0 0,5 20 10,0
θ3 0,3 6 1,8 0,3 0 0,0
Total 1,0 1,8 1,0 16,0
Se a diretoria escolher a ação que minimize a perda de oportunidade

esperada, escolherá a ação A1, a mesma ação selecionada sob o critério de
maximizar o ganho esperado. Pode ser demonstrado que esse resultado não
ocorreu por acaso. Sempre a ação escolhida pelo critério da maximização do
ganho esperado também será o escolhido para a minimização da perda de
oportunidade esperada.
Critério minimax da perda de oportunidade

No método do critério minimax de perda de oportunidade, o tomador de
decisão seleciona a ação que minimiza a pior perda de oportunidade possí-
vel. Como no critério de maximin, de maximizar os piores ganhos, o critério
minimax para a perda de oportunidade toma uma perspectiva pessimista. O
tomador de decisão determina para cada ação a maior perda de oportunida-
de que pode ocorrer.
No exemplo em discussão, para a ação A2 a maior perda de oportunidade

possível é de R$16.000,00, para a ação A1, é R$1.800,00. Então, o tomador de
decisões opta pela ação A2, que é a de não se investir em propaganda.
Nesse exemplo, a ação escolhida pelo processo minimax foi a mesma da es-
colhida para o processo maximim, ação A2, mas esse fato nem sempre ocorre.
Valor esperado da informação

perfeita (VEIP) ou o custo da incerteza
A quantidade perda de oportunidade esperada (POE) pode ser interpre-
tada também através do valor esperado da informação perfeita (VEIP) ou do
custo da incerteza (CI).
220
Teoria da decisão
O valor esperado da informação perfeita (VEIP) é a diferença entre o

ganho esperado com informação perfeita e o ganho esperado sob incerte-
za. Como foi visto acima, para o problema do investimento em propagan-
da, o ganho esperado sob incerteza foi de R$31.800,00, o ganho esperado
com informação perfeita pode ser determinado pela escolha do melhor
ganho para cada evento e as probabilidades aqui são consideradas como
aproximações das frequências relativas calculadas por várias observações
anteriores.
Ganhos Ganhos
Evento Probabilidades
(R$) ponderados
θ1 = venda forte 90 0,2 18,0
θ2 = venda moderada 30 0,5 15,0
θ3 = venda fraca 2 0,3 0,6
33,6
Então, o valor esperado da informação perfeita será igual a R$33.600,00

– R$31.800,00 = R$1.800,00. Exatamente o mesmo valor encontrado para a
perda de oportunidade esperada.
A expressão custo da incerteza destaca o custo associado à tomada de

decisão sob incerteza, uma vez que o ganho esperado com perfeita informa-
ção subentende que esse seria o ganho esperado com o conhecimento de
eventos passados ou ganho esperado “sob certeza”.
Representação através de diagrama de decisão

Pode ser útil para melhor visualização representar a estrutura de um
problema de decisão sob incerteza através de um diagrama de árvore
de decisão, também chamado de diagrama de decisão ou diagrama de
árvore.
O problema do investimento em propaganda pode ser apresentado atra-

vés do diagrama a seguir:
221
Teoria da decisão
R$90,00
θ1
θ2
R$30,00
A1 θ3
2
– R$4,00
R$60,00
1 θ1
A2
θ2
R$10,00
θ3
2
R$2,00
Saindo do ponto 1, o tomador de decisões pode seguir o ramo A1 ou

o ramo A2, correspondentes, respectivamente, às ações de investir em
propaganda e não investir em propaganda. No ponto 2, um novo ramo
pode ser aberto a partir da primeira decisão que corresponde aos possí-
veis eventos, alcançando os valores de ganhos pela escolha da ação e o
acontecimento do evento.
Para a tomada de decisão, o diagrama precisa receber as novas informa-

ções correspondentes ao valor das estimativas de probabilidade que cada
evento ocorra e a realização da análise retrospectiva ou de indução backward
(para trás). Multiplica-se, então, os valores dos ganhos no final de cada ramo
pelo valor da probabilidade de cada um dos eventos somando os resulta-
dos destes produtos e retornando ao ponto 2, que assume o valor de ganho
esperado para cada uma das ações, A1 e A2, com valores de R$31.800,00 e
R$17.600,00, respectivamente.
O valor do ganho esperado para a ação 1 foi determinado pela seguinte

expressão:
31,8 = (0,2).(90) + (0,5).(30) + (0,3).(–4)
O novo passo é retornar do nó 2 para o nó 1 através da escolha do ganho

esperado de maior valor, no caso o ganho esperado correspondente da ação
1, conforme exposto no diagrama 2:
222
Teoria da decisão
R$90,00
(0,2)
R$31,8
(0,5)
R$30,00
A1 (0,3)
2
R$31,8
– R$4,00
R$60,00
1 (0,2)
A2 R$23,0
(0,5)
R$10,00
(0,3)
2
R$2,00
Dessa forma, o diagrama de árvore reproduz de forma esquemática

e compacta a análise realizada através das tabelas. Um diagrama análogo
pode ser construído em termos de perdas de oportunidade.
Estabelecimento
de distribuições de probabilidades
Estabelecer as probabilidades de ocorrência de cada estado da natureza
(eventos) é uma tarefa fundamental para o equacionamento do esquema de
tomada de decisões. Até agora, o estabelecimento dessas probabilidades foi
realizado de forma subjetiva e simples. Se houver uma forma mais científica
de estabelecimento da distribuição de probabilidades dos possíveis eventos,
o problema da tomada de decisões pode ser mais bem equacionado.
Se a variável aleatória que representa os estados da natureza for discre-

ta e houver somente um número pequeno de resultados possíveis, então
o tomador de decisões provavelmente será capaz de assinalar diretamente
probabilidades para cada possível resultado. No entanto, se a variável alea-
tória tiver um número grande de valores possíveis, o tomador de decisões
terá que tratar a variável aleatória como contínua e necessitará construir uma
função de distribuição acumulada trabalhando com um número de interva-
los selecionados da variável aleatória.
223
Teoria da decisão
Duas situações possíveis são apresentadas ao tomador de decisões:
o tomador de decisões estabelece diretamente uma distribuição de

probabilidades subjetivas sem um processamento formal dos dados;
existe uma pequena quantidade de dados do passado, e o tomador de

decisões processa essa informação para construir uma distribuição de
probabilidades acumulada ou cumulativa.
O problema agora é encontrar meios para a construção dessas distribuições

de probabilidades. Trabalharemos com as duas possibilidades, a saber: (I) assi-
nalamento subjetivo direto; e (II) assinalamento usando dados do passado.
Assinalamento subjetivo direto

Nesse caso, o estabelecimento de uma distribuição cumulativa de probabi-
lidades subjetiva será feito sem processamento formal de dados.
Tomemos por exemplo um caso em que o tomador de decisões infere

que para o próximo ano as vendas de certo produto de sua companhia
deverão ficar entre 100 000 e 500 000 unidades, e deseja estabelecer uma
distribuição de probabilidades cumulativas subjetivas sem usar explicita-
mente qualquer dado.
A base de procedimento é focalizar a atenção em poucos pontos da dis-

tribuição. Uma proposta é trabalhar com os percentis. Se pensarmos em três
percentis, o mais adequado é tomar o primeiro e o quarto quartil e a media-
na. O primeiro quartil divide o rol de dados em duas partes, os primeiros 25%
e os últimos 75%. A mediana divide o rol de dados em duas partes iguais, os
primeiros 50% e os últimos 50%. E o terceiro percentil divide o rol também
em duas partes, os primeiros 75% e os últimos 25%.
Observe que o primeiro quartil representa o vigésimo quinto percentil, a

mediana representa o quinquagésimo percentil e o terceiro quartil, o septu-
agésimo quinto percentil.
Comecemos pela mediana ou o quinquagésimo percentil. O tomador

de decisões deve escolher, entre 100 000 e 500 000, um valor que acredite
que a probabilidade de ocorrer um valor menor ou igual a ele seja igual a
50%. Pode ser qualquer valor no intervalo inicialmente estabelecido. Vamos
supor que após muita reflexão ele acredite que esse valor deve ser algo em
224
Teoria da decisão
torno de 350 000. Ou seja, o tomador de decisões acredita que a chance de

se vender menos de 350 000 unidades do produto é de 50%. Naturalmente,
a chance de vender mais de 350 000 também é de 50%.
O raciocínio deve ser repetido para a determinação dos outros dois valo-
res. Vamos supor que esses valores sejam 250 000 e 400 000. Ou seja, o toma-
dor de decisões acredita que a probabilidade de vender mais do que 250 000
produtos seja de 75% e que a probabilidade de vender mais do que
400 000 produtos seja de 25%.
Dessa forma, três pontos da distribuição de probabilidades cumulativa

foram determinados. Os percentis de ordem 25, 50 e 75, ou equivalente-
mente o primeiro, o segundo e o terceiro quartis. Lembrando que o segundo
quartil coincide com a mediana.
O procedimento usual é o de determinar mais dois pontos, preferencial-

mente mais próximos dos extremos e usar esses cinco pontos para a constru-
ção da função que represente a distribuição de probabilidades cumulativa.
Uma proposta é usar o primeiro e o nonagésimo nono percentis, ou os

percentis de ordem 1 e de ordem 99. Esses valores podem ser considerados
como os valores limites inferior e superior da primeira condição estabeleci-
da. Ou seja, podemos escolher como primeiro percentil o valor de 100 000
unidades de venda e 500 000 como o valor do nonagésimo nono percentil.
Dessa forma, estabelecemos que a probabilidade de vender mais do que
100 000 unidades do produto em questão é de 99% e que a probabilidade
de vender mais do que 500 000 unidades é de somente 1%.
A figura seguinte representa a situação construída. O gráfico pode ser

considerado como uma aproximação da distribuição de probabilidade cumu-
lativa subjetiva da venda do produto no próximo ano.
Distribuição de probabilidade cumulativa

1
0,9
0,8
0,7
Probabilidade
0,6
0,5
0,4
0,3
0,2
0,1
0
0 100 200 300 400 500 600
Vendas
225
Teoria da decisão
A distribuição anterior, que representa uma distribuição de probabilidades

discreta, pode ser mais bem aproximada através de uma curva em forma de “s”
pela união de seus pontos, para a construção de uma distribuição de probabi-
lidades contínua.

1
0,9
0,8
0,7
Probabilidades
0,6
0,5
0,4
0,3
0,2
0,1
0
0 100 200 300 400 500 600
Vendas
O assinalamento direto da distribuição de probabilidades cumulativa

subjetiva é apropriada para as seguintes situações: (I) quando existir um
número pequeno de dados e não houver dados do passado; e (II) quando,
apesar de existirem dados do passado, o tomador de decisões não se sentir
confortável para usar esses dados para o estabelecimento da distribuição de
probabilidade cumulativa. Este último caso pode ocorrer em razão de mu-
danças da política da empresa ou de algum avanço tecnológico importante
implementado, por exemplo.
Assinalamento de probabilidades
usando dados do passado
Se existe uma grande quantidade de dados do passado, o tomador de de-
cisões pode usá-los para estabelecer a distribuição de probabilidades atra-
vés do uso das frequências relativas dos dados. No entanto, se a quantidade
de dados for pequena, um procedimento deve ser realizado tomando a dis-
tribuição de frequências destes dados para a construção de uma distribuição
de frequências acumulada através de aproximações.
226
Teoria da decisão
Vamos ilustrar a construção de uma distribuição cumulativa de probabi-

lidades através de um exemplo simples. Certa loja vende, entre outros, um
produto A. Acompanhando a venda desse produto nos últimos 20 meses,
observamos que em um determinado mês foram vendidos 33 unidades. Em
outros dois meses foram vendidos 38. Fazendo observações dessa ordem,
pudemos construir a seguinte distribuição de frequências que relaciona o
número de produtos vendidos com a quantidade de meses em que esse
número foi alcançado. Um possível resultado é o que segue:
Número de Número de meses em Número de Frequência relativa

produtos que os produtos vendi- produtos do número de
vendidos dos alcançaram a venda vendidos produtos vendidos
33 1 33 1/20 = 0,05
34 0
35 4 35 4/20 = 0,20
36 5 36 5/20 = 0,25
37 0
38 2 38 2/20 = 0,10
39 3 39 3/20 = 0,15
40 0
41 1 41 1/20 = 0,05
42 2 42 2/20 = 0,10
43 2 43 2/20 = 0,10
Podemos, com base nos dados acima, construir a distribuição de frequên-

cias acumuladas para o número de produtos vendidos:
Número de Frequência relativa do número Frequência relativa

produtos vendidos de produtos vendidos acumulada
33 0,05 0,05
34 0,05
35 0,20 0,25
36 0,25 0,50
227
Teoria da decisão
Número de Frequência relativa do número Frequência relativa

produtos vendidos de produtos vendidos acumulada
37 0,50
38 0,10 0,60
39 0,15 0,75
40 0,75
41 0,05 0,80
42 0,10 0,90
43 0,10 1,00
Considerando que a frequência relativa é uma aproximação de probabili-

dades e que, portanto, a frequência relativa acumulada é uma aproximação
da probabilidade acumulada, podemos construir o seguinte gráfico da dis-
tribuição de frequências relativas acumuladas, que representam as probabi-
lidades de vender até certo número de produtos. Observando a tabela ante-
rior ou o próximo gráfico, podemos verificar que a probabilidade de vender
até 36 produtos em um determinado mês é de 50%.

1
0,9
0,8
0,7
Probabilidade
0,6
0,5
0,4
0,3
0,2
0,1
0
30 35 40 45 50
Número de produtos vendidos
Para aplicações em tomada de decisões sob incerteza, trabalhar com

dados contínuos pode dificultar enormemente a tarefa. Até aqui trabalha-
mos com dados discretos. Existem técnicas para transformar dados contínu-
os em dados discretos, mas que estão fora do escopo do presente texto.
228
Teoria da decisão
Tomada de decisões
baseada na utilidade esperada
Até agora as análises de tomada de decisão tiveram por critério a escolha
da ação ótima como aquela que resultaria em maior ganho médio a longo
prazo se a mesma decisão tivesse que ser tomada repetidamente sob idên-
ticas condições. No entanto, algumas decisões pessoais e nos negócios são
tomadas frente a um único conjunto de condições. Em algumas dessas oca-
siões não seria realístico pensar em termos de muitas repetições da mesma
situação de decisão.
Sendo assim, é útil ter um aparato para lidar com tomada de decisão em
tempo único. A Teoria da Utilidade fornece tal aparato e também um método
lógico para tomada de decisões repetitivas. Para ilustrar a ideia, vamos supor
três situações com duas ações alternativas para cada uma delas. Na primeira
(A) se contrapõem duas decisões que têm como consequência para a ação A1
receber R$0 com certeza e, para a ação A2, receber R$0,60 com probabilidade
½ e perder R$0,40 com probabilidade ½. Na segunda situação, B1 implica
ganhar R$0,00 com certeza e B2, receber R$60.000,00 com probabilidade ½
e perder R$40.000,00 com probabilidade ½. A terceira situação, C1 implica
receber R$1 milhão com certeza contra C2, que implica receber R$2 milhões
com probabilidade ½ e receber R$0,00 com probabilidade ½.
O cálculo do ganho esperado para a decisão colocada em A é de R$0,10

[(1/2).(0,6)+(1/2).(0,4)]. Isso significa que a longo prazo o resultado deverá
ser positivo. Ocorre, no entanto, que se a decisão tem que ser tomada para
somente uma realização, a perda pode ser de R$0,40. A firma talvez possa
correr esse risco. Mas na situação B, o valor do ganho esperado a longo prazo
seria de R$10.000,00, o que levaria o tomador de decisões a optar pelo risco,
ou seja, escolher a ação B2. Como a situação é pontual, a firma pode perder
R$40.000,00. Ficando invibializado o tomador de decisões pode optar por
não correr o risco e optar por ganho certo de R$0,00.
No caso da situação C, mesmo pensando a longo prazo, o valor do ganho

esperado seria R$1.050.000,00 se a opção fosse por C2, contra um ganho certo
de R$1.000.000,00 pela ação C1. Nesse caso, não resta muita dúvida que, apesar
de a ação C2 poder resultar num ganho de R$2,1 milhões, a melhor ação seria
mesmo tomar a ação C1, com ganho certo de R$1 milhão.
Fica claro que grandes e pequenas corporações podem tomar diferentes

atitudes diante do risco. A questão que o tomador de decisões deve respon-
229
Teoria da decisão
der é: “Qual é a probabilidade para que a consequência M1 se torne indiferente

para que se possa correr o risco de optar por ganhar M1 com certa probabilida-
de p ou M2 com probabilidade 1–p?”. Esse tipo de questão pode ser respondido
pela aplicação da metodologia da Teoria da Utilidade. Não é objeto de estudo
aqui o desenvolvimento mais aprofundado dessa teoria, senão o de apresen-
tá-la ilustrativamente, mesmo porque essa situação não é muito comum na
prática diária da tomada de decisões. Maiores informações sobre essa teoria
podem ser adquiridas através de bibliografia mais aprofundada, como o livro
de R. S. Schlaifer, Analysis of Decisions Under Uncertainty, McGraw Hill.
Tomada de decisão com

probabilidades a posteriori
As análises feitas até agora podem ser consideradas como análises a
priori, isto é, a tomada de decisões foi baseada em melhor ganho (ou menor
perda) com base em ações relacionadas com uma distribuição de probabi-
lidades construída sem a utilização de levantamento de dados amostrais
auxiliares. Aqui discutiremos a chamada análise a posteriori, em que a distri-
buição de probabilidades envolvida na tomada de decisões será feita com
base em probabilidades a priori revisadas pela observação de dados amos-
trais complementares.
Probabilidades a posteriori
As probabilidades a posteriori são calculadas com base em duas informa-
ções, as probabilidades a priori e a informação obtida através da observação
de um conjunto de dados. O meio de fazer essa atualização é o Teorema de
Bayes. Se uma nova atualização for necessária, a atual probabilidade a pos-
teriori será utilizada como probabilidade a priori no novo contexto em que
uma nova tomada amostral seja realizada.
O propósito de incorporar mais evidência através de processos amostrais

é o de reduzir o custo esperado da incerteza.
Se o custo esperado da incerteza (ou de outra forma, o custo esperado da

perda de oportunidade) for elevado, então o acréscimo de nova informação
através de um processo de amostragem pode se tornar desejável. O método
geral para se incorporar nova informação, ou nova evidência amostral, pode
230
Teoria da decisão
ser ilustrado pelo uso de dois tipos de informação amostral: (I) através da
especificação da confiabilidade da informação amostral; e (II) através da es-
pecificação do tamanho da amostra.
Análise a posteriori: uma ilustração

da especificação da confiabilidade
Retomando o exemplo do investimento em propaganda, a situação colo-
cada para o tomador de decisões era a de decidir entre duas ações, A1 (inves-
tir em propaganda de um novo produto) e A2 (não investir em propaganda
de um novo produto).
Qual a ação que a diretoria deve tomar de forma a potencializar as suas

possibilidades de lucro, diante do quadro de retorno ou possíveis ganhos?
A tabela a seguir resume a situação de retorno exposta, na qual os valo-

res são expressos em milhares de reais, isto é, 90 representa um ganho de
R$90.000,00:
A1 = investir em A2 = não investir em

Eventos
propaganda (R$) propaganda (R$)
θ3 = venda fraca -4 2
Com base em avaliações subjetivas, a diretoria estabelece a seguinte dis-

tribuição de probabilidades para os eventos em questão:
θ1 = venda forte 0,2
θ2 = venda moderada 0,5
θ3 = venda fraca 0,3
Total 1,0
Diante desses dados, foram determinados os valores esperados de ganhos

sob incerteza para a ação A1 de R$31.800,00 e para a ação A2 de R$17.600,00.
231
Teoria da decisão
Associado a esses cálculos, foi determinado o custo da incerteza (ou valor

esperado da perda de oportunidade) em R$1.800,00, considerado alto pela
diretoria. Decide-se, então, por proceder a um levantamento amostral no
sentido de verificar os ganhos esperados para cada ação de forma que o
custo da incerteza possa ser reduzido através da incorporação de evidências
adicionais e, portanto, com a diminuição da incerteza.
Vamos assumir que a pesquisa possa resultar em três resultados amostrais,

denotados por x1, x2 e x3, correspondentes aos três estados da natureza (even-
tos) θ1, θ2 e θ3. Especificamente, os resultados da pesquisa podem ser: a amos-
tra indica vendas fortes (x1), vendas moderadas (x2) ou vendas fracas (x3).
A pesquisa foi realizada e a amostra indicou um nível de venda moderada

para o produto, isto é, x2 foi observado.
Suponha agora que, com base em pesquisas anteriores semelhantes, os

pesquisadores possam acessar a confiabilidade da evidência amostral nos
seguintes termos: no passado, quando o nível de venda real foi moderado,
a pesquisa amostral indicou corretamente venda moderada em 80% das
vezes. No entanto, quando o nível real de vendas foi forte, em cerca de 20%
das pesquisas realizadas o nível indicado foi erroneamente indicado como
moderado. E quando o nível real de vendas foi baixo, cerca de 30% das pes-
quisas amostrais indicaram vendas moderadas.
Essas frequências relativas representam probabilidades condicionais que as

evidências indicassem nível moderado de vendas, dados os três possíveis even-
tos de nível de venda. Essas probabilidades podem ser representadas por:
P(x2/θ1) = 0,2
P(x2/θ2) = 0,8
P(x2/θ3) = 0,3
Com essa informação, a distribuição de probabilidades a priori original

pode ser revisada conforme indica a seguinte tabela:
232
Teoria da decisão
Probabilidade Probabilidade Probabilidade Probabilidade

a priori condicional conjunta a posteriori
Eventos θi P(θi) P(x2/θi) P(θi) P(x2/θi) P(θi/x2)
θ1 = venda forte 0,2 0,2 0,04 0,0755
θ2 = venda
0,5 0,8 0,40 0,7547
moderada
θ3 = venda fraca 0,3 0,3 0,09 0,1698
Total 1,0 0,53 1,0000
Observe a utilização do Teorema de Bayes para cada um dos θi:
P (θ1)P(x2 / θ1)
P(θ1 / x2) =
∑P (θi)P(x2 / θi)
Na tabela, multiplicar cada probabilidade a priori P(θi) pela sua correspon-

dente probabilidade condicional P(x2/θi), obtendo-se assim as probabilida-
des conjuntas, cuja soma é ΣP(θi) P(x2/θi). Para calcular as probabilidades a
posteriori associadas a cada um dos eventos θi, basta dividir a probabilidade
conjunta de cada evento pela soma das probabilidades conjuntas. Essa é
uma forma confortável de calcular as probabilidades a posteriori através do
uso do Teorema de Bayes.
Fica bem ilustrativo a diminuição do espaço amostral com a corresponden-

te probabilidade de 0,53 e quanto dessa probabilidade será destinada a cada
um dos eventos. Equivale, portanto, a considerar 0,53 como a totalidade (1,0)
e verificar quanto disso corresponde a cada um dos eventos.
Assim, com uma indicação amostral de vendas moderadas, a probabili-

dade a priori de 0,5 do evento vendas moderadas foi revisado e cresceu para
aproximados 0,75. Da mesma forma, as probabilidades 0,2 e 0,3, correspon-
dentes aos eventos venda fraca e venda forte, foram revisados e declinaram
para 0,07 e 0,17.
233
Teoria da decisão
Essas probabilidades revisadas podem ser agora utilizadas para os cál-

culos do ganho esperado a posteriori e da perda esperada de oportunidade a
posteriori ou custo esperado da incerteza. Então, os resultados obtidos foram
de R$28.756,80 de ganho esperado para a ação A1 (investir em propaganda)
e R$12.416,60 para A2 (não investir em propaganda) e o custo esperado da
incerteza diminuiu de R$1.800,00 para R$1.018,80.
Tabela 1 – Ganho esperado a posteriori

Ação 1: investir em propaganda Ação 2: não investir em propaganda
Evento Probabi- Resultado Probabi- Resulta- Resultado
Resultado
lidade ponderado lidade do ponderado
θ1 0,0755 90 6,795 0,0755 60 4,53
θ2 0,7547 30 22,641 0,7547 10 7,547
θ3 0,1698 -4 -0,6792 0,1698 2 0,3396
Total 1,0000 28.756,80 1,0000 12.416,60
Tabela 2 – Perda de oportunidade esperada a posteriori

Ação 1: investir em propaganda Ação 2: não investir em propaganda
Probabi- Resultado Probabi- Resultado

Evento Resultado Resultado
lidade ponderado lidade ponderado
θ1 0,0755 0 0 0,0755 30 2,265
θ2 0,7547 0 0 0,7547 20 15,094
θ3 0,1698 6 1,0188 0,1698 0 0
Total 1,0000 1,0188 1,0000 17,3590
O diagrama de árvores a seguir descreve a situação para os ganhos espe-

rados a posteriori.
234
Teoria da decisão
) R$90,00
755
R$28.756,60 (0,0
(0,7547)
R$30,00
A1 (0,1
698
2 )
R$28.756,60
– R$4,00
) R$60,00
1 755
R$12.416,60 (0,0
A2
(0,7547)
R$10,00
(0,1
698
)
2
R$2,00
Como o ganho esperado sob A1 é maior que o ganho esperado sob A2,
a melhor das duas ações continua sendo a de investir em propaganda. Ob-
serve, no entanto, que essa decisão poderia ter sido modificada após o assi-
nalamento da distribuição de probabilidades a posteriori, com a inclusão de
novas evidências devido ao processo de busca de dados na amostragem.
A amostragem indicada anteriormente indicou “vendas moderadas”, mas

se ela tivesse indicado vendas fracas ou vendas fortes, o mesmo procedi-
mento poderia ser realizado para o cálculo dos novos valores de ganhos es-
perados e de custos da incerteza.
O custo da incerteza teve uma diminuição de R$1.800,00 para R$1.088,00.

Esse custo significa o quanto o tomador de decisões estaria disposto a pagar
para ter a informação perfeita. Se esse valor tivesse crescido ao invés de di-
minuído, como foi o caso, significaria que a evidência amostral não resultou
em diminuição da dúvida de que ação tomar e que a nova situação não traria
maior segurança na decisão.
Análise a posteriori:
uma ilustração da aceitação da amostragem
Como uma segunda ilustração da análise a posteriori, vamos considerar
o problema da aceitação da amostragem de um produto manufaturado.
Vamos assumir que a empresa ABC inspeciona artigos de componentes de
235
Teoria da decisão
seus produtos vindos de certo fornecedor. Observando dados de inspeções

passadas, a empresa verifica que 10%, 20% e 30% dos componentes do for-
necedor tinham defeitos.
Da experiência passada, a empresa ABC estabeleceu como critério de

aceitação de lotes com até 10% peças de defeituosas para retrabalho, e rejei-
tar lotes com 20% e 30% de peças defeituosas. A questão consiste em decidir
se aceita ou não um novo lote através do exame de uma amostra sua.
Essa decisão deverá ser tomada com base em algumas informações que
a empresa tem. Primeiro, com base em frequências relativas, lotes com essas
percentagens de peças defeituosas ocorreram 50%, 30% e 20% das vezes.
Ou seja, lotes com 10% de peças defeituosas ocorreram em 50% das entre-
gas. Outra informação que será utilizada será a matriz de resultados baseada
na matriz de perda de oportunidades em tomar a ação A1, de rejeitar o lote,
e a ação A2, de aceitar o lote. Com base em resultados anteriores, essa matriz
é dada por:
Tabela 3 – Matriz de perda de oportunidade

Evento Ação A1 Ação A2
Proporção de defeituosas Rejeitar o lote Aceitar o lote
0,10 R$30,00 R$0,00
0,20 R$0,00 R$15,00
0,30 R$0,00 R$20,00
Seria mais realístico tomar eventos com proporções de defeituosas va-

riando de 0%, 1% até 100%, ou mesmo considerar esta como uma variável
contínua. Para efeito de simplificação de apresentação do método, serão
consideradas somente essas três possibilidades.
Com essas informações e com base no resultado de uma amostra de, diga-
mos, 10 elementos de uma nova entrega, em que será verificado o número de
peças defeituosas entre essas 10, a empresa decidirá se aceita ou não o lote.
A empresa pode usar as frequências relativas (50%, 30% e 20%) como dis-
tribuição a priori e determinar a perda esperada de oportunidade para cada
uma das duas ações possíveis:
236
Teoria da decisão
Ação A1 - rejeitar o lote Ação A2 - aceitar o lote

Evento
p Perda de Perda Perda de Perda
P0(p) P0(p)
oportunidade ponderada oportunidade ponderada
0,10 0,50 30 15,00 0,50 0 0,00
0,20 0,30 0 0,00 0,30 15 4,50
0,30 0,20 0 0,00 0,20 20 4,00
Total 1,00 R$15,00 1,00 R$8,50
Quando então utilizamos os dados do passado, verificamos que a perda

esperada de oportunidade a priori para ação A1 (R$15,00) supera a perda da
ação A2 (R$8,50). Assim, a ação ótima é a ação A2, de aceitar o lote.
Indo agora para a análise a posteriori, quando uma amostra de tamanho

10 com reposição dos itens do lote é retirada para análise. Verifica-se que três
peças são defeituosas. Qual será agora a melhor ação?
As evidências amostrais devem ser utilizadas para revisar as probabilida-

des a priori das proporções de peças defeituosas. Para aplicar o Teorema de
Bayes, é necessário determinar as probabilidades condicionais P(X = 3/n =
10, p). Aqui será necessária a aplicação do cálculo de probabilidades de um
processo de Bernoulli através da distribuição binomial. Então:
P(X = 3/n = 10, p) = Cn,xpx (1– p)n – x
Essas probabilidades serão iguais a 0,0574, 0,2013 e 0,2668 para “p” igual
a 0,10, 0,20 e 0,30, respectivamente. Senão, vejamos para p = 0,10, o mesmo
pode ser feito para p = 0,20 e p = 0,30:
P(X = 3/n = 10, p) = Cn, xpx (1 – p)n – x = C10, 3 (0,10)3.(0,9)7
(120).(0,001).(0,478297) = 0,057396 ≈ 0,0574
Dessa forma, as probabilidades a posteriori podem ser determinadas di-

retamente pelo Teorema de Bayes através de uma tabela auxiliar. Como já
realizado anteriormente, denotaremos a probabilidade a priori por P0 e a
probabilidade a posteriori por P1:
237
Teoria da decisão
Probabilidade Probabilidade Probabilidade Probabilidade

Eventos p a priori condicional conjunta a posteriori
P0(p) P(X=3/n=10,p) P(p) P(X=3/n=10,p) P1(p)

0,10 0,5 0,0574 0,02870 0,20147
0,20 0,3 0,2013 0,06039 0,42394
0,30 0,2 0,2668 0,05336 0,37459
Total 1,0 0,14245 1,00000
As perdas esperadas de oportunidade podem agora ser recalculadas uti-

lizando essas probabilidades a posteriori. O novo cálculo das perdas espera-
das de oportunidade é apresentado na tabela a seguir:
Ação A1: rejeitar o lote Ação A2: aceitar o lote

Evento
P Perda de Perda Perda de Perda
P1(p) P1(p)
oportunidade ponderada oportunidade ponderada
0,10 0,20147 30,00 6,04 0,20147 0,00 0,00
0,20 0,42394 0,00 0,00 0,42394 15,00 6,36
0,30 0,37459 0,00 0,00 0,37459 20,00 7,49
Total 1,00000 R$6,04 1,00000 R$13,85
A ação ótima agora é a de rejeitar o lote, uma vez que a perda esperada de
oportunidade de A2 é maior do que a perda esperada de oportunidade de A1.
Para efeito de comparação, pode-se verificar que se supuséssemos que o

número de peças defeituosas na amostra de 10 itens fosse de 2 unidades, a
ação preferida seria A1 com perda de oportunidade de 12,41 contra 9,79 de
A2. E se houvesse uma única defeituosa, a perda de oportunidade de A1 seria
de 19,47 contra 5,67 de A2.
Efeito do tamanho da amostra

Podemos analisar o efeito do tamanho da amostra no cálculo das pro-
babilidades a posteriori. Suponha que uma amostra de tamanho 100, e não
mais de tamanho 10, seja retirada. Vamos assumir a mesma proporção de
defeituosas, 30% como no caso da amostra pequena. Então, um número de
30 peças defeituosas foi encontrado no lote.
238
Teoria da decisão
Probabilidade Probabilidade Probabilidade

Eventos Probabilidade conjunta
a priori condicional a posteriori
p
P0(p) P(X=30/n=100,p) P(p) P(X=30/n=100,p) P1(p)
0,10 0,5 0,000000018 0,000000009 0,00000005
0,20 0,3 0,005189 0,0015567 0,082
0,30 0,2 0,086784 0,0173568 0,918
Total 1,0 0,018913509 1,000
A maior probabilidade, 91,8%, foi encontrada para o evento p = 0,30

depois que foi acrescentada à informação que na amostra de tamanho 100
havia 30% de defeituosas. Pode-se generalizar esse resultado da seguinte
forma: à medida que o tamanho da amostra cresce, a distribuição de pro-
babilidades a posteriori da variável aleatória “proporção de defeituosas” é
influenciada muito mais pelo tamanho da amostra do que pela distribuição
de probabilidades a priori.
As informações a seguir devem ser utilizadas para a resolução dos exercí-
cios de 1 a 5. Um investidor tem R$50.000,00 e deve decidir entre três portfó-
lios preparados por um especialista. Os portfólios são caracterizados como de
alto risco, médio risco e baixo risco, e os retornos dependem da situação eco-
nômica. Assumindo que somente duas situações econômicas sejam conside-
radas (“crescimento” e “recessão”), a probabilidade de recessão é de 30%. Dada
a seguinte matriz de resultados (dada em centenas de reais), qual portfólio o
investidor deveria escolher?
Portfólio
Estados da natureza
Risco alto Risco médio Risco baixo
Crescimento 10 4 2
Recessão -15 -2 1
1. Qual dos três portfólios deve ser escolhido se o critério utilizado for
o maximim?
2. Para o problema em questão, qual a crítica ao uso desse critério?
239
Teoria da decisão
3. Para o critério ganho esperado sob incerteza, qual a decisão a ser to-
mada?
4. Calcule as perdas de oportunidade esperada para cada portfólio.
5. Faça a representação através do diagrama de decisão para o critério

minimax.
6. Construa a distribuição de probabilidades acumulada através da uti-

lização de dados de vendas do passado com relação aos números de
pedidos e ao número de semanas em que eles foram feitos, conforme
tabela a seguir:
Número de Número de semanas Número de Número de semanas

equipamentos que o número de equipamentos em que o número de
vendidos ordens foi recebido vendidos ordens foi recebido
21 1 32 1
22 0 33 1
23 0 34 1
24 2 35 0
25 2 36 0
26 3 37 1
27 3 38 1
28 1 39 1
29 0 40 0
30 0 41 0
31 1 42 1
Dados para os exercícios 7 e 8. Um novo curso está sendo ofertado em

uma faculdade. Seja “p” a proporção de estudantes que tiveram notas infe-
riores à média no trabalho final do curso. Os estados da natureza e suas res-
pectivas probabilidades condicionais são as seguintes:
240
Teoria da decisão
P P0(p)
0,05 0,30
0,10 0,40
0,15 0,20
0,20 0,10
7. Das informações dadas, preencha as células em branco e interprete os

dados. O X é o resultado da pesquisa de 1 000 empresas de construção.
Estados da natureza P0(θ) P(X/θ) P0(θ) P(X/θ) P1(θ/X)
θ1 = casas terão preços aumen-

0,80
tados no próximo ano
θ1 = casas terão preços iguais

0,60
ou diminuídos no próximo ano
8. São dados os seguintes resultados de um experimento em que θ1 é

“produto superior” e θ2 é “produto igual ou inferior”. Calcule as proba-
bilidades a priori.
Estados da natureza P(X/θ) P1(θ/X)

θ1 0,50 0,25
θ2 0,50 0,75
Gabarito
1. No critério maximim, o tomador de decisão assume que uma vez que
uma ação seja escolhida a natureza escolherá o estado da natureza
que minimize o rendimento sob a pior perspectiva.
Estados da Portfólio
Risco alto Risco baixo
natureza risco médio
Crescimento 10 4 2
Recessão –15 –2 1
241
Teoria da decisão
Possíveis ações: A1 = risco alto, A2 = risco médio e A3 = risco baixo.
Se o investidor escolher A1, a natureza provocará a ocorrência de θ2

(recessão) e o resultado será um prejuízo de R$15.000,00. Para a ação
A2, o resultado será um prejuízo de R$2.000,00, e para A3 o resultado
será um lucro de R$1.000,00.
O investidor deve escolher a ação que produza o maior rendimento.

Nesse caso, a ação A3, é escolher o portfólio de risco baixo.
2. O critério é um critério pessimista. No caso em questão, a decisão

pelo portfólio de risco baixo dá um retorno de R$2.000,00 se a situa-
ção for de crescimento da economia e de R$1.000,00 para o caso de
recessão. O investidor ganha nas duas situações, mas ganha pouco.
Se houver uma situação de crescimento na economia, a aquisição dos

portfólios de risco médio e risco alto dariam resultados muito bons.
Valeria a pena ter informações sobre as probabilidades de ocorrência
dos vários estados da natureza. Se houver uma boa probabilidade de
crescimento econômico, valerá a pena outra opção.
3. Uma vez que a probabilidade de recessão é de 30% ou 0,3, então a

probabilidade de crescimento é de 70% ou 0,7. Assim, a distribuição
de probabilidades pode ser expressa pela tabela:
θ1 = crescimento 0,7
θ2 = recessão 0,3
Total 1
O valor esperado de cada ação será a média ponderada dos resultados

para cada ação, tendo como peso as probabilidades de ocorrência de
cada evento:
Risco Resultado Risco Resultado Risco Resultado

Evento Prob.
alto ponderado médio ponderado pequeno ponderado
θ1 0,7 10 70 4 2,8 2 1,4
θ2 0,3 –15 –45 –2 –0,6 1 0,3
242
Teoria da decisão

Evento Prob.
Total 1,0 35 2,2 1,7
Resultado
R$35.000,00 R$2.200,00 R$1.700,00
esperado
Pelo critério de ganho esperado sob incerteza, o tomador de decisões

deve escolher aquela ação com maior resultado esperado. No proble-
ma, a ação a ser escolhida é A1, ou seja, escolher o portfólio de risco
alto, que deve ter como resultado o valor de R$35.000,00.
4. Para determinar as Perdas de Oportunidade Esperada, é necessário

inicialmente determinar a tabela de perda de oportunidades. Esse cál-
culo é o resultado da diferença entre o ganho daquele ato e o ganho
para o melhor ato que poderia ter sido selecionado.
Ganhos Perda de oportunidade

Evento
A1 A2 A3 A1 A2 A3
θ1 10 4 2 0 6 8
θ2 –15 –2 1 16 3 0
A partir da determinação das perdas de oportunidade, podemos cal-

cular agora as perdas de oportunidade esperada para cada ação.

Evento Prob.
θ1 0,7 0 0 6 4,2 8 5,6
θ2 0,3 16 4,8 3 1,8 0 0
Total 1,0 4,8 6,0 5,6
Resultado
R$4.800,00 R$6.000,00 R$5.600,00
Esperado
As perdas de oportunidade esperada para cada portfólio são: risco

alto POE(A1) = R$4.800,00; risco médio POE(A2) = R$6.000,00; e risco
pequeno POE(A3) = R$5.600,00.
243
Teoria da decisão
5. A ação que minimiza a perda de oportunidade esperada é a ação A1,

cuja perda de oportunidade esperada é R$4.800,00, a menor das três.
Portanto, a ação a ser tomada é a de investir no portfólio de risco alto.
6. São dados números de aparelhos vendidos e a quantidade de ordens

recebidas. Ou seja, ocorreu somente em uma semana o pedido de 21
equipamentos. 24 equipamentos foram pedidos em duas semanas, e
assim por diante.

equipamentos em que o número de equipamentos em que o número de
21 1 32 1
22 0 33 1
23 0 34 1
24 2 35 0
25 2 36 0
26 3 37 1
27 3 38 1
28 1 39 1
244
Teoria da decisão

29 0 40 0
30 0 41 0
31 1 42 1
Reorganizando a tabela e computando as frequências relativas, teremos:
Número de Frequência de Frequência relativa

equipamentos vendidos ocorrências de ocorrências
21 1 0,05
24 2 0,10
25 2 0,10
26 3 0,15
27 3 0,15
28 1 0,05
31 1 0,05
32 1 0,05
33 1 0,05
34 1 0,05
37 1 0,05
38 1 0,05
39 1 0,05
42 1 0,05
Distribuição de frequências relativas acumuladas:

21 0,05 32 0,70
22 0,05 33 0,75
245
Teoria da decisão

23 0,05 34 0,80
24 0,15 35 0,80
25 0,25 36 0,80
26 0,40 37 0,85
27 0,55 38 0,90
28 0,60 39 0,95
29 0,60 40 0,95
30 0,60 41 0,95
31 0,65 42 1,00
O gráfico da distribuição de frequências acumuladas é a ogiva de

Galton a seguir:
Distribuição acumulada
1
0,9
0,8
Probabilidade
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
7. Preenchendo os vazios:
Estados da
P0(θ) P(X/θ) P0(θ) P(X/θ) P1(θ/X)
natureza
θ1 = Casas terão
preços aumenta-
0,80 1,00 – 0,60 = 0,40 0,80 . 0,40 = 0,32 0,32/0,44 = 0,73
dos no próximo
ano
246
Teoria da decisão
Estados da
P0(θ) P(X/θ) P0(θ) P(X/θ) P1(θ/X)
natureza
θ1 = Casas terão
preços iguais ou
1,00 – 0,80 = 0,20 0,60 0,20 . 0,60 = 0,12 0,12/0,44 = 0,27
diminuídos no pró-
ximo ano
Total 1,00 1,00 0,32 + 0,12 = 0,44 0,73 + 0,27 = 1,00
Interpretação das probabilidades:
P0(θ) – probabilidades a priori dos estados da natureza. A probabilida-

de a priori de que as casas terão seus preços aumentados no próximo
ano é de 80%. E de não terem seus preços aumentados é de 20%.
P(X/θ) – probabilidades determinadas através de observações amos-

trais ou de dados do passado.
P1(θ/X) – probabilidades a posteriori dos estados da natureza. São chama-

das de probabilidades revisadas com base em observações amostrais.
8. Encontrar os valores de “a” e de “b”.
Estados da natureza P0(θ) P0(θ) P0(θ) P0(θ) P1(θ/X)

θ1 a 0,50 0,5 a 0,25
θ2 b 0,50 0,5 b 0,75
Total 0,5a + 0,5b
Sabemos que:
 0,5a
 0,5a + 0,5b = 0,25

 0,5b = 0,75
 0,5a + 0,5b
Resolvendo o sistema de duas equações e duas incógnitas, chegamos
ao resultado que: a = P0(θ1) = 0,25 e que b = P0(θ2) = 0,75.
247
Problema
A empresa ABC é do ramo de informática. Um dos carros-chefe da em-
presa é um novo modem que está tendo muita aceitação no mercado. Os
diretores desejam fazer previsões de vendas para os próximos meses com
base nos dados de venda dos últimos 24 meses.
A tabela abaixo apresenta o resultado das vendas:
Tabela 1 – número de modems vendidos

Mês Vendas (R$)
1 48
2 53
3 46
4 51
5 47
6 50
7 49
8 55
9 55
10 51
11 54
12 52
13 51
14 55
15 47
16 51
17 53
249
Mês Vendas (R$)

18 56
19 52
20 50
21 50
22 48
23 51
24 53
Desejamos construir um modelo matemático idealmente satisfatório

dessa série temporal. Idealmente deveríamos procurar definir e medir os
muitos fatores que determinam as variações da quantidade vendida e então
estabelecer as relações matemáticas entre esses fatores e a particular série
em questão. No entanto, as determinantes das mudanças de uma série tem-
poral como essa são múltiplas, incluindo fatores como concorrência, prefe-
rências do consumidor, tecnologia, investimentos, clima, costumes e mais
uma série de variáveis econômicas e não econômicas.
A enormidade e a impraticabilidade da tarefa de medir todos esses fa-

tores e então relacioná-los matematicamente dificulta o enfoque chamado
direto. Assim, a opção por um enfoque mais prático e indireto tem sido a
opção de contorno dessas dificuldades.
A análise de séries temporal clássica é essencialmente um método que
busca quebrar uma série em distintos componentes que representam os
efeitos de fatores explanatórios. Esses componentes são: (I) tendência; (II)
flutuações cíclicas; (III) variações sazonais; e (IV) movimentos irregulares.
Série temporal
Uma série temporal é um conjunto de observações de uma variável quan-
titativa coletada no tempo. A série pode ser determinada em qualquer in-
tervalo de tempo, hora, dia, semana, mês, trimestre ou ano, dependendo do
250
interesse do tomador de decisões ou das condições do estudo ou ainda da

disponibilidade de informações.
Qualquer variável quantitativa pode ser medida no tempo e na área de

negócios pode interessar fazer medidas de vendas, preços, inventários e
assim por diante.
Gráfico de linhas
Como verificado no capítulo de análise de dados, o gráfico adequado
para a apresentação dos dados de uma série temporal é um gráfico de
linhas. Para o exemplo da venda dos modems, o gráfico correspondente é
o apresentado a seguir:
Gráfico de linhas
58
56
54
52
50
48
46
44
42
40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Métodos de séries temporais

As técnicas que analisam o comportamento de dados do passado e do
presente para predizer o futuro são chamadas de modelos de extrapolação. A
forma geral de tais modelos é Ŷt+1 = f (Yt, Yt-1, Yt-2 ...), em que Ŷt+1 representa o valor
predito para a variável em questão no período t + 1. Yt representa o valor da série
no tempo t, Yt-1 representa o valor da série no tempo t – 1 e assim por diante.
O objetivo de um modelo de extrapolação é identificar a função f(.) que

produza previsões de valores futuros da variável da série temporal.
251
Tendência
A tendência se refere a movimentos crescentes ou decrescentes de uma
série temporal em um longo período de tempo.
Antes que uma tendência de uma particular série possa ser determinada,
é geralmente necessário submeter os dados a algum tratamento prelimi-
nar, como, por exemplo, verificar a quantidade em relação a uma população
determinada durante o período em que os dados foram coletados. Dessa
forma, caracteriza-se a quantidade per capita.
O gráfico a seguir apresenta uma série com tendência crescente. Observe

que a linha de tendência faz um ângulo significativamente maior que zero
com o eixo X.
1650
1500
1350
1200
1050
1 5 9 13 17 20
Série temporal estacionária

Uma série temporal é dita estacionária se não há uma tendência de cresci-
mento ou decrescimento significativo nos dados através do tempo. Se a série
temporal apresentar alguma dessas tendências, ela é dita não estacionária.
Em uma série estacionária, os dados estão espalhados no tempo de forma

aleatória ao redor de uma reta paralela ao eixo X, que representa os valores da
média dos dados, apresentando um equilíbrio estável. Uma série pode ser esta-
cionária durante um período e não estacionária durante outro período.
A série a seguir pode ser considerada estacionária. Observe que a linha de

tendência da série é paralela ao eixo X.
252
120
110
100
90
80
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Erro Médio Quadrático (EMQ)

Vários métodos podem ser utilizados para modelar dados de uma série
temporal. Uma forma de avaliar qual é o melhor modelo é estudar qual ex-
plica melhor o comportamento da série em relação aos dados do passado.
Podemos fazer essa verificação através da comparação dos dados reais (Y)
com os dados decorrentes do ajuste do modelo (Ŷ).
Com base nas observações acima, podemos definir o Erro Médio Quadráti-
co (EMQ) correspondente a cada um dos modelos propostos. Aquele modelo
com o menor erro médio quadrático será considerado o mais adequado.
O EMQ é definido como a soma da diferença entre os valores observados

e valores reais dividida por n.
∑(Y – Ŷ)2
EMQ =
n
O EMQ é bastante próximo do critério de mínimos quadrados ordinários

utilizado na construção do modelo de regressão linear simples.
253
Ciclo
Flutuações cíclicas ou movimentos cíclicos são movimentos de cresci-
mento ou decrescimento recorrentes em torno dos níveis de tendência.
Sazonalidade
Variações sazonais são ciclos que se completam dentro de um período de
calendário regular, repetindo esse padrão básico ao longo de toda a série. Os
maiores fatores que produzem esses padrões repetidos ocorrem em séries
anuais que obedecem a variações sazonais devido ao clima e aos costumes.
Todos os anos, no período que antecede o inverno, há um crescimento

da venda de roupas para o frio. Também há todo ano um crescimento de
vendas em datas como o Dia das Mães, Dia dos Pais, Dia das Crianças e no
período do Natal.
Movimentos irregulares
Movimentos irregulares são flutuações nas séries temporais que têm du-
ração curta, têm natureza errática e não seguem nenhuma regularidade re-
corrente ou outro padrão discernível.
Método dos mínimos quadrados ordinários

Para situações nas quais é desejável ter uma equação matemática para
descrever a tendência em uma série temporal, o método mais comumente
usado é ajustar alguma forma de função polinomial para os dados. Nesta
seção, vamos ilustrar o método geral através de um exemplo simples, ajus-
tando uma linha reta ao método dos mínimos quadrados.
O método dos mínimos quadrados

O método dos mínimos quadrados, quando usado para ajustar linhas
retas de tendência em dados de séries temporais, é empregado principal-
mente porque é simples e prático e fornece o melhor ajustamento de acordo
com um critério razoável.
254
No entanto, devemos alertar que o método de mínimos quadrados não

tem o mesmo tipo de suporte teórico quando aplicado para ajustar retas na
análise de regressão, conforme visto no capítulo 6.
A maior dificuldade é que as suposições probabilísticas feitas na análise de

regressão simplesmente não são encontradas na análise de séries temporais.
No exemplo que analisamos naquele capítulo, verificamos como gastos em
pesquisa e desenvolvimento tecnológico podem afetar positivamente o fatura-
mento de empresas de informática. Naquele caso, o faturamento era considera-
do uma variável aleatória e o investimento uma variável fixa ou controlada.
Para a variável dependente, o modelo assumia distribuições de proba-

bilidade condicional dessa variável aleatória em torno de seus valores que
caiam na reta de regressão. Os valores Y eram as médias das distribuições
de probabilidade condicional. Algumas suposições estavam implícitas nesse
tipo de modelo: os desvios em torno da reta eram considerados erros alea-
tórios descritos por uma distribuição de probabilidades. As sucessivas ob-
servações da variável dependente foram assumidas como independentes.
Por exemplo, os gastos da empresa B em p&d não dependiam dos gastos da
empresa A, e assim por diante.
Se uma reta é ajustada, por exemplo, para uma série de tempo anual
sobre vendas, o tempo é tratado como a variável independente X e as
vendas como a variável independente Y. Não é razoável pensar que os des-
vios das vendas reais em um dado ano seja um erro aleatório. De fato, se os
dados originais são anuais, os desvios em relação à reta podem ser devido
a operações cíclicas ou fatores irregulares. Se a série for de um ano, não faz
sentido pensar em fatores sazonais devidos ao clima ou costumes porque a
série duraria um só período.
Finalmente, a suposição de independência não é encontrada em uma

série temporal. As vendas de um determinado mês certamente não são in-
dependentes do que foi vendido no mês anterior.
Ajustamento de uma reta

Como exemplo, vamos ajustar uma reta pelo método dos mínimos qua-
drados para as vendas de computadores de uma grande loja durante o perí-
odo de 1993 a 2007, conforme tabela a seguir:
255
Ano Tempo Vendas (R$)

1993 1 2.484
1994 2 2.767
1995 3 2.088
1996 4 3.611
1997 5 4.216
1998 6 4.665
1999 7 5.275
2000 8 5.616
2001 9 6.165
2002 10 6.720
2003 11 7.400
2004 12 7.975
2005 13 8.800
2006 14 9.520
2007 15 10.450
A reta de regressão pode ser expressa como Ŷ = a + b t. Os valores de “a”

e “b” estimados através do método de regressão são substituídos na reta e o
modelo linear que explica a relação.
O sistema de equações normais é dado então por:
y=a+bt
∑tY = a∑t + b∑t 2
Usualmente, quando uma equação de regressão é utilizada para séries

temporais, os valores dos tempos são transformados para valores com
poucos dígitos. Então, o ano 1993 será transformado para 1, o de 1994 para 2
e assim por diante. Poderíamos também transformar os dados fazendo o ano
central igual a 0, os anteriores –1, –2 ... e os posteriores 1, 2... Utilizaremos a
primeira opção. Dessa forma, o sistema de equações normais será:
88 752 = 15a + 120b

8 666 864 = 120a + 1 240b
256
Resolvendo o sistema, encontraremos os valores de a = 1 435,43 e b =

560,17. A reta de regressão será então: Ŷ = 1 435,43 + 560,17 t.
O gráfico que se segue representa os dados originais e a reta de regressão

ajustada.
Gráfico de vendas
12 000
10 000
8 000
6 000
4 000
2 000
0
0 5 10 15 20
O valor de r2, o coeficiente de determinação, é igual a 0,987, ou seja, o ajuste é

bastante bom para essa série. O valor de a = 1 453,43 tem a mesma interpretação
que na reta de regressão. É o valor de vendas para t = 0, ou seja, para o ano 1992.
Também b = 560,17 é a variação de vendas para a variação de um ano.
Projeção no tempo
Projeções na reta determinada podem ser obtidas se substituirmos t na
reta por valores apropriados. Por exemplo, a projeção para vendas de com-
putador para o ano de 2008, por exemplo, pode ser realizada assumindo o
valor t = 16 na reta de tendência. Então, os valores das vendas seriam Ŷ = 1
435,43 + 560,17 t = 1 435,43 + 560,17 . (16) = 10 398,2, ou simplesmente 10
398 computadores.
Essas estimativas podem ser feitas para mais um ou dois períodos, e ainda
assim há um alto grau de incerteza. Se predições para mais tempo forem
desejadas, estimativas de outros fatores teriam que ser acrescentados à esti-
mativa da tendência.
Flutuações cíclicas
Como foi indicado previamente, quando uma série temporal consistir de
dados anuais, ela poderá conter tendência, ciclo e elementos irregulares. As
257
variações sazonais estarão ausentes, uma vez que elas ocorrem dentro de
um ano. Então, desvios dos dados anuais em relação à reta de tendência são
atribuíveis somente a fatores cíclicos e irregulares.
Os desvios em relação à tendência são mais facilmente observados divi-

dindo o valor dos dados originais pelos valores correspondentes na linha de
tendência para o mesmo período. Por convenção, o resultado da divisão do
dado original pelo valor na linha de tendência é multiplicado por 100 para
expressar os resultados como percentuais de tendência.
Assim, se o dado original é exatamente igual ao valor estimado, a per-

centagem de tendência será igual a 100. Se o dado original é maior do que
o valor estimado, o valor da percentagem de tendência será maior que 100,
caso contrário será menor.
A expressão para a percentagem de tendência é então dada por:
Percentagem de tendência = (Y/Ŷ).100
Quando convertidos à percentagem de tendência, os dados contêm so-

mente os movimentos cíclicos e irregulares, uma vez que a divisão pela ten-
dência elimina aquele fator. O modelo multiplicativo para a análise fornece a
lógica desse procedimento. Isto é, os dados originais são vistos como repre-
sentando os efeitos combinados de tendência, ciclo e fatores irregulares.
Em símbolos, T, C e I representam tendência, ciclo e fatores irregulares,

respectivamente. Dividindo a série temporal original pelos resultados obti-
dos dos valores da tendência, produzem:
Y = T.C.I = C.I
Ŷ T
As percentagens de tendência da série de vendas de computador mos-

trada no início desta seção está apresentada na tabela e no gráfico a seguir:
Tempo Vendas (R$) Yest. %Tend.

1 2.484 1 995,6 124,5
2 2.767 2 555,8 108,3
3 3.088 3 115,9 99,1
258
Tempo Vendas (R$) Yest. %Tend.

4 3.611 3 676,1 98,2
5 4.216 4 236,3 99,5
6 4.665 4 796,5 97,3
7 5.275 5 356,6 98,5
8 5.616 5 916,8 94,9
9 6.165 6 477,0 95,2
10 6.720 7 037,1 95,5
11 7.400 7 597,3 97,4
12 7.975 8 157,5 97,8
13 8.800 8 717,7 100,9
14 9.520 9 277,8 102,6
15 10.450 9 838,0 106,2
Percentagem de tendência
130
125
120
115
110
105
100
95
90
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Tempo
Abaixo e acima da linha que representa 100% estão as percentagens que

podem mostrar picos e vales durante o período estudado. Esses gráficos de
flutuações cíclicas são muito úteis na área de negócios e aparecem frequen-
temente em jornais e periódicos econômicos. Eles podem ainda ser utilizados
para verificar a amplitude das flutuações, da duração dos períodos de expansão
e contração e para outros itens de interesse dos ciclos de negócios.
259
Modelo de médias móveis

A técnica conhecida como médias móveis é provavelmente o método
de extrapolação mais simples para dados estacionários. Com essa técnica, o
valor predito para a série temporal no período t + 1, denotado Ŷt+1, é simples-
mente a média das k observações anteriores da série, isto é:
Ŷt+1 = (Yt + Yt-1 + ... + Yt-k+1)

K
O valor k determina quantas observações prévias serão incluídas na média

móvel. Não há um valor de k que seja teoricamente melhor que outro, sendo
assim devemos tentar vários valores para escolher o melhor.
O primeiro exemplo do capítulo forneceu informações da quantidade de

modems vendidos durante um período de 24 meses. A tabela a seguir repro-
duz a quantidade das vendas. Observe que para k = 2, o valor Ŷ3 = 50,5 é a
média entre Y1 = 48 e Y2 = 53. O valor Ŷ4 = 49,5 é a média entre Y2 = 53 e Y3 =
46, e assim por diante.
Ŷ p/ média móveis Ŷ p/ média móveis

Mês Vendas (R$)
2 meses 4 meses
1 48
2 53
3 46 50,5
4 51 49,5
5 47 48,5 49,5
6 50 49 49,25
7 49 48,5 48,5
8 55 49,5 49,25
9 55 52 50,25
10 51 55 52,25
11 54 53 52,5
12 52 52,5 53,75
13 51 53 53
14 55 51,5 52
260
Ŷ p/ média móveis Ŷ p/ média móveis

Mês Vendas (R$)
2 meses 4 meses
15 47 53 53
16 51 51 51,25
17 53 49 51
18 56 52 51,50
19 52 54,5 51,75
20 50 54 53
21 50 51 52,75
22 48 50 52
23 51 49 50
24 53 49,5 49,75
EMQ 9,55 9,35
Procedimento semelhante se aplica a outros valores de k. Para k = 4, em

que Ŷ5 = (Y1 + Y2 + Y3 + Y4)/4, os valores restantes são calculados com igual
procedimento. O gráfico a seguir apresenta as três séries. A série 1 corres-
ponde aos dados reais. A série 2 e a série 3 correspondem às médias móveis
com k = 2 e k = 4, respectivamente.
Média móvel com k = 2 e k = 4
58
56
54
52
Série 1
50 Série 2
48 Série 3
46
44
1 3 5 7 9 11 13 15 17 19 21 23
Os gráficos mostram que os valores preditos tendem a ser menos volá-

teis, ou mais suaves, do que os dados reais. Isso ocorre porque o método
de médias móveis retira os picos e os vales. Esse método então é conhecido
como método de suavização ou alisamento. Quanto maior for o valor de k,
maior será a suavização, como pode ser observado no gráfico anterior.
261
Podemos verificar a acurácia relativa das duas funções de previsão atra-

vés da comparação entre os erros médios quadráticos. Os valores dos erros
médios quadráticos para k = 2 e k = 4 são determinados pela expressão do
EMQ e são dados na tabela. O EMQ(k = 2) = 9,55 e EMQ(k = 4) = 9,35. O modelo
com quatro médias é um pouco melhor do que o modelo com duas médias.
Previsão com o modelo de médias móveis

Supondo que o modelo com média móvel de 2 meses para a venda de
modems possa ser aceito como satisfatório, a predição do número de modems
a ser vendido no vigésimo-quinto mês é calculado como:
(Y24 + Y23) (53 + 51)

Ŷ25 = = = 52
2 2
Para fazer previsões além de um único período e do conjunto de dados da

série temporal usando a técnica de médias móveis, devemos substituir os va-
lores previstos por valores reais não observados. Por exemplo, suponha que
ao final do período 24 desejamos prever o número de modems que serão
vendidos nos períodos 25 e 26. Usando a média móvel de dois períodos, a
previsão para o período 26 será:
(Y25 + Y24)
Ŷ26 =
2
No entanto, não sabemos o valor real de Y25. Temos que substituir Y25 por
Ŷ25 na equação passada, assim:
(Ŷ25 + Y24) (52 + 53)

Ŷ26 = = = 52,5
2 2
Método de médias móveis

para estudar sazonalidade
Para derivar um conjunto de índices de uma série caracterizada por um
padrão sazonal estável, cerca de cinco a nove anos de dados mensais ou trimes-
trais são necessários. Um padrão de sazonalidade estável significa que picos e
vales geralmente ocorrem nos mesmos meses ou trimestres a cada ano.
262
Um exemplo de valores de vendas de televisores em uma rede de lojas de

departamentos no país durante um período de cinco anos; medidos a cada
trimestre, será útil para ilustrar o método.
Tabela 2 – Vendas de televisão

Vendas
Ano Trimestre (em milhares
de reais)
2003 I 942
2003 II 1355,4
2003 III 1168,8
2003 IV 1248,3
2004 I 998,5
2004 II 1470
2004 III 1297,1
2004 IV 1311,2
2005 I 1113,5
2005 II 1565,2
2005 III 1410,9
2005 IV 1484
2006 I 1152,4
2006 II 1653,5
2006 III 1442,6
2006 IV 1535,8
2007 I 1267,1
2007 II 1678,7
2007 III 1527
2007 IV 1625,3
O gráfico a seguir representa a série correspondente aos valores de venda

de televisão no período:
263
Vendas de televisão
1 750
1 500
1 250
1 000
750
1 3 5 7 9 11 13 15 17 19
Os dados revelam que nos dois primeiros trimestres de cada semestre, ou

seja, no primeiro e no terceiro trimestres, há uma queda no valor das vendas
de televisão.
O processo de determinação das médias móveis consistirá em calcular

inicialmente a soma das vendas em 2003 (942; 1 355,4; 1 168,8 e 1 248,3) cor-
respondentes aos quatro primeiros valores de venda. O resultado encontra-
do foi de 4 714,5, como pode ser observado na tabela a seguir:
Vendas
Ano Trimestre (em milhares Total 1
de reais)
2003 I 942
2003 II 1.355,4
2003 III 1.168,8 4.714,5
2003 IV 1.248,3 4.771
2004 I 998,5 4.885,6
2004 II 1.470 5.013,9
2004 III 1.297,1 5.076,8
2004 IV 1.311,2 5.191,8
2005 I 1.113,5 5.287
2005 II 1.565,2 5.400,8
2005 III 1.410,9 5.573,6
2005 IV 1.484 5.612,5
264
Vendas
Ano Trimestre (em milhares Total 1
de reais)
2006 I 1.152,4 5.700,8
2006 II 1.653,5 5.732,5
2006 III 1.442,6 5.784,3
2006 IV 1.535,8 5.899
2007 I 1.267,1 5.924,2
2007 II 1.678,7 6.008,6
2007 III 1.527 6.098,1
2007 IV 1.625,3
Este processo deve ser continuado a partir do II trimestre de 2003. Então

o valor R$4.771,00 é o resultado da soma dos quatro valores subsequentes
(R$1.355,40; R$1.168,80; R$1.248,30 e R$998,50). Dessa forma, completa-se a
quarta coluna da tabela, Total 1, como resultado da soma de quatro valores.
A coluna seguinte, Total 2, será o resultado da soma de dois em dois

valores. Assim, o total R$9.485,50 é o resultado da soma de R$4.714,50 e
R$4.771,00. O Total 2 é o resultado então da soma de oito valores. Ver desta-
que na tabela a seguir:
Vendas
Ano Trimestre (em milhares Total 1 Total 2
de reais)
2003 I 942
2003 II 1.355,4
2003 III 1.168,8 4.714,5 9.485,5
2003 IV 1.248,3 4.771 9.656,6
2004 I 998,5 4.885,6 9.899,5
2004 II 1.470 5.013,9 10.090,7
2004 III 1.297,1 5.076,8 10.268,6
2004 IV 1.311,2 5.191,8 10.478,8
2005 I 1.113,5 5.287 10.687,8
2005 II 1.565,2 5.400,8 10.974,4
265
Vendas
Ano Trimestre (em milhares Total 1 Total 2
de reais)
2005 III 1.410,9 5.573,6 11.186,1
2005 IV 1.484 5.612,5 11.313,3
2006 I 1.152,4 5.700,8 11.433,3
2006 II 1.653,5 5.732,5 11.516,8
2006 III 1.442,6 5.784,3 11.683,3
2006 IV 1.535,8 5.899 11.823,2
2007 I 1.267,1 5.924,2 11.932,8
2007 II 1.678,7 6.008,6 12.106,7
2007 III 1.527 6.098,1
2007 IV 1.625,3
Os outros valores da coluna Total 2 são calculados da mesma forma.
Agora, é possível calcularmos as médias de vendas para cada período

de 8 trimestres, dividindo-se o Total 2 por 8. Essas determinações estão
na seguinte tabela:
Vendas
Ano Trimestre (em milhares Total 1 Total 2 Média móvel
de reais)
2003 I 942
2003 II 1.355,4
2003 III 1.168,8 4.714,5 9.485,5 1.185,69
2003 IV 1.248,3 4.771 9.656,6 1.207,08
2004 I 998,5 4.885,6 9.899,5 1.237,44
2004 II 1.470 5.013,9 10.090,7 1.261,34
2004 III 1.297,1 5.076,8 10268,6 1.283,58
2004 IV 1.311,2 5.191,8 10.478,8 1.309,85
2005 I 1.113,5 5.287 10.687,8 1.335,98
2005 II 1.565,2 5.400,8 10.974,4 1.371,8
2005 III 1.410,9 5.573,6 11.186,1 1.398,26
266
Vendas
Ano Trimestre (em milhares Total 1 Total 2 Média móvel
de reais)
2005 IV 1.484,00 5.612,50 11.313,30 1.414,16
2006 I 1.152,40 5.700,80 11.433,30 1.429,16
2006 II 1.653,50 5.732,50 11.516,80 1.439,60
2006 III 1.442,60 5.784,30 11.683,30 1.460,41
2006 IV 1.535,80 5.899,00 11.823,20 1.477,90
2007 I 1.267,10 5.924,20 11.932,80 1.491,60
2007 II 1.678,70 6.008,60 12.106,70 1.513,34
2007 III 1.527,00 6.098,10
2007 IV 1.625,30
O gráfico a seguir apresenta a série original das vendas e a nova série de

médias móveis sem a influência da sazonalidade.
1 750
1 500
1 250
1 000
750
1 3 5 7 9 11 13 15 17 19
Observe que essa série de médias móveis não é igual à reta que se obteria
se utilizássemos o método de mínimos quadrados, procedimento que resulta
na reta de regressão ou tendência. A tabela que se segue apresenta os dois re-
sultados para efeito de comparação. Pode-se observar que os valores são bem
próximos.
Ano Trimestre Média móvel Regressão

2003 III 1.185,69 1.181,3
2003 IV 1.207,08 1.205,4
2004 I 1.237,44 1.229,6
267
Ano Trimestre Média móvel Regressão

2004 II 1.261,34 1.253,7
2004 III 1.283,58 1.277,9
2004 IV 1.309,85 1.302,0
2005 I 1.335,98 1.326,1
2005 II 1.371,80 1.350,3
2005 III 1.398,26 1.374,4
2005 IV 1.414,16 1.398,6
2006 I 1.429,16 1.422,7
2006 II 1.439,60 1.446,9
2006 III 1.460,41 1.471,0
2006 IV 1.477,90 1.495,2
2007 I 1.491,60 1.519,3
2007 II 1.513,34 1.543,5
É útil verificar algumas informações reveladas no gráfico dos dados origi-

nais e os dados das médias móveis. Os dados originais foram estabelecidos
trimestralmente e contêm todos os componentes dos movimentos de ten-
dência, ciclo, sazonal e movimentos irregulares.
Embora o período nesse exemplo seja um pouco curto para que a

tendência seja revelada, podemos observar que as vendas de televisão
tendem a crescer durante todo o período. Movimentos irregulares estão
presentes. A média móvel, que passa suavemente entre os dados, segue
uma tendência crescente. Se as flutuações cíclicas estão claramente in-
dicadas, podemos ser capazes de observar como as médias móveis as
descrevem bem.
Retirada da sazonalidade
A percentagem da média móvel é dada pela razão entre os dados originais
e os das médias móveis multiplicada por 100, como de costume.
268
Vendas
Percentagem
Ano Trimestre (em milhares Média móvel
m. móveis
de reais)
2003 I 942
2003 II 1.355,4
2003 III 1.168,8 1.185,69 98,60
2003 IV 1.248,3 1.207,08 103,40
2004 I 998,5 1.237,44 80,70
2004 II 1.470 1.261,34 116,50
2004 III 1.297,1 1.283,58 101,10
2004 IV 1.311,2 1.309,85 100,10
2005 I 1.113,5 1.335,98 83,30
2005 II 1.565,2 1.371,80 114,10
2005 III 1.410,9 1.398,26 100,90
2005 IV 1.484 1.414,16 104,90
2006 I 1.152,4 1.429,16 80,60
2006 II 1.653,5 1.439,60 114,90
2006 III 1.442,6 1.460,41 98,80
2006 IV 1.535,8 1.477,90 103,90
2007 I 1.267,1 1.491,60 84,90
2007 II 1.678,7 1.513,34 110,90
2007 III 1.527
2007 IV 1.625,3
Esses valores podem ser apresentados através de um gráfico com centro

no valor 100%. Podemos ver no gráfico que os movimentos de tendência
e de ciclo não estão mais presentes. A linha base 100 representa o nível de
média móvel ou base tendência-ciclo. As flutuações acima e abaixo desta
linha revelam claramente o movimento sazonal repetitivo das vendas de te-
levisão. Como notado antes, a componente irregular também está presente.
Verifique essas observações no gráfico a seguir:
269
Percentagem de médias móveis

120
110
100
90
80
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
O próximo passo no procedimento é remover o efeito dos movimentos ir-

regulares. Isso é conseguido através do cálculo de médias das percentagens
das médias móveis para o mesmo trimestre. Isto é, calculamos as médias de
todos os primeiros trimestres e depois de todos os segundos trimestres, e
assim por diante.
Ano Trimestre Percentagem m. móveis

2003 I
2003 II
2003 III 98,60
2003 IV 103,40
2004 I 80,70
2004 II 116,50
2004 III 101,10
2004 IV 100,10
2005 I 83,30
2005 II 114,10
2005 III 100,90
2005 IV 104,90
2006 I 80,60
2006 II 114,90
270
Ano Trimestre Percentagem m. móveis

2006 III 98,80
2006 IV 103,90
2007 I 84,90
2007 II 110,90
2007 III
2007 IV
Percentagem de médias móveis por trimestre:
Ano Trimestre I Trimestre II Trimestre III Trimestre IV

2003 – – 98,60 103,40
2004 80,70 116,50 101,10 100,10
2005 83,10 114,10 100,90 104,90
2006 80,60 114,90 98,80 103,90
2007 84,90 110,90 – –
Média 82,02 114,48 99,84 103,67
Quando dividimos o valor dos dados originais de valor de venda pelas per-
centagens médias das médias móveis por trimestre e multiplicamos por 100,
encontramos os valores estimados para trimestre, retirando a sazonalidade.
Então, para o primeiro valor de vendas R$942 milhões pelo índice sazonal de
82,02 e multiplicando-se esse resultado por 100, obtemos o valor de R$1.148,53
milhões. O mesmo procedimento é realizado para todos os outros trimestres:
Vendas
Índice de Valores sem
sazonalidade sazonalidade
de reais)
2003 I 942 82,02 1.148,50
2003 II 1.355,4 114,48 1.183,96
2003 III 1.168,8 99,84 1.170,67
2003 IV 1.248,3 103,67 1.204,11
2004 I 998,5 82,02 1.217,39
271
Vendas
Índice de Valores sem
sazonalidade sazonalidade
de reais)
2004 II 1.470 114,48 1.284,07
2004 III 1.297,1 99,84 1.299,18
2004 IV 1.311,2 103,67 1.264,78
2005 I 1.113,5 82,02 1.357,60
2005 II 1.565,2 114,48 1.367,23
2005 III 1.410,9 99,84 1.413,16
2005 IV 1.484 103,67 1.431,47
2006 I 1.152,4 82,02 1.405,02
2006 II 1.653,5 114,48 1.444,36
2006 III 1.442,6 99,84 1.444,91
2006 IV 1.535,8 103,67 1.481,43
2007 I 1.267,1 82,02 1.544,87
2007 II 1.678,7 114,48 1.466,37
2007 III 1.527 99,84 1.529,45
2007 IV 1.625,3 103,67 1.567,76
O gráfico seguinte apresenta os valores sem sazonalidade.
Valores sem sazonalidade

1650
1500
1350
1200
1050
1 5 9 13 17
Podemos observar no gráfico a tendência subjacente e os movimentos

irregulares. Comparando com os dados originais, observamos que o movi-
mento sazonal já não se encontra mais presente.
272
Outros métodos de previsão

Além dos métodos apresentados, várias outras propostas podem ser in-
crementadas para o estudo de séries temporais. Para os métodos de médias
móveis apresentados, podemos observar que todos os dados do passado
têm o mesmo peso. No entanto, muitas vezes os dados mais recentes podem
influenciar mais fortemente as previsões. A técnica conhecida como médias
móveis ponderadas permite assinalar diferentes pesos para os dados que par-
ticiparão como base de previsões.
Também a técnica conhecida como alisamento exponencial permite a pon-

deração de dados provenientes de dados estacionários. Nesse caso, busca-se
a melhor combinação de pesos para os dados de tal forma que dados mais
recentes tenham maior peso e também buscando encontrar o melhor valor
dos ponderadores para obtenção de menor erro médio quadrático. Uma série
estacionária pode ter efeitos de sazonalidade tanto aditivos como multiplicati-
vos. Essa consideração leva também à construção de modelos particulares.
Para estudar tendência, é proposto um modelo de médias móveis duplas.

Essa técnica envolve tomar médias de médias. O alisamento exponencial
duplo é uma derivação dessa técnica que implica considerar também pon-
derações. O método de Holt faz parte dessas técnicas. Além de considerar
a tendência, dados não estacionários podem adicionalmente apresentar
sazonalidade. Aqui também os efeitos sazonais podem ser de nature-
za aditiva ou multiplicativa. O método de Holt-Winter é outra técnica que
pode ser aplicada a séries temporais que exibem efeitos de tendência e
sazonalidade.
Alguns modelos podem ser considerados como uma representação pro-

babilística de uma série temporal. Nesse caso, o modelo é caracterizado
como um processo estocástico ou uma função aleatória. Esses modelos, con-
siderados através do método de Box & Jenkins, consistem em três estágios.
O primeiro, de identificação, propicia verificar se a série temporal pode ser
descrita através de uma combinação de médias móveis e termos de auto-
correlação. No segundo estágio, estimação, os dados da série temporal são
usados para estimar os parâmetros do modelo tentativa; e o terceiro estágio,
teste-diagnóstico, consiste em testes para examinar os desvios do modelo
ajustado para determinar a adequação dos modelos.
273
A tabela a seguir mostra os resultados da produção de um componen-
te eletrônico em uma fábrica. Os dados servirão para a resolução dos
exercícios de 1 a 4.
Ano Produção (em 1 000) Ano Produção (em 1 000)

1994 1 286,40 2001 1 547,50
1995 1 324,40 2002 1 585,50
1996 1 368,70 2003 1 625,20
1997 1 426,90 2004 1 684,30
1998 1 478,60 2005 1 738,10
1999 1 511,10 2006 1 801,10
2000 1 533,40 2007 1 855,40
1. Determine a forma do modelo através do método de mínimos qua-

drados.
2. Construa os gráficos de linha e o gráfico da regressão.
3. Quais os valores esperados de venda do componente eletrônico para

os anos de 2008 e 2009?
4. Faça uma análise das flutuações cíclicas através do cálculo da percen-

tagem de tendência.
As despesas em novas instalações e equipamentos das indústrias ma-

nufatureiras no período de 1987 a 2006, em milhões de reais, são apre-
sentadas na tabela a seguir. Faça as análises propostas nos exercícios
de 5 a 7 acompanhadas dos respectivos gráficos:
Ano Despesas Ano Despesas

1987 11,44 1997 22,45
1988 14,97 1998 26,99
1989 15,96 1999 28,51
1990 11,44 2000 28,37
1991 12,08 2001 31,68
1992 14,48 2002 31,95
274
Ano Despesas Ano Despesas

1993 13,68 2003 29,99
1994 14,68 2004 31,35
1995 15,69 2005 38,01
1996 18,58 2006 46,10
5. Utilizar a técnica de médias móveis com k = 2 para fazer a previsão de

vendas de automóveis para os anos de 2007 e 2008.
6. Fazer as mesmas previsões do exercício 5 utilizando a técnica de mé-

dias móveis com k = 4.
7. Comparar os resultados obtidos nos exercícios 5 e 6 através da deter-

minação do Erro Médio Quadrático (EMQ) de cada ano. Qual técnica
mostrou-se mais adequada para a análise proposta?
8. A tabela a seguir apresenta as vendas mensais em milhões de reais por

parte de fábricas de carros de passageiros para o período de janeiro
de 2003 a dezembro de 2007. Determinar uma nova série utilizando a
primeira etapa do método de médias móveis para retirada da sazona-
lidade.
Ano Mês Vendas Ano Mês Vendas

2004 Janeiro 545,00 2006 Janeiro 666,00
Fevereiro 528,40 Fevereiro 716,10
Março 594,40 Março 765,20
Abril 627,20 Abril 736,90
Maio 684,40 Maio 798,00
Junho 738,40 Junho 761,60
Julho 464,30 Julho 393,60
Agosto 254,00 Agosto 371,00
Setembro 454,20 Setembro 808,80
Outubro 365,40 Outubro 841,70
Novembro 341,10 Novembro 827,40
Dezembro 570,60 Dezembro 666,20
275
Ano Mês Vendas Ano Mês Vendas

2005 Janeiro 678,10 2007 Janeiro 859,80
Fevereiro 719,00 Fevereiro 815,50
Março 815,90 Março 882,80
Abril 736,60 Abril 786,60
Maio 716,70 Maio 880,10
Junho 761,30 Junho 873,30
Julho 468,00 Julho 677,50
Agosto 457,60 Agosto 415,70
Setembro 712,00 Setembro 666,10
Outubro 758,60 Outubro 887,20
Novembro 736,60 Novembro 827,10
Dezembro 593,20 Dezembro 745
Gabarito
1. Com o quadro a seguir, é possível determinar o sistema de equações
normais da análise de regressão:
∑Y = na + b∑X
∑XY = a∑X + b∑X2
Observe que os anos (X) podem ser reescritos de 1 a 14 ou da forma

como está na tabela, de dois em dois anos, para se fazer ΣX = 0. Isso
facilita as contas e o sistema pode ser escrito como:
∑Y = na
∑XY = b∑X2
X Y XY X2 Yest
–13 1 286,4 –16 723,2 169 1 287,08
–11 1 324,4 –14 568,4 121 1 328,26
276
X Y XY X2 Yest
–9 1 368,7 –12 318,3 81 1 369,44
–7 1 426,9 –9 988,3 49 1 410,62
–5 1 478,6 –7 393,0 25 1 451,80
–3 1 511,1 –4 533,3 9 1 492,99
–1 1 533,4 -1 533,4 1 1 534,17
1 1 547,5 1 547,5 1 1 575,35
3 1 585,5 4 756,5 9 1 616,53
5 1 625,2 8 126,0 25 1 657,71
7 1 684,3 11 790,1 49 1 698,89
9 1 738,1 15 642,9 81 1 740,07
11 1 801,1 19 812,1 121 1 781,25
13 1 855,4 24 120,2 169 1 822,43
0 21 766,6 18 737,4 910
Dessa forma:
a=
∑Y
n
∑XY
b=
∑X2
Assim,
21 766, 6
a= = 1 554,76
14
18 737, 4
b= = 20,59
910
O modelo será então:
Ŷ = a + bX = 1557,76 + 20,59X.
277
2. O gráfico adequado para representar uma série temporal é o chamado

gráfico de linhas:
Gráfico de linhas
1900
1800
Vendas 1700
1600
1500
1400
1300
1200
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Tempo
Para a análise de regressão entre os pontos, traça-se a reta de regressão

ou reta de tendência:
Gráfico de regressão
1900
1800
1700
Vendas
1600
1500
1400
1300
1200
0 5 10 15
Tempo
3. Os valores esperados de venda para os anos de 2008 e 2009 podem

ser obtidos substituindo os valores correspondentes a esses anos na
equação da reta de regressão. Para 2008, o valor de X será igual a 15 e
para 2009 será igual a 17. Assim:
Para X = 15,
278
Ŷ = 1 557,76 + 20,59X = 1 557,76 + 20,59(15) = 1 863,615.
Ou seja, o valor esperado de vendas para 2008 é de 1 863 615 compo-

nentes.
Para X = 17,
Ŷ = 1 557,76 + 20,59X = 1 557,76 + 20,59(17) = 1 904,796.
Ou seja, o valor esperado de vendas para 2009 é de 1 904 796 com-

ponentes.
4. As flutuações cíclicas podem ser verificadas através da determinação

Y
da percentagem de tendência,   .100 .
 Ŷ 
Y Yest (Y/Yest)100
1 286,4 1 287,08 99,95
1 324,4 1 328,26 99,71
1 368,7 1 369,44 99,95
1 426,9 1 410,62 101,15
1 478,6 1 451,80 101,85
1 511,1 1 492,99 101,21
1 533,4 1 534,17 99,95
1 547,5 1 575,35 98,23
1 585,5 1 616,53 98,08
1 625,2 1 657,71 98,04
1 684,3 1 698,89 99,14
1 738,1 1 740,07 99,89
1 801,1 1 781,25 101,11
1 855,4 1 822,43 101,81
279
Percentagem de tendência
110,00
108,00
106,00
104,00
102,00
% tendência
100,00
98,00
96,00
94,00
92,00
90,00
0 5 10 15
Tempo
Observa-se que os dados oscilam em torno do valor 100%.
5. As médias móveis para k = 2 são determinadas como as médias dos

dois anos anteriores. O valor 13,21 é a média entre 11,44 e 14,97. O
valor 15,47 é a média entre 14,97 e 15,96, e assim por diante.
Ano Despesas k=2

1987 11,44
1988 14,97
1989 15,96 13,21
1990 11,44 15,47
1991 12,08 13,70
1992 14,48 11,76
1993 13,68 13,28
1994 14,68 14,08
1995 15,69 14,18
1996 18,58 15,19
1997 22,45 17,14
1998 26,99 20,52
1999 28,51 24,72
2000 28,37 27,75
280
Ano Despesas k=2

2001 31,68 28,44
2002 31,95 30,03
2003 29,99 31,82
2004 31,35 30,97
2005 38,01 30,67
2006 46,10 34,68
Média móvel para k = 2

50
45
40
35
30
Despesas
25 Série 1
20 Série 2
15
10
5
0
1 3 5 7 9 11 13 15 17 19
Tempo
A previsão para 2007 é feita como a média entre os anos 2005 e 2006,
então:
Y +Y 38, 01+ 46,10

Yˆ2007 = 2005 2006 = = 42, 06
2 2

O valor previsto de despesas para 2007 é de R$42,06 milhões.
A previsão para 2008 é feita como a média entre os anos 2006 e 2007.
Como o valor para 2007 não é conhecido, utiliza-se o valor calculado
da estimativa Ŷ2007 = 42,06:
Y + Yˆ 46,10 + 42, 06
Yˆ2008 = 2006 2007 = = 44, 08
2 2

281
6. As médias móveis para k = 4 são determinadas como as médias dos

quatro anos anteriores. O valor 13,45 é a média entre 11,44, 14,97,
15,96 e 11,44. O valor 13,61 é a média entre 14,97, 15,96, 11,44 e 12,08
e assim por diante.
Ano Despesas k=4

1987 11,44
1988 14,97
1989 15,96
1990 11,44
1991 12,08 13,45
1992 14,48 13,61
1993 13,68 13,49
1994 14,68 12,92
1995 15,69 13,73
1996 18,58 14,63
1997 22,45 15,66
1998 26,99 17,85
1999 28,51 20,93
2000 28,37 24,13
2001 31,68 26,58
2002 31,95 28,89
2003 29,99 30,13
2004 31,35 30,50
2005 38,01 31,24
2006 46,10 32,83
282
Média móvel para k = 4

50
40
30
Despesas
Despesas
20 k=4
10
0
1 3 5 7 9 11 13 15 17 19
Tempo
A previsão para 2007 é feita como a média entre os anos 2003, 2004,
2005 e 2006, então:
Y +Y +Y +Y 29, 99 + 31,35 + 38, 01+ 46,10

Yˆ2007 = 2003 2004 2005 2006 = = 36,36
4 4
A previsão para 2008 é feita como a média entre os anos 2004, 2005,
2006 e 2007. Como o valor para 2007 não é conhecido, utiliza-se o va-
lor calculado da estimativa Ŷ2007 = 36,36.
Y + Y + Y + Yˆ 31,35 + 38, 01+ 46,10 + 36,36

Yˆ2008 = 2004 2005 2006 2007 = = 37, 96
4 4
O valor previsto de despesas para 2008 é de R$ 37,96 milhões.
7. Comparar o EMQ para k = 2 e para k = 4.
Ano Despesas k=2 k=4 EMQ k = 2 EMQ k = 4

1987 11,44
1988 14,97
1989 15,96 13,21 7,5900
1990 11,44 15,47 16,2006
283
Ano Despesas k=2 k=4 EMQ k = 2 EMQ k = 4

1991 12,08 13,70 13,45 2,6244 1,8838
1992 14,48 11,76 13,61 7,3984 0,7526
1993 13,68 13,28 13,49 0,1600 0,0361
1994 14,68 14,08 12,92 0,3600 3,0976
1995 15,69 14,18 13,73 2,2801 3,8416
1996 18,58 15,19 14,63 11,5260 15,5828
1997 22,45 17,14 15,66 28,2492 46,1381
1998 26,99 20,52 17,85 41,9256 83,5396
1999 28,51 24,72 20,93 14,3641 57,4943
2000 28,37 27,75 24,13 0,3844 17,9564
2001 31,68 28,44 26,58 10,4976 26,0100
2002 31,95 30,03 28,89 3,7056 9,3789
2003 29,99 31,82 30,13 3,3306 0,0189
2004 31,35 30,97 30,50 0,1444 0,7268
2005 38,01 30,67 31,24 53,8756 45,7991
2006 46,10 34,68 32,83 130,4164 176,2256
EMQ = 19 30,53
EMQ(k = 2) = 19 e EMQ(k = 4) = 30,53.
Como o EMQ para média móvel com dois valores é menor do que para
quatro, o método é mais adequado para duas médias.
Observando os valores previstos para 2007, percebemos que o valor

previsto para as despesas para k = 2 é de R$42,02 milhões, enquanto
para k = 4 o valor das despesas previstas é de R$36,36 milhões. De fato, o
valor previsto para 2007 com duas médias parece ser o mais adequado.
8. As médias móveis calculadas a seguir correspondem a médias que

envolvem 13 medidas cada uma e 24 valores, conforme técnica
apresenta no texto.
284
Ano Mês Vendas Total 1 Total 2 Média móvel

2004 Janeiro 545,00
Fevereiro 528,40
Março 594,40
Abril 627,20
Maio 684,40
Junho 738,40
Julho 464,30
Agosto 254,00
Setembro 454,20
Outubro 365,40
Novembro 341,10 6 167,40 12 467,90 519,50
Dezembro 570,60 6 300,50 12 791,60 532,98
2005 Janeiro 678,10 6 491,10 13 203,70 550,15
Fevereiro 719,00 6 712,60 13 534,60 563,94
Março 815,90 6 822,00 13 676,30 569,85
Abril 736,60 6 854,30 13 731,50 572,15
Maio 716,70 6 877,20 13 758,10 573,25
Junho 761,30 6 880,90 13 965,40 581,89
Julho 468,00 7 084,50 14 426,80 601,12
Agosto 457,60 7 342,30 15 077,80 628,24
Setembro 712,00 7 735,50 15 866,50 661,10
Outubro 758,60 8 131,00 16 284,60 678,53
Novembro 736,60 8 153,60 16 295,10 678,96
Dezembro 593,20 8 141,50 16 280,10 678,34
2006 Janeiro 666,00 8 138,60 16 226,50 676,10
Fevereiro 716,10 8 087,90 16 176,10 674,00
Março 765,20 8 088,20 16 257,70 677,40
Abril 736,90 8 169,50 16 339,30 680,80
285
Ano Mês Vendas Total 1 Total 2 Média móvel

Maio 798,00 8 169,80 16 265,20 677,72
Junho 761,60 8 095,40 16 104,20 671,01
Julho 393,60 8 008,80 16 114,40 671,43
Agosto 371,00 8 105,60 16 294,30 678,93
Setembro 808,80 8 188,70 16 468,20 686,18
Outubro 841,70 8 279,50 16 632,00 693,00
Novembro 827,40 8 352,50 16 898,80 704,12
Dezembro 666,20 8 546,30 17 192,00 716,33
2007 Janeiro 859,80 8 645,70 17 409,00 725,38
Fevereiro 815,50 8 763,30 17 576,30 732,35
Março 882,80 8 813,00 17 708,10 737,84
Abril 786,60 8 895,10 17 901,90 745,91
Maio 880,10 9 006,80 18 297,50 762,40
Junho 873,30 9 290,70 18 626,10 776,09
Julho 677,50 9 335,40 18 528,10 772,00
Agosto 415,70 9 192,70 18 430,90 767,95
Setembro 666,10 9 238,20 18 476,10 769,84
Outubro 887,20 9 237,90 18 554,60 773,11
Novembro 827,10 9 316,70
Dezembro 745,00
286
O gráfico a seguir apresenta a retirada da sazonalidade propiciada

pelo método:
Gráfico de linhas
1000,00
900,00
800,00
700,00
Vendas
Série 1
600,00 Série 2
500,00
400,00
300,00
1 4 7 10 13 16 19 22 25 28 31 34
Tempo
287
288
Anexos
Tabela A – Distribuição acumulada binomial
F( c ) = P(X ≤ c) = ΣX = 0,n Cn,X(p)x(1 – p)n–x
Exemplo: se p = 0,15, n = 5, c = 2, então F(2) = P(X ≤ 2) = 0,9734.
n c 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
2 0 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4245 0,3600 0,3025 0,2500
1 0,9975 0,9900 0,9775 0,9600 0,9375 0,9100 0,8775 0,8400 0,7975 0,7500
3 0 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250
1 0,9928 0,9720 0,9393 0,8960 0,8438 0,7840 0,7183 0,6480 0,5748 0,5000
2 0,9999 0,9990 0,9966 0,9920 0,9844 0,9730 0,9571 0,9360 0,9089 0,8750
4 0 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625
1 0,9860 0,9477 0,8905 0,8192 0,7383 0,6517 0,5630 0,4752 0,3910 0,3125
2 0,9995 0,9963 0,9880 0,9728 0,9492 0,9163 0,8735 0,8208 0,7585 0,6875
3 1,0000 0,9999 0,9995 0,9984 0,9961 0,9919 0,9850 0,9744 0,9590 0,9375
5 0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313
1 0,9774 0,9185 0,8352 0,7373 0,6328 0,5282 0,4284 0,3370 0,2562 0,1875
2 0,9988 0,9914 0,9734 0,9421 0,8965 0,8369 0,7648 0,6826 0,5931 0,5000
3 1,0000 0,9995 0,9978 0,9933 0,9844 0,9692 0,9460 0,9130 0,8688 0,8125
4 1,0000 1,0000 0,9999 0,9997 0,9990 0,9976 0,9947 0,9898 0,9815 0,9688
6 0 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156
1 0,9672 0,8857 0,7765 0,6554 0,5339 0,4202 0,3191 0,2333 0,1636 0,1094
2 0,9978 0,9842 0,9527 0,9011 0,8306 0,7443 0,6471 0,5443 0,4415 0,3438
3 0,9999 0,9987 0,9941 0,9830 0,9624 0,9295 0,8826 0,8208 0,7447 0,6563
4 1,0000 0,9999 0,9996 0,9984 0,9954 0,9891 0,9777 0,9590 0,9308 0,8906
5 1,0000 1,0000 1,0000 0,9999 0,9998 0,9993 0,9982 0,9959 0,9917 0,9844
289
Anexos
n c 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
7 0 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078
1 0,9556 0,8503 0,7166 0,5767 0,4449 0,3294 0,2338 0,1586 0,1024 0,0625
2 0,9962 0,9743 0,9262 0,8520 0,7564 0,6471 0,5323 0,4199 0,3164 0,2266
3 0,9998 0,9973 0,9879 0,9667 0,9294 0,8740 0,8002 0,7102 0,6083 0,5000
4 1,0000 0,9998 0,9988 0,9953 0,9871 0,9712 0,9444 0,9037 0,8471 0,7734
5 1,0000 1,0000 0,9999 0,9996 0,9987 0,9962 0,9910 0,9812 0,9643 0,9375
6 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9994 0,9984 0,9963 0,9922
8 0 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039
1 0,9428 0,8131 0,6572 0,5033 0,3671 0,2553 0,1691 0,1064 0,0632 0,0352
2 0,9942 0,9619 0,8948 0,7969 0,6785 0,5518 0,4278 0,3154 0,2201 0,1445
3 0,9996 0,9950 0,9786 0,9437 0,8862 0,8059 0,7064 0,5941 0,4770 0,3633
4 1,0000 0,9996 0,9971 0,9896 0,9727 0,9420 0,8939 0,8263 0,7396 0,6367
5 1,0000 1,0000 0,9998 0,9988 0,9958 0,9887 0,9747 0,9502 0,9115 0,8555
6 1,0000 1,0000 1,0000 0,9999 0,9996 0,9987 0,9964 0,9915 0,9819 0,9648
7 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9993 0,9983 0,9961
9 0 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,0101 0,0046 0,0020
1 0,9288 0,7748 0,5995 0,4362 0,3003 0,1960 0,1211 0,0705 0,0385 0,0195
2 0,9916 0,9470 0,8591 0,7382 0,6007 0,4628 0,3373 0,2318 0,1495 0,0898
3 0,9994 0,9917 0,9661 0,9144 0,8343 0,7297 0,6089 0,4826 0,3614 0,2539
4 1,0000 0,9991 0,9944 0,9804 0,9511 0,9012 0,8283 0,7334 0,6214 0,5000
5 1,0000 0,9999 0,9994 0,9969 0,9900 0,9747 0,9464 0,9006 0,8342 0,7461
6 1,0000 1,0000 1,0000 0,9997 0,9987 0,9957 0,9888 0,9750 0,9502 0,9102
7 1,0000 1,0000 1,0000 1,0000 0,9999 0,9996 0,9986 0,9962 0,9909 0,9805
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9992 0,9980
10 0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010
1 0,9139 0,7361 0,5443 0,3758 0,2440 0,1493 0,0860 0,0464 0,0233 0,0107
2 0,9885 0,9298 0,8202 0,6778 0,5256 0,3828 0,2616 0,1673 0,0996 0,0547
3 0,9990 0,9872 0,9500 0,8791 0,7759 0,6496 0,5138 0,3823 0,2660 0,1719
290
Anexos
n c 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
4 0,9999 0,9984 0,9901 0,9672 0,9219 0,8497 0,7515 0,6331 0,5044 0,3770
5 1,0000 0,9999 0,9986 0,9936 0,9803 0,9527 0,9051 0,8338 0,7384 0,6230
6 1,0000 1,0000 0,9999 0,9991 0,9965 0,9894 0,9740 0,9452 0,8980 0,8281
7 1,0000 1,0000 1,0000 0,9999 0,9996 0,9984 0,9952 0,9877 0,9726 0,9453
8 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9983 0,9955 0,9893
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9990
11 0 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,0036 0,0014 0,0005
1 0,8981 0,6974 0,4922 0,3221 0,1971 0,1130 0,0606 0,0302 0,0139 0,0059
2 0,9848 0,9104 0,7788 0,6174 0,4552 0,3127 0,2001 0,1189 0,0652 0,0327
3 0,9984 0,9815 0,9306 0,8389 0,7133 0,5696 0,4256 0,2963 0,1911 0,1133
4 0,9999 0,9972 0,9841 0,9496 0,8854 0,7897 0,6683 0,5328 0,3971 0,2744
5 1,0000 0,9997 0,9973 0,9883 0,9657 0,9218 0,8513 0,7535 0,6331 0,5000
6 1,0000 1,0000 0,9997 0,9980 0,9924 0,9784 0,9499 0,9006 0,8262 0,7256
7 1,0000 1,0000 1,0000 0,9998 0,9988 0,9957 0,9878 0,9707 0,9390 0,8867
8 1,0000 1,0000 1,0000 1,0000 0,9999 0,9994 0,9980 0,9941 0,9852 0,9673
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9993 0,9978 0,9941
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9995
12 0 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002
1 0,8816 0,6590 0,4435 0,2749 0,1584 0,0850 0,0424 0,0196 0,0083 0,0032
2 0,9804 0,8891 0,7358 0,5583 0,3907 0,2528 0,1513 0,0834 0,0421 0,0193
3 0,9978 0,9744 0,9078 0,7946 0,6488 0,4925 0,3467 0,2253 0,1345 0,0730
4 0,9998 0,9957 0,9761 0,9274 0,8424 0,7237 0,5833 0,4382 0,3044 0,1938
5 1,0000 0,9995 0,9954 0,9806 0,9456 0,8822 0,7873 0,6652 0,5269 0,3872
6 1,0000 0,9999 0,9993 0,9961 0,9857 0,9614 0,9154 0,8418 0,7393 0,6128
7 1,0000 1,0000 0,9999 0,9994 0,9972 0,9905 0,9745 0,9427 0,8883 0,8062
8 1,0000 1,0000 1,0000 0,9999 0,9996 0,9983 0,9944 0,9847 0,9644 0,9270
9 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9992 0,9972 0,9921 0,9807
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9989 0,9968
291
Anexos
n c 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998
13 0 0,5133 0,2542 0,1209 0,0550 0,0238 0,0097 0,0037 0,0013 0,0004 0,0001
1 0,8646 0,6213 0,3983 0,2336 0,1267 0,0637 0,0296 0,0126 0,0049 0,0017
2 0,9755 0,8661 0,6920 0,5017 0,3326 0,2025 0,1132 0,0579 0,0269 0,0112
3 0,9969 0,9658 0,8820 0,7473 0,5843 0,4206 0,2783 0,1686 0,0929 0,0461
4 0,9997 0,9935 0,9658 0,9009 0,7940 0,6543 0,5005 0,3530 0,2279 0,1334
5 1,0000 0,9991 0,9925 0,9700 0,9198 0,8346 0,7159 0,5744 0,4268 0,2905
6 1,0000 0,9999 0,9987 0,9930 0,9757 0,9376 0,8705 0,7712 0,6437 0,5000
7 1,0000 1,0000 0,9998 0,9988 0,9944 0,9818 0,9538 0,9023 0,8212 0,7095
8 1,0000 1,0000 1,0000 0,9998 0,9990 0,9960 0,9874 0,9679 0,9302 0,8666
9 1,0000 1,0000 1,0000 1,0000 0,9999 0,9993 0,9975 0,9922 0,9797 0,9539
10 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9987 0,9959 0,9888
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9983
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
14 0 0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001
1 0,8470 0,5846 0,3567 0,1979 0,1010 0,0475 0,0205 0,0081 0,0029 0,0009
2 0,9699 0,8416 0,6479 0,4481 0,2811 0,1608 0,0839 0,0398 0,0170 0,0065
3 0,9958 0,9559 0,8535 0,6982 0,5213 0,3552 0,2205 0,1243 0,0632 0,0287
4 0,9996 0,9908 0,9533 0,8702 0,7415 0,5842 0,4227 0,2793 0,1672 0,0898
5 1,0000 0,9985 0,9885 0,9561 0,8883 0,7805 0,6405 0,4859 0,3373 0,2120
6 1,0000 0,9998 0,9978 0,9884 0,9617 0,9067 0,8164 0,6925 0,5461 0,3953
7 1,0000 1,0000 0,9997 0,9976 0,9897 0,9685 0,9247 0,8499 0,7414 0,6047
8 1,0000 1,0000 1,0000 0,9996 0,9978 0,9917 0,9757 0,9417 0,8811 0,7880
9 1,0000 1,0000 1,0000 1,0000 0,9997 0,9983 0,9940 0,9825 0,9574 0,9102
10 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9989 0,9961 0,9886 0,9713
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9994 0,9978 0,9935
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9991
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
292
Anexos
n c 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
15 0 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001 0,0000
1 0,8290 0,5490 0,3186 0,1671 0,0802 0,0353 0,0142 0,0052 0,0017 0,0005
2 0,9638 0,8159 0,6042 0,3980 0,2361 0,1268 0,0617 0,0271 0,0107 0,0037
3 0,9945 0,9444 0,8227 0,6482 0,4613 0,2969 0,1727 0,0905 0,0424 0,0176
4 0,9994 0,9873 0,9383 0,8358 0,6865 0,5155 0,3519 0,2173 0,1204 0,0592
5 0,9999 0,9978 0,9832 0,9389 0,8516 0,7216 0,5643 0,4032 0,2608 0,1509
6 1,0000 0,9997 0,9964 0,9819 0,9434 0,8689 0,7548 0,6098 0,4522 0,3036
7 1,0000 1,0000 0,9994 0,9958 0,9827 0,9500 0,8868 0,7869 0,6535 0,5000
8 1,0000 1,0000 0,9999 0,9992 0,9958 0,9848 0,9578 0,9050 0,8182 0,6964
9 1,0000 1,0000 1,0000 0,9999 0,9992 0,9963 0,9876 0,9662 0,9231 0,8491
10 1,0000 1,0000 1,0000 1,0000 0,9999 0,9993 0,9972 0,9907 0,9745 0,9408
11 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9981 0,9937 0,9824
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9989 0,9963
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
16 0 0,4401 0,1853 0,0743 0,0281 0,0100 0,0033 0,0010 0,0003 0,0001 0,0000
1 0,8108 0,5147 0,2839 0,1407 0,0635 0,0261 0,0098 0,0033 0,0010 0,0003
2 0,9571 0,7892 0,5614 0,3518 0,1971 0,0994 0,0451 0,0183 0,0066 0,0021
3 0,9930 0,9316 0,7899 0,5981 0,4050 0,2459 0,1339 0,0651 0,0281 0,0106
4 0,9991 0,9830 0,9209 0,7982 0,6302 0,4499 0,2892 0,1666 0,0853 0,0384
5 0,9999 0,9967 0,9765 0,9183 0,8103 0,6598 0,4900 0,3288 0,1976 0,1051
6 1,0000 0,9995 0,9944 0,9733 0,9204 0,8247 0,6881 0,5272 0,3660 0,2272
7 1,0000 0,9999 0,9989 0,9930 0,9729 0,9256 0,8406 0,7161 0,5629 0,4018
8 1,0000 1,0000 0,9998 0,9985 0,9925 0,9743 0,9329 0,8577 0,7441 0,5982
9 1,0000 1,0000 1,0000 0,9998 0,9984 0,9929 0,9771 0,9417 0,8759 0,7728
10 1,0000 1,0000 1,0000 1,0000 0,9997 0,9984 0,9938 0,9809 0,9514 0,8949
11 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9987 0,9951 0,9851 0,9616
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9991 0,9965 0,9894
293
Anexos
n c 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9994 0,9979
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
17 0 0,4181 0,1668 0,0631 0,0225 0,0075 0,0023 0,0007 0,0002 0,0000 0,0000
1 0,7922 0,4818 0,2525 0,1182 0,0501 0,0193 0,0067 0,0021 0,0006 0,0001
2 0,9497 0,7618 0,5198 0,3096 0,1637 0,0774 0,0327 0,0123 0,0041 0,0012
3 0,9912 0,9174 0,7556 0,5489 0,3530 0,2019 0,1028 0,0464 0,0184 0,0064
4 0,9988 0,9779 0,9013 0,7582 0,5739 0,3887 0,2348 0,1260 0,0596 0,0245
5 0,9999 0,9953 0,9681 0,8943 0,7653 0,5968 0,4197 0,2639 0,1471 0,0717
6 1,0000 0,9992 0,9917 0,9623 0,8929 0,7752 0,6188 0,4478 0,2902 0,1662
7 1,0000 0,9999 0,9983 0,9891 0,9598 0,8954 0,7872 0,6405 0,4743 0,3145
8 1,0000 1,0000 0,9997 0,9974 0,9876 0,9597 0,9006 0,8011 0,6626 0,5000
9 1,0000 1,0000 1,0000 0,9995 0,9969 0,9873 0,9617 0,9081 0,8166 0,6855
10 1,0000 1,0000 1,0000 0,9999 0,9994 0,9968 0,9880 0,9652 0,9174 0,8338
11 1,0000 1,0000 1,0000 1,0000 0,9999 0,9993 0,9970 0,9894 0,9699 0,9283
12 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9994 0,9975 0,9914 0,9755
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9981 0,9936
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9988
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
18 0 0,3972 0,1501 0,0536 0,0180 0,0056 0,0016 0,0004 0,0001 0,0000 0,0000
1 0,7735 0,4503 0,2241 0,0991 0,0395 0,0142 0,0046 0,0013 0,0003 0,0001
2 0,9419 0,7338 0,4797 0,2713 0,1353 0,0600 0,0236 0,0082 0,0025 0,0007
3 0,9891 0,9018 0,7202 0,5010 0,3057 0,1646 0,0783 0,0328 0,0120 0,0038
4 0,9985 0,9718 0,8794 0,7164 0,5187 0,3327 0,1886 0,0942 0,0411 0,0154
5 0,9998 0,9936 0,9581 0,8671 0,7175 0,5344 0,3550 0,2088 0,1077 0,0481
6 1,0000 0,9988 0,9882 0,9487 0,8610 0,7217 0,5491 0,3743 0,2258 0,1189
7 1,0000 0,9998 0,9973 0,9837 0,9431 0,8593 0,7283 0,5634 0,3915 0,2403
8 1,0000 1,0000 0,9995 0,9957 0,9807 0,9404 0,8609 0,7368 0,5778 0,4073
294
Anexos
n c 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
9 1,0000 1,0000 0,9999 0,9991 0,9946 0,9790 0,9403 0,8653 0,7473 0,5927
10 1,0000 1,0000 1,0000 0,9998 0,9988 0,9939 0,9788 0,9424 0,8720 0,7597
11 1,0000 1,0000 1,0000 1,0000 0,9998 0,9986 0,9938 0,9797 0,9463 0,8811
12 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9986 0,9942 0,9817 0,9519
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9987 0,9951 0,9846
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9990 0,9962
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9993
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
19 0 0,3774 0,1351 0,0456 0,0144 0,0042 0,0011 0,0003 0,0001 0,0000 0,0000
1 0,7547 0,4203 0,1985 0,0829 0,0310 0,0104 0,0031 0,0008 0,0002 0,0000
2 0,9335 0,7054 0,4413 0,2369 0,1113 0,0462 0,0170 0,0055 0,0015 0,0004
3 0,9868 0,8850 0,6841 0,4551 0,2631 0,1332 0,0591 0,0230 0,0077 0,0022
4 0,9980 0,9648 0,8556 0,6733 0,4654 0,2822 0,1500 0,0696 0,0280 0,0096
5 0,9998 0,9914 0,9463 0,8369 0,6678 0,4739 0,2968 0,1629 0,0777 0,0318
6 1,0000 0,9983 0,9837 0,9324 0,8251 0,6655 0,4812 0,3081 0,1727 0,0835
7 1,0000 0,9997 0,9959 0,9767 0,9225 0,8180 0,6656 0,4878 0,3169 0,1796
8 1,0000 1,0000 0,9992 0,9933 0,9713 0,9161 0,8145 0,6675 0,4940 0,3238
9 1,0000 1,0000 0,9999 0,9984 0,9911 0,9674 0,9125 0,8139 0,6710 0,5000
10 1,0000 1,0000 1,0000 0,9997 0,9977 0,9895 0,9653 0,9115 0,8159 0,6762
11 1,0000 1,0000 1,0000 1,0000 0,9995 0,9972 0,9886 0,9648 0,9129 0,8204
12 1,0000 1,0000 1,0000 1,0000 0,9999 0,9994 0,9969 0,9884 0,9658 0,9165
13 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9993 0,9969 0,9891 0,9682
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9994 0,9972 0,9904
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9995 0,9978
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9996
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
18 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
295
Anexos
n c 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
20 0 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000 0,0000
1 0,7358 0,3917 0,1756 0,0692 0,0243 0,0076 0,0021 0,0005 0,0001 0,0000
2 0,9245 0,6769 0,4049 0,2061 0,0913 0,0355 0,0121 0,0036 0,0009 0,0002
3 0,9841 0,8670 0,6477 0,4114 0,2252 0,1071 0,0444 0,0160 0,0049 0,0013
4 0,9974 0,9568 0,8298 0,6296 0,4148 0,2375 0,1182 0,0510 0,0189 0,0059
5 0,9997 0,9887 0,9327 0,8042 0,6172 0,4164 0,2454 0,1256 0,0553 0,0207
6 1,0000 0,9976 0,9781 0,9133 0,7858 0,6080 0,4166 0,2500 0,1299 0,0577
7 1,0000 0,9996 0,9941 0,9679 0,8982 0,7723 0,6010 0,4159 0,2520 0,1316
8 1,0000 0,9999 0,9987 0,9900 0,9591 0,8867 0,7624 0,5956 0,4143 0,2517
9 1,0000 1,0000 0,9998 0,9974 0,9861 0,9520 0,8782 0,7553 0,5914 0,4119
10 1,0000 1,0000 1,0000 0,9994 0,9961 0,9829 0,9468 0,8725 0,7507 0,5881
11 1,0000 1,0000 1,0000 0,9999 0,9991 0,9949 0,9804 0,9435 0,8692 0,7483
12 1,0000 1,0000 1,0000 1,0000 0,9998 0,9987 0,9940 0,9790 0,9420 0,8684
13 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9985 0,9935 0,9786 0,9423
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9984 0,9936 0,9793
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9985 0,9941
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9987
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998
18 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
19 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Tabela B – Distribuição de probabilidades binomial
P(X = x) = Cn,x (px (1 – p) n – x
Exemplo se p = 0,15, n =4 e X =3 então P(X = 3) = 0,0115.
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0 0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000
1 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000
296
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
2 0 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500
1 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000
2 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500
3 0 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250
1 0,1354 0,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750
2 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750
3 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250
4 0 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625
1 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500
2 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750
3 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500
4 0,0000 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 0,0256 0,0410 0,0625
5 0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313
1 0,2036 0,3281 0,3915 0,4096 0,3955 0,3602 0,3124 0,2592 0,2059 0,1563
2 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456 0,3369 0,3125
3 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125
4 0,0000 0,0005 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1563
5 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313
6 0 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156
1 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938
2 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344
3 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125
4 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344
5 0,0000 0,0001 0,0004 0,0015 0,0044 0,0102 0,0205 0,0369 0,0609 0,0938
6 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156
7 0 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078
1 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547
297
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
2 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641
3 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734
4 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734
5 0,0000 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641
6 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547
7 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078
8 0 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039
1 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1373 0,0896 0,0548 0,0313
2 0,0515 0,1488 0,2376 0,2936 0,3115 0,2965 0,2587 0,2090 0,1569 0,1094
3 0,0054 0,0331 0,0839 0,1468 0,2076 0,2541 0,2786 0,2787 0,2568 0,2188
4 0,0004 0,0046 0,0185 0,0459 0,0865 0,1361 0,1875 0,2322 0,2627 0,2734
5 0,0000 0,0004 0,0026 0,0092 0,0231 0,0467 0,0808 0,1239 0,1719 0,2188
6 0,0000 0,0000 0,0002 0,0011 0,0038 0,0100 0,0217 0,0413 0,0703 0,1094
7 0,0000 0,0000 0,0000 0,0001 0,0004 0,0012 0,0033 0,0079 0,0164 0,0313
8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0017 0,0039
9 0 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,0101 0,0046 0,0020
1 0,2985 0,3874 0,3679 0,3020 0,2253 0,1556 0,1004 0,0605 0,0339 0,0176
2 0,0629 0,1722 0,2597 0,3020 0,3003 0,2668 0,2162 0,1612 0,1110 0,0703
3 0,0077 0,0446 0,1069 0,1762 0,2336 0,2668 0,2716 0,2508 0,2119 0,1641
4 0,0006 0,0074 0,0283 0,0661 0,1168 0,1715 0,2194 0,2508 0,2600 0,2461
5 0,0000 0,0008 0,0050 0,0165 0,0389 0,0735 0,1181 0,1672 0,2128 0,2461
6 0,0000 0,0001 0,0006 0,0028 0,0087 0,0210 0,0424 0,0743 0,1160 0,1641
7 0,0000 0,0000 0,0000 0,0003 0,0012 0,0039 0,0098 0,0212 0,0407 0,0703
8 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0035 0,0083 0,0176
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0008 0,0020
10 0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010
1 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403 0,0207 0,0098
2 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439
298
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
3 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172
4 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384 0,2051
5 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461
6 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051
7 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172
8 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016 0,0042 0,0098
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010
11 0 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,0036 0,0014 0,0005
1 0,3293 0,3835 0,3248 0,2362 0,1549 0,0932 0,0518 0,0266 0,0125 0,0054
2 0,0867 0,2131 0,2866 0,2953 0,2581 0,1998 0,1395 0,0887 0,0513 0,0269
3 0,0137 0,0710 0,1517 0,2215 0,2581 0,2568 0,2254 0,1774 0,1259 0,0806
4 0,0014 0,0158 0,0536 0,1107 0,1721 0,2201 0,2428 0,2365 0,2060 0,1611
5 0,0001 0,0025 0,0132 0,0388 0,0803 0,1321 0,1830 0,2207 0,2360 0,2256
6 0,0000 0,0003 0,0023 0,0097 0,0268 0,0566 0,0985 0,1471 0,1931 0,2256
7 0,0000 0,0000 0,0003 0,0017 0,0064 0,0173 0,0379 0,0701 0,1128 0,1611
8 0,0000 0,0000 0,0000 0,0002 0,0011 0,0037 0,0102 0,0234 0,0462 0,0806
9 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018 0,0052 0,0126 0,0269
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0021 0,0054
12 0 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002
1 0,3413 0,3766 0,3012 0,2062 0,1267 0,0712 0,0368 0,0174 0,0075 0,0029
2 0,0988 0,2301 0,2924 0,2835 0,2323 0,1678 0,1088 0,0639 0,0339 0,0161
3 0,0173 0,0852 0,1720 0,2362 0,2581 0,2397 0,1954 0,1419 0,0923 0,0537
4 0,0021 0,0213 0,0683 0,1329 0,1936 0,2311 0,2367 0,2128 0,1700 0,1208
5 0,0002 0,0038 0,0193 0,0532 0,1032 0,1585 0,2039 0,2270 0,2225 0,1934
6 0,0000 0,0005 0,0040 0,0155 0,0401 0,0792 0,1281 0,1766 0,2124 0,2256
7 0,0000 0,0000 0,0006 0,0033 0,0115 0,0291 0,0591 0,1009 0,1489 0,1934
8 0,0000 0,0000 0,0001 0,0005 0,0024 0,0078 0,0199 0,0420 0,0762 0,1208
299
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
9 0,0000 0,0000 0,0000 0,0001 0,0004 0,0015 0,0048 0,0125 0,0277 0,0537
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0008 0,0025 0,0068 0,0161
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0029
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002
13 0 0,5133 0,2542 0,1209 0,0550 0,0238 0,0097 0,0037 0,0013 0,0004 0,0001
1 0,3512 0,3672 0,2774 0,1787 0,1029 0,0540 0,0259 0,0113 0,0045 0,0016
2 0,1109 0,2448 0,2937 0,2680 0,2059 0,1388 0,0836 0,0453 0,0220 0,0095
3 0,0214 0,0997 0,1900 0,2457 0,2517 0,2181 0,1651 0,1107 0,0660 0,0349
4 0,0028 0,0277 0,0838 0,1535 0,2097 0,2337 0,2222 0,1845 0,1350 0,0873
5 0,0003 0,0055 0,0266 0,0691 0,1258 0,1803 0,2154 0,2214 0,1989 0,1571
6 0,0000 0,0008 0,0063 0,0230 0,0559 0,1030 0,1546 0,1968 0,2169 0,2095
7 0,0000 0,0001 0,0011 0,0058 0,0186 0,0442 0,0833 0,1312 0,1775 0,2095
8 0,0000 0,0000 0,0001 0,0011 0,0047 0,0142 0,0336 0,0656 0,1089 0,1571
9 0,0000 0,0000 0,0000 0,0001 0,0009 0,0034 0,0101 0,0243 0,0495 0,0873
10 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0022 0,0065 0,0162 0,0349
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0012 0,0036 0,0095
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
14 0 0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001
1 0,3593 0,3559 0,2539 0,1539 0,0832 0,0407 0,0181 0,0073 0,0027 0,0009
2 0,1229 0,2570 0,2912 0,2501 0,1802 0,1134 0,0634 0,0317 0,0141 0,0056
3 0,0259 0,1142 0,2056 0,2501 0,2402 0,1943 0,1366 0,0845 0,0462 0,0222
4 0,0037 0,0349 0,0998 0,1720 0,2202 0,2290 0,2022 0,1549 0,1040 0,0611
5 0,0004 0,0078 0,0352 0,0860 0,1468 0,1963 0,2178 0,2066 0,1701 0,1222
6 0,0000 0,0013 0,0093 0,0322 0,0734 0,1262 0,1759 0,2066 0,2088 0,1833
7 0,0000 0,0002 0,0019 0,0092 0,0280 0,0618 0,1082 0,1574 0,1952 0,2095
8 0,0000 0,0000 0,0003 0,0020 0,0082 0,0232 0,0510 0,0918 0,1398 0,1833
9 0,0000 0,0000 0,0000 0,0003 0,0018 0,0066 0,0183 0,0408 0,0762 0,1222
300
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
10 0,0000 0,0000 0,0000 0,0000 0,0003 0,0014 0,0049 0,0136 0,0312 0,0611
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0033 0,0093 0,0222
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0019 0,0056
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0009
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
15 0 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001 0,0000
1 0,3658 0,3432 0,2312 0,1319 0,0668 0,0305 0,0126 0,0047 0,0016 0,0005
2 0,1348 0,2669 0,2856 0,2309 0,1559 0,0916 0,0476 0,0219 0,0090 0,0032
3 0,0307 0,1285 0,2184 0,2501 0,2252 0,1700 0,1110 0,0634 0,0318 0,0139
4 0,0049 0,0428 0,1156 0,1876 0,2252 0,2186 0,1792 0,1268 0,0780 0,0417
5 0,0006 0,0105 0,0449 0,1032 0,1651 0,2061 0,2123 0,1859 0,1404 0,0916
6 0,0000 0,0019 0,0132 0,0430 0,0917 0,1472 0,1906 0,2066 0,1914 0,1527
7 0,0000 0,0003 0,0030 0,0138 0,0393 0,0811 0,1319 0,1771 0,2013 0,1964
8 0,0000 0,0000 0,0005 0,0035 0,0131 0,0348 0,0710 0,1181 0,1647 0,1964
9 0,0000 0,0000 0,0001 0,0007 0,0034 0,0116 0,0298 0,0612 0,1048 0,1527
10 0,0000 0,0000 0,0000 0,0001 0,0007 0,0030 0,0096 0,0245 0,0515 0,0916
11 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0074 0,0191 0,0417
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0016 0,0052 0,0139
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0032
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
16 0 0,4401 0,1853 0,0743 0,0281 0,0100 0,0033 0,0010 0,0003 0,0001 0,0000
1 0,3706 0,3294 0,2097 0,1126 0,0535 0,0228 0,0087 0,0030 0,0009 0,0002
2 0,1463 0,2745 0,2775 0,2111 0,1336 0,0732 0,0353 0,0150 0,0056 0,0018
3 0,0359 0,1423 0,2285 0,2463 0,2079 0,1465 0,0888 0,0468 0,0215 0,0085
4 0,0061 0,0514 0,1311 0,2001 0,2252 0,2040 0,1553 0,1014 0,0572 0,0278
5 0,0008 0,0137 0,0555 0,1201 0,1802 0,2099 0,2008 0,1623 0,1123 0,0667
6 0,0001 0,0028 0,0180 0,0550 0,1101 0,1649 0,1982 0,1983 0,1684 0,1222
301
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
7 0,0000 0,0004 0,0045 0,0197 0,0524 0,1010 0,1524 0,1889 0,1969 0,1746
8 0,0000 0,0001 0,0009 0,0055 0,0197 0,0487 0,0923 0,1417 0,1812 0,1964
9 0,0000 0,0000 0,0001 0,0012 0,0058 0,0185 0,0442 0,0840 0,1318 0,1746
10 0,0000 0,0000 0,0000 0,0002 0,0014 0,0056 0,0167 0,0392 0,0755 0,1222
11 0,0000 0,0000 0,0000 0,0000 0,0002 0,0013 0,0049 0,0142 0,0337 0,0667
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0040 0,0115 0,0278
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0008 0,0029 0,0085
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
17 0 0,4181 0,1668 0,0631 0,0225 0,0075 0,0023 0,0007 0,0002 0,0000 0,0000
1 0,3741 0,3150 0,1893 0,0957 0,0426 0,0169 0,0060 0,0019 0,0005 0,0001
2 0,1575 0,2800 0,2673 0,1914 0,1136 0,0581 0,0260 0,0102 0,0035 0,0010
3 0,0415 0,1556 0,2359 0,2393 0,1893 0,1245 0,0701 0,0341 0,0144 0,0052
4 0,0076 0,0605 0,1457 0,2093 0,2209 0,1868 0,1320 0,0796 0,0411 0,0182
5 0,0010 0,0175 0,0668 0,1361 0,1914 0,2081 0,1849 0,1379 0,0875 0,0472
6 0,0001 0,0039 0,0236 0,0680 0,1276 0,1784 0,1991 0,1839 0,1432 0,0944
7 0,0000 0,0007 0,0065 0,0267 0,0668 0,1201 0,1685 0,1927 0,1841 0,1484
8 0,0000 0,0001 0,0014 0,0084 0,0279 0,0644 0,1134 0,1606 0,1883 0,1855
9 0,0000 0,0000 0,0003 0,0021 0,0093 0,0276 0,0611 0,1070 0,1540 0,1855
10 0,0000 0,0000 0,0000 0,0004 0,0025 0,0095 0,0263 0,0571 0,1008 0,1484
11 0,0000 0,0000 0,0000 0,0001 0,0005 0,0026 0,0090 0,0242 0,0525 0,0944
12 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0081 0,0215 0,0472
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0021 0,0068 0,0182
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0016 0,0052
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
302
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
18 0 0,3972 0,1501 0,0536 0,0180 0,0056 0,0016 0,0004 0,0001 0,0000 0,0000
1 0,3763 0,3002 0,1704 0,0811 0,0338 0,0126 0,0042 0,0012 0,0003 0,0001
2 0,1683 0,2835 0,2556 0,1723 0,0958 0,0458 0,0190 0,0069 0,0022 0,0006
3 0,0473 0,1680 0,2406 0,2297 0,1704 0,1046 0,0547 0,0246 0,0095 0,0031
4 0,0093 0,0700 0,1592 0,2153 0,2130 0,1681 0,1104 0,0614 0,0291 0,0117
5 0,0014 0,0218 0,0787 0,1507 0,1988 0,2017 0,1664 0,1146 0,0666 0,0327
6 0,0002 0,0052 0,0301 0,0816 0,1436 0,1873 0,1941 0,1655 0,1181 0,0708
7 0,0000 0,0010 0,0091 0,0350 0,0820 0,1376 0,1792 0,1892 0,1657 0,1214
8 0,0000 0,0002 0,0022 0,0120 0,0376 0,0811 0,1327 0,1734 0,1864 0,1669
9 0,0000 0,0000 0,0004 0,0033 0,0139 0,0386 0,0794 0,1284 0,1694 0,1855
10 0,0000 0,0000 0,0001 0,0008 0,0042 0,0149 0,0385 0,0771 0,1248 0,1669
11 0,0000 0,0000 0,0000 0,0001 0,0010 0,0046 0,0151 0,0374 0,0742 0,1214
12 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0047 0,0145 0,0354 0,0708
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0045 0,0134 0,0327
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0039 0,0117
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0009 0,0031
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
19 0 0,3774 0,1351 0,0456 0,0144 0,0042 0,0011 0,0003 0,0001 0,0000 0,0000
1 0,3774 0,2852 0,1529 0,0685 0,0268 0,0093 0,0029 0,0008 0,0002 0,0000
2 0,1787 0,2852 0,2428 0,1540 0,0803 0,0358 0,0138 0,0046 0,0013 0,0003
3 0,0533 0,1796 0,2428 0,2182 0,1517 0,0869 0,0422 0,0175 0,0062 0,0018
4 0,0112 0,0798 0,1714 0,2182 0,2023 0,1491 0,0909 0,0467 0,0203 0,0074
5 0,0018 0,0266 0,0907 0,1636 0,2023 0,1916 0,1468 0,0933 0,0497 0,0222
6 0,0002 0,0069 0,0374 0,0955 0,1574 0,1916 0,1844 0,1451 0,0949 0,0518
7 0,0000 0,0014 0,0122 0,0443 0,0974 0,1525 0,1844 0,1797 0,1443 0,0961
8 0,0000 0,0002 0,0032 0,0166 0,0487 0,0981 0,1489 0,1797 0,1771 0,1442
303
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
9 0,0000 0,0000 0,0007 0,0051 0,0198 0,0514 0,0980 0,1464 0,1771 0,1762
10 0,0000 0,0000 0,0001 0,0013 0,0066 0,0220 0,0528 0,0976 0,1449 0,1762
11 0,0000 0,0000 0,0000 0,0003 0,0018 0,0077 0,0233 0,0532 0,0970 0,1442
12 0,0000 0,0000 0,0000 0,0000 0,0004 0,0022 0,0083 0,0237 0,0529 0,0961
13 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0024 0,0085 0,0233 0,0518
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0082 0,0222
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0022 0,0074
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
20 0 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000 0,0000
1 0,3774 0,2702 0,1368 0,0576 0,0211 0,0068 0,0020 0,0005 0,0001 0,0000
2 0,1887 0,2852 0,2293 0,1369 0,0669 0,0278 0,0100 0,0031 0,0008 0,0002
3 0,0596 0,1901 0,2428 0,2054 0,1339 0,0716 0,0323 0,0123 0,0040 0,0011
4 0,0133 0,0898 0,1821 0,2182 0,1897 0,1304 0,0738 0,0350 0,0139 0,0046
5 0,0022 0,0319 0,1028 0,1746 0,2023 0,1789 0,1272 0,0746 0,0365 0,0148
6 0,0003 0,0089 0,0454 0,1091 0,1686 0,1916 0,1712 0,1244 0,0746 0,0370
7 0,0000 0,0020 0,0160 0,0545 0,1124 0,1643 0,1844 0,1659 0,1221 0,0739
8 0,0000 0,0004 0,0046 0,0222 0,0609 0,1144 0,1614 0,1797 0,1623 0,1201
9 0,0000 0,0001 0,0011 0,0074 0,0271 0,0654 0,1158 0,1597 0,1771 0,1602
10 0,0000 0,0000 0,0002 0,0020 0,0099 0,0308 0,0686 0,1171 0,1593 0,1762
11 0,0000 0,0000 0,0000 0,0005 0,0030 0,0120 0,0336 0,0710 0,1185 0,1602
12 0,0000 0,0000 0,0000 0,0001 0,0008 0,0039 0,0136 0,0355 0,0727 0,1201
13 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0045 0,0146 0,0366 0,0739
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0049 0,0150 0,0370
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0049 0,0148
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0046
304
Anexos
n x 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002
19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
20 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
Tabela C – Distribuição de Poisson acumulada
Exemplo: Se μ = 2, então F(3) = 0,857.
μ 0 1 2 3 4 5 6 7 8 9
0,02 0,980 1,000
0,04 0,961 0,999 1,000
0,06 0,942 0,998 1,000
0,08 0,923 0,997 1,000
0,10 0,905 0,995 1,000
0,15 0,861 0,990 0,999 1,000
0,20 0,819 0,982 0,999 1,000
0,25 0,779 0,974 0,998 1,000
0,30 0,741 0,963 0,996 1,000
0,35 0,705 0,951 0,994 1,000
0,40 0,670 0,938 0,992 0,999 1,000
0,45 0,638 0,925 0,989 0,999 1,000
0,50 0,607 0,910 0,986 0,998 1,000
0,55 0,577 0,894 0,982 0,998 1,000
0,60 0,549 0,878 0,977 0,997 1,000
0,65 0,522 0,861 0,972 0,996 0,999 1,000
0,70 0,497 0,844 0,966 0,994 0,999 1,000
0,75 0,472 0,827 0,959 0,993 0,999 1,000
0,80 0,449 0,809 0,953 0,991 0,999 1,000
0,85 0,427 0,791 0,945 0,989 0,998 1,000
305
Anexos
μ 0 1 2 3 4 5 6 7 8 9
0,90 0,407 0,772 0,937 0,987 0,998 1,000
0,95 0,387 0,754 0,929 0,984 0,997 1,000
1,00 0,368 0,736 0,920 0,981 0,996 0,999 1,000
1,10 0,333 0,699 0,900 0,974 0,995 0,999 1,000
1,20 0,301 0,663 0,879 0,966 0,992 0,998 1,000
1,30 0,273 0,627 0,857 0,957 0,989 0,998 1,000
1,40 0,247 0,592 0,833 0,946 0,986 0,997 0,999 1,000
1,50 0,223 0,558 0,809 0,934 0,981 0,996 0,999 1,000
1,60 0,202 0,525 0,783 0,921 0,976 0,994 0,999 1,000
1,70 0,183 0,493 0,757 0,907 0,970 0,992 0,998 1,000
1,80 0,165 0,463 0,731 0,891 0,964 0,990 0,997 0,999 1,000
1,90 0,150 0,434 0,704 0,875 0,956 0,987 0,997 0,999 1,000
2,00 0,135 0,406 0,677 0,857 0,947 0,983 0,995 0,999 1,000
2,20 0,111 0,355 0,623 0,819 0,928 0,975 0,993 0,998 1,000
2,40 0,091 0,308 0,570 0,779 0,904 0,964 0,988 0,997 0,999 1,000
2,60 0,074 0,267 0,518 0,736 0,877 0,951 0,983 0,995 0,999 1,000
2,80 0,061 0,231 0,469 0,692 0,848 0,935 0,976 0,992 0,998 0,999
3,00 0,050 0,199 0,423 0,647 0,815 0,916 0,966 0,988 0,996 0,999
3,20 0,041 0,171 0,380 0,603 0,781 0,895 0,955 0,983 0,994 0,998
3,40 0,033 0,147 0,340 0,558 0,744 0,871 0,942 0,977 0,992 0,997
3,60 0,027 0,126 0,303 0,515 0,706 0,844 0,927 0,969 0,988 0,996
3,80 0,022 0,107 0,269 0,473 0,668 0,816 0,909 0,960 0,984 0,994
4,00 0,018 0,092 0,238 0,433 0,629 0,785 0,889 0,949 0,979 0,992
4,20 0,015 0,078 0,210 0,395 0,590 0,753 0,867 0,936 0,972 0,989
4,40 0,012 0,066 0,185 0,359 0,551 0,720 0,844 0,921 0,964 0,985
4,60 0,010 0,056 0,163 0,326 0,513 0,686 0,818 0,905 0,955 0,980
4,80 0,008 0,048 0,143 0,294 0,476 0,651 0,791 0,887 0,944 0,975
306
Anexos
μ 0 1 2 3 4 5 6 7 8 9
5,00 0,007 0,040 0,125 0,265 0,440 0,616 0,762 0,867 0,932 0,968
5,20 0,006 0,034 0,109 0,238 0,406 0,581 0,732 0,845 0,918 0,960
5,40 0,005 0,029 0,095 0,213 0,373 0,546 0,702 0,822 0,903 0,951
5,60 0,004 0,024 0,082 0,191 0,342 0,512 0,670 0,797 0,886 0,941
5,80 0,003 0,021 0,072 0,170 0,313 0,478 0,638 0,771 0,867 0,929
6,00 0,002 0,017 0,062 0,151 0,285 0,446 0,606 0,744 0,847 0,916
6,20 0,002 0,015 0,054 0,134 0,259 0,414 0,574 0,716 0,826 0,902
6,40 0,002 0,012 0,046 0,119 0,235 0,384 0,542 0,687 0,803 0,886
6,60 0,001 0,010 0,040 0,105 0,213 0,355 0,511 0,658 0,780 0,869
6,80 0,001 0,009 0,034 0,093 0,192 0,327 0,480 0,628 0,755 0,850
7,00 0,001 0,007 0,030 0,082 0,173 0,301 0,450 0,599 0,729 0,830
7,20 0,001 0,006 0,025 0,072 0,156 0,276 0,420 0,569 0,703 0,810
7,40 0,001 0,005 0,022 0,063 0,140 0,253 0,392 0,539 0,676 0,788
7,60 0,001 0,004 0,019 0,055 0,125 0,231 0,365 0,510 0,648 0,765
7,80 0,000 0,004 0,016 0,048 0,112 0,210 0,338 0,481 0,620 0,741
8,00 0,000 0,003 0,014 0,042 0,100 0,191 0,313 0,453 0,593 0,717
8,50 0,000 0,002 0,009 0,030 0,074 0,150 0,256 0,386 0,523 0,653
9,00 0,000 0,001 0,006 0,021 0,055 0,116 0,207 0,324 0,456 0,587
9,50 0,000 0,001 0,004 0,015 0,040 0,089 0,165 0,269 0,392 0,522
10,00 0,000 0,000 0,003 0,010 0,029 0,067 0,130 0,220 0,333 0,458
10,50 0,000 0,000 0,002 0,007 0,021 0,050 0,102 0,179 0,279 0,397
11,00 0,000 0,000 0,001 0,005 0,015 0,038 0,079 0,143 0,232 0,341
11,50 0,000 0,000 0,001 0,003 0,011 0,028 0,060 0,114 0,191 0,289
12,00 0,000 0,000 0,001 0,002 0,008 0,020 0,046 0,090 0,155 0,242
12,50 0,000 0,000 0,000 0,002 0,005 0,015 0,035 0,070 0,125 0,201
13,00 0,000 0,000 0,000 0,001 0,004 0,011 0,026 0,054 0,100 0,166
13,50 0,000 0,000 0,000 0,001 0,003 0,008 0,019 0,041 0,079 0,135
307
Anexos
μ 0 1 2 3 4 5 6 7 8 9
14,00 0,000 0,000 0,000 0,000 0,002 0,006 0,014 0,032 0,062 0,109
14,50 0,000 0,000 0,000 0,000 0,001 0,004 0,010 0,024 0,048 0,088
15,00 0,000 0,000 0,000 0,000 0,001 0,003 0,008 0,018 0,037 0,070
16,00 0,000 0,000 0,000 0,000 0,000 0,001 0,004 0,010 0,022 0,043
17,00 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,005 0,013 0,026
18,00 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,003 0,007 0,015
19,00 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,004 0,009
20,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,005
21,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,003
22,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002
23,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001
24,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
25,00 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
μ 10 11 12 13 14 15 16 17 18 19
2,8 1,060
3 1,049
3,2 1,039
3,4 1,031 1,064
3,6 1,023 1,051
3,8 1,017 1,039 1,061
4 1,010 1,028 1,047
4,2 1,004 1,019 1,034
4,4 0,997 1,010 1,022 1,034
4,6 0,991 1,001 1,011 1,021
4,8 0,983 0,991 1,000 1,008
5 0,975 0,982 0,988 0,995 1,002
5,2 0,966 0,971 0,977 0,982 0,988
308
Anexos
μ 10 11 12 13 14 15 16 17 18 19
5,4 0,956 0,960 0,965 0,969 0,974
5,6 0,945 0,948 0,952 0,956 0,959 0,963
5,8 0,932 0,935 0,938 0,941 0,944 0,947
6 0,919 0,921 0,924 0,926 0,928 0,931 0,933
6,2 0,904 0,906 0,908 0,910 0,912 0,914 0,916
6,4 0,887 0,889 0,891 0,892 0,894 0,896 0,897
6,6 0,870 0,871 0,873 0,874 0,875 0,877 0,878 0,880
6,8 0,851 0,852 0,854 0,855 0,856 0,857 0,858 0,859
7 0,831 0,832 0,833 0,834 0,835 0,836 0,837 0,838
7,2 0,810 0,811 0,812 0,813 0,813 0,814 0,815 0,816
7,4 0,788 0,789 0,790 0,790 0,791 0,791 0,792 0,793 0,793
7,6 0,765 0,766 0,766 0,767 0,767 0,768 0,768 0,769 0,769
7,8 0,742 0,742 0,742 0,743 0,743 0,744 0,744 0,744 0,745
8 0,717 0,717 0,718 0,718 0,718 0,719 0,719 0,719 0,720 0,720
8,5 0,653 0,653 0,654 0,654 0,654 0,654 0,654 0,655 0,655 0,655
9 0,588 0,588 0,588 0,588 0,588 0,588 0,588 0,588 0,589 0,589
9,5 0,522 0,522 0,522 0,522 0,522 0,522 0,522 0,522 0,522 0,523
10 0,458 0,458 0,458 0,458 0,458 0,458 0,458 0,458 0,458 0,458
10,5 0,397 0,397 0,397 0,397 0,397 0,397 0,397 0,397 0,397 0,397
11 0,341 0,341 0,341 0,341 0,341 0,341 0,341 0,341 0,341 0,341
11,5 0,289 0,289 0,289 0,289 0,289 0,289 0,289 0,289 0,289 0,289
12 0,242 0,242 0,242 0,242 0,242 0,242 0,242 0,242 0,242 0,242
12,5 0,201 0,201 0,201 0,201 0,201 0,201 0,201 0,201 0,201 0,201
13 0,166 0,166 0,166 0,166 0,166 0,166 0,166 0,166 0,166 0,166
13,5 0,135 0,135 0,135 0,135 0,135 0,135 0,135 0,135 0,135 0,135
14 0,109 0,109 0,109 0,109 0,109 0,109 0,109 0,109 0,109 0,109
14,5 0,088 0,088 0,088 0,088 0,088 0,088 0,088 0,088 0,088 0,088
15 0,070 0,070 0,070 0,070 0,070 0,070 0,070 0,070 0,070 0,070
309
Anexos
μ 10 11 12 13 14 15 16 17 18 19
16 0,043 0,043 0,043 0,043 0,043 0,043 0,043 0,043 0,043 0,043
17 0,026 0,026 0,026 0,026 0,026 0,026 0,026 0,026 0,026 0,026
18 0,015 0,015 0,015 0,015 0,015 0,015 0,015 0,015 0,015 0,015
19 0,009 0,009 0,009 0,009 0,009 0,009 0,009 0,009 0,009 0,009
20 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,005
21 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003
22 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002
23 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001
24 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
25 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
μ 20 21 22 23 24 25 26 27 28 29
8,5 0,655
9 0,589
9,5 0,523 0,523
10 0,458 0,458 0,459
10,5 0,397 0,397 0,397 0,398
11 0,341 0,341 0,341 0,341
11,5 0,289 0,289 0,289 0,289 0,289
12 0,242 0,242 0,242 0,242 0,242 0,242
12,5 0,201 0,201 0,201 0,201 0,201 0,201 0,201
13 0,166 0,166 0,166 0,166 0,166 0,166 0,166
13,5 0,135 0,135 0,135 0,135 0,135 0,135 0,135 0,135
14 0,109 0,109 0,109 0,109 0,109 0,109 0,109 0,109 0,109
14,5 0,088 0,088 0,088 0,088 0,088 0,088 0,088 0,088 0,088 0,088
15 0,070 0,070 0,070 0,070 0,070 0,070 0,070 0,070 0,070 0,070
16 0,043 0,043 0,043 0,043 0,043 0,043 0,043 0,043 0,043 0,043
310
Anexos
17 0,026 0,026 0,026 0,026 0,026 0,026 0,026 0,026 0,026 0,026
18 0,015 0,015 0,015 0,015 0,015 0,015 0,015 0,015 0,015 0,015
19 0,009 0,009 0,009 0,009 0,009 0,009 0,009 0,009 0,009 0,009
20 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,005
21 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003
22 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002
23 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001
24 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
25 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
μ 30 31 32 33 34 35 36 37 38 39
15 0,070
16 0,043 0,043
17 0,026 0,026 0,026
18 0,015 0,015 0,015 0,015 0,015
19 0,009 0,009 0,009 0,009 0,009 0,009
20 0,005 0,005 0,005 0,005 0,005 0,005 0,005 0,005
21 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003 0,003
22 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002 0,002
23 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001
24 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
25 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
μ 40 41 42 43
23 0,001 0,001
24 0,000 0,000 0,000
25 0,000 0,000 0,000 0,000
311
Anexos
Tabela D – Probabilidade sob a área da curva normal padrão
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
–4,0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
–3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
–3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
–3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
–3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
–3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
–3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
–3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
–3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
–3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
–3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
–2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
–2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
–2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
–2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
–2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
–2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
–2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
–2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
–2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
–2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
–1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
–1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
–1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
–1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
–1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
312
Anexos
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
–1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
–1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
–1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
–1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
–1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
–0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
–0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
–0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
–0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
–0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
–0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
–0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
–0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
–0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
313
Anexos
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
314
Anexos
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
4,0 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Tabela E – Distribuição “t” de Student
Exemplo: Para 19 graus de liberdade, área de 0,05 (bicaudal).
t = 2,093
bicaudal
0,1 0,05 0,02 0,01
1 6,314 12,706 31,821 63,656
2 2,920 4,303 6,965 9,925
3 2,353 3,182 4,541 5,841
4 2,132 2,776 3,747 4,604
5 2,015 2,571 3,365 4,032
6 1,943 2,447 3,143 3,707
7 1,895 2,365 2,998 3,499
8 1,860 2,306 2,896 3,355
9 1,833 2,262 2,821 3,250
10 1,812 2,228 2,764 3,169
11 1,796 2,201 2,718 3,106
12 1,782 2,179 2,681 3,055
13 1,771 2,160 2,650 3,012
14 1,761 2,145 2,624 2,977
15 1,753 2,131 2,602 2,947
16 1,746 2,120 2,583 2,921
17 1,740 2,110 2,567 2,898
18 1,734 2,101 2,552 2,878
19 1,729 2,093 2,539 2,861
315
Anexos
bicaudal
0,1 0,05 0,02 0,01
20 1,725 2,086 2,528 2,845
21 1,721 2,080 2,518 2,831
22 1,717 2,074 2,508 2,819
23 1,714 2,069 2,500 2,807
24 1,711 2,064 2,492 2,797
25 1,708 2,060 2,485 2,787
26 1,706 2,056 2,479 2,779
27 1,703 2,052 2,473 2,771
28 1,701 2,048 2,467 2,763
29 1,699 2,045 2,462 2,756
30 1,697 2,042 2,457 2,750
40 1,684 2,021 2,423 2,704
60 1,671 2,000 2,390 2,660
120 1,658 1,980 2,358 2,617
Distribuição normal 1,645 1,960 2,326 2,576
0,050 0,025 0,010 0,005
Unicaudal
316
Referências
Bussab, Wilton de O.; Morettin, Pedro A. Estatística Básica. 5. ed. São

Paulo: Saraiva, 2006.
Costa Neto, Pedro L. O. Estatística. 2. ed. Rio de Janeiro: Edgard Blücher,

2002.
Hamburg, Morris. Statistical Analysis for Decison Making. University of

Pennsylvania, 1991.
Levine, David M. STEPHAN, David; KREHBIEL, Timothy; BERENSON, Mark.

Estatística: teoria e aplicações. 3. ed. Rio de Janeiro: LTC, 2005.
Ragsdale, Cliff T. Spread Sheet Making and Decision Analysis. South-

Western College Publishing, 2001.
Spiegel, Murray R. Estatística. Makron, 1994.
Stevenson, William U. Estatística Aplicada à Administração. Harbra,

2001.
Triola, Mario F. Introdução à Estatística. LTC, 2008.
319
MÉ
TO
D OS
APL QU
ICA ANTI
DO TAT

SA IVO
NEG S
ÓC
IOS
MÉ
TO
D OS
APL QU
ICA ANTI
DO TAT
SA IVO
NEG S
ÓC
IOS
Fundação Biblioteca Nacional
ISBN 978-85-387-3091-0


Metodos Quantitativos Aplicados A Negocios

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Metodos Quantitativos Aplicados A Negocios

Transféré par

Droits d'auteur :

Formats disponibles

MÉ

Métodos Quantitativos Aplicados a Negócios

Paulo Afonso Bracarense

Métodos Quantitativos Aplicados a Negócios

IESDE Brasil S.A.

Bracarense, Paulo Afonso, 1957-

1. Negócios 2. Investimentos 3. Investimentos - Análises. I. Guimarães, Ubiratan

12-6746. CDD: 332.6

17.09.12 02.10.12 039220

Capa: IESDE Brasil S.A.

Todos os direitos reservados.

IESDE Brasil S.A.

Ubiratan Vieira Guimarães

11 | Modelagem matemática dos fenômenos reais

216 | Critérios de escolha utilizando distribuição a priori

Por que escrever mais um livro de Estatística? De fato a literatura já forne-

O livro foi composto para um curso esbelto, no sentido de que pretende

Esse último destaque norteou toda a redação do livro e é fundamental

Evitamos o uso extensivo da matemática. Ou, de outra forma, utilizamos

A primeira é o reconhecimento de que o emaranhado de notações, no-

A segunda questão de linguagem, e isso agora diz mais respeito à mate-

mático ou uma pessoa habituada com a linguagem matemática enxergará

Naturalmente, esse conhecimento pode facilitar em certos momentos

Modelagem matemática dos fenômenos reais

A ciência tem procurado compreender os fenômenos da natureza através

A forma básica dos modelos construídos para os fenômenos que compor-

Os papéis da teoria de probabilidades

Quando se fala de incerteza, de acaso, fala-se tradicionalmente de proba-

de incerteza associada a um fenômeno que no geral pode ser compreendi-

As técnicas estatísticas utilizam-se fartamente de levantamento de dados

Organização dos capítulos do livro

Quando falamos em amostragem, estamos de antemão reconhecendo

No lance de uma moeda honesta, a probabilidade de sair cara em um

Tendo então a noção da probabilidade, poderemos voltar ao trabalho

Na matéria que será tratada no capítulo 4, estudaremos técnicas simples

A nossa pretensão de falar da população com base em elementos da

Essa parte da estatística é chamada de inferência estatística ou de esta-

O conteúdo até esse ponto do livro é o mínimo obrigatório a qualquer

Elas são apresentadas nos capítulos de 6 a 8. No capítulo 6 discutiremos

Outras técnicas estatísticas são bastante úteis dependendo do ramo de

Para cada um desses tópicos há uma enormidade de livros específicos,

Solicitou para um estudo preliminar a relação dos funcionários em que

Um auxiliar administrativo apresentou o seguinte quadro como resultado:

1 A. L. Ferraz M 49 1.714,00 Oper.

2 R. Abreu M 48 1.701,00 Oper.

3 R. S. Reis M 64 1.589,00 Oper.

4 N. Farias F 37 1.418,00 Oper.

5 J. L. Jansen F 42 1.000,00 Aux. Adm.

6 U. S. Machado M 40 3.732,00 Téc.

7 F. Nogueira F 21 1.330,00 Oper.

8 M. Pinheiro F 33 1.307,00 Oper.

9 M. A. da Silva M 39 1.282,00 Oper.

10 P. A. B. Costa F 42 1.260,00 Oper.

11 H. F. Minho F 39 975,00 Aux. Adm.

12 N. M. de Lima M 32 1.256,00 Oper.

13 C. F. Loureiro M 22 1.185,00 Oper.

14 M. E. M. Ferreira M 21 3.535,00 Téc.

15 J. A. Isaias F 37 2.956,00 Téc.

16 J. Martins F 24 1.179,00 Oper.

17 A. P. Ribeiro M 28 966,00 Aux. Adm.

18 L. C. Batista M 32 3.204,00 Adm.

19 A. F. dos Santos M 31 881,00 Aux. Adm.

20 C. A. Brandão F 38 3.080,00 Adm.