Vous êtes sur la page 1sur 170

Estatstica

Autora: Profa. Renata Nascimento Nogueira


Colaboradores: Profa. Elisangela Monaco de Moraes
Prof. Roberto Macias
Prof. Mauricio Martins do Fanno
Professora conteudista: Renata Nascimento Nogueira

Graduao em fsica (bacharelado) pela Universidade de So Paulo (1992), mestrado em fsica pela Universidade
de So Paulo (1995) e doutorado em fsica pela Universidade de So Paulo (1999). Ps-doutorado na rea de cincia
dos materiais, pela USP (2003) e Virginia Tech (2001).

Tem dez trabalhos publicados em revistas cientficas de mbito internacional.

Atua no magistrio superior desde 2005, tendo lecionado disciplinas das reas de fsica, matemtica e estatstica
em diversos cursos das trs grandes reas do conhecimento. Atualmente, horista da Universidade Paulista, da
Faculdade Taboo da Serra e da Escola Brasileira Israelita Chaim Nachman Bialik.

Dados Internacionais de Catalogao na Publicao (CIP)

N778 Nogueira, Renata Nascimento

Estatstica. / Renata Nascimento Nogueira. - So Paulo: Editora


Sol.
168 p., il.

Nota: este volume est publicado nos Cadernos de Estudos


e Pesquisas da UNIP, Srie Didtica, ano XVII, n. 2-030/11,
ISSN 1517-9230.

1.Estatstica 2.Dados Estatsticos 3.Probabilidade I.Ttulo

CDU 519.2

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrnico, incluindo fotocpia e gravao) ou arquivada em qualquer sistema ou banco de dados sem
permisso escrita da Universidade Paulista.
Prof. Dr. Joo Carlos Di Genio
Reitor

Prof. Fbio Romeu de Carvalho


Vice-Reitor de Planejamento, Administrao e Finanas

Profa. Melnia Dalla Torre


Vice-Reitora de Unidades Universitrias

Prof. Dr. Yugo Okida


Vice-Reitor de Ps-Graduao e Pesquisa

Profa. Dra. Marlia Ancona-Lopez


Vice-Reitora de Graduao

Unip Interativa EaD

Profa. Elisabete Brihy


Prof. Marcelo Souza
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli

Material Didtico EaD

Comisso editorial:
Dra. Anglica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Ktia Mosorov Alonso (UFMT)
Dra. Valria de Carvalho (UNIP)

Apoio:
Profa. Cludia Regina Baptista EaD
Profa. Betisa Malaman Comisso de Qualificao e Avaliao de Cursos

Projeto grfico:
Prof. Alexandre Ponzetto

Reviso:
Silvana Pierro
Sumrio
Estatstica

APRESENTAO.......................................................................................................................................................9
INTRODUO ........................................................................................................................................................ 10
Unidade I
1 AS TRS SUBDIVISES DA ESTATSTICA...................................................................................................11
1.1 Estatstica descritiva.............................................................................................................................11
1.2 Probabilidades..........................................................................................................................................11
1.3 Inferncia...................................................................................................................................................11
2 DADOS ESTATSTICOS..................................................................................................................................... 12
2.1 Tipos de dados........................................................................................................................................ 12
2.1.1 Dados quantitativos............................................................................................................................... 12
2.1.2 Dados qualitativos................................................................................................................................... 12
2.1.3 Como identificar o tipo de uma varivel?..................................................................................... 13
2.1.4 Classificao de variveis..................................................................................................................... 14
2.2 Dados brutos........................................................................................................................................... 16
Unidade II
3 TABELAS DE FREQUNCIA E SEUS GRFICOS....................................................................................... 26
3.1 Construo das tabelas....................................................................................................................... 26
3.1.1 Varivel sabor......................................................................................................................................... 26
3.1.2 Varivel tamanho................................................................................................................................. 27
3.1.3 Varivel preo........................................................................................................................................ 27
3.1.4 Varivel vendas...................................................................................................................................... 28
3.2 Grficos de tabelas de frequncia.................................................................................................. 30
3.2.1 Grficos de colunas................................................................................................................................. 30
3.2.2 Diagramas circulares.............................................................................................................................. 32
3.2.3 Escolha do tipo de grfico................................................................................................................... 34
3.2.4 Comentrios adicionais......................................................................................................................... 34
4 MEDIDAS DE POSIO................................................................................................................................... 34
4.1 Moda.......................................................................................................................................................... 35
4.2 Mediana.................................................................................................................................................... 36
4.3 Mdia.......................................................................................................................................................... 37
4.3.1 Mdia aritmtica...................................................................................................................................... 38
4.3.2 Clculo da mdia para dados apresentados em intervalos.................................................... 42
4.3.3 Mdia ponderada..................................................................................................................................... 42
4.3.4 Propriedades da mdia.......................................................................................................................... 45
4.3.5 Mdias ponderadas da rea econmica: ndices de inflao................................................ 46
Unidade III
5 MEDIDAS DE DISPERSO.............................................................................................................................. 55
5.1 Intervalo.................................................................................................................................................... 55
5.1.1 Dados da tabela 12................................................................................................................................. 55
5.1.2 Dados da tabela 13................................................................................................................................. 56
5.1.3 Dados da tabela 14................................................................................................................................. 56
5.2 Varincia e desvio-padro................................................................................................................. 56
5.2.1 Estabelecendo critrios.......................................................................................................................... 56
5.3 Definies formais................................................................................................................................ 58
5.3.1 Varincia e desvio-padro para populaes................................................................................. 58
5.3.2 Varincia e desvio-padro para amostras..................................................................................... 59
5.4 Realizao dos clculos...................................................................................................................... 59
5.4.1 Dados no agrupados............................................................................................................................ 60
5.4.2 Dados agrupados..................................................................................................................................... 62
5.4.3 Mdias ponderadas................................................................................................................................. 64
6 NOES GERAIS DE PROBABILIDADE...................................................................................................... 64
6.1 Variveis aleatrias............................................................................................................................... 64
6.2 Noes intuitivas de probabilidade................................................................................................ 65
6.3 Probabilidade enquanto frequncia relativa.............................................................................. 65
6.3.1 Formalizao.............................................................................................................................................. 65
6.4 Alguns cuidados na interpretao de uma probabilidade.................................................... 68
6.4.1 Caso geral.................................................................................................................................................... 68
6.4.2 Quando a probabilidade 0................................................................................................................ 68
6.4.3 Quando a probabilidade 1................................................................................................................ 68
6.5 Origem dos dados................................................................................................................................. 69
6.5.1 Dados empricos....................................................................................................................................... 69
6.5.2 Dados analticos....................................................................................................................................... 69
Unidade IV
7 PROBABILIDADES............................................................................................................................................. 77
7.1 Noes de teoria de conjuntos........................................................................................................ 77
7.1.1 Noes gerais............................................................................................................................................ 77
7.1.2 Operaes com conjuntos.................................................................................................................... 79
7.1.3 Diagramas de Venn................................................................................................................................. 82
7.1.4 Aplicao..................................................................................................................................................... 91
7.2 Propriedades importantes................................................................................................................. 98
7.2.1 Eventos mutuamente exclusivos....................................................................................................... 98
7.2.2 Eventos complementares..................................................................................................................... 99
7.2.3 Eventos independentes.......................................................................................................................100
7.2.4 Eventos no mutuamente excludentes........................................................................................101
7.3 Distribuies de probabilidade.......................................................................................................103
7.4 Anlise combinatria.........................................................................................................................103
7.4.1 Princpio da multiplicao.................................................................................................................103
7.4.2 Permutaes............................................................................................................................................105
7.4.3 Arranjos...................................................................................................................................................... 110
7.4.4 Combinaes............................................................................................................................................111
7.5 Distribuies de probabilidade....................................................................................................... 113
7.5.1 Variveis aleatrias...............................................................................................................................114
7.5.2 Tipos de distribuio.............................................................................................................................114
7.6 Distribuio binomial......................................................................................................................... 114
7.6.1 Jogo de n moedas..................................................................................................................................115
7.6.2 Caso geral..................................................................................................................................................121
7.6.3 Aplicao.................................................................................................................................................. 123
7.7 Distribuio uniforme de probabilidades..................................................................................125
7.8 Distribuio normal de probabilidades.......................................................................................127
7.8.1 Condies de validade........................................................................................................................ 127
7.8.2 A varivel z.............................................................................................................................................. 128
7.8.3 Distribuio normal padronizada................................................................................................... 130
8 INFERNCIA E ESTIMAO.........................................................................................................................137
8.1 Definies...............................................................................................................................................137
8.1.1 Populao e amostra........................................................................................................................... 138
8.1.2 Censo e amostragem........................................................................................................................... 138
8.2 Tcnicas de amostragem..................................................................................................................140
8.2.1 Classificao............................................................................................................................................ 140
8.2.2 Duas tcnicas probabilsticas........................................................................................................... 140
8.2.3 Duas tcnicas no probabilsticas (no aleatrias)..................................................................141
8.3 Representatividade da amostra.....................................................................................................141
8.4 Distribuies amostrais.....................................................................................................................142
8.4.1 Nova notao......................................................................................................................................... 142
8.4.2 Comparao entre distribuio amostral e populao......................................................... 145
8.5 Estimao...............................................................................................................................................145
8.5.1 Intervalos de confiana bilateral para conhecido............................................................... 145
8.5.2 Observaes finais................................................................................................................................ 148
APRESENTAO

Caro aluno,

A palavra estatstica j faz parte de nossa linguagem cotidiana, bem como as estatsticas em
si. Ainda que de maneira informal, todos utilizamos diversos de seus conceitos e informaes
estatsticas para orientar nossa leitura da realidade e, a partir disso, tomar decises que dependam
dessas informaes.

Um exemplo em que a presena da estatstica bvia a leitura de pesquisas de inteno de voto.


Muitas vezes ajudam a orientar nossas escolhas ou, pelo menos, servem de tema de conversa. No
entanto, nosso uso muito mais frequente e prximo. Utilizamos intuitivamente os conceitos de mdia
e intervalo para definir quanto tempo antes de um compromisso temos que sair de casa; o conceito de
probabilidade quando compramos um presente e torcemos para que o presenteado goste; inferncias
ao tentar prever como certos aspectos de nossa vida devem evoluir.

Pois bem, temos por objetivo ajud-lo a compreender e a utilizar os conceitos da estatstica
na resoluo de problemas formais, por meio das contas necessrias e, principalmente, buscando
trasmitir esse conhecimento de modo que voc possa aplic-lo em situaes de sua vida
profissional e pessoal, fazendo da estatstica uma ferramenta que o ajude a tomar decises bem
fundamentadas.

Para adentrar no aprendizado, em primeiro lugar, necessrio que apresentemos os assuntos que
abordaremos e o por qu de sua escolha. Assim, antes de comearmos a falar da estatstica em si,
faremos alguns comentrios a respeito de como foi estruturado este texto. A cada tpico iniciaremos
discutindo o tema de maneira informal, buscando que voc o reconhea no seu cotidiano. Em seguida,
passaremos ao tratamento formal do tema, o que inclui a formalizao matemtica. Note que para
uma compreenso adequada das formalizaes, ajuda muito que voc tenha claro o tema em questo,
assim, no deixe de ler os textos introdutrios. Alm disso, se voc tem dificuldades com a matemtica
bsica, principalmente a resoluo de expresses numricas e de equaes, busque revisar esses pontos,
pois precisar deles. Por fim, depois de termos visto como fazer as contas, passaremos aos exemplos,
retirados de situaes prximas a sua realidade.

Os objetivos da disciplina de Estatstica se dividem em objetivos gerais e especficos. Eles foram


definidos de modo que essa rea do conhecimento seja um instrumento de anlise da realidade a
auxili-lo na sua prtica profissional. Esses objetivos esto listados a seguir:

Apresentar ao aluno os conceitos fundamentais de Estatstica, de maneira que ele possa


compreender e interpretar dados estatsticos e utiliz-los na tomada de decises.

Apresentar os conceitos bsicos da estatstica descritiva, destacando as medidas sobre distribuio


e os principais indicadores para o desenvolvimento da inferncia estatstica. Coletar e interpretar
dados de forma sistematizada e imprimir credibilidade a anlises quantitativas dos fenmenos da
realidade investigada.
9
Unidade I

INTRODUO

A estatstica pode ser definida como uma subdiviso da matemtica que descreve
caractersticas de conjuntos, organizando e resumindo dados a seu respeito, buscando
relaes entre esses conjuntos de dados e elaborando modelos de forma tal que possam ser
feitas previses a respeito de sua evoluo temporal ou da de conjuntos com caractersticas
similares.

Populao e amostra

Nos estudos estatsticos, fundamental que tenhamos bem presentes os conceitos de populao e
de amostra. Uma discusso mais detalhada a respeito deles ser retomada adiante, mas preciso defini-
los antecipadamente, ainda que de maneira rpida.

Chamamos de populao ao conjunto com a totalidade dos elementos estudados.

O significado de amostra utilizado em estatstica similar ao utilizado cotidianamente, ou seja,


um pedao ou uma parte do todo que se utiliza para experimentar se determinada coisa ou no
apropriada. Nos estudos estatsticos, uma amostra uma frao do conjunto estudado, uma seleo
de elementos da populao que ser estudada no intuito de se conhecerem caractersticas do conjunto
todo.

10
ESTATSTICA

Unidade I
1 AS TRS SUBDIVISES DA ESTATSTICA

usual dividir esse ramo do conhecimento em trs subdivises. So elas:

1.1 Estatstica descritiva

A chamada estatstica descritiva diz respeito organizao e ao resumo dos dados que se tenha
a respeito do conjunto estudado, de modo a descrev-lo de maneira apropriada. Fazem parte dessa
subdiviso a elaborao de tabelas e grficos para a apresentao dos dados e a determinao de
parmetros que representem o conjunto, como a moda, a mediana, a mdia e as medidas de disperso,
que dizem respeito ao nvel de similaridade entre os elementos do conjunto. Esses temas trataremos
nesta Unidade.

1.2 Probabilidades

O estudo das probabilidades busca definir se um determinado evento tende a acontecer


frequentemente ou no. A utilizao de probabilidades ajuda a fundamentar tomadas de deciso,
avaliando riscos e permitindo que se faam escolhas mais seguras. Os tpicos relacionados a elas sero
discutidos em duas das unidades da apostila, sendo que na Unidade I desenvolveremos os conceitos
gerais e na Unidade II abordaremos modelos estatsticos de distribuio de probabilidades.

1.3 Inferncia

A inferncia estatstica o ramo de maior importncia, visto que este o instrumental utilizado
para transcender as informaes a respeito de um dado conjunto para uma realidade maior, ou seja,
a maneira de se entender o todo a partir de uma parte. Por exemplo, a inferncia que nos permite
extrapolar os resultados de uma pesquisa de opinio para toda a populao. Esses temas trataremos na
Unidade IV.

Saiba mais

Sobre o papel da aleatoriedade em nosso cotidiano, de maneira


agradvel, mas sem perder o rigor, sugerimos a leitura de MLODINOW,
Leonard. O andar do bbado. Rio de Janeiro: Zahar, 2009.

11
Unidade I

2 DADOS ESTATSTICOS

Conforme dissemos anteriormente, nosso objetivo o de descrever conjuntos. Para tanto, o primeiro
passo definir quais as grandezas a respeito de um conjunto so de nosso interesse no estudo em
particular. Por exemplo, se algum vai estudar a populao de uma cidade, pode estar interessado
em diferentes tipos de informaes a respeito dela. Um estudo sociolgico poder buscar nveis de
desemprego, educao etc.; um estudo mdico poder buscar informaes a respeito de mortalidade e
alimentao; um estudo publicitrio precisar saber tipos de consumo etc.

2.1 Tipos de dados

Cada caracterstica relevante a ser estudada uma varivel desse conjunto, uma grandeza. Como
h tipos diferentes de caractersticas, teremos tambm tipos diferentes de dados, os quais se classificam
como veremos a seguir.

Vale notar que, quando escrevemos programas computacionais, para armazenar os dados de maneira
apropriada, necessria a identificao correta de cada um dos tipos de dados a armazenar, para que se
utilize o tipo de varivel correspondente, caso contrrio poder haver problemas no tratamento deles.

2.1.1 Dados quantitativos

So chamados de dados quantitativos aqueles que expressam quantidades. Nesse caso, os


valores associados a tais grandezas sero sempre valores numricos. So exemplos de dados
quantitativos: renda, altura, peso, idade, rea cultivada, nmero de computadores, tamanho da
memria, rapidez do processador etc.

Os dados quantitativos podem ser ainda subdivididos em dois tipos: discretos e contnuos.

So valores contnuos aqueles que podem assumir qualquer valor num certo intervalo. Dos exemplos
dados anteriormente, citamos a altura.

So valores discretos aqueles que podem assumir apenas alguns valores num certo intervalo,
notadamente quando s se podem ter nmeros inteiros. Dos exemplos anteriores, um caso desses o
nmero de computadores.

2.1.2 Dados qualitativos

So chamados dados qualitativos aqueles que expressam qualidades que no se podem medir ou
quantificar. Os valores associados a essas variveis podem no ser numricos. Podemos citar como
exemplo de variveis qualitativas: nome, escolaridade, cor, sabor, patente etc.

Vale notar que, para uma varivel qualitativa, podemos tambm chamar de valor a caracterstica
especfica. Por exemplo, num estudo a respeito de planetas, podemos ter dados a respeito da cor de cada
um. Nesse caso, a varivel cor do planeta Marte seria vermelha.
12
ESTATSTICA

Assim como os dados quantitativos, os qualitativos tm uma subdiviso. Eles podem ser nominais
ou ordinais.

Os dados ordinais so aqueles que se podem ordenar. Entre os citados anteriormente, teramos como
ordinais as variveis escolaridade e patente militar.

Escolaridade uma varivel que pode assumir valores como Ensino Superior completo, Ensino
Fundamental incompleto, Ensino Mdio completo etc. Se fssemos ordenar, seria correto dizer que
Ensino Fundamental incompleto vem antes de Ensino Mdio completo, j que algum no pode
cursar o Ensino Mdio sem ter concludo o Ensino Fundamental. Ou seja, esses valores tm naturalmente
uma ordem, logo, a varivel ordinal.

Se analisarmos a varivel patente militar, tambm veremos que os valores sargento e general
seguem uma hierarquia, logo, podemos falar em ordem, e a varivel ordinal.

Os dados nominais so aqueles que no tm uma ordem natural, suas diferenas no implicam em
alguma forma de hierarquia, sendo as classes diferenciadas pelo seu nome. Um exemplo a varivel cor.
Ningum pode dizer que o vermelho valha mais que o azul ou menos que o amarelo, logo, temos apenas
diferenas, sem que haja uma ordem.

Tambm interessante enfatizar que pode acontecer de uma varivel qualitativa ser identificada por
um nmero, mas que este no mede uma quantidade. Por exemplo, comum que fabricantes de tintas
identifiquem cores especficas por meio de nmeros, mas esses nmeros so apenas identificadores,
como se fossem nomes. Assim, se tivermos um azul cujo cdigo 231, isso no significa que ele seja de
algum modo menor que um azul de cdigo 679.

2.1.3 Como identificar o tipo de uma varivel?

Para identificar de que tipo uma varivel, devemos fazer as seguintes perguntas:

Primeira: Este valor representa uma quantidade, um valor numrico?

Se a resposta for sim, ser quantitativa; caso contrrio ser qualitativa.

Segunda pergunta para a quantitativa: Pode ter qualquer valor intermedirio ou apenas alguns
valores (em particular), inteiros?

Se a resposta for sim, ela contnua, caso contrrio, discreta.

Segunda pergunta para a qualitativa: Existe uma ordem natural para os valores dessa varivel?

Se sim, ela ordinal; caso contrrio, nominal.

13
Unidade I

2.1.4 Classificao de variveis

Veja o exemplo a seguir: queremos realizar um estudo a respeito das vendas de sucos prontos para
beber de uma determinada marca, num supermercado. Para isso, a primeira coisa a fazer definir quais
as caractersticas de interesse do estudo e, para cada caracterstica:

1. Definir uma varivel que armazene seu valor.

2. Verificar que tipo de valores a varivel assume.

3. Classificar a varivel.

Para efetuar tal estudo, preciso, primeiro, ver quais so os dados que caracterizam o produto:

Pode ser encontrado nos sabores maracuj, caju e uva.

vendido em embalagens de trs tamanhos: pequeno, mdio e grande.

Mas essas caractersticas no so suficientes. Para estudar vendas, precisamos tambm de


informaes a respeito de quantidade vendida e de preo. Desse modo, nosso estudo precisar das
seguintes variveis:

Caracterstica Nome da varivel Valores possveis


Sabor Sabor Maracuj, caju, uva
Tamanho da embalagem Tamanho Pequeno, mdio, grande
Quantidade vendida Vendas Nmeros inteiros
Preo Preo Nmeros inteiros ou no inteiros

Passamos agora classificao das variveis.

1. Varivel sabor

Pergunta 1: Esse valor representa uma quantidade, um valor numrico?

Resposta: No. Logo, qualitativa.

Pergunta 2 das qualitativas: Existe uma ordem natural dos sabores?

Resposta: No, pois no se pode dizer que uma fruta seja anterior ou posterior a outra. Logo, nominal.

Classificao da varivel sabor: qualitativa nominal.

2. Varivel tamanho
14
ESTATSTICA

Pergunta 1: Esse valor representa uma quantidade, um valor numrico?

Resposta: No, pois ainda que o volume possa ser medido em valores numricos, as embalagens
esto classificadas como pequena, mdia e grande, que no so quantidades especificadas. Logo,
qualitativa.

Pergunta 2 das qualitativas: Existe uma ordem natural dos tamanhos?


Resposta: Sim, h uma hierarquia natural. Logo, ordinal.

Classificao da varivel tamanho: qualitativa ordinal.

3. Varivel vendas

Pergunta 1: Esse valor representa uma quantidade, um valor numrico?


Resposta: Sim, pois o nmero de vendas efetuadas. Logo, quantitativa.

Pergunta 2 das quantitativas: Pode ter qualquer valor intermedirio ou apenas alguns valores (em
particular), inteiros?

Resposta: No, pois no posso vender metade ou um tero da embalagem, por exemplo. Logo,
discreta.

Classificao da varivel tamanho: quantitativa discreta.

4. Varivel preo

Pergunta 1: Esse valor representa uma quantidade, um valor numrico?


Resposta: Sim, pois a quantidade de dinheiro que se deve pagar. Logo, quantitativa.

Pergunta 2 das quantitativas: Pode ter qualquer valor intermedirio ou apenas alguns valores (em
particular), inteiros?
Resposta: Sim, pois o preo no precisa ser um nmero inteiro de reais, logo, contnua.

Classificao da varivel tamanho: quantitativa contnua.

Observao

A rigor, no podemos usar dcimos ou milsimos de centavos, pois isso


tornaria o preo uma varivel discreta. No entanto, possvel utilizar o
preo com tantas casas decimais quantas forem de interesse.

15
Unidade I

2.2 Dados brutos

Uma vez definidos o tema de interesse de um estudo estatstico e as variveis de interesse,


passa-se etapa de obteno dos dados. A forma de obter dados depender do tipo de pesquisa
a ser realizada. Geralmente, estudos de reas tcnicas obtm seus dados por meio de medidas
diretas das grandezas. Nas reas de humanas, no entanto, muito comum a utilizao de pesquisas
de campo que envolvem entrevistas ou observaes de situaes. Em qualquer dos casos, o
procedimento a seguir aquele que permitir ter um conjunto significativo de valores para as
variveis de interesse.

Uma vez obtidos os dados, monta-se uma tabela em que, para cada elemento pesquisado, colocam-
se os valores correspondentes de cada varivel. comum chamar a essa etapa de tabulao dos dados.
O resultado final ser ento a tabela de dados brutos, ou seja, dados que ainda no foram lapidados,
analisados.

Exemplo

Utilizando o exemplo da seo anterior, podemos simular uma obteno e uma organizao dos dados.
Nesse caso, a obteno dos dados seria feita por observao dos clientes em alguns supermercados. Por
simplicidade, vamos supor que cada cliente compre apenas um tipo de suco.

Foram observadas compras de 12 clientes. A tabela traz os valores de cada varivel para cada um
deles. Note que cliente no uma nova varivel, no sentido em que os valores referentes a ele no so
uma caracterstica dele, mas apenas indicam o fato de serem diferentes pessoas a cada linha e ordem em
que os dados foram anotados. Aps a tabulao, teremos os resultados obtidos conforme apresentados
na tabela 1.

Cliente Sabor Tamanho Preo Vendas


1 maracuj pequeno 1,50 8
2 uva mdio 1,75 3
3 maracuj mdio 2,00 9
4 maracuj grande 5,00 1
5 caju pequeno 1,35 1
6 uva grande 5,30 12
7 caju grande 4,80 6
8 maracuj mdio 1,50 4
9 maracuj mdio 1,75 4
10 uva pequeno 1,20 1
11 uva grande 4,95 1
12 caju mdio 1,75 8

Tabela 1 Dados brutos para a compra de sucos.

16
ESTATSTICA

Dessa maneira, os dados ficam organizados e as informaes a respeito de cada cliente podem ser
acessadas facilmente. Por exemplo, se quero saber qual foi o valor pago por suco comprado pelo cliente
de nmero 7, vou terceira coluna (preo) da stima linha da tabela e vejo que foi R$ 4,80.

Observao: Antes do ttulo Resumo, que aparece no final de cada uma das quatro Unidades em
que est dividida nossa disciplina, acrescentamos alguns exemplos de aplicao do nosso objeto de
estudo: a estatstica. Com eles voc ter a oportunidade observar e, mais do que isso, de praticar com
situaes verossmeis a teoria que compe cada uma das Unidades. Ateno: para solucionar algumas
das questes, ter que estar com o contedo aprendido tanto da Unidade em que se encontram os
exemplos como tambm do da Unidade seguinte e mesmo da posterior.

Para que no fique tentado a descobrir a resposta de cada questo imediatamente aps ter sido
apresentado o problema, tivemos o cuidado de dispor na sequncia as seis situaes a serem resolvidas
e somente depois as respectivas resolues. Dessa forma voc ir, primeiro, testar seus conhecimentos
para s depois checar as solues que encontramos para eles.

Exemplos de aplicao

1) Resolva a questo utilizando os dados brutos da tabela a seguir.

Entrevistado Gnero Altura Filhos Escolaridade


1 F 1,68 0 Mdia
2 F 1,61 0 Superior
3 F 1,58 1 Ps-graduao
4 M 1,72 2 Superior
5 M 1,47 1 Mdia
6 F 1,53 1 Ps-graduao
7 M 1,92 1 Mdia
8 M 1,67 1 Mdia
9 M 1,74 2 Ps-graduao
10 M 1,79 2 Mdia
11 M 1,85 3 Mdia
12 F 1,71 2 Mdia
13 M 1,63 1 Ps-graduao
14 M 1,56 1 Superior
15 F 1,49 1 Ps-graduao
16 M 1,58 2 Ps-graduao
17 M 1,76 2 Mdia-+.
18 F 1,77 3 Superior
19 F 1,81 1 Superior
20 M 1,86 0 Superior

17
Unidade I

Para cada uma das variveis da tabela:

a) Classifique o tipo de varivel.

b) Construa tabelas de frequncia e faa um grfico que apresente os dados de maneira clara.

2) Para os conjuntos de dados a seguir, encontre a moda e a mediana.

a) Conjunto A = {3,20; 3,20; 3,20; 3,20; 3,31; 3,33; 3,25; 3,45; 3,47; 3,58; 4,70}

b) Conjunto B = {5,20; 5,21; 5,23; 5,27; 5,30; 5,31; 5,32; 5,32; 5,32; 5,32}

3) Na tabela a seguir esto colocadas as notas obtidas por 5 alunos em duas provas.

Aluno Prova 1 Prova 2


1 7 7
2 10 6
3 4 8
4 9 5
5 8 10

a) Sabendo que a primeira prova tem peso 3 e a segunda peso 5, calcule a mdia de cada uma
delas e complete a tabela utilizando apenas uma casa decimal.

b) A partir desses dados, e tendo em conta que a aprovao obtida quando a mdia igual ou
superior a 7.0, construa uma tabela de frequncia considerando as seguintes classes: aprovado
e reprovado.

4) Encontre a mdia final dos alunos listados a seguir, sabendo que a primeira avaliao tem peso 2,
a segunda, peso 3 e a terceira, peso 5.

Aluno n1 n2 n3
1 10 0 0
2 8 5 2
3 6 6 6
4 2 8 4
5 7 7 9

5) Para o conjunto de dados a seguir, calcule a mdia, a varincia e o desvio-padro, assumindo que
os mesmos sejam dados amostrais.

18
ESTATSTICA

xi fi
5 1
10 6
15 12
20 8

6) Para o conjunto de dados a seguir, calcule a mdia, a varincia e o desvio-padro, assumindo que
os mesmos sejam dados amostrais e considerando que cada valor xi tenha peso pi.

xi pi
5 5
8 8
12 9
15 3

Resoluo

1) Os intervalos da tabela das alturas e o tipo de grfico em cada caso dependem de escolhas, logo,
h diversas respostas possveis. Apresentamos aqui uma das possibilidades.

a) Classificao das variveis:

Gnero: qualitativa nominal.

Altura: quantitativa contnua.

Filhos: quantitativa discreta.

Escolaridade: qualitativa ordinal.

b) Tabelas de frequncias.

Gnero:
xi fi
F 8
M 12
Total 20

19
Unidade I

Altura:
xi fi
1,45 1,54 3
1,55 1,64 5
1,65 1,74 5
1,75 1,84 4
1,85 1,95 3
Total 20

6
5
4
3
2
1
0
1,45 1,54 1,55 1,64 1,65 1,74 1,75 1,84 1,85 1,95

Filhos:
xi fi
0 3
1 9
2 6
3 2
Total 20

10
9
8
7
6
5
4
3
2
1
0
0 1 2 3

20
ESTATSTICA

Escolaridade:
xi fi
Mdia 8
Superior 6
Ps-graduao 6
Total 20

0
Mdia Superior Ps-graduao

2)

a) Moda = 3,20, mediana = 3,31

b) Moda = 5,32, mediana = 5,305

3)

a)

Aluno n1 n2 3*n1 5*n2 Soma Nota


1 7 7 21 35 56 7
2 10 6 30 30 60 7,5
3 4 8 12 40 52 6,5
4 9 5 27 25 52 6,5
5 8 10 24 50 74 9,25

21
Unidade I

b)
xi fi
A 3
R 2

4)
Aluno n1 n2 n3 2*n1 3*n2 5*n2 Soma Nota
1 10 0 0 20 0 0 20 2
2 8 5 2 16 15 10 41 4,1
3 6 6 6 12 18 30 60 6
4 2 8 4 4 24 20 48 4,8
5 7 7 9 14 21 45 80 8

5)
xi fi fi*xi xi-x (xi-x)^2 fi*(xi-x)^2
5 1 5 -10 100 100
10 6 60 -5 25 150
15 12 180 0 0 0
20 8 160 5 25 200
soma 27 405 450
mdia 15 varincia 16,67
desvio 4,08

6)
xi pi pi*xi xi-x (xi-x)^2 pi*(xi-x)^2
5 5 25 -4,68 21,9 109,51
8 8 64 -1,68 2,82 22,58
12 9 108 2,32 5,38 48,44
15 3 45 5,32 28,3 84,91
soma 25 242 265,44
mdia 9,68 varincia 10,62
desvio 3,26

Resumo

Objetivos da disciplina

Aprender:

1. Conceitos bsicos da rea.


2. Coletar e organizar dados estatsticos.
22
ESTATSTICA

3. Descrever por meio de parmetros.


4. Realizar anlises quantitativas.
5. Utilizar anlises efetuadas para fundamentar tomada de decises.

Dados estatsticos

1. Um estudo estatstico comea pela definio das variveis do


problema.
2. A classificao apropriada das variveis escolhidas importante para
permitir tratamento adequado dos dados.
3. De maneira geral, as variveis se classificam como qualitativas ou
quantitativas.
4. Mais especificamente, temos quatro classificaes: qualitativas
nominais, qualitativas ordinais, quantitativas discretas e quantitativas
contnuas.
5. A obteno dos dados para o estudo corresponde a preencher os
valores das variveis escolhidas. Os valores obtidos so organizados
numa tabela. A tabela com todos os valores individuais chamada de
tabela de dados brutos.

Exerccios

Questo 1. Considerando que as variveis qualitativas se dividem em nominais (N) e ordinais


(O) e que as variveis quantitativas se dividem em discretas (D) e contnuas (C), estabelea a
alternativa abaixo que relaciona corretamente e respectivamente as seguintes variveis estatsticas:
funcionrios ausentes ao trabalho; durao de movimentos ssmicos; opo religiosa dos alunos de
uma faculdade; faturamento anual, em reais, de uma empresa; aproveitamento dos alunos de uma
turma (bom, regular, timo etc.); cidade em que nascemos.

A) C; C; N; C; O; N
B) D; C; N; C; O; N
C) D; C; N; N; O; N
D) D; C; N; C; N; N
E) N; C; N; C; O; C

Resposta correta: alternativa B.

23
Unidade I

Anlise das alternativas

(D) Funcionrios ausentes ao trabalho: varivel quantitativa discreta ( uma quantidade e os


valores s podem ser inteiros);
(C) Durao de movimentos ssmicos: varivel quantitativa contnua ( uma quantidade de
tempo e podem existir nmeros fracionrios);
(N) Opo religiosa dos alunos de uma faculdade: varivel qualitativa nominal (indica qualidade
e no existe ordenao possvel);
(C) Faturamento anual em reais de uma empresa: varivel quantitativa contnua ( uma quantidade
de dinheiro e podem existir nmeros fracionrios);
(O) Aproveitamento dos alunos de uma turma (bom, regular, timo etc.): varivel qualitativa
ordinal (indica qualidade e existe ordenao possvel);
(N) Cidade em que nascemos: varivel qualitativa nominal (indica qualidade e no existe ordenao
possvel).

Questo 2. Em 4 de janeiro de 2011 a Folha de So Paulo publicou a reportagem 81% dos


internautas no Brasil buscam informaes de sade, da qual se retirou os dois pargrafos a seguir:

Mais de 80% dos brasileiros usam a internet para buscar informaes sobre
sade, remdios e condies mdicas. o que revela uma pesquisa divulgada
ontem, encomendada pela seguradora de sade Bupa ao instituto Ipsos e
London School of Economics.

O estudo ouviu 12.262 pessoas em 12 pases: Austrlia, China, Frana,


Alemanha, ndia, Itlia, Mxico, Rssia, Espanha, Reino Unido, EUA, alm do
Brasil. Foram entrevistados 1.005 brasileiros em amostra representativa da
populao de at 50 anos.

Fonte: Pastore, M. 81% dos internautas fazem buscas sobre sade. Folha.com. So Paulo, 4 jan. 2011, caderno equilbrio e sade.

A partir da leitura desse texto fizeram-se as seguintes afirmaes:

I. 81% dos brasileiros utilizam a internet.

II. Mais de 80% dos brasileiros que utilizam a internet buscam informaes sobre sade.

III. Existe uma incoerncia entre o ttulo da reportagem e o corpo da reportagem.

IV. Para chegar a essas concluses, foram entrevistados 1.005 brasileiros a partir dos quais se pode
inferir o comportamento de toda a populao.

24
ESTATSTICA

V. Apesar de confusa, o que a reportagem provavelmente quer dizer que foi tomada uma amostra
de 1.005 brasileiros que utilizam a internet e que destes 81% procuram informaes sobre sade,
o que leva a crer que mais de 80% dos internautas fazem esse tipo de pesquisa.

Esto corretas as afirmativas:

A) I, II e III.
B) II, III e IV.
C) III, IV e V.
D) I, IV e V.
E) I, II e V.

Resoluo desta questo na Plataforma.

25
Unidade II

Unidade II
3 TABELAS DE FREQUNCIA E SEUS GRFICOS

Nesta seo comeamos a anlise dos dados por meio da construo de tabelas de frequncia.

As tabelas de dados brutos, embora tragam todas as caractersticas do conjunto, no permitem que
tenhamos um entendimento dele, pois os dados assim dispersos somente nos permitem formar uma
imagem fragmentada. Tomando a tabela do exemplo da Unidade I, com apenas 12 clientes, verifica-se
um amontoado de fatos sem significado, imagine em pesquisas reais, em que podemos ter at mesmo
milhes de pessoas entrevistadas, como o caso do censo. Assim sendo, para que os dados possam se
converter em informao preciso analis-los.

Como saber que espcie de informao uma tabela de dados brutos esconde? A resposta at mesmo
intuitiva: contando quantas vezes cada valor aparece. De maneira formal, dizemos que a primeira anlise
a ser feita a construo das tabelas de frequncia para cada uma das variveis, as quais agrupam os
dados com valores iguais ou similares em uma mesma classe e nos do as frequncias com que cada
valor ou intervalo de valores aparece no conjunto estudado.

O procedimento para a construo de uma tabela de frequncias simples: tomam-se os valores


possveis da varivel e contam-se quantas vezes cada um aparece. Tambm comum calcular a frequncia
relativa, ou seja, qual o percentual relativo a cada valor.

3.1 Construo das tabelas

Para melhor compreenso, vamos construir tabelas de frequncia e de frequncia relativa para os
dados do exemplo a respeito de vendas de suco.

3.1.1 Varivel sabor

Os valores possveis para essa varivel so: caju, maracuj e uva. usual chamar os valores das
variveis de x. Utilizando essa notao, teremos: x1 = caju, x2 = maracuj, x3 = uva. Pelo fato de a varivel
ser nominal, no h ordem especfica a ser seguida pelos valores, mas usual nesses casos, para facilitar
sua localizao, ordenar os valores alfabeticamente.

Dos diversos clientes, dois compraram suco de caju, seis compraram de maracuj e quatro o de uva.
Chamando as frequncias de f, teremos: f1 = 2, f2 = 6, f3 = 4. As frequncias relativas sero os valores
percentuais de cada sabor. Ou seja: f1=100 * 2/12, f2 = 100 * 6/12, f3 = 100 * 4/12. Fazendo as contas e
apresentando os resultados com aproximao a partir da primeira casa decimal: f1 = 16,7%, f2 = 50,0%,
f3 = 33,3%.
26
ESTATSTICA

Alm dos dados anteriores, comum que tenhamos uma linha adicional com a quantidade total de
dados.

Colocamos, ento, essas informaes na tabela 2, como segue:

xi fi fi(%)

caju 2 16,7

maracuj 6 50

uva 4 33,3

Total 12 100

Tabela 2 Frequncias e frequncias relativas para a varivel sabor.

Comparando a tabela acima com os valores dados na tabela de dados brutos, notamos que essa nova
organizao nos mostra de maneira muito mais rpida e direta o grau de preferncia dos clientes com
relao ao sabor.

3.1.2 Varivel tamanho

Fazendo a mesma coisa para a segunda varivel, teremos a tabela 3. Assim como para o caso da
varivel sabor, tambm aqui a distribuio de preferncias dos clientes fica muito mais visvel que
na tabela de dados brutos. Atente agora para o seguinte detalhe: como a varivel ordinal, a tabela
deve seguir a ordem natural dos valores, ou seja, ordeno os valores do menor para o maior, assim:
x1 = pequeno, x2 = mdio, x3 = grande.

xi fi fi(%)

Pequeno 3 25

Mdio 5 41,67

Grande 4 33,33

Total 12 100

Tabela 3 Frequncias e frequncias relativas para a varivel tamanho.

3.1.3 Varivel preo

Empregamos o mesmo procedimento para a varivel preo. Utilizamos os valores existentes


para os preos, pois, como a varivel contnua, no possvel determinar antes os valores
possveis, pois eles so inmeros. Assim procedendo, teremos construda a tabela 4. Note que no
inclumos as frequncias relativas por uma questo de conciso.

27
Unidade II

xi fi
1,20 1
1,35 1
1,50 2
1,75 3
2,00 1
4,80 1
4,95 1
5,00 1
5,30 1
Total 12

Tabela 4 Frequncias sem perda de informao para a varivel preo.

A tabela feita dessa maneira dita sem perda de informaes, pois cada valor individual est ali
representado. No entanto, se olharmos para os dados que h nela, nesse caso constataremos que no h
a o mesmo ganho de clareza que nos casos anteriores, pois h muitos valores possveis para a varivel.
Isso faz com que haja uma grande disperso dos dados entre todos esses valores. Essa caracterstica nos
faz buscar uma nova maneira de construir essa tabela.

O procedimento apropriado em casos como esse utilizar intervalos de valores em lugar de valores
individuais. Como os valores das variveis oscilam variam entre 1,20 e 5,30, por exemplo, escolho utilizar
intervalos que agrupem de 1 em 1 real. Perceba a necessidade de definir o intervalo de maneira que no
haja dvidas quanto colocao de certo dado, razo pela qual o final de cada intervalo refere-se a 99
centavos. Com isso, temos uma nova distribuio de frequncias, conforme dados da tabela 5.

Preo Frequncia
1,00 1,99 7
2,00 2,99 1
3,00 3,99 0
4,00 4,99 2
5,00 5,99 2
Total 12

Tabela 5 Frequncias para a varivel preo, com agrupamento por intervalos.

Olhando para a nova tabela, percebe-se mais claramente haver uma concentrao maior de compras
dos artigos mais baratos, o que no ficava claro na construo anterior.

3.1.4 Varivel vendas

Utilizamos finalmente um procedimento similar para a varivel vendas, sem perdas de informao.
Como a varivel discreta, podemos admitir que os valores xi sero os nmeros inteiros entre 1 e 12,
que englobam todos os dados coletados. Desse modo construmos a tabela 6.
28
ESTATSTICA

xi fi
1 4
2 0
3 1
4 2
5 0
6 1
7 0
8 2
9 1
10 0
11 0
12 1
Total 12

Tabela 6 Frequncias sem perda de informao para a varivel vendas.

Novamente, a tabela traz dados muito dispersos pelos valores, no permitindo uma compreenso
muito melhor do que a tabela de dados brutos. De novo, buscamos a construo de intervalos de
valores em lugar de valores individuais. Note-se que a construo de intervalos requer uma escolha, e
diferentes escolhas podem gerar diferentes leituras. Para exemplificar, foram construdas duas tabelas
com escolhas diferentes de intervalos: tabelas 7 e 8.

xi fi
15 7
6 10 4
11 15 1
Total 12

Tabela 7 Frequncias para a varivel vendas, com agrupamento por intervalos de tamanho 5.

xi fi
14 7
58 3
9 12 2
Total 12

Tabela 8 Frequncias para a varivel vendas, com agrupamento por intervalos de tamanho 3.

Para evitar que as diferenas geradas pela escolha dos intervalos possa levar a concluses
errneas, h critrios de escolha, mas a discusso desses critrios vai alm do escopo e dos
objetivos desta disciplina. Neste momento, basta saber que em estudos reais tomam-se os cuidados
necessrios para evitar esse problema, muitas vezes, inclusive, utilizando-se de intervalos de
tamanhos diferentes, quando preciso.
29
Unidade II

3.2 Grficos de tabelas de frequncia

A apresentao de dados estatsticos utiliza-se no somente de tabelas, mas tambm de grficos.


O objetivo de uma apresentao grfica tornar as caractersticas importantes visveis em um tempo
bastante curto. Essa caracterstica dos grficos que torna sua utilizao to frequente na apresentao
de conjuntos de valores, principalmente quando se discutem aspectos tcnicos, por exemplo, nos
cadernos de economia dos jornais.

Neste momento, vamos nos ater construo de grficos de colunas e diagramas circulares, pois
eles so os mais comumente utilizados para representar frequncias. Um mesmo conjunto de dados
pode ser apresentado em diferentes tipos de grficos. Novamente, utilizaremos o exemplo de dados a
respeito da venda de sucos e discutiremos a construo de grficos a partir de sua elaborao para as
tabelas de frequncia construdas na seo anterior.

Aps a construo dos grficos, discutiremos brevemente a convenincia da utilizao de cada um


para cada situao.

Observao

A escolha apropriada do tipo de grfico depender das caractersticas


do conjunto que se queira enfatizar.

3.2.1 Grficos de colunas

Os grficos de colunas so construdos tendo como eixo horizontal os valores da varivel e na vertical
a frequncia. Assim sendo, as colunas sero tanto mais altas quanto maior a frequncia daquele valor.

Para a grandeza sabor, apresentada no grfico 1, como no h ordenamento natural dos valores,
podemos escolher a ordem que nos parea mais adequada. Por coerncia, utiliza-se a mesma ordem j
definida na construo da tabela 2.
7
6
5
4
3
2
1
0
caju maracuj uva

Grfico 1 Colunas para as frequncias referentes varivel sabor.

30
ESTATSTICA

Seguindo as definies de significado dadas anteriormente, vemos que para os valores caju,
maracuj e uva temos colunas de altura 2, 6 e 4, respectivamente, o que corresponde ao nmero
de clientes entrevistados que compraram sucos de cada um desses sabores.

No caso da varivel tamanho, temos como eixo horizontal os valores pequeno, mdio e
grande. Como a grandeza ordinal, o eixo deve seguir o valor crescente de tamanho, definindo
a ordem de aparecimento das colunas referentes a cada valor, conforme apresentamos no
grfico 2.

6
5
4
3
2
1
0
pequeno mdio grande

Grfico 2 - Colunas para as frequncias referentes varivel tamanho.

Para a varivel preo, utilizamos como referncia de cada categoria o centro do intervalo
correspondente. Como os valores so contnuos, as colunas foram construdas sem espaamento, de
modo a deixar claro o fato de que um elemento que pertena a uma coluna ter valor no intervalo
correspondente. Por exemplo, o elemento contado como fazendo parte da coluna 2,5 ter valor entre 1
e 2. Observe como essas informaes so apresentadas no grfico 3 a seguir.
8
7
6
5
4
3
2
1
0
1,50 2,50 3,50 4,50 5,50

Grfico 3 - Colunas para as frequncias referentes varivel preo.

Por fim, trazemos o grfico da varivel vendas, para o qual escolhemos a distribuio de intervalos
de tamanho 3. Desta vez, optamos por utilizar diretamente o intervalo como rtulo dos dados. Esses
valores de frequncia esto apresentados no grfico 4.
31
Unidade II

8
7
6
5
4
3
2
1
0
1-4 5-8 9 - 12

Grfico 4 - Colunas para as frequncias referentes varivel vendas.

3.2.2 Diagramas circulares

Os diagramas circulares so construdos de tal modo que, quanto maior a proporo de uma categoria
no conjunto, maior ser a rea do crculo que se refere a ela, sendo que a categoria pode referir-se a um
valor ou a um intervalo de valores. Devido aos cortes radiais que definem fatias da circunferncia, esses
grficos tambm so conhecidos por grficos de pizza.

Por sua natureza, so bastante utilizados nos casos em que mostrar a quantidade especfica de cada
categoria no importante, mas sim mostrar clara e rapidamente as propores de cada uma.

Como exemplo, utilizaremos as mesmas tabelas de frequncia para as quais fizemos os grficos de
coluna.

Para a varivel sabor, temos que o valor maracuj que responde por metade das vendas, logo, ele
ser representado por uma fatia correspondente, ou seja, pela metade do crculo; em outras palavras,
por uma seo circular de 180, visto que o crculo todo tem 360. O restante ser dividido na proporo
de 4 para 2 entre os sabores uva e caju; desse modo, o primeiro ter uma fatia de 120 e o segundo uma
de 60, conforme representado no grfico 5.

caju
maracuj
uva

Grfico 5 Diagrama circular para a varivel sabor, de acordo com os dados da tabela 2.

32
ESTATSTICA

De maneira equivalente foram construdos os grficos para as variveis tamanho, preo e vendas,
os quais esto apresentados nos grficos 6, 7 e 8, respectivamente.

pequeno
mdio
grande

Grfico 6 Diagrama circular para a varivel tamanho, de acordo com os dados da tabela 3.

1,00 - 1,99
2,00 - 2,99
3,00 - 3,99
4,00 - 4,99
5,00 - 5,99

Grfico 7 Diagrama circular para a varivel preo, de acordo com os dados da tabela 5.

1-4
5-8
9 - 12

Grfico 8 Diagrama circular para a varivel vendas, de acordo com os dados da tabela 6.

33
Unidade II

3.2.3 Escolha do tipo de grfico

Como dissemos no incio desta seo, o papel de um grfico trazer alguma informao de
maneira clara e direta, logo, o critrio para se escolher um grfico ou outro quando vamos apresentar
dados depende de qual o objetivo dessa figura em nossa argumentao. Ou seja, se quisermos
enfatizar os valores especficos de cada frequncia para cada varivel, o grfico mais apropriado ser
o de colunas; no entanto, se for interessante enfatizar a proporo de cada um, devemos utilizar o
diagrama circular.

Tomemos como exemplo o caso da varivel sabor. No grfico 1, a caracterstica mais marcante
o fato de maracuj ser o valor mais frequente, mas no fica claro que isso diz respeito metade dos
clientes. No grfico 5, no entanto, a informao de que um dos sabores responde por metade das vendas
salta aos olhos em poucos instantes. Logo, se o objetivo for ressaltar a preferncia por maracuj,
melhor usar o diagrama circular, mas se a inteno fazer uma discusso que englobe os trs sabores,
pode ser mais interessante utilizar o grfico de colunas.

Do mesmo modo, se tomamos como exemplo a varivel preo, vemos que o diagrama circular
nos d, de maneira imediata, a caracterstica de o artigo mais barato ter um nmero muito maior
de vendas. Entretanto, como o diagrama circular no enfatiza a ordem, no se percebe que h uma
segunda concentrao das vendas na faixa de maior preo, o que se v facilmente no grfico de colunas.
Logo, o diagrama circular ser adequado numa discusso em que a informao de qual a faixa de preos
mais procurada for mais interessante, mas, se for importante conhecer o comportamento para todas as
faixas, ele no apresenta bem os dados.

3.2.4 Comentrios adicionais

Apresentamos aqui somente dois tipos de grficos, por consider-los os mais significativos
para as discusses de interesse da disciplina. No entanto, existem diversos outros tipos, mas a
lgica de construo que os rege geralmente derivada da mesma lgica de construo dos tipos
vistos aqui. Portanto, no deve haver dificuldade na compreenso ou na construo de algum
outro formato.

Note ainda que atualmente raro que tenhamos que construir grficos manualmente, visto que
todas as planilhas de dados j possuem ferramentas de elaborao dos grficos em diversos formatos, e
ainda h programas especficos de excelente qualidade desenvolvidos para esse fim.

4 MEDIDAS DE POSIO

No primeiro passo de transformar dados em informao, construmos as tabelas de frequncia. Mas,


para irmos adiante em nossas anlises, preciso encontrar maneiras de encontrar caractersticas que se
apresentem de forma ainda mais resumida.

Nesta seo apresentaremos trs grandezas que resumem caractersticas de um conjunto em apenas
um valor: a moda, a mediana e a mdia.
34
ESTATSTICA

4.1 Moda

A palavra moda utilizada por ns cotidianamente com um significado parecido com a definio
em estatstica. No dia a dia, dizemos que algo est na moda se muita gente o est usando ou o est
fazendo. Em estatstica, moda o valor que mais aparece no conjunto, aquele que a caracterstica da
maioria. Quando h um valor que se sobressai em frequncia, com relao aos demais valores, dizemos
que o conjunto tem uma moda, modal.

Tomemos como exemplo os dados da tabela 9. Eles dizem a respeito s vendas mensais de impressoras
e multifuncionais em uma loja.

Tipo Quantidade
Impressora jato de tinta 112
Impressora laser monocromtica 263
Impressora laser colorida 185
Multifuncional jato de tinta 488
Multifuncional laser monocromtica 124
Multifuncional laser colorida 93
Total 1.265

Tabela 9 Quantidade de impressoras e multifuncionais vendida na loja A.

Vemos que o artigo que mais aparece a multifuncional jato de tinta, com 488 unidades. Um
erro comum atribuir moda a frequncia do valor, mas ressalto que a moda ser o valor da varivel
e no a quantidade de vezes que o mesmo aparece. Ou seja, a moda desse conjunto ser, portanto,
multifuncional jato de tinta.

H situaes em que o conjunto tem dois valores mais frequentes em lugar de um. Nesses casos, dizemos
que o conjunto tem duas modas. Um conjunto com essa caracterstica tambm chamado de bimodal.

Tomando o mesmo tipo de dados que no exemplo anterior, temos na tabela 10 um caso em que o
conjunto bimodal.

Tipo Quantidade
Impressora jato de tinta 102
Impressora laser monocromtica 485
Impressora laser colorida 183
Multifuncional jato de tinta 488
Multifuncional laser monocromtica 85
Multifuncional laser colorida 92
Total 1.435

Tabela 10 Quantidade de impressoras e multifuncionais vendida na loja A.

35
Unidade II

Nessa ocorrncia, muito embora os valores de vendas no sejam rigorosamente iguais, nota-
se haver dois produtos que so muito mais procurados que os demais, portanto, dizemos que
o conjunto bimodal, tendo como modas impressora laser monocromtica e multifuncional
jato de tinta.

Existe ainda a possibilidade de no haver nenhum valor que realmente se sobressaia com relao
aos demais. Quando isso acontece, dizemos que o sistema no tem moda ou, mais formalmente, que o
conjunto amodal.

Utilizando novamente o tema dos exemplos anteriores, mostramos na tabela 11 um caso em que o
conjunto amodal, no havendo nenhum valor que realmente se destaque dos demais em nmero de
vezes que aparece.

Tipo Quantidade
Impressora jato de tinta 98
Impressora laser monocromtica 115
Impressora laser colorida 121
Multifuncional jato de tinta 118
Multifuncional laser monocromtica 95
Multifuncional laser colorida 72
Total 619

Tabela 11 Quantidade de impressoras e multifuncionais vendida na loja A.

A moda uma grandeza de fcil determinao e de grande utilidade quando interessante verificar
se o conjunto tem alguma caracterstica marcante, um valor que seja muito comum. No entanto, essa
a nica informao que a grandeza moda pode nos dar. Ela no traz qualquer informao a respeito
dos demais valores do conjunto, logo, importante que definamos outras grandezas para podermos
aprofundar nossas anlises.

4.2 Mediana

A segunda grandeza que utilizaremos como um resumo do conjunto a mediana, que definimos
como sendo o valor que corresponde ao ponto central do conjunto. Ou seja, a mediana o valor que
divide o conjunto em duas metades, isto , haver um mesmo nmero de valores inferiores e superiores
ao valor da mediana.

Tomemos como exemplo um conjunto de pessoas cujas idades esto colocadas na tabela 12.

Nome Idade
Ana 3
Bruno 32
Denise 19

36
ESTATSTICA

Gabriel 56
Jos 12
Maria 16
Pedro 11

Tabela 12 Idades dos integrantes de uma famlia.

A mediana ser a idade que divide o conjunto em dois, ou seja, a idade acima e abaixo da qual haver
o mesmo nmero de pessoas. Metaforicamente, podemos imaginar que colocamos essas pessoas em
fila, da mais nova mais velha. Como temos um nmero mpar de elementos no conjunto, a mediana
ser a idade da pessoa que ficou no meio da fila. Como h 7 elementos no conjunto, a pessoa do meio
da fila ser a quarta mais velha. Colocando as idades em ordem, temos: 3, 11, 12, 16, 19, 32 e 56. Nesse
caso, a mediana 16.

Suponhamos, agora, que uma pessoa de 5 anos seja adicionada ao conjunto. Com isso, a sequncia
crescente de idades passa a ser 3, 5, 11, 12, 16, 19, 32 e 56. A diviso em dois subconjuntos faria
com que o primeiro tivesse as quatro pessoas mais novas e o segundo, as quatro mais velhas.
Define-se como mediana, nesse caso, o valor intermedirio entre o maior do primeiro conjunto
e o menor do segundo. Para o exemplo teramos as idades de 12 e 16. A mediana seria o valor
equidistante de 12 e 16, que 14.

Note que a mediana no influenciada pelos valores no centrais do conjunto. Por exemplo, se
Gabriel tivesse 40 anos em lugar de 56, no haveria qualquer mudana no valor da mediana.

Vale ainda comentar que essa grandeza s pode ser definida para grandezas quantitativas ou para
qualitativas ordinais, visto que no h possibilidade de haver ordenao das variveis qualitativas
nominais.

Observao

comum o aluno confundir os conceitos de mdia e mediana. Assim,


antes de passar ao prximo tpico, tenha certeza de ter assimilado bem o
conceito de mediana.

4.3 Mdia

As medidas de posio dadas anteriormente podem traduzir algumas caractersticas interessantes


dos conjuntos estudados, mas no permitem um estudo analtico mais profundo. Para que isso seja
feito, preciso definir uma terceira medida de posio do conjunto que a mdia.

Assim como outros conceitos, tambm o de mdia faz parte de nossa linguagem cotidiana, pois
costumamos realizar com bastante frequncia clculos de mdias, ainda que de maneira informal e
intuitiva. Por exemplo, quando samos para trabalhar, sabemos aproximadamente quanto tempo

37
Unidade II

demoraremos no trajeto, e assim tambm sabemos quais so, em mdia, os nossos gastos com
determinados itens comumente comprados etc.

Imagine a seguinte situao: um grupo de amigos organiza um jantar e cada um fica responsvel
por realizar parte das compras. Ao final, cada um deles comunica o valor gasto e eles dividem
igualmente as despesas. O valor da contribuio de cada um para a festa justamente a mdia de
gastos do grupo.

Visto o conceito, passaremos agora a formalizar a maneira de realizar os clculos de mdias e


aprofundaremos o conceito discutindo as mdias ponderadas. Em seguida, comentaremos algumas
utilizaes de interesse na rea econmica.

Observao

As mdias so as grandezas mais comumente utilizadas nas anlises


estatsticas.

4.3.1 Mdia aritmtica

A chamada mdia aritmtica, ou mdia ou mdia simples, a mais utilizada no cotidiano e estabelece
que todos os elementos tm a mesma importncia.

Se detalharmos o exemplo citado anteriormente, na tabela 13 teremos listados os gastos individuais.


Para saber o valor do gasto efetivo de cada um, temos que somar todos os gastos individuais e dividi-los
pelo nmero de pessoas.

Pessoa Gasto
Alberto 25
Beatriz 31
Carlos 47
Diana 19
Edgar 28

Tabela 13 Gastos efetuados para a realizao do jantar por participante do grupo de amigos.

Nesse caso, teremos:


25 + 31+ 47 +19 + 28
Gasto mdio = = 30
5
Dessa maneira, determinamos que a mdia de gastos foi de R$ 30,00, ou seja, esse o valor
correspondente aos gastos de cada um. interessante observar que o valor da mdia no precisa ser um
valor encontrado no conjunto.

38
ESTATSTICA

Utilizando o exemplo como guia, vamos agora formalizar o clculo da mdia aritmtica.

Em primeiro lugar, utilizaremos a letra N para denotar a quantidade de pessoas, x para indicar a varivel
gasto e o ndice i para indicar cada gasto individual. Ou seja, teremos que N = 5, ou seja, o gasto efetuado por
Beatriz poderia ser escrito como x2 = 31. Para indicar que estamos falando da mdia, utilizaremos uma barra
superior. Com isso, a expresso anterior pode ser reescrita de maneira mais geral como:

x1 + x2 + x 3 + x 4 + x5
x=
N
Mas, essa notao no ser prtica se tivermos um grande nmero de elementos, assim, utilizamos
um indicador de que temos que somar todos os valores de xi. A isso chamamos somatrio de x, ou seja,
soma de todos os valores de x. Para indicar tal operao, convencionou-se utilizar a letra grega sigma
maiscula, como segue:

x=
xi
N
Note que utilizamos aqui a notao mais concisa. Em muitos textos, utiliza-se na expresso a indicao
explcita da soma de todos os valores de x entre 1 e N. A notao explcita absolutamente necessria
em casos em que pode haver valores no considerados, mas, como no contexto desta disciplina sempre
utilizaremos somatrios com todos os elementos, tornou-se mais conveniente usar a notao resumida
em lugar da mais explicativa.

Passamos agora a discutir o clculo da mdia quando os dados esto apresentados em uma tabela de
frequncia. Para isso, comearemos calculando a mdia da mesma maneira utilizada anteriormente, mas
agora para uma situao ligeiramente diferente. Suponhamos agora que haja uma mesa com 10 pessoas em
uma lanchonete, as quais combinaram dividir igualmente a despesa final. Os dados a respeito do consumo de
cada um dos ocupantes esto apresentados na tabela 14.

Pessoa Gasto
1 12
2 15
3 15
4 18
5 13
6 12
7 13
8 15
9 12
10 15

Tabela 14 Gastos efetuados por ocupante da mesa da lanchonete.

No difcil perceber que montar a conta da maneira utilizada anteriormente pouco


prtico. Assim, vamos inicialmente montar a tabela de frequncias, o que se apresenta na tabela
39
Unidade II

15. Temos aqui como valores xi os gastos individuais e como fi o nmero de pessoas que gastou
esse valor.

xi fi
12 3
13 2
15 4
18 1
Tabela 15 Frequncia para os gastos efetuados por ocupante da mesa da lanchonete.

Para calcular a mdia precisamos, em primeiro lugar, do nmero de pessoas, que o somatrio das
frequncias, como segue:

N = fi

O segundo valor a ser determinado o valor total da conta, o qual calculado considerando o
seguinte:

3 pessoas gastaram 12, logo, somam-se 36 conta.


2 pessoas gastaram 13, logo, somam-se 26 conta.
4 pessoas gastaram 15, logo, somam-se 60 conta.
1 pessoa gastou 18, logo, somam-se 18 conta.

Formalmente, podemos escrever de maneira geral que se efetua o somatrio do produto do valor da
varivel pela sua frequncia. O resultado ser ento dividido pelo nmero de dados N, que o somatrio
das frequncias. O clculo da mdia dado, portanto, pela expresso:

x=
fi .xi
fi
No exemplo, como a soma das frequncias nos d o total de pessoas na mesa, que so 10, temos
uma conta de R$ 140,00 a ser dividida por 10 pessoas. A mdia, portanto, ser de R$ 14,00. Na tabela
16 apresentada uma forma prtica de se efetuar a conta. Acrescentamos uma coluna tabela, na qual,
para cada valor de x se coloca o resultado do produto xi * fi. Coloca-se tambm uma linha adicional ao
final da tabela, na qual se apresentam os resultados dos somatrios que sero utilizados no clculo da
mdia.

Observao

Note que estamos calculando exatamente a mesma coisa e que utilizar


as frequncias explicitamente apenas muda a maneira de fazer as contas.

40
ESTATSTICA

xi fi xi*fi
12 3 36
13 2 26
15 4 60
18 1 18
Soma 10 140

Tabela 16 Quadro esquemtico para clculo de mdias a partir de tabela de frequncias.

Dessa maneira, o clculo da mdia feito dividindo-se o valor da soma da terceira


coluna, R$ 140,00, pela soma da segunda coluna, 10 pessoas. Como vimos anteriormente, a
mdia ser de R$ 14,00.

Daremos agora um exemplo genrico, em que os dados de frequncias sero apresentados diretamente
na tabela. Veja a seguir:

xi fi
5 5
6 8
7 9
8 3

Tabela 17 Frequncias para os valores de uma varivel x genrica.

Seguindo o procedimento descrito anteriormente, acrescentaremos a coluna com os produtos xi * fi,


de modo a obter a soma de todos os valores de x do conjunto (no exemplo, era o total da conta). Uma
linha adicional ser utilizada para colocar o resultado dos somatrios de cada coluna, deixando claros os
valores da soma anteriormente descrita e o nmero total de dados N (no exemplo, o nmero de pessoas
na mesa). Por fim, acrescentamos ainda uma ltima linha, que trar o resultado final, consequncia
da diviso do somatrio da terceira coluna pelo somatrio da segunda coluna. O procedimento aqui
descrito est colocado na tabela 18. Vemos a que a situao equivale a termos um gasto de R$ 160,00
dividido igualmente por 25 pessoas, obtendo a mdia de 6,4.

xi fi xi*fi
5 5 25
6 8 48
7 9 63
8 3 24
Soma 25 160
Mdia 6,4

Tabela 18 Clculo do valor mdio de um conjunto de dados para uma


varivel x genrica a partir de sua tabela de frequncias.

41
Unidade II

4.3.2 Clculo da mdia para dados apresentados em intervalos

Quando a tabela de frequncias traz classes de dados em intervalos em lugar de valores


individuais, assumimos que o valor que melhor representa a classe o valor referente ao meio do
intervalo.

Tomando como exemplo os intervalos da tabela 7, os intervalos teriam por valores representativos:

O intervalo 1-5 tem como valor representativo x1 = 3.


O intervalo 6-10 tem como valor representativo x2 = 8.
O intervalo 11-15 tem como valor representativo x3 = 13.

Para efeito de clculo, remontamos a tabela tendo em lugar dos intervalos os valores centrais
e calculamos a mdia da mesma maneira j descrita anteriormente, conforme apresentamos na
tabela 19.

Intervalo xi fi xi*fi
1-5 3 7 21
6-10 8 4 32
11-15 13 1 13
Soma 12 66
Mdia 5,5

Tabela 19 Clculo do valor mdio de um conjunto de dados a partir


da tabela de frequncias dada por intervalos de valores.

Como os valores tratados dessa maneira no consideram exatamente o valor de cada um dos dados, a
mdia ser um valor aproximado. Portanto, quando houver acesso aos dados brutos e tambm necessidade
de um clculo preciso, prefervel utilizar os dados brutos para efetuar o clculo da mdia.

4.3.3 Mdia ponderada

At aqui tratamos todos os dados como tendo a mesma importncia para o clculo da mdia. No
entanto, sabemos que na realidade h gradaes de importncia que fazem com que esse clculo de
mdia simples no seja uma descrio apropriada da realidade.

Pensemos no seguinte exemplo cotidiano: para avaliar o desempenho de um aluno, usual


que se utilize mais de um instrumento de apreciao. Digamos que um professor aplique duas
avaliaes no bimestre: a primeira seria um trabalho em grupo a respeito de algum tpico
desenvolvido em aula e a segunda uma prova a respeito de todo o contedo. Nesse caso, o
segundo instrumento de avaliao traz mais informaes a respeito do desempenho de cada
aluno que o trabalho, e necessrio que essa diferena de importncia esteja refletida na nota
final, o que se faz estabelecendo pesos para cada nota.

42
ESTATSTICA

O clculo de uma mdia ponderada se faz de maneira similar ao clculo em que so utilizadas
tabelas de frequncia.

Tomando o exemplo das notas, digamos que o professor assuma que a prova quatro vezes mais
importante que o trabalho; ele ento atribuir peso 1 ao trabalho e peso 4 prova. Para o clculo da
nota final, chamaremos de n1 e p1 a nota e o peso do trabalho, respectivamente. Do mesmo modo,
chamaremos de n2 e p2 a nota e o peso da prova. Em analogia ao clculo de mdias pela tabela de
frequncias, poderamos imaginar que a situao equivalente seria termos 1 trabalho e 4 provas e
calcularamos a nota final como se fossem 5 avaliaes em lugar de duas: um trabalho e quatro provas
sendo, as quatro com a mesma nota. O clculo da mdia final do aluno seria dado, ento, por:

p1.n1 +p2 .n2


M=
p1 +p2

Com os pesos citados anteriormente, teramos, portanto:

1.n1 + 4.n2
M=
1+ 4

Ou, simplesmente:

n1 + 4n2
M=
5

Na tabela 20 apresentamos alguns exemplos de clculo de mdias para diversos conjuntos de notas
considerando os pesos citados acima.

Aluno n1 n2 n1*p1 n2*p2 N


1 0 10 0 40 8
2 10 0 10 0 2
3 8 2 8 8 3,2
4 2 8 2 32 6,8
5 7 7 7 28 7
6 9 6 9 24 6,6

Tabela 20 Exemplo de clculo de mdias com ponderao: notas de alunos.

A partir do exemplo anterior, podemos agora apresentar a frmula geral para o clculo de mdias
ponderadas:

x=
pi .xi
pi

43
Unidade II

Vejamos agora outro exemplo de interesse, em que trataremos da dinmica de clculo de inflao.
Os nmeros e os artigos aqui abordados so claramente irreais, uma vez que nosso propsito
exclusivamente didtico.

Suponhamos que o clculo de inflao levasse em conta somente os aumentos de cinco artigos num
dado perodo, conforme apresentado na tabela 21.

Artigo Aumento (xi)


1 arroz 1
2 acar 1
3 caf 1
4 feijo 1
5 uva 20

Tabela 21 Exemplo de clculo de mdia aritmtica para um conjunto


de aumento de preos (em valores percentuais).

Como a uva teve aumento de 20% e os demais artigos somente de 1%, teramos, num clculo sem
ponderao:

1+1+1+1+ 20
x= = 4,8
5

O que resulta de uma inflao de 4,8% no perodo.

imediato pensar, porm, que esse valor no representativo, uma vez que o consumo de uvas geralmente
espordico e o valor de 4,8% no reflete o impacto que tal aumento traria economia da regio.

Em outras palavras, considerar que o aumento do preo da uva tenha o mesmo peso ou importncia
do aumento do preo do arroz no razovel e preciso que o valor mdio do aumento de preos leve
em conta essas diferenas.

Estabelecemos, ento, pesos fictcios para os artigos citados, buscando refletir a importncia
atribuda a cada um deles. Clculos reais de inflao tm critrios para a escolha dos pesos, os valores
aqui escolhidos apenas buscam ilustrar o efeito dos pesos.

Segundo nossas estimativas, o arroz seria o item mais relevante, com grau de importncia 50; o acar
e o feijo viriam empatados em segundo lugar, ambos com importncia 35; o caf teria importncia
25 e a uva, por ter pequeno impacto, teria apenas importncia 1. Esses valores esto apresentados na
tabela 22.

Temos, assim, um novo clculo de inflao, em que o aumento da uva se torna muito menos
importante que os demais aumentos, fazendo a descrio do aumento mdio dos preos ser mais
condizente com a realidade.

44
ESTATSTICA

A maneira de realizar o clculo similar utilizada quando tnhamos os dados na tabela de frequncia:

Acrescentamos uma coluna onde colocaremos os resultados dos produtos pi.xi, na qual pi o peso
do artigo i e xi o aumento de preo do mesmo artigo.
Acrescentamos uma linha adicional, na qual sero colocados os somatrios dos valores das colunas
pi e pi.xi.
Efetuamos os somatrios dos pesos e colocamos o resultado na linha adicional da coluna pi.
Efetuamos os somatrios dos produtos pi.xi e colocamos o resultado na linha adicional da coluna pi.xi.
Efetuamos a diviso dos dois somatrios para obter a mdia.

O procedimento descrito est esquematizado na tabela 22.

Artigo Aumento (xi) Peso (pi) pi*xi


1 arroz 1 50 50
2 acar 1 35 35
3 caf 1 25 25
4 feijo 1 35 35
5 uva 20 1 20
Soma 146 165
Mdia 1,13

Tabela 22 Exemplo de clculo de mdias com ponderao para


aumento de preos (em valores percentuais).

Calculando a mdia dessa maneira, a inflao recalculada nesses moldes de 1,13%, o que muito
mais condizente do que o valor anterior de 4,8%, pois temos um nmero prximo quele do aumento
dos itens importantes.

4.3.4 Propriedades da mdia

Para terminar nossa discusso a respeito das mdias, vale comentar duas de suas caractersticas:

1. Se somamos um mesmo nmero a todos os elementos do conjunto, a mdia ser acrescida de


mesmo valor.

fcil entender essa propriedade se pensarmos em uma mdia de idade. Um conjunto que tenha,
por exemplo, uma mdia de idade de 6 anos, passados 3 anos, todos tero envelhecido o mesmo
tempo e a idade mdia do conjunto ser acrescida de 3 anos.

2. Se multiplicarmos todos os elementos do conjunto por um mesmo nmero, a mdia ser acrescida
de mesmo valor.
45
Unidade II

Podemos compreender essa propriedade facilmente se pensarmos no exemplo da lanchonete. Se


todos se reunirem uma vez por semana na mesma lanchonete e consumirem a mesma coisa todas
as vezes, o gasto mensal de cada um ser multiplicado por quatro e o gasto mdio ser a soma
dos gastos mdios dirios, resultando num gasto mensal 4 vezes maior.

4.3.5 Mdias ponderadas da rea econmica: ndices de inflao

Os indicadores da rea econmica so calculados levando-se em conta a relevncia dos diversos


fatores abordados no universo estudado. Em outras palavras, os ndices econmicos so geralmente
uma ponderao de diversos dados com pesos diferentes.

Como discutimos anteriormente, o clculo da inflao precisa ponderar a importncia dos diversos
artigos. Alm disso, tambm h outros fatores a considerar. Por exemplo, mais importante o valor
referente a uma regio cuja populao seja maior, dado que haver um nmero maior de pessoas que
sentir aquelas variaes de preo.

Para que possa haver confiabilidade nos resultados, os institutos de pesquisa econmica
disponibilizam os detalhes de suas atribuies de peso para que estudiosos que utilizem esses nmeros
possam saber como ele foi obtido.

interessante notar que existem diversos ndices, cada um com caractersticas prprias, de acordo
com o interesse em se conhecer algum aspecto da economia.

No quadro abaixo, tabela 23, citamos alguns exemplos de ndices de preos reais.

Smbolo Instituio Descrio sumria


ndice do Custo de Vida
ICV Dieese Variao do custo de vida das famlias com renda de 1 a 30 salrios-mnimos.
Municpio de So Paulo.
ndice Geral de Preos do Mercado
ndice de Preos por Atacado (IPA), 60%.
IGP-M FGV
ndice de Preos ao Consumidor (IPC), 30%.
ndice Nacional de Custo da Construo (INCC), 10%.
ndice Nacional do Custo da Construo Mercado
INCC-M FGV Evoluo dos custos de construes habitacionais.
18 municpios das maiores capitais de estados do pas.
ndice Nacional de Preos ao Consumidor
INPC IBGE Pesquisa de preos nas 11 regies de maior produo econmica.
Pesquisa de Oramento Familiares (POF), que abrange famlias com renda de 1 a 8 salrios-mnimos.
ndice Nacional da Variao de Custos do Transporte Rodovirio de Carga Lotao
Custos do transporte rodovirio de carga lotao e de carga fracionada.
INCTL Fipe
A carga denominada lotao quando a mercadoria suficiente para lotar um caminho; nesse
caso, a transportadora encaminha um veculo at o depsito, realiza a operao de carregamento e
transfere a carga diretamente ao seu destino.

Tabela 23 Exemplos de ndices de preos.

46
ESTATSTICA

Note haver ndices gerais, tais como o IGP-M, e ndices especficos, como o caso do INCTL. A
variedade dos ndices reflete a prpria variedade da economia, pois setores diferentes precisam ter
informaes detalhadas a respeito de sua rea de atuao.

Vale ainda comentar que o Brasil no tem um ndice oficial de inflao. Alguns dos comumente
utilizados so calculados pelo Instituto Brasileiro de Geografia e Estatstica (IBGE), pela Fundao Getlio
Vargas (FGV), pela Fundao Instituto de Pesquisas Econmicas (Fipe) e pelo Departamento Intersindical
de Estatstica e Estudos Socioeconmicos (Dieese).

Indicadores econmicos

So geralmente mdias ponderadas que refletem alguma caracterstica ou tendncia da economia


de uma regio.
Os indicadores econmicos servem de parmetro de compreenso da economia e de aspectos
importantes das sociedades e auxiliam na anlise de conjuntura para a tomada de decises.
H uma grande variedade de indicadores econmicos. Conhecer os ndices principais de sua rea
de atuao pode auxili-lo a tomar decises mais bem embasadas na realidade.

Saiba mais

Os portais oficiais do Banco Central do Brasil (http://www.bcb.gov.br/) e do


Instituto de Pesquisa Econmica Aplicada (http://www.ipea.gov.br/) trazem
informaes a respeito de diversos ndices, bem como seus valores em sries
histricas. Voc encontrar tambm informaes detalhadas sobre cada ndice.

Observao

Utilizar um ndice econmico mais indicado para o caso, ao analisar uma


determinada situao importante, demonstra competncia na rea de atuao.

Exemplos de aplicao

1) Extrai-se s uma carta de um baralho de 52 cartas. Determine a probabilidade de obter:

a) Um valete.

b) Uma carta vermelha.

c) Um dez de paus.
47
Unidade II

d) Uma figura.

e) Uma carta de ouros.

f) Um nove vermelho ou um oito preto.

2) Uma urna tem 20 bolas azuis, 15 bolas vermelhas, 10 bolas laranja e 5 bolas verdes. Misturam-se
as bolas e escolhe-se uma aleatoriamente. Determine a probabilidade de a bola escolhida ser:

a) Verde.

b) Azul.

c) Azul ou verde.

d) No vermelha.

e) Vermelha ou verde.

f) Amarela.

g) No amarela.

3) Dez fichas so numeradas de 0 a 9 e colocadas em uma urna. Determine a probabilidade de a ficha


escolhida ser:

a) O nmero 3.

b) Um nmero mpar.

c) Um nmero menor do que 4.

4) Uma populao consome trs marcas de papel: A, B e C. Feita uma pesquisa de mercado, colheram-
se os resultados mostrados na tabela abaixo.

A B C AeB BeC AeC A, B e C Nenhum


129 146 146 75 68 59 23 132

Supondo que esses nmeros sejam significativos para descrever o consumo dessa populao,
determine a probabilidade de um consumidor:

a) Comprar papel da marca A.

b) Comprar papel da marca B.


48
ESTATSTICA

c) Comprar papel das trs marcas.

d) Comprar somente papel da marca C.

e) No comprar papel da marca B.

f) No comprar nenhuma das marcas.

g) Comprar de qualquer das marcas.

h) Comprar de apenas uma marca.

i) Um consumidor da marca A usar tambm papel da marca B.

j) Um consumidor da marca B usar tambm papel da marca A.

5) Utilizando o conceito geral de probabilidades e as propriedades apresentadas, calcule as


probabilidades solicitadas.

a) A meteorologia prev que probabilidade de chuva de 60%. A probabilidade de Marta receber


uma ligao de Joana de 80%. Qual a probabilidade de chover e Joana telefonar?

b) Uma prova de mltipla escolha tem 5 alternativas por questo. Qual a probabilidade de um
aluno acertar uma questo que no saiba?

c) Qual a probabilidade de adivinhar em que dia da semana nasceu Adam Smith?

d) Um filme foi bem avaliado por 70% do pblico. Qual a probabilidade de encontrar na plateia
algum que o avalia mal?

e) Uma revista sorteia brindes para os compradores que enviarem um cupom pelo correio. Apenas
10% dos leitores enviam o cupom. Dos leitores dessa revista, 90% so maiores de 30 anos. Qual
a probabilidade de um comprador com menos de 30 anos ser a pessoa sorteada?

Resoluo

1) Em todos os casos, temos como espao amostral as 52 cartas do baralho, ou seja: ntot = 52.

a) H 4 valetes no baralho, logo, P = 4/52, ou P = 0,08 (valor arredondado).

b) Metade das cartas vermelha, metade preta, logo, P = 0,5.

c) 1 carta especfica, logo, P = 1/52, P = 0,02 (valor arredondado).

49
Unidade II

d) Cada naipe tem 3 figuras, e num baralho h 4 naipes, perfazendo 12 figuras, logo, P = 12/52,
P = 0,23 (valor arredondado).

e) H 13 cartas de ouros, logo, P = 13/52, P = 0,25.

f) Duas cartas especficas, logo, P = 2/52, P = 0,038.

2) Total de bolas: 50.

a) H 5 bolas verdes, logo, P = 5/50, P = 0,1.

b) H 20 bolas azuis, logo, P = 20/50, P = 0,4.

c) H 5 bolas verdes e 20 bolas azuis, logo, P = 25/50, P = 0,5.

d) H 15 bolas vermelhas, portanto as demais so no vermelhas e: P = (50-15)/50 = 35/50, P = 0,7.

e) H 15 bolas vermelhas e 5 verdes, logo, P = 20/50, P = 0,4.

f) No h bolas amarelas, logo, P = 0/50, P = 0.

g) No h bolas amarelas, logo, todas so no amarelas e: P = 50/50, P = 1.

3)
a) 1 ficha em 10, logo, P = 1/10, P = 0,1.

b) Metade dos nmeros mpar, logo, P = 0,5.

c) H 4 nmeros menores que 4, logo, P = 0,4.

4) Para resolver as questes, preciso montar o diagrama:

A 18

36 52 B
23
42
45 26

132
C

Com isso temos o total de compradores, que de 400. Esse o espao amostral referente aos itens
a-h. As contas so indicadas exatamente, mas os resultados finais podem estar arredondados.
50
ESTATSTICA

a) Comprar papel da marca A: P = 129/400, P = 0,32.

b) Comprar papel da marca B: P = 146/400, P = 0,37.

c) Comprar papel das 3 marcas: P = 23/400, P = 0,06.

d) Comprar somente papel da marca C: P = 42/400, P = 0,11.

e) No comprar papel da marca B: P = 1 - 0,37, P = 63.

f) No comprar nenhuma das marcas P = 132/400, P = 0,33.

g) Comprar qualquer das marcas: P = 1 - 0,33, P = 0,67.

h) Comprar de apenas uma marca: P = (18 + 26 + 42)/400, P = 0,22.

i) Um consumidor da marca A usar tambm papel da marca B: P = 75/129, P = 0,58.

j) Um consumidor da marca B usar tambm papel da marca A: P = 75/146, P = 0,51.

5) Utilizando o conceito geral de probabilidades e as propriedades apresentadas, as probabilidades


solicitadas so:

a) Eventos independentes: P = 0,6 * 0,8, P = 0,48.

b) 5 alternativas, apenas 1 certa: P = 0,2.

c) 7 dias na semana, nasceu em um deles: P = 0,14.

d) Eventos mutuamente excludentes: p = 0,7, q = 1 - p, q = 0,3.

e) Envio de cupom e idade so eventos independentes; ter menos de 30 anos evento complementar
de ter mais de 30: P = 0,1 * 0,1, P = 0,01.

Resumo

Tabelas de frequncia e seus grficos

1. Para a organizao e anlise de dados estatsticos, interessante


verificar com que frequncia aparece cada valor, ou intervalo de
valores, de uma varivel e constroem-se tabelas de frequncia.

51
Unidade II

2. As tabelas de frequncia podem trazer valores absolutos (nmero de


vezes que o valor aparece) ou relativos (qual a porcentagem de cada
categoria de dados).

3. Quando queremos apresentar dados estatsticos, de modo a trazer


alguma informao de maneira imediata, fazemos isso por meio da
utilizao de grficos.

4. Existem diversos tipos de grfico, e cada um poder deixar mais


claras algumas das caractersticas diferentes do conjunto, logo, a
escolha do tipo de grfico a ser utilizado em uma situao depende
de qual ou quais caractersticas se queira mostrar com maior
nfase.

Exerccios

Questo 1. Uma agncia de publicidade relacionou o valor das ltimas 119 campanhas publicitrias
que realizou at determinada data e representou-as no grfico a seguir, agrupando os valores em
categorias.

Custos das ltimas 119 campanhas realizadas

11% 10% 5 mil a 10 mil


10 mil a 15 mil
12% 12%
15 mil a 20 mil
20 mil a 25 mil
15% 25 mil a 30 mil
21% 30 mil a 35 mil
19% 35 mil a 40 mil

Baseando-se nesses dados, podemos afirmar que o custo mdio de uma campanha publicitria dessa
agncia de:

A) R$ 22.290,00

B) R$ 22.920,00

52
ESTATSTICA

C) R$ 23.290,00

D) R$ 24.190,00

E) R$ 21.690,00

Resposta correta: alternativa B.

Anlise das alternativas

O grfico dado apresenta a porcentagem de campanhas para cada categoria de custos. Assim, por
exemplo, informa que 10% das campanhas tm custo entre 5 mil e 10 mil reais. Portanto, podemos
chegar concluso de que 12 campanhas (10% de 119) apresentaram custos entre 5 mil e 10 mil reais
(informaes retiradas da primeira categoria).

Raciocnio semelhante podemos fazer com as outras categorias, chegando-se ao quadro abaixo, no
qual tambm so feitos clculos acessrios para a determinao da mdia:

Custo das campanhas publicitrias Quantidade de Ponto mdio de Ponto mdio vezes frequncia
realizadas (em reais) campanhas classe simples
5 mil a 10 mil 12 R$ 7.500 R$ 90.000
10 mil a 15 mil 14 R$ 12.500 R$ 175.000
15 mil a 20 mil 18 R$ 17.500 R$ 315.000
20 mil a 25 mil 23 R$ 22.500 R$ 517.500
25 mil a 30 mil 25 R$ 27.500 R$ 687.500
30 mil a 35 mil 14 R$ 32.500 R$ 455.000
35 mil a 40 mil 13 R$ 37.500 R$ 487.500
Somatrios 119 R$ 2.727.500

Clculo do custo mdio: x =


pix xi = 2.727.500 = 22.920
pi 119
A alternativa que corresponde a esse resultado a B.

Questo 2. O grfico a seguir representa a produo, em toneladas, atingida ao longo dos meses por
uma empresa em suas trs linhas de produo (A, B, C).

53
Unidade II

Produo mensal

Quantidade de meses

Toneladas produzidas por ms

Com base nesse grfico no se pode afirmar que:

A) Em cerca de 20 meses, o volume produzido na linha B de 825 toneladas.


B) A produo de 1.825 toneladas foi atingida no mesmo nmero de meses pelas linhas A e B.
C) A produo de 1.575 toneladas foi atingida ao longo de um perodo de 10 meses na linha de
produo C.
D) A produo mais frequente do produto A de 575 toneladas.
E) A produo mais rara para o produto B de 2.075 toneladas.

Resoluo desta questo na Plataforma.

54
ESTATSTICA

Unidade III
5 MEDIDAS DE DISPERSO

Nas sees anteriores, apresentamos grandezas que nos trazem um valor significativo dos dados de
um conjunto. Nesta seo, vamos discutir como aprofundar nossa anlise, enfocando agora a disperso
dos dados, ou seja, analisaremos se se eles esto concentrados em torno do valor mdio ou se esto
espalhados, dispersos em torno dele.

bastante provvel que no exemplo a respeito dos gastos de um conjunto de amigos na lanchonete
voc tenha pensado que no seria justo dividir as despesas igualmente, j que os gastos so bem
diferentes. tambm provvel que voc no tenha considerado injusta a diviso das despesas para fazer
o jantar.

A origem do provvel desconforto no primeiro caso e da sensao de justia no segundo se explica


estatisticamente pelas medidas de disperso.

No jantar, assumimos que todos tm acesso s mesmas comidas e bebidas e, portanto, o gasto
efetivo de cada um seria parecido, visto que se supe que os que gastaram mais sero ressarcidos e a
despesa ser igual para todos. No caso da lanchonete, h diferenas significativas no valor do consumo,
e, portanto, o valor efetivamente gasto pode diferir significativamente do valor pago.

O objetivo desta seo comear a transformar essa sensao intuitiva em conhecimento


quantitativo para a grandeza correspondente. Vamos abordar aqui somente as medidas de disperso
mais frequentemente utilizadas: o intervalo e o desvio-padro.

5.1 Intervalo

O conceito de intervalo bastante intuitivo e coincide com o significado da linguagem cotidiana. O


intervalo de valores aquele que vai do menor ao maior valor.

Retomemos os exemplos das tabelas 12, 13 e 14 para determinar os intervalos de dados.

5.1.1 Dados da tabela 12

Nos dados da tabela 12 temos idades de pessoas em uma famlia. A mais nova, Ana, tem 3 anos e a
mais velha, Gabriel, tem 56. Assim sendo, o intervalo vai de 3 a 56.

Quando no de interesse saber exatamente qual o maior e qual o menor valor, mas apenas saber
qual o tamanho do intervalo, este ser encontrado, subtraindo-se o menor valor do maior valor do
55
Unidade III

conjunto. No exemplo, o intervalo tem tamanho 53, que a diferena de idade da pessoa mais velha
para a mais nova.

5.1.2 Dados da tabela 13

Tomando agora os dados da tabela 13, vemos que o maior gasto foi de R$ 47,00 e o menor foi de
R$19,00. Desse modo, o intervalo seria de 19 a 47, o que nos d um intervalo de tamanho 28.

No entanto, como comentamos anteriormente, nesse exemplo as diferenas de gasto eram


apenas circunstanciais e, aps feito o acerto de contas, todos teriam gastado exatamente o mesmo
valor: R$ 30,00.

Se utilizarmos em nossa anlise o gasto efetivo, teremos ento R$ 30,00 como a maior e a menor
despesa, simultaneamente, e o intervalo indo de 30 a 30, com tamanho zero.

Ou seja, se todos os dados tm o mesmo valor, dizemos que so dados sem qualquer disperso, ou
dizemos, formalmente, que a disperso nula.

5.1.3 Dados da tabela 14

Na tabela 14 temos os dados para os gastos na lanchonete. Nesse caso, a menor despesa individual
foi de R$ 12,00 e a maior foi de R$ 18,00. O intervalo vai, portanto, de 12 a 18 e tem tamanho 6.

5.2 Varincia e desvio-padro

O intervalo uma medida de disperso fcil de calcular, porm de utilidade limitada, pois traz apenas
informaes sobre os valores extremos.

A exemplo do que discutimos para as medidas de posio, quando abordamos a mdia, vamos agora
definir uma medida de disperso que considere cada um dos valores individuais.

5.2.1 Estabelecendo critrios

Nesta seo vamos discutir alguns aspectos importantes referentes definio de varincia. O
intuito no trazer uma discusso formal, mas apenas discutir alguns aspectos de modo a facilitar a
compreenso.

Tomemos um exemplo similar quele dos gastos na lanchonete, em que analisaremos os gastos de
5 amigos em um restaurante.

Para analisar o quanto a diviso igualitria das despesas foi justa (ou injusta), o primeiro passo
comparar cada valor consumido com o valor efetivamente pago. Formalmente, isso significa subtrair o
valor mdio do valor especfico.

56
ESTATSTICA

Como essa anlise um refinamento do estudo da mdia, continuaremos seguindo um procedimento


similar para a realizao dos clculos. Assim, retomamos a tabela j com a linha e a coluna adicionais
para o clculo da mdia e acrescentamos uma nova coluna com o valor dessas diferenas, conforme
colocamos na tabela 24.

O clculo da mdia se d simplesmente pela soma das despesas individuais dividida pelo nmero de
pessoas, com resultado 30. Na terceira coluna, temos as diferenas entre os gastos individuais e a mdia.
Essas diferenas so obtidas pela subtrao xi- x, logo, um resultado positivo significa que a pessoa
consumiu mais do que pagou; ao contrrio, quando o resultado menor do que zero, isso significa que
a pessoa consumiu menos do que pagou.

Por exemplo, Alberto gastou R$ 25,00 e pagou R$ 30,00, a diferena citada de R$ -5,00. J Beatriz
consumiu R$ 31,00 e pagou R$ 30,00, portanto, sua diferena de R$ 1,00.

Para analisar a disperso dos dados, uma primeira proposta seria a de somar as diferenas. No
entanto, como podemos ver na ltima linha da terceira coluna, a soma das diferenas d zero.
Esse resultado era esperado, visto que houve equilbrio entre os consumos maiores ou menores
que a mdia.

Uma segunda proposta seria considerar as diferenas sem o sinal, ou seja, o valor absoluto delas
e dividir pelo nmero de pessoas para ter uma mdia desses desvios. Existe de fato uma medida de
disperso assim calculada, mas sua utilizao no frequente, ento passaremos a discutir outra
proposta matematicamente mais significativa: a varincia.

Pessoa xi xi- x
Alberto 25 -5
Beatriz 31 1
Carlos 47 17
Diana 19 -11
Edgar 28 -2
Soma 150 0
Mdia 30

Tabela 24 Clculo da comparao de valores individuais e mdia para o exemplo de gastos na lanchonete.

A varincia utiliza as distncias entre os valores individuais e as mdias, mas o faz elevando esses
valores ao quadrado. No cabe aqui discutir os motivos de tal definio, dada a complexidade da
matemtica envolvida, mas vale uma discusso qualitativa dessa escolha.

Ao utilizarmos os quadrados das diferenas, garantimos que os parmetros de desvio sero sempre
positivos, j que o produto de nmeros com sinais iguais sempre positivo.

Alm disso, esse critrio faz com que tenhamos ainda mais rigor na medida da injustia,
pois quanto maior a diferena, maior o peso com que ela ser contada. Por exemplo: a diferena
57
Unidade III

referente a Beatriz, que de 1, entrar na conta da injustia com o seu quadrado, que tambm
1, e a diferena devida a Alberto, que de -5, entrar na conta da injustia com o seu quadrado,
que 25.

Nas prximas sees, vamos utilizar os critrios anteriores para definir os parmetros de disperso
que so efetivamente utilizados na maioria dos estudos estatsticos. Em seguida, passaremos a construir
passo a passo o procedimento para efetuar seus clculos.

5.3 Definies formais

H duas grandezas que descrevem a disperso dos dados utilizando o critrio acima: a
varincia e o desvio-padro. O desvio-padro a raiz quadrada da varincia e ser denotado
pela letra sigma minscula (). A varincia , portanto, o quadrado do desvio-padro e se
denota por 2.

5.3.1 Varincia e desvio-padro para populaes

Quando nossos dados trazem a totalidade da populao estudada, como o caso do exemplo
anterior, a varincia definida como a mdia dos quadrados das diferenas entre o valor individual e o
valor mdio, conforme formalizado a seguir:

(x x )
2

2 =
N
O desvio-padro ser simplesmente a raiz da varincia:

= 2

Geralmente, a grandeza mais utilizada para analisar disperses o desvio-padro. No detalharemos


ainda o seu significado, isso ficar para quando estudarmos a distribuio normal de probabilidades.
Por hora, basta saber que uma maior disperso dos dados implica ter um valor maior para o desvio-
padro.

Nos casos em que temos os dados em tabelas de frequncia, precisamos que lembrar que cada
valor xi aparece fi vezes e, a exemplo do que fizemos para o clculo da mdia, preciso multiplicar a
quantidade de vezes que cada valor aparece para que todas as diferenas sejam computadas.

Assim sendo, teremos:

fi . (x x )
2

2 =
fi
E, novamente, o desvio-padro ser simplesmente a raiz da varincia.
58
ESTATSTICA

Lembrete

Lembre que, embora as frmulas sejam escritas de maneira diferente


quando colocamos as frequncias explicitamente, a grandeza calculada a
mesma nos dois casos.

5.3.2 Varincia e desvio-padro para amostras

Nos casos em que temos dados para uma amostra e no para toda a populao, em lugar de
dividirmos por N, a diviso ser feita por N-1.

No cabe aqui discutir os motivos dessa definio, mas apenas comentar dois aspectos dessa
diferena.

Quando o nmero de dados grande, o valor final no ser muito afetado pela substituio de N
por N-1. Quando o nmero de dados pequeno, a disperso encontrada dividindo-se por N-1 maior,
refletindo o fato de que se espera que haja maior diversidade de valores na populao em geral que na
observada na amostra.

Por fim, note que como na maioria das vezes temos amostras em lugar de populaes, mais comum
utilizarmos as definies na forma que esto colocadas a seguir:

(x x )
2
2
=
N 1

ou

fi . (x x )
2

2 =
( fi ) 1
e, como nas outras vezes:

= 2

5.4 Realizao dos clculos

Vamos agora completar o clculo da varincia e do desvio-padro que havamos iniciado na tabela
24, e para que o procedimento de clculo e o significado fiquem mais claros, vamos resolver ainda
outros exemplos adicionais.

59
Unidade III

5.4.1 Dados no agrupados

Para efetuar os clculos, preciso lembrar que nesse caso temos uma populao, j que temos os
valores referentes a todos os ocupantes da mesa estudada.

Utilizaremos aqui um procedimento similar ao usado no clculo das mdias, colocando os valores
intermedirios que precisamos para os clculos em colunas adicionais e realizando as somas pertinentes
nas colunas respectivas. Vejamos como fazer isso na tabela 25.

Pessoa xi xi-x (xi-x)^2


Alberto 25 -5 25
Beatriz 31 1 1
Carlos 47 17 289
Diana 19 -11 121
Edgar 28 -2 4
Total 150 440
Mdia 30 varincia 88
desvio 9,38

Tabela 25 Clculo da varincia e do desvio-padro para o primeiro exemplo de gastos na lanchonete.

Como havamos feito antes, na terceira coluna esto as diferenas entre os valores individuais e a
mdia. No efetuamos a soma para esses valores porque a varincia utilizar somente o somatrio dos
quadrados desses nmeros, os quais esto colocados na coluna seguinte.

Para maior clareza, vejamos passo a passo como foi feito o clculo do desvio-padro depois de j
termos calculado a mdia.

Como j visto anteriormente, a diferena entre o valor individual e a mdia, dado por xi - x, tem
valor -5.

Elevamos o valor encontrado ao quadrado para determinar (xi - x)2, obtendo o valor 25, que
colocado na tabela.

Repetimos esse procedimento para todos os dados xi.

Somamos todos os valores da coluna (xi - x)2, obtendo o valor 440, que colocado na linha adicional
da coluna.

Como se trata de uma populao, dividimos o valor obtido por N, que, nesse caso, 5. O resultado
a varincia de valor 88.

Para a obteno do desvio-padro, calcula-se a raiz quadrada de 88 e temos finalmente o valor


aproximado =9,38.
60
ESTATSTICA

Utilizaremos o mesmo procedimento para calcular o desvio-padro de outros dois novos conjuntos
de dados. Para tornar mais imediata a comparao entre os valores das disperses nos trs exemplos,
mantivemos o tipo de situao descrita e o valor da mdia inalterados.

Observando os dados da tabela 26, temos imediatamente a sensao de que, nesse caso, a diviso da
conta em partes iguais seria mais injusta que no caso anterior.

De modo formal, temos inicialmente um intervalo que vai de 11 a 48 e maior neste caso que no
primeiro exemplo. Essa medida de disperso apoia, portanto, essa sensao.

Mas, como j dissemos, o intervalo s nos informa a respeito de extremos e mais interessante
analisar o desvio-padro. O clculo da varincia e do desvio-padro foi efetuado seguindo o mesmo
procedimento j descrito. O valor obtido de 15,19, maior que o encontrado anteriormente.

Pessoa xi xi-x (xi-x)^2


1 36 6 36
2 42 12 144
3 48 18 324
4 11 -19 361
5 13 -17 289
Total 150 1.154
Mdia 30 varincia 230,8
desvio 15,19

Tabela 26 Clculo da varincia e do desvio-padro para o segundo exemplo de gastos na lanchonete.

Analisando agora os dados da tabela 27, vemos que, assim como no segundo conjunto, o intervalo
vai de 11 a 48. No entanto, os dados nos mostram que trs pessoas pagaram praticamente o mesmo que
consumiram, sendo que as outras duas tiveram consumo mais distante da mdia.

O clculo do desvio-padro, efetuado novamente seguindo o procedimento descrito, tem por resultado
o valor 11,71. Esse valor menor que o do segundo exemplo e maior que o do primeiro, mostrando que a
disperso no ltimo caso intermediria, ficando entre as disperses dos dois casos anteriores.

Pessoa xi xi-x (xi-x)^2


1 30 0 0
2 31 1 1
3 48 18 324
4 11 -19 361
5 30 0 0
Total 150 0 686
Mdia 30 varincia 137,2
desvio 11,71

Tabela 27 Clculo da varincia e do desvio-padro para o segundo exemplo de gastos na lanchonete.

61
Unidade III

5.4.2 Dados agrupados

No intuito de construir o procedimento para o caso de dados agrupados, vamos calcular a varincia
e o desvio-padro para um conjunto de dados em que haja valores repetidos.

A partir de agora, passaremos a utilizar a frmula da varincia para amostras, visto que sua utilizao
mais frequente, pois mais comum termos estudos que utilizam amostras que estudos que trazem
informaes sobre toda a populao. Esse clculo est colocado na tabela 28.

Dado xi xi-x (xi-x)^2


1 10 -10 100
2 30 10 100
3 10 -10 100
4 30 10 100
5 30 10 100
6 30 10 100
7 20 0 0
8 20 0 0
9 0 -20 400
10 10 -10 100
11 30 10 100
Somas 220 1.200
Mdia 20 varincia 120
desvio 10,95

Tabela 28 Clculo do desvio-padro para um conjunto de dados brutos de uma amostra.

Assim como no clculo da mdia quando h valores repetidos, podemos agrupar os dados e fazer
com que os termos referentes a valores iguais sejam multiplicados pelas suas frequncias. Desse modo,
todos os dados sero includos na conta de uma maneira mais prtica e concisa.

Vamos ver agora um procedimento para o clculo do desvio-padro quando os dados esto agrupados
em uma tabela de frequncias. Para isso tomaremos os mesmos dados da tabela 28, mas j agrupados
numa tabela de frequncias. Os dados agrupados e a tabela com os valores utilizados no clculo do
desvio-padro esto na tabela 29.

xi fi fi*xi xi-x (xi-x)^2 fi*(xi-x)^2


0 1 0 -20 400 400
10 3 30 -10 100 300
20 2 40 0 0 0
30 5 150 10 100 500
Soma 11 220 1.200
Mdia 20 varincia 120
desvio 10,95

Tabela 29 Clculo do desvio-padro para um conjunto de dados amostrais agrupados.

62
ESTATSTICA

Comparando o procedimento utilizado na tabela 28, em que tnhamos os dados brutos,


vemos que para a tabela de frequncias acrescentamos duas colunas necessrias para colocar os
resultados dos produtos pelas frequncias. Descrevemos, a seguir, o uso dessa tabela para realizar
os clculos:

A primeira e a segunda colunas trazem os dados para valor e respectiva frequncia.


O somatrio de fi, apresentado na primeira linha adicional da segunda coluna, d-nos o total de
dados no conjunto, ou seja, N =11.
Como cada valor xi aparece no conjunto fi vezes, o somatrio de fi*xi, apresentado na primeira linha
220
adicional da terceira coluna, dividido por N, tem como resultado a mdia: x = , logo, x = 20 .
11
A quarta coluna traz a diferena entre cada valor e a mdia.
A quinta coluna traz o quadrado dessa diferena.
A ltima coluna traz o produto de cada valor da coluna anterior pela frequncia respectiva.
Como cada valor xi aparece no conjunto fi vezes, tambm a diferena entre o valor xi e a mdia aparecer
fi vezes. Para o clculo da varincia utilizaremos o somatrio de fi.(xi-x)2, cujo resultado est colocado na
primeira linha adicional. Assim, lembrando que ao utilizar a frmula para amostras devemos subtrair 1
1.200
no denominador, teremos a varincia dada pela expresso: 2 = , logo, 2 = 120 .
11 1
Para a obteno do desvio-padro, calcula-se a raiz quadrada de 120 e temos finalmente o valor
aproximado =10,95.

Vale enfatizar que os resultados obtidos dessa maneira teriam necessariamente que ser iguais aos
obtidos quando utilizamos os dados brutos da tabela 27, afinal em ambos os casos temos o mesmo
conjunto de dados, apenas com apresentao diferente.

Vejamos agora um exemplo adicional em que os dados amostrais so apresentados diretamente


numa tabela de frequncias. Alm disso, nesse exemplo utilizaremos dados cuja mdia no inteira,
o que mais frequente na realidade. Os dados e os resultados esto colocados na tabela 30. Procure
identificar ali cada um dos passos do procedimento descritos anteriormente.

xi fi fi*xi xi-x (xi-x)^2 fi*(xi-x)^2


5 5 25 -4,68 21,9 109,51
8 8 64 -1,68 2,82 22,58
12 9 108 2,32 5,38 48,44
15 3 45 5,32 28,3 84,91
Soma 25 242 265,44
Mdia 9,68 varincia 10,62
desvio 3,26

Tabela 30 Clculo do desvio-padro para um conjunto de dados amostrais agrupados numa tabela de frequncias.

63
Unidade III

5.4.3 Mdias ponderadas

Vamos ver agora um procedimento para o clculo quando os dados tm pesos diferentes.

Lembramos que, para efeito dos clculos, o peso e a frequncia tm papis similares. Assim sendo,
montaremos a tabela e efetuaremos os clculos seguindo os mesmos passos descritos para a tabela 29,
mas tendo em lugar das frequncias fi os pesos pi.

Os dados e os clculos esto esquematicamente apresentados na tabela 31 colocada a seguir.

xi pi pi*xi xi-x (xi-x)^2 pi*(xi-x)^2


5 5 25 -4,68 21,9 109,51
8 8 64 -1,68 2,82 22,58
12 9 108 2,32 5,38 48,44
15 3 45 5,32 28,3 84,91
Soma 25 242 265,44
Mdia 9,68 varincia 10,62
desvio 3,26

Tabela 31 Clculo do desvio-padro para um conjunto de dados amostrais com ponderao.

6 NOES GERAIS DE PROBABILIDADE

Utilizamos o conceito intuitivo de probabilidade em diversas situaes de nossas vidas, diariamente.


Antes de sair de casa, analisamos a probabilidade de chover para levarmos ou no o guarda-chuva.
No pensamos, porm, se deveramos levar uma roupa elegante para o caso de uma festa formal
inesperada.

Em ambos os casos, lanamos mo do conceito intuitivo de probabilidade para tomar nossa


deciso.

O objetivo desta seo utilizar esse conceito intuitivo como ponto de partida para a construo do
conceito formal de probabilidade enquanto frequncia relativa de determinados eventos de interesse.

6.1 Variveis aleatrias

As probabilidades dizem respeito a situaes em que existe aleatoriedade. Ou seja, em que o resultado
a ser obtido depende de fatores imponderveis do acaso.

Em estatstica, quando falamos em um resultado, ele se expressa no valor de uma varivel. Se o valor
depende do acaso, a varivel que expressa esse valor chamada de varivel aleatria.

Podemos chamar de varivel aleatria, por exemplo, o resultado de um jogo de par ou mpar, sendo
que a varivel resultado poderia assumir os valores par ou mpar.
64
ESTATSTICA

Cada resultado de uma varivel aleatria ter uma chance, maior ou menor, de ser observado.
Estabelecer a magnitude dessas chances o que se busca no clculo de probabilidades.

6.2 Noes intuitivas de probabilidade

Todos temos alguma noo intuitiva a respeito de probabilidades, pois sabemos avaliar que coisas
sero mais ou menos provveis em diversas situaes, ainda que de maneira subjetiva.

Um exemplo de utilizao dessa capacidade a compra de presente de um amigo-secreto ao qual


no conhecemos bem. Para essa compra, buscamos avaliar que tipo de coisas a pessoa em questo deve
gostar, baseando-nos no conhecimento que temos de outras pessoas ou de determinados grupos sociais.
Uma deciso possvel, dado que a maioria das pessoas gosta de msica, seria comprar um CD que estivesse
fazendo sucesso no momento. Ou seja, pensando assim estamos assumindo que o evento gostar do
presente ser mais provvel se escolhermos algo que frequentemente apreciado por outras pessoas.

Observao

Uma boa anlise das probabilidades envolvidas em uma situao nos


ajuda a tomar boas decises.

A situao descrita anteriormente reflete a noo intuitiva da probabilidade de um evento. A partir


de agora, refinaremos essa noo, transformando-a em algo que se possa quantificar.

6.3 Probabilidade enquanto frequncia relativa

Diz-nos a intuio que o que mais comum mais provvel. Se escrevermos essa ideia em termos
do formalismo matemtico, teremos a definio de probabilidade enquanto frequncia relativa.

6.3.1 Formalizao

Para determinar a probabilidade de que ocorra um determinado evento E como resultado de uma
varivel aleatria, precisamos analisar quantos so os resultados possveis em geral e quantos so
aqueles favorveis ao evento E.

A probabilidade de o evento E ocorrer, que ser denotada por P(E), ser a razo entre o nmero
especfico de eventos que so favorveis a E, ao qual chamaremos nE, pelo nmero total de eventos
possveis, ao qual chamaremos ntot. O conjunto de todos os eventos possveis tambm chamado de
espao amostral.

Formalmente, escrevemos:
n
PE = E
ntot

65
Unidade III

Decorre da que uma probabilidade P ser necessariamente um nmero entre 0 e 1, pelos motivos
que seguem:

A menor probabilidade possvel est relacionada ao menor nmero possvel de eventos favorveis
a E. O nmero de eventos favorveis a E ser, no mnimo, zero, visto que uma contagem de
eventos no pode ser negativa. Assim sendo, a menor probabilidade possvel zero.

A maior probabilidade possvel est relacionada ao maior nmero possvel de eventos favorveis
a E. O nmero de eventos favorveis a E ser, no mximo, igual ao nmero total de eventos
possveis. Dessa forma, nE ser igual a ntot e a diviso de um pelo outro ser igual a 1.

bastante comum falar de porcentagens utilizando a notao percentual. Assim, uma probabilidade
0,6 seria descrita como uma probabilidade de 60%. Note, porm, que temos aqui somente duas maneiras
de escrever o mesmo valor. No decorrer da apostila utilizaremos ambas as notaes para descrever
probabilidades a depender da convenincia da discusso.

Lembrete

A porcentagem somente uma maneira de escrever uma frao cujo


denominador 100, logo, no h diferena entre uma probabilidade de 0,5
e de 50%.

Exemplo

Numa festa de escola so realizados alguns sorteios de brindes entre os alunos, cujas idades esto
apresentadas na tabela 32.

Idade Quantidade
6 12
7 20
8 17
9 21
10 15
Total 85

Tabela 32 Frequncias para as idades das crianas participantes de uma festa escolar.

Para calcular a probabilidade de um aluno de 8 anos de idade ganhar o brinde num determinado
sorteio seguimos os passos descritos abaixo:

Temos 85 alunos no total, ou seja, o nmero de eventos possveis nesse caso 85, ou, seguindo a
notao proposta: ntot = 85.

66
ESTATSTICA

Como queremos analisar o evento aluno de 8 anos sorteado, chamamos de nmero de


eventos favorveis ao nmero de crianas dessa idade. Dos 85 alunos, 17 tm 8 anos de
idade, assim, h 17 eventos favorveis no conjunto. Novamente, de acordo com a notao
proposta: n8 = 17.

O clculo da probabilidade se d dividindo-se o nmero de eventos favorveis pelo nmero total


de eventos possveis. Chamaremos P(8) a probabilidade em questo. Assim, temos:

n8 17
P (8) = =
ntot 85

E, portanto:

P(8) = 0,2.

Se houver preferncia pela notao percentual, podemos dizer que essa probabilidade de 20%.

Suponhamos agora que haja um brinde que seja de interesse apenas dos alunos maiores, com mais
de 7 anos. Assim, o sorteio desse brinde seria feito somente com parte das crianas. Como calcularamos
a probabilidade de um aluno de 8 anos ser sorteado?

Para esse sorteio, embora haja um mesmo nmero de alunos de 8 anos, temos um menor nmero de
eventos possveis, o que aumenta a probabilidade de um deles ser sorteado. Formalmente, realizamos os
clculos seguindo um procedimento similar ao citado anteriormente:

Temos agora somente 53 alunos com mais de 7 anos, ou seja, o nmero de eventos possveis nesse
caso 53, ou ntot= 53.

O nmero de crianas com 8 anos permanece o mesmo, portanto, n8 = 17.

O clculo da probabilidade se d dividindo-se o nmero de eventos favorveis pelo nmero total


de eventos possveis. Agora temos:

n8 17
P (8) = =
ntot 53

E, portanto:

P(8) = 0,32.

Por simplicidade, arredondamos o resultado para 2 casas decimais. Novamente, se houver


preferncia pela notao percentual, podemos dizer que essa probabilidade de aproximadamente
32%.

67
Unidade III

6.4 Alguns cuidados na interpretao de uma probabilidade

Elencamos alguns cuidados para a interpretao de resultados de probabilidade que podem levar a
concluses equivocadas.

6.4.1 Caso geral

Um primeiro cuidado, e talvez o mais importante, lembrar que a portabilidade dos resultados para
as probabilidades calculadas a partir de certo conjunto de dados s vale se a situao descrita for similar
quela em questo.

Retomando o exemplo inicial, o do amigo-secreto, realizado entre os membros de uma orquestra,


mais provvel que o presenteado, dadas as caractersticas especficas desse grupo, goste de ganhar um
CD de msica clssica e no se anime com o lanamento dos ltimos sucessos populares, ao contrrio
do que se observaria na maioria dos casos.

Retomando o exemplo das crianas da festa, podemos pensar que as mesmas pessoas, 10 anos
depois, no gostariam de ganhar aqueles mesmos brindes pelos quais tanto se interessaram na dcada
anterior.

claro que nos casos citados a distino bvia e dificilmente algum utilizaria dados de uma
situao na outra. No entanto, comum que se utilizem estudos gerados em um pas para analisar
a economia de outro, ou produtos com diferentes especificaes etc. H vezes em que a utilizao
vlida, mas em outras no. Assim, busque ter um olhar crtico ao trabalhar com informaes que
envolvam probabilidades.

6.4.2 Quando a probabilidade 0

Quando a probabilidade de um evento zero, isso no quer dizer que ele no ocorrer. Quer
dizer somente que entre os dados disponveis no havia nenhum que correspondesse ao evento em
questo.

Temos como exemplos de casos assim todos os eventos historicamente novos ou aqueles que so
extremamente raros.

No entanto, tudo aquilo que impossvel ter, necessariamente, probabilidade nula.

6.4.3 Quando a probabilidade 1

Do mesmo modo que a probabilidade nula (zero) no quer dizer que algo seja totalmente impossvel,
tambm a probabilidade de valor 1 (ou 100%) no significa certeza absoluta de que algo acontecer.

Entram nessa categoria os eventos cuja no ocorrncia extremamente rara ou so aqueles que
acabam no ocorrendo por causa de um evento impondervel e imprevisvel.
68
ESTATSTICA

Do mesmo modo, algo que seja certeza ter probabilidade igual a um.

6.5 Origem dos dados

Quando estudamos probabilidades, podemos analisar situaes em que os valores conhecidos das
variveis so empricos ou analticos. Na sequncia definiremos cada um deles.

Os dados analticos e os empricos so tratados de maneira diferente. Passamos agora a discutir essa
distino, mostrando como utilizar os dados de ambos os tipos.

6.5.1 Dados empricos

Dados empricos so aqueles cujos valores so observados na prtica. Fazem parte dessa classificao
todos os dados oriundos de pesquisas de campo, como a idade das pessoas de certo grupo, os valores
de preos de mercado etc.

Para efeitos didticos, os dados do tipo emprico utilizados no foram retirados da realidade, mas
simulam valores que poderiam ter sido encontrados dessa maneira.

6.5.2 Dados analticos

Os dados analticos tm um carter diferente, eles no precisam ser medidos diretamente, visto que
a anlise das caractersticas do sistema estudado j nos d os valores possveis da varivel aleatria, bem
como a proporo em que eles se encontram.

Como exemplo dessa classe de dados temos os jogos de azar, como o jogo de uma moeda, o jogo de
dados ou o sorteio de cartas, por exemplo.

Nesta seo vamos realizar a anlise das probabilidades referentes a alguns desses sistemas.

1. Jogo de uma moeda

Quando jogamos uma moeda, sabemos que haver dois resultados possveis: face cara ou face
coroa. Em princpio, podemos assumir que a moeda equilibrada e que a ocorrncia de uma ou outra
face depender somente do acaso e com igual proporo.

Para analisar as probabilidades referentes a esse caso, chamemos o resultado face cara de K e o
resultado face coroa de C, para facilitar a identificao.

Chamando o nmero de eventos possveis cara, coroa e total de nK, nC e ntot, respectivamente,
teremos: nK = 1, nC = 1 e ntot = 2.

A partir desses dados, podemos calcular as probabilidades de cada evento possvel:

69
Unidade III

Probabilidade de face cara: P(K) = nK/ ntot, logo P(K) = 1/2.

Probabilidade de face coroa: P(C) = nC/ ntot, logo P(C)=1/2.

2. Jogo de um dado

Podemos fazer uma anlise similar para o jogo de um dado. Novamente supomos o dado equilibrado,
em que todas as faces so igualmente provveis.

Chamaremos de P(n) a probabilidade de termos o resultado face n. Assim, P(1) simboliza a


probabilidade de termos o resultado 1 no jogo do dado.

Como h 6 faces e todas so igualmente provveis, teremos ntot = 6 e, para qualquer face:

Probabilidade de face 1: P(1) = n1/ ntot, logo P(1) = 1/6.

Probabilidade de face 4: P(4) = n4/ ntot, logo P(4) = 1/6.

Podemos ainda calcular as probabilidades de algumas situaes adicionais, como a de


sortearmos um nmero par. As faces cujo resultado atende a esse critrio so as faces 2, 4 e 6.
Logo, temos 3 resultados favorveis ao critrio escolhido. O nmero total de resultados possveis
o mesmo (ntot = 6), logo:

Probabilidade de face par: P(par) = npar/ ntot, logo, P(par) = 3/6.

Probabilidade de face par: P(par) = 1/2.

Exemplos de aplicao

1) Um vendedor de automveis deseja impressionar possveis compradores de certo modelo. Para isso
apregoa a grande possibilidade de personalizao do automvel, fornecendo opes de escolha
entre trs tipos de motor, dois tipos de transmisso, cinco cores externas e duas internas. Quantas
opes ele pode oferecer ao cliente?

2) Se um torneio de basquete consiste na participao de 36 times, supondo que todos os times


tenham exatamente o mesmo nvel, pergunta-se:

a) De quantas maneiras podem ser conquistados os trs primeiros lugares?

b) De quantas maneiras podem ser conquistadas as trs vagas para a participao num campeonato
internacional?

3) Um fabricante estima haver defeito em cerca de 2% de seus produtos. Se tal suspeita correta,
estime a probabilidade de que, numa amostra de 9 unidades, haja:
70
ESTATSTICA

a) Uma defeituosa.

b) Nenhuma defeituosa.

4) Doze por cento dos que reservam lugares em um voo, sistematicamente faltam ao embarque. O
avio comporta 15 passageiros.

a) Determine a probabilidade de todos os que reservaram voo comparecerem ao embarque.

b) Se houver 16 pedidos de reserva, determine a probabilidade de:

i) Uma pessoa ficar de fora.

ii) Nenhuma pessoa ficar de fora.

5) Um exame constitudo de 100 testes com 5 alternativas cada. Qual a nota esperada de um
estudante que no sabe nada da matria? Qual a varincia correspondente a essa distribuio?

6) Um teste de escolaridade tem distribuio normal com mdia 100 e desvio-padro 10. Determine
a probabilidade de um indivduo que se submeta ao teste ter nota:

a) Maior que 120.

b) Maior que 80.

c) Entre 85 e 115.

d) Maior que 100.

Resoluo

1) Utilizando o princpio da multiplicao: N=3 * 2 * 5 * 2, logo N = 60.

2)
a) N = 36 * 35 * 34 = 42840

b) N = 42840/3! = 42840/6 = 7140

3) Distribuio binomial com n = 9 e p = 0,02.

a) k = 1, P(1) = 0,1531

b) k = 0, P(0) = 0,8337

71
Unidade III

4) Binomial com p = 0,12 (probabilidade de faltar).

a) n = 15, k = 0: P(0) = 0,1470

b) n = 16

i) S fica algum de fora se ningum faltar, logo, k = 0. P(0) = 0,1293.

ii) Resultado complementar daquele discutido no item anterior, logo:


P = 1 - 0,1293 = 0,8707

5) Mdia: x = 100.0,2 = 20; desvio-padro: = 100.0,2.0,8 = 16.

6)

a) Maior que 120.

z = (120-100)/10 = 2
A(2) = 0,4772
P(x>120) = P(z>2) = 0,5 - A(2) = 0,0228

b) Maior que 80.

z = (120-100)/10 = 2
A(2) = 0,4772
P(x>120) = P(z>2) = 1-A(2) = 0,5228

72
ESTATSTICA

c) Entre 85 e 115.

z1 = (85-100)/10 = -1,5, z2 = (115-100)/10 = 1,5


A(1,5) = 0,4332
P(x>120) = P(-1,5<z>1,5) = A (1,5)+A(1,5) = 0,8664

d) Maior que 100.

z = (100-100)/10 = 0
P(x>100) = P(z>0) = 0,5

Resumo

Medidas de posio e disperso

1. As medidas de posio e disperso tm o papel de resumir as


caractersticas principais de um conjunto.

2. So medidas de posio, entre outras, a moda, a mediana e a mdia.

3. As medidas de disperso nos informam a respeito da concentrao


dos valores individuais em torno dos valores mdios.

4. So medidas de disperso o intervalo, a varincia e o desvio-padro.

Exerccios

Questo 1. Muitos pases enfrentam srios problemas com seu elevado crescimento populacional.
Em alguns foi proposta (e por vezes colocada em efeito) a proibio de as famlias terem mais de um

73
Unidade III

filho. Algumas vezes, no entanto, essa poltica teve consequncias trgicas (por exemplo, em alguns
pases houve registros de famlias de camponeses que abandonaram suas filhas recm-nascidas para
terem mais uma chance de ter um filho do sexo masculino). Por essa razo, outras leis menos restritivas
foram consideradas. Uma delas foi a de que as famlias teriam direito a um segundo (e ltimo) filho, caso
o primeiro fosse do sexo feminino. Suponha que essa ltima regra fosse seguida por todas as famlias
de certo pas (isto , sempre que o primeiro filho fosse do sexo feminino, fariam uma segunda e ltima
tentativa para ter um menino). Suponha ainda que, em cada nascimento sejam iguais as chances de
nascer menino ou menina. Examinando os registros de nascimento, aps alguns anos de a poltica ter
sido colocada em prtica, seria esperado que:

A) O nmero de nascimentos de meninos fosse aproximadamente o dobro do de meninas.


B) Em mdia, cada famlia tivesse 1,25 filho.
C) Aproximadamente 25% das famlias no tivessem filhos do sexo masculino.
D) Aproximadamente 50% dos meninos fossem filhos nicos.
E) Aproximadamente 50% das famlias tivessem um filho de cada sexo.

Resposta correta: alternativa C.

Anlise das alternativas

Nas condies do exposto no exerccio, seria possvel a existncia de quatro tipos de famlias:

Famlias com um nico filho homem (o primeiro e nico a nascer). A probabilidade de essa famlia
existir de 50%, pois as probabilidades de nascer um homem ou uma mulher so iguais, logo, no
primeiro nascimento existe uma probabilidade de 50% de que o filho seja homem.
Famlias com uma primeira filha mulher e um segundo filho homem. A probabilidade de essa
famlia existir de 25%, porque 50% das famlias tm a primeira filha mulher, e dessas, metade
(50%) ter um segundo filho homem, ou seja, 50% de 50% igual a 25%.
Famlias com duas filhas mulheres, ou seja, nenhum filho homem. o que sobra de probabilidade,
ou seja, 25%. Assim sendo, a resposta correta corresponde alternativa C.

A) Alternativa incorreta.
Justificativa: o prprio enunciado diz que a probabilidade de nascerem meninas e meninos igual.

B) Alternativa incorreta.
Justificativa: na situao descrita teramos 50% de famlias com dois filhos e 50% de famlias com
um filho, ou seja, em mdia 1,5 filho e no 1,25 filho.

74
ESTATSTICA

C) Alternativa correta.
Justificativa: so os casos das famlias com duas filhas mulheres, como visto acima, existem 25% de
probabilidades de isso ocorrer.
D) Alternativa incorreta.
Justificativa: nas condies dadas, 50% das famlias tero filhos nicos homens e no 50% dos
meninos sero filhos nicos.
E) Alternativa incorreta.
Justificativa: apenas 25% das famlias tero um filho de cada sexo, como visto acima.

Questo 2. Determinado investidor resolve mandar fazer um estudo estatstico antes de aplicar
parte de suas reservas. Para tanto, foram levantados os dados relacionados no grfico abaixo referente
a dois investimentos diferentes.

25

20
Qualidade de aplicaes feitas

15

Investimento A
10 Investimento B

0
-4% -2% 0% 2% 4% 6% 8% 10%
Rendimento obtido por aplicao

Ele deseja escolher o investimento baseado no s na rentabilidade mdia, mas tambm na


estabilidade do investimento (variaes pequenas). O especialista encarregado de fazer o estudo analisa
os dados e faz as afirmaes:

I. O investimento B mais recomendado que o investimento A porque tem maior rendimento


mdio.
II. O investimento A mais rentvel e tem menor variabilidade.

III. Apesar de ambos os investimentos terem rentabilidades prximas, o investimento A tem maior
variabilidade, o destaca preferencialmente.
75
Unidade III

IV. As rentabilidades dos dois investimentos so muito prximas, mas ambas tm uma disperso
muito elevada, o que torna as anlises de baixa qualidade.
V. O investimento A mais recomendado que o investimento B porque tem um desvio-padro
menor.

Selecione a alternativa correta:

A) I, II e III.
B) II, III e IV.
C) III, IV e V.
D) I, IV e V.
E) II, IV e V.

Resoluo desta questo na Plataforma.

76
ESTATSTICA

Unidade IV
7 PROBABILIDADES

7.1 Noes de teoria de conjuntos

Quando estudadas as probabilidades, principalmente quando isso feito a partir de dados empricos,
preciso analisar algumas propriedades do conjunto estudado. Para isso utilizamos a teoria de conjuntos,
a qual discutiremos na presente seo.

7.1.1 Noes gerais

Em primeiro lugar, vamos definir alguns conceitos fundamentais e estabelecer a notao


apropriada.

Conjuntos e elementos

Os conceitos de conjunto e de elemento fazem parte daqueles que se chamam de conceitos primitivos,
que todos sabemos o que , mas no h como definir formalmente.

Podemos dizer, no entanto, que conjuntos so colees de elementos, sendo que elementos de um
mesmo conjunto devem ter algo em comum; no faz muito sentido pensar em um conjunto em que
um elemento seja uma flor, outro seja um planeta e o terceiro seja uma letra de msica. Ou seja, temos
sempre conjuntos de algo que podemos definir como sendo de uma mesma classe de elementos: um
conjunto de pessoas, um conjunto de pases, um conjunto de mveis etc.

Representao

Utilizamos geralmente uma letra maiscula para nomear o conjunto, e seus elementos so listados
entre chaves, como segue:

A = {j, l, n, p}

B = {3, 5, 89}

C = {Pedro, Joo, Ndia}

Note que a lista de elementos pode ser dada numa ordem qualquer, desse modo posso escrever
o conjunto A de maneiras diferentes. Por exemplo, se tenho A = {j, l, n, p}, posso escrever o mesmo
conjunto como A = {l, j, p, n}, visto que em ambos os casos temos os mesmos elementos.
77
Unidade IV

Tomando como exemplo os conjuntos anteriores, podemos dizer que o elemento j pertence ao
conjunto A, que o elemento 3 pertence ao conjunto B etc. Podemos ainda dizer que o elemento 5 no
pertence ao conjunto A ou que Simone no pertence ao conjunto C. A maneira de escrevermos essas
informaes em linguagem matemtica a seguinte:

j A

3 B

5 A

Simone C

Outro ponto importante a definio do conjunto vazio, indicado pelo fato de no haver
nenhum elemento entre as chaves, ou seja, de no haver nenhum elemento no conjunto. Pode
parecer estranho definir um conjunto sem elementos, mas quando vamos analisar conjuntos,
muitas vezes importante dizermos que no h nenhum elemento com alguma caracterstica
especfica. Analogamente, poderamos pensar que seria estranho termos um nmero para
representar a ausncia, a contagem de algo que no h, mas ningum imaginaria que a existncia
do nmero zero no importante.

Uma notao alternativa para o conjunto vazio utilizar um smbolo especfico, conforme
apresentamos a seguir:

D = { } ou D =

Subconjuntos

Dizemos que A subconjunto de B quando todos os elementos que pertencem ao conjunto A


tambm pertencem ao conjunto B.

Vale notar que o conjunto vazio um subconjunto de qualquer conjunto dado.

Chamamos de conjunto universo, ou simplesmente universo, aquele que rene todos os elementos
que sero considerados no problema.

Exemplo

Para deixar mais claro o conceito de subconjuntos, vamos agora elencar todos os subconjuntos de
A = {1, 2, 3, 4}.

Conjunto com 4 elementos:

A = {1, 2, 3, 4}
78
ESTATSTICA

Conjuntos com 3 elementos:

B = {1, 2, 3}

C = {1, 2, 4}

D = {1, 3, 4}

E = {2, 3, 4}

Conjuntos com 2 elementos:

F = {1, 2}

G = {3, 4}

H = {1, 4}

I = {2, 3}

J = {1, 3}

K = {2, 4}

Conjuntos com 1 elemento:

L = {1}

M = {2}

N = {3}

O = {4}

Conjunto com 0 elemento:

P={}

Vale relembrar que o conjunto A subconjunto de si prprio e que o conjunto vazio ser um
subconjunto de A, pois em ambos os casos se atende ao critrio de no ter nenhum elemento que no
pertena a A.

7.1.2 Operaes com conjuntos

Quando temos dois conjuntos, podemos comparar para ver se h elementos em comum ou podemos
juntar esses elementos. Esses dois procedimentos se apresentam como sendo as operaes de interseo
e unio de conjuntos, que detalharemos a seguir.
79
Unidade IV

Interseo de conjuntos

A interseo de dois conjuntos A e B ser o conjunto que contm os elementos que pertencem a
ambos, ao qual chamaremos C.

A linguagem utilizada formalmente para descrever a interseo descrev-la por meio do uso da
conjuno e, ou seja, dizemos que o conjunto C formado pelos elementos que pertencem a A e B. O
smbolo que representa essa operao um U invertido, ou seja, .

Por exemplo, se tivermos A = {1, 2, 3, 4} e B = {2, 4, 6, 8}, a interseo ser:

C=AB
C = {2, 4}

Pois os elementos 2 e 4 fazem parte dos dois conjuntos.

Unio de conjuntos

A unio de dois conjuntos A e B resulta em um terceiro, ao qual chamaremos C, que tem todos os
elementos dos conjuntos A e B. Note que, se houver elementos que pertenam a ambos, eles aparecero
somente uma vez no conjunto C.

A linguagem utilizada formalmente para descrever a interseo descrev-la por meio do uso da
conjuno ou, ou seja, dizemos que o conjunto C formado pelos elementos que pertencem a A ou B.
O smbolo que representa a operao uma letra U maiscula.

Num exemplo informal, podemos pensar na seguinte situao: Maria estuda numa escola de idiomas
e faz dois cursos, ingls e espanhol. Se a escola resolver fazer uma festa unindo todas as turmas, ela ser
contada como elemento tanto na turma de ingls como na turma de espanhol, no entanto, isso no faz
dela duas pessoas, ela ser apenas um elemento no conjunto de alunos da escola.

Tratando agora de um exemplo informal, se tivermos A = {1, 2, 3, 4} e B = {2, 4, 6, 8}, a unio ser:

C=AUB
C = {1, 2, 3, 4, 6, 8}

Ressalte-se que os elementos 2 e 4, que aparecem nos dois conjuntos, aparecero somente uma vez
no conjunto C, conforme discutido no exemplo da aluna Maria.

Classificao e contagem de elementos

Quando dois conjuntos no tm elementos em comum, dizemos que os conjuntos so disjuntos. Por
exemplo, os conjuntos A = {1, 4, 6} e o conjunto B = {8, 0, 2} so conjuntos disjuntos. Nesses casos,
80
ESTATSTICA

se realizarmos a unio dos dois conjuntos, o nmero de elementos no conjunto final ser a soma do
nmero de elementos de cada conjunto.

De uma maneira mais formal, e chamando de nA, nB e nC o nmero de elementos dos conjuntos A, B
e C, respectivamente, teremos:

C=AUB

C = {1, 4, 6, 8, 0, 2}

nC = nA + nB

Note que essa contagem de elementos numa unio de conjuntos, conforme descrita anteriormente,
a origem da operao de adio, podendo muitas vezes at se confundir com ela.

No entanto, se houver elementos comuns aos dois conjuntos, se simplesmente somarmos os nmeros
de elementos de A e B, estaremos contando os elementos repetidos duas vezes, retomando o exemplo
da Maria, ela seria contada como se fosse duas pessoas em lugar de uma.

Para ilustrar essa situao, retomemos os conjuntos A = {1, 2, 3, 4} e B = {2, 4, 6, 8}.

C = A U B, logo C = {1, 2, 3, 4, 6, 8}

D = A B, logo D = {2, 4}

Se fssemos encontrar o nmero de elementos de C a partir do nmero de elementos de A e


B, somando o nmero de elementos em cada um, estaramos contando os elementos 2 e 4 duas
vezes. Para evitar essa contagem indevida, teramos que somar os nmeros de elementos dos dois
conjuntos e descontar o nmero de elementos contados duas vezes. Formalmente, teramos:

nC = nA + nB - nD

Ou, de uma maneira mais genrica:

nA U B = nA + nB - nA B

Chamamos essa formulao de princpio aditivo.

Lembrete

comum encontrar problemas de contagem de elementos, utilizando


a teoria de conjuntos a serem achados, em provas de raciocnio lgico em
concursos.
81
Unidade IV

Exemplo

Para ilustrar a questo da contagem, suponhamos que dois amigos, Pedro e Luiz, resolvem
fazer uma festa conjunta e cada um deles elabora uma lista de convidados com 20 pessoas. No
entanto, eles tm amigos em comum, e isso se reflete no fato de 12 pessoas constarem das duas
listas.

Com essas informaes e a utilizao do princpio aditivo, podemos deduzir o nmero efetivo de
convidados.

Chamando de P o conjunto de convidados de Paulo e de L o conjunto de convidados de Luiz,


temos:

Convidados de Paulo: nP = 20

Convidados de Luiz: nL = 20

Convidados em comum: nPL = 12

Convidados da festa: nP U L = nP + nL - nPL

Convidados da festa: nP U L = 20 + 20 12

Convidados da festa: nP U L = 28

Ou seja, embora cada um tenha 20 convidados, ser 28 o nmero total de pessoas chamadas a
participar da festa.

7.1.3 Diagramas de Venn

Os diagramas de Venn foram desenvolvidos com o objetivo de tornar fcil a visualizao de conjuntos
e subconjuntos. Nesta seo vamos mostrar como se constroem esses diagramas e como podemos
utilizar essa ferramenta como um recurso auxiliar na anlise de probabilidades.

Montagem de diagramas com os elementos

Nesses diagramas, associa-se uma rea para cada conjunto, na qual ficam seus elementos. Quando
um elemento pertence a mais de um conjunto, haver uma rea comum aos dois conjuntos, de modo
que exista um lugar para colocar esse elemento.

No diagrama apresentado no grfico 9, temos uma representao referente aos conjuntos utilizados
num exemplo da seo 2: A = {1, 2, 3, 4} e B = {2, 4, 6, 8}.

82
ESTATSTICA

A B

1 6
2

3 4 8

Grfico 9 Representao de dois conjuntos com interseo.

Assim:

Na regio central, a qual pertence tanto elipse do conjunto A quanto do conjunto B, so


colocados os elementos comuns aos dois conjuntos: 2 e 4.

Na regio que pertence elipse do conjunto A, mas no elipse do conjunto B, foram colocados
os elementos que pertencem a A, mas no a B: 1 e 3.

Na regio que pertence elipse do conjunto B, mas no elipse do conjunto A, foram colocados
os elementos que pertencem a B, mas no a A: 6 e 8.

Desse modo, a elipse A tem os quatro elementos do conjunto A e a elipse B tem os quatro elementos
do conjunto B, sendo que todos os elementos dos conjuntos foram representados de modo tal que
podemos, apenas com o uso do diagrama, saber rapidamente quais so os elementos de cada conjunto
e quais so ou no comuns a ambos.

Suponhamos agora que nosso conjunto universo englobe todos os nmeros inteiros entre 1 e 9.
Nesse caso, poderamos representar essa situao colocando os elementos restantes dentro do quadrado
do diagrama, mas fora das elipses, como vemos no grfico 10.

A B

1 6
2

3 4 8

5 9
7

Grfico 10 Representao grfica de dois conjuntos com interseo pertencentes a um conjunto universo
com elementos que no pertencem a A ou a B.

83
Unidade IV

Veremos agora alguns exemplos adicionais envolvendo situaes diversas da descrita anteriormente,
inclusive com representao de trs conjuntos.

Observando o grfico 11, podemos ver que os conjuntos A e B no possuem elemento comum, logo,
no h necessidade de haver uma regio em comum para os dois conjuntos.

No diagrama do grfico 11, indicamos o conjunto universo explicitamente, mas tal indicao
nem sempre necessria, ele pode o mesmo ser implicitamente denotado, conforme vimos no
grfico 10.

A B
c d
e i
f
a

o u
g

Grfico 11 Representao de dois conjuntos sem interseo e conjunto universo indicado explicitamente.

Outra situao de interesse que fica bastante fcil de visualizar o caso em que temos um conjunto
A cujos elementos pertencem tambm a um conjunto B maior, ou seja, quando A est contido em B.
Essa situao est descrita no grfico 12. Note que o conjunto B tem 3 elementos, todos que esto em
sua elipse, ou seja, B = {a, b, c}.

c A

a b

Grfico 12 Representao de um conjunto contido em outro.

To importante quanto saber montar um diagrama de Venn saber extrair as informaes


apresentadas. Para desenvolver tal habilidade, vamos agora efetuar a leitura detalhada de um diagrama
com grau de complexidade maior do que os anteriores.

84
ESTATSTICA

O grfico 13 traz um diagrama de Venn em que temos trs conjuntos, A, B e C, pertencentes ao


conjunto universo das letras de nosso alfabeto. Como h diversas regies representadas, vamos comentar
cada uma delas. Desse modo, faremos a leitura detalhada do diagrama.

A regio central, que pertence aos trs crculos, traz os elementos a e b. Portanto, esses so os
elementos que pertencem aos trs conjuntos A, B e C.
Na regio comum a A e B, mas externa ao crculo C, temos os elementos d e e. Portanto, esses so
os elementos que pertencem aos conjuntos A e B, mas no pertencem a C.
Na regio comum a B e C, mas externa ao crculo A, temos os elementos f e g. Portanto, esses so
os elementos que pertencem aos conjuntos B e C, mas no pertencem a A.
Na regio comum a A e C, mas externa ao crculo B, temos o elemento c. Portanto, esse elemento
pertence aos conjuntos A e C, mas no pertence a B.
Na regio que pertence ao crculo de A, mas no aos demais crculos, temos os elementos h, i, j.
Na regio que pertence ao crculo de B, mas no aos demais, temos o elemento k.
Na regio que pertence ao crculo de C, mas no aos demais, temos os elementos m, n, o, p, q, r, s e t.
Os elementos representados dentro do quadrado que no esto dentro de nenhum dos crculos
pertencem ao universo considerado, mas no pertencem aos conjuntos A, B ou C.

Por fim, vamos especificar cada um dos conjuntos A, B e C. A leitura do diagrama nos mostra que: A
= {a, b, c, d, e, h, i, j}, B = {a, b, d, e, f, g, k} e C = {a, b, c, f, g, m, n, o, p, q, r, s, t}.

A
h i
j
B
c
d e
m a b
n
o u
p q f g k
r s v w
C t w x y z

Grfico 13 Representao de trs conjuntos sem interseo.

Muito embora a leitura de um diagrama como esse no seja conceitualmente complicada, quando temos
um nmero grande de elementos no conjunto universo, a construo e a leitura de tais diagramas comea
a perder sua funo prtica, por excesso de elementos. Alm disso, na maioria das vezes a informao de
maior interesse o nmero de elementos em cada regio, sem que haja necessidade de sabermos quais
so exatamente os elementos em cada uma delas. Isso particularmente verdade quando o interesse
calcular probabilidades. Assim, usual utilizarmos esses diagramas colocando em cada regio a contagem
de elementos em lugar dos elementos em si, o que faremos na prxima seo.
85
Unidade IV

Diagramas com contagem dos elementos

Vamos agora reapresentar os diagramas de Venn vistos at o momento com a contagem de elementos
referente a cada regio e vamos ver tambm como utilizar esses diagramas para extrair informaes
sobre os conjuntos.

Dada a importncia desta leitura e sabendo que a compreenso s vezes difcil para muitos alunos,
vamos apresentar um grande nmero de exemplos com explicaes passo a passo.

No grfico 14, temos a contagem dos elementos que foram apresentados no grfico 9. Ali cada
campo interno s elipses tem dois elementos.

importante notar que os nmeros colocados no diagrama de contagem no so mais os elementos


do conjunto, mas sim o nmero de elementos alocados em cada regio. Para que isso fique claro,
observe novamente o diagrama do grfico 9.

Ou seja:

A interseo de A e B tem 2 elementos: {2, 4}.


O conjunto A tem 2 elementos que no pertencem ao conjunto B: {1, 3}.
O conjunto B tem 2 elementos que no pertencem ao conjunto A: {6, 8}.
Todos os elementos do conjunto universo pertencem ao conjunto A ou ao conjunto B.

A partir disso, podemos realizar a contagem de elementos de cada conjunto:

O conjunto A tem os 2 elementos que no pertencem ao conjunto B mais 2 elementos que


pertencem a ele somente, logo nA= 4.
O conjunto B tem os 2 elementos que no pertencem ao conjunto A mais 2 elementos que
pertencem a ele somente, logo nB= 4.
O conjunto universo tem os 2 elementos que pertencem somente ao conjunto A, 2 elementos que
pertencem somente ao conjunto B e mais 2 elementos que pertencem aos dois, logo ntot= 6.

A B

2 2 2

Grfico 14 Representao com a contagem de elementos dos conjuntos dados no grfico 9.

86
ESTATSTICA

Fazendo agora o mesmo processo para o grfico 10, construmos o diagrama com a contagem de
elementos do grfico 15.

Na comparao com o grfico 14, temos como nica diferena o fato de haver 2 elementos que
so do universo considerado, mas no fazem parte de A nem de B. Logo, tudo o que foi dito para A e B
quando lemos o grfico 14 permanece vlido para o grfico 15.

A alterao se d na contagem do nmero de elementos do universo, que acrescido de 3 elementos.


Assim, temos:

O conjunto A tem os 4 elementos que esto dentro de sua regio, ou seja: nA = 4.


O conjunto B tem os 4 elementos que esto dentro de sua regio, ou seja: nB = 4.
O conjunto universo tem os 6 elementos que pertencem unio dos conjuntos A e B mais os 3
elementos que pertencem somente a ele. Portanto: ntot = 9.

Na prtica, para obtermos os valores acima, apenas somamos os nmeros que aparecem dentro da
regio de interesse.

A B

2 2 2

Grfico 15 Representao com a contagem de elementos dos conjuntos dados no grfico 10.

No grfico 16 colocamos as contagens referentes ao grfico 11. Nesse caso, como os conjuntos A e B
so disjuntos, a determinao de seu nmero de elementos consiste simplesmente em ler o nmero de
elementos na regio pertencente a cada um. O nmero de elementos do conjunto universo ser a soma
dos nmeros escritos no diagrama.

Assim, teremos: nA = 1, nB = 4 e ntot = 9.

A B

1 4

U
Grfico 16 Representao com a contagem de elementos dos conjuntos dados no grfico 11.

87
Unidade IV

Para o diagrama apresentado no grfico 17, a leitura nos dar os valores: nA = 2, nB = 3 e ntot = 3, visto
que todos os elementos do conjunto universo fazem parte do conjunto B.

Note ainda que o nmero zero colocado no diagrama tem o papel de indicar que aquela
regio no tem nenhum elemento. Em princpio, poderamos deixar a regio em branco, mas, na
prtica, quando vamos preencher diagramas mais indicado que o valor zero seja indicado, pois
a ausncia de contagem pode fazer crer que, durante a anlise, se tenha esquecido de considerar
aquela regio.

B
1
A

Grfico 17 Representao com a contagem de elementos dos conjuntos dados no grfico 12.

O caso com trs conjuntos, A, B e C, apresentado no grfico 18 a partir do diagrama de elementos


do grfico 13 exige uma leitura mais cuidadosa, logo, vamos efetu-la passo a passo.

Em primeiro lugar, notamos que em cada regio est colocado o nmero de elementos
correspondente, do mesmo modo que nos demais diagramas j apresentados nesta seo. O
aluno que tem dificuldade na construo e leitura de diagramas de Venn deve buscar construir
o diagrama a partir do original, de modo a compreender de maneira apropriada o significado de
cada regio dele.

Fazendo a leitura individual de cada regio, teremos:

Elementos que no pertencem a A, B ou C: 7.


Elementos pertencentes a A, B e C: 2.
Elementos pertencentes a A e B, mas no a C: 2.
Elementos pertencentes a B e C, mas no a A: 2.
Elementos pertencentes a A e C, mas no a B: 1.
Elementos pertencentes somente a A: 3.
Elementos pertencentes somente a B: 1.
Elementos pertencentes somente a C: 8.

88
ESTATSTICA

B
1 2
2
8
2 1

C
7

Grfico 18 Representao com a contagem de elementos dos conjuntos dados no grfico 13.

Feita a leitura dos campos individualmente, passamos agora a ver situaes que englobam mais de
um campo e que, eventualmente, geram dvidas quando vamos utilizar esses diagramas.

Nos exemplos que seguem, vamos utilizar o artifcio de deixar em branco somente os campos que
contm elementos que sero contados na situao descrita, facilitando a compreenso do uso do
diagrama.

Vamos agora ver como determinar o nmero de elementos nos conjuntos A, B e C.

Se quisermos saber quantos elementos pertencem ao conjunto A, temos que somar os nmeros
que esto dentro do crculo A, conforme ilustramos no grfico 19. A quantidade de elementos no
conjunto A ser a soma de todos os elementos que esto dentro de seu crculo, nA = 3 + 2 + 2 + 1,
logo, nA = 8, o que pode ser facilmente confirmado se olharmos os elementos de conjunto A colocados
no grfico 13.

B
1 2
2
8
2 1

C
7

Grfico 19 Representao com a contagem de elementos dos conjuntos dados no grfico 13, enfatizando o conjunto A.

Se procedermos da mesma maneira, somando os elementos de cada campo do respectivo crculo,


encontraremos nB = 7 e nC = 13.

89
Unidade IV

Muitas vezes, de interesse verificar algumas situaes que envolvem algumas caractersticas que
no esto dadas em um campo ou no crculo completo. Por exemplo, podemos querer o nmero de
elementos que pertence a cada um dos conjuntos. Nesse caso, teremos que somar os elementos que
pertencem somente a A com os pertencentes apenas a B e os que so apenas de C, obtendo n = 3 + 1
+ 8 = 12. Essa situao est ilustrada no grfico 20.

B
1 2
22
8
2 1

C
7

Grfico 20 Representao com a contagem de elementos dos conjuntos dados no grfico 13,
enfatizando os elementos que pertencem a cada um dos conjuntos A, B e C.

Outra situao de interesse saber quantos elementos pertencem a B e C, ou seja, interseo de C


e B. Temos essa situao ilustrada no grfico 21.

B
1 2
2
8
2 1

C
7

Grfico 21 Representao com a contagem de elementos dos conjuntos dados no grfico 13,
enfatizando os elementos que pertencem a B e C.

Um ltimo exemplo de interesse o caso em que a caracterstica que se busca definida a


partir da excluso. Por exemplo, quero saber quantos so os elementos que no pertencem ao
conjunto B. Procedemos ento como se retirssemos o crculo B de dentro da figura e contssemos
os elementos restantes, conforme ilustramos no grfico 22. Teremos assim o nmero em questo,
que a soma de todos os que esto nos campos no sombreados, resultando em um total de 19
elementos.

90
ESTATSTICA

B
1 2
2
8
2 1

C
7

Grfico 22 Representao com a contagem de elementos dos conjuntos dados no grfico 13,
enfatizando os elementos que no pertencem a B.

7.1.4 Aplicao

Visto como utilizar os diagramas de Venn para contagem de elementos, passaremos a ver algumas
aplicaes mais realistas com o uso das informaes para calcular probabilidades.

Convidados para festa conjunta de dois amigos

Para ilustrar a montagem do diagrama e comearmos a calcular as probabilidades a partir das


informaes ali expressas, comearemos com uma variante da situao j discutida anteriormente.

Suponhamos que, em outra festa conjunta, participam 45 convidados de Paulo e 35 convidados de


Luiz, havendo 15 pessoas que constam das duas listas. Alm disso, acompanhando os convidados, vo
festa 5 pessoas que nenhum deles conhece.

Em primeiro lugar, colocamos as informaes em uma tabela para organiz-las de modo a termos
mais clareza. Novamente, chamaremos de P e L os conjuntos de convidados de Pedro e Luiz.

P L PeL Nenhum
45 35 15 5

Comecemos agora a organizar essas informaes no diagrama. Em primeiro lugar, como h dois conjuntos
L e P de maior interesse, e que tm interseo, utilizaremos o diagrama com 2 elipses, como segue:

P L

91
Unidade IV

O nmero mais fcil de colocarmos no diagrama aquele referente aos acompanhantes, pois ficaro
fora das elipses:

P L

O prximo nmero a ser colocado o de convidados de ambos os anfitries na regio pertencente


aos dois conjuntos P e L:

P L

15

Sabemos que so 45 os convidados de Paulo, mas 15 j esto no diagrama, logo, faltam 30, que so
convidados somente de Paulo:

P L

30 15

Por fim, temos os convidados somente de Luiz, que so 35 menos os 15 convidados em comum,
que j esto representados no diagrama. Logo, teremos como representao diagramtica com todos os
dados o grfico a seguir:

P L

30 15 20

92
ESTATSTICA

Tendo essas informaes, podemos calcular o nmero total de participantes da festa sem o risco de
contar nenhuma pessoa duas vezes.

ntot = 30 + 15 + 20 + 5

ntot = 70

De posse dessas informaes, passamos a calcular algumas probabilidades:

Qual a probabilidade de um convidado da festa ser amigo de Luiz?

Para calcular essa probabilidade P(L), devemos dividir o nmero de convidados de Luiz (nL) pelo
nmero total de convidados (ntot).
Temos nL = 35 e ntot = 70, logo, P(L) = 35/70.
P(L) = 0,5
Se houver preferncia pela notao percentual, P(L) = 50%.

Qual a probabilidade de um convidado da festa ser amigo de ambos?

Para calcular P(ambos), devemos dividir o nmero de convidados de ambos (nambos) pelo nmero
total de convidados (ntot).
Temos ento nambos = 15 e ntot = 70, logo, P(L) = 15/70.
P(ambos) = 0,21, aproximadamente.
Em notao percentual, P(ambos) = 21%.

Qual a probabilidade de um convidado da festa no ser amigo de Pedro?

Para calcular P(no P), devemos dividir o nmero de convidados que no faz parte do conjunto P
(nnP) pelo nmero total de convidados (ntot).
Para calcular nnP,temos duas possibilidades. A primeira subtrair do total o nmero de amigos de
Pedro, assim: nnP = 70 45 = 25.
A segunda possibilidade somar os nmeros dos campos que no fazem parte do conjunto P, ou
seja, nnP = 20 + 5 = 25.
A probabilidade ser P(nP) = nnP/ntot, logo, P(L) = 25/70.
P(nP) = 0,36, aproximadamente.
Em notao percentual, P(nP) = 36%.

93
Unidade IV

Nos exemplos anteriores, calculamos probabilidades considerando todos os participantes da festa.


Agora, veremos um exemplo em que consideramos um universo mais restrito.

Qual a probabilidade de um convidado de Luiz ser tambm amigo de Pedro?

Para calcular essa probabilidade, temos como universo no mais a totalidade dos convidados, mas
apenas aqueles que so amigos de Luiz. Esquematicamente, como se passssemos a utilizar um
diagrama apenas com os elementos pertencentes a L:

P L

30 15 20

Temos, ento, um novo total de eventos possveis, nesse caso, 35.


Alm disso, s vamos considerar os amigos de Pedro que tambm so amigos de Luiz e o nmero
de amigos de Pedro nesse universo mais reduzido de 15 pessoas.
Assim sendo, essa probabilidade ser P = 15/35.
P(L) = 0,43
Se houver preferncia pela notao percentual, P(L) = 43%.

Clientes de uma empresa

Vamos agora utilizar o mesmo tipo de raciocnio para discutir um exemplo um pouco mais complexo.

Suponhamos que uma empresa que desenvolve programas computacionais tenha trs produtos
mais importantes, aos quais chamaremos A, B e C.

Dos diversos clientes, temos alguns que utilizam apenas um dos programas, alguns utilizam dois
deles, outros utilizam os trs e h clientes que utilizam somente outros produtos da empresa, conforme
colocado no quadro a seguir:

A B C AeB BeC AeC A, B e C Outros


35 36 36 17 15 16 8 16

Nosso interesse aqui realizar clculos de probabilidade referentes a esse universo, logo, necessrio
que tenhamos informaes relevantes que no esto colocadas no quadro diretamente. Entre outras,
precisamos saber quantos clientes a firma tem no total.

94
ESTATSTICA

Para encontrar esse valor, o primeiro impulso seria somar os nmeros apresentados na tabela, no
entanto, a exemplo do que vimos na seo anterior, isso faria com que contssemos um mesmo cliente
mais de uma vez. Assim, vamos utilizar um procedimento anlogo ao do exemplo da festa organizando
essas informaes num diagrama de Venn com 3 crculos, cada um deles para um dos programas.

A exemplo do que fizemos anteriormente, o primeiro valor a colocar o nmero de clientes que
no usa os programas A, B ou C. O outro nmero que podemos colocar tambm imediatamente o dos
clientes que utilizam os 3. Desse modo, teremos:

C
16

Passamos agora ao preenchimento dos campos em que h usurios de 2 programas. Para isso, temos que
descontar do valor dado no quadro os 8 usurios que utilizam os 3 programas e j foram alocados no diagrama.

17 usam A e B. Destes, 8 utilizam tambm C. Logo, 9 utilizam somente A e B.


15 usam B e C. Destes, 8 utilizam tambm A. Logo, 7 utilizam somente B e C.
16 usam A e C. Destes, 8 utilizam tambm C. Logo, 8 utilizam somente A e B.

Colocando essas informaes no diagrama, temos:

B
8 9
8

7
C
16

Por fim, vamos ver agora quantos elementos h que utilizam somente um dos programas.

O programa A tem 35 usurios, dos quais j esto representados 25. Note que no diagrama anterior
j h 25 elementos representados dentro do crculo A. Portanto, h 10 clientes que utilizam
somente o programa A.
95
Unidade IV

O programa B tem 36 usurios, dos quais j esto representados 24 dentro do crculo correspondente.
Portanto, h 12 clientes que utilizam somente o programa B.
O programa C tem tambm 36 usurios, dos quais 23 j esto representados dentro do crculo
correspondente. Portanto, h 13 clientes que utilizam somente o programa C.

Com isso, temos agora o diagrama completo:

10

B
8 9
8
13
12
7
C
16

Para sabermos o nmero total de clientes, basta somar todos os nmeros dados no diagrama e
teremos ntot = 80. Note que essa soma inclui os 64 usurios de A, B ou C e tambm os 16 que utilizam
apenas outros produtos, mas tambm so clientes da empresa.

De posse de todas as informaes, podemos agora utiliz-las na determinao de probabilidades.


Vejamos alguns exemplos.

Qual a probabilidade de um cliente utilizar o programa A?

Eventos favorveis a A: 35.


Eventos possveis: 80.
Probabilidade: P = 35/80.
Probabilidade: P = 0,4375 ou P = 43,75%.

Qual a probabilidade de um cliente utilizar somente o programa A?

Eventos favorveis a somente A: 10.


Eventos possveis: 80.
Probabilidade: P = 10/80.
Probabilidade: P = 0,125 ou P = 12,5%.

96
ESTATSTICA

Qual a probabilidade de um cliente utilizar dois dos programas principais?


Eventos favorveis a usar os dois principais: 9 + 7 + 8 = 24.
Eventos possveis: 80.
Probabilidade: P = 24/80.
Probabilidade: P = 0,3 ou P = 30%.

Qual a probabilidade de um cliente no utilizar nenhum dos programas principais?


Eventos favorveis a no usar os principais: 16.
Eventos possveis: 80.
Probabilidade: P = 16/80.
Probabilidade: P = 0,2 ou P = 20%.

Qual a probabilidade de um cliente no utilizar o programa B ou C?


Eventos favorveis a no usar B ou C (sero os que usam apenas A somados aos que no usam
nenhum dos trs): 12 + 16 = 28.
Eventos possveis: 80.
Probabilidade: P = 28/80.
Probabilidade: P = 0,35 ou P = 35%.

Os exemplos anteriores consideraram sempre como conjunto universo todos os clientes da empresa,
mas, assim como fizemos na seo anterior, possvel analisar situaes em que haja restrio do
conjunto. Por exemplo, se quisermos saber apenas como se comportam os clientes do programa A com
relao utilizao dos outros. Nesse caso, o universo considerado ser apenas o conjunto representado
no crculo A:

10

B
8 9
8
13
12
7
C
16

97
Unidade IV

Qual a probabilidade de um usurio de A utilizar tambm B?

Eventos favorveis a usar B: 9 + 8 = 17 (somente os usurios de B que pertencem ao crculo A).


Eventos possveis: 35.
Probabilidade: P = 17/35.
Probabilidade: P = 0,4857 ou P = 48,57%.

Qual a probabilidade de um usurio de A no utilizar B ou C?

Eventos favorveis a no usar B ou C: 10 (os usurios de A somente).


Eventos possveis: 35.
Probabilidade: P = 10/35.
Probabilidade: P = 0,2857 ou P = 28,57%.

Qual a probabilidade de um usurio de A no utilizar C?

Eventos favorveis a no usar B: 9 (os usurios de B somente).


Eventos possveis: 35.
Probabilidade: P = 9/35.
Probabilidade: P = 0,2571 ou P = 25,71%.

7.2 Propriedades importantes

Agora que j h mais familiaridade com o conceito de probabilidade e com a maneira de calcul-la,
vamos formalizar algumas propriedades importantes.

7.2.1 Eventos mutuamente exclusivos

Chamamos de eventos mutuamente exclusivos ou excludentes, aqueles cujo acontecimento implica


na no ocorrncia do outro. Ou seja, se dois eventos A e B so mutuamente exclusivos, quando A ocorre
necessrio que B no ocorra.

Podemos citar como exemplos: face cara e face coroa, pois quando temos um resultado, certamente
no teremos o outro na mesma jogada; chover e no chover; viajar e ficar em casa; obter as diferentes
faces num jogo de dado etc.

Nos casos citados, a probabilidade de acontecer um ou outro evento ser a soma das probabilidades
de cada evento.

P(A ou B) = P(A) + P(B)


98
ESTATSTICA

Jogo de dado

Num jogo de dado, os eventos so mutuamente exclusivos, pois a obteno de uma face implica
em no termos obtido nenhuma das outras, logo, podemos utilizar a propriedade anterior para obter a
probabilidade de tirar um nmero par.

Qual a probabilidade de o resultado ser par?

Faces pares: 2, 4 e 6.
Probabilidade de cada face: P(2) = 1/6, P(4) = 1/6, P(6) = 1/6.
P(par) = P(2 ou 4 ou 6) = P(2) + P(4) + P(6).
P(par) = 1/6 + 1/6 + 1/6 = 3/6
P(par) = 0,5 ou P(par) = 50%

Esse exemplo j foi resolvido anteriormente de outra maneira. A comparao das duas formas pode
ser ilustrativa na compreenso da propriedade que utilizamos nesta segunda resoluo.

7.2.2 Eventos complementares

So eventos complementares aqueles em que a ocorrncia de um ou de outro engloba todos os


eventos possveis. Por exemplo: no jogo de moeda, os eventos cara e coroa so complementares. No jogo
de dado, teramos como complementares face 2 e no obter face 2.

Quando dois eventos foram complementares, a soma de suas probabilidades ser 1.

P(A) + P(no A) = 1

Informalmente, podemos dizer que temos certeza (P = 100%) de que o evento A ocorrer ou no
ocorrer. Tomando os exemplos anteriores teramos: a moeda cai cara ou no cai cara; o dado d a face
2 ou outra face qualquer etc.

usual em algumas situaes chamar de p minsculo a probabilidade de ocorrncia (ou sucesso) e


de q a probabilidade de no ocorrer (ou insucesso).

Desse modo, com a soma p + q = 1, temos:

q=1-p

Previso do tempo

Um jornal traz a informao de que a previso de chuva de 20%. Qual a probabilidade de no


chover?
99
Unidade IV

Chover e no chover so complementares.


Chamo a probabilidade de chuva de p, logo, p = 0,2.
Chamo a probabilidade de no chuva de q.
q=1-p
q = 1 - 0,2
q = 0,8

Ou seja, a probabilidade de no chover de 80%.

7.2.3 Eventos independentes

Chamamos de eventos independentes aqueles cujo acontecimento no interfere na probabilidade


de outro acontecer. Quando dois eventos como A e B so independentes, a probabilidade de ambos
ocorrerem ser dada pelo produto das probabilidades:

P(A e B) = P(A).P(B)

Jogo de dado e moeda

Podemos tomar como exemplo o jogo de uma moeda e de um dado. Em primeiro lugar, verificamos
que os eventos so independentes, visto que o resultado do jogo de um no interfere no resultado que
se obtm ao jogar o outro. Assim, a probabilidade de ocorrer um resultado especfico em uma jogada
ser dada pelo produto das probabilidades dos dois eventos.

Qual a probabilidade de o resultado dar cara e cinco?

Como j vimos: P(K) = 1/2 e P(5) = 1/6.


Probabilidade de faces cara e cinco: P(K e 5) = 1/2 . 1/6.
P(K e 5) = 1/12

Para entendermos melhor o resultado: uma vez obtida a face desejada, temos ainda duas
possibilidades de resultado da moeda, o que faz a probabilidade do resultado 5 e cara ser metade
da probabilidade de resultado 5. De outro modo, uma vez obtida a face cara, h seis possibilidades
de resultado do dado, logo, a probabilidade do resultado especfico ser um sexto da probabilidade
de tirar cara na moeda.

Para qualquer dos dois raciocnios, o resultado ser a multiplicao das probabilidades, conforme
estabelece a propriedade.

100
ESTATSTICA

Gnero e compra de computador

O uso da propriedade anterior no se limita a casos analticos, ento, vejamos agora um exemplo
com dados de tipo emprico.

Uma loja de informtica vende 1 computador a cada 20 clientes que entram na loja. De seus clientes,
cerca de 40% so mulheres.

Computadores so vendidos para homens e para mulheres, assim, podemos considerar os eventos
independentes para efetuar o clculo a seguir.

Qual a probabilidade de um cliente que entre na loja ser uma mulher que compre um
computador?

Probabilidade de ser mulher: P(M) = 40% ou P(M) = 0,4.


Probabilidade de comprar computador: P(c) = 1/20 ou P(c) = 0,05.
Como os eventos so independentes, a probabilidade de ambos ocorrerem ser o produto das
probabilidades de cada evento.
P(M e c) = 0,4 * 0,05 = 0,02 ou P(M e c) = 2%.
Ou seja, a cada 100 clientes, h 2 mulheres que adquirem um computador.

Qual a probabilidade de um cliente que entre na loja ser um homem que compre um
computador?

Eventos ser homem e ser mulher so complementares.


Probabilidade de ser homem: P(M) = 1 - P(H) ou P(M) = 1 - 0,4.
P(H) = 0,6
Probabilidade de comprar computador: P(c) = 1/20 ou P(c) = 0,05.
Como os eventos so independentes, a probabilidade de ambos ocorrerem ser o produto das
probabilidades de cada evento.
P(M e c) = 0,6 * 0,05 = 0,03 ou P(M e c) = 3%
Ou seja, a cada 100 clientes, h 3 homens que adquirem um computador.

7.2.4 Eventos no mutuamente excludentes

Quando dois eventos, A e B, podem ocorrer simultaneamente, isso implica em termos interseo no
vazia entre os conjuntos A e B. Nesse caso, a probabilidade de ocorrer um ou outro evento ser dada por:

P(A ou B) = P(A) + P(B) P(A e B)

101
Unidade IV

Vimos diversos casos desse tipo na seo 7.4. Essa propriedade traduz formalmente o fato de haver
elementos comuns que seriam contados duas vezes.

Convidados da festa

Retomando o exemplo da festa, para calcular a probabilidade de o convidado ser amigo de Pedro ou
de Luiz utilizando a propriedade citada, teramos:

Total de convidados: ntot = 70.

Probabilidade de ser amigo de Pedro:

P(P) = 45/70
P(P) = 0,643

Probabilidade de ser amigo de Luiz:

P(P) = 35/70
P(P) = 0,5

Probabilidade de ser amigo de ambos:

P(P) = 15/70
P(P) = 0,214

Probabilidade de ser amigo de Pedro ou de Luiz:

P = 0,643 + 0,5 - 0,214


P = 0,93

Para ilustrar o significado da probabilidade obtida, podemos utilizar os dados do exemplo em que
vimos haver, das 70 pessoas presentes na festa, apenas 5 que no so amigas de nenhum deles, ou seja,
h 65 amigos de um dos dois, logo:

Probabilidade de ser amigo de Pedro ou de Luiz:

P = 65/70
P = 0,93

Obviamente, como tnhamos acesso aos nmeros de convidados, esse caminho mais fcil de
utilizar, no entanto, o objetivo aqui era o de ilustrar a validade da propriedade. Alm disso, quando
temos somente as probabilidades, sua utilizao necessria.

102
ESTATSTICA

7.3 Distribuies de probabilidade

Para dar continuidade a nosso estudo de probabilidades, vamos agora discutir como se
constroem alguns modelos estatsticos que trazem como informao as probabilidades
de todos os eventos possveis para certo universo estudado, as chamadas distribuies de
probabilidade.

Nesta disciplina estudaremos duas das principais distribuies: a binomial e a normal.

Como vimos no clculo de probabilidades, muitas vezes preciso analisar a situao de modo a
podermos contar ou nmero de eventos. Veremos, a seguir, como realizar tais contagens em uma srie
de situaes, para que mais adiante possamos compreender a primeira distribuio de probabilidades
que abordaremos: a distribuio binomial.

A outra distribuio a ser estudada, chamada de normal, retomar os conceitos de mdia e desvio-padro
vistos anteriormente e os utilizar para estimar probabilidades de faixas de valores. Para facilitar a
compreenso, discutiremos antes dela alguns conceitos importantes a partir da distribuio
uniforme.

7.4 Anlise combinatria

A anlise combinatria utilizada para realizar a contagem do nmero de eventos em uma situao
dada. Seu estudo nos permitir, ao final, ter o ferramental matemtico necessrio para compreender a
distribuio binomial.

7.4.1 Princpio da multiplicao

Nesta seo vamos discutir algumas situaes que ilustram o fato de utilizarmos multiplicaes para
a contagem dos eventos.

Exemplo 1: Combinando roupas

Comecemos a estudar a anlise combinatria a partir de um exemplo simples: determinar quantos


conjuntos diferentes se podem obter com 2 calas e 5 blusas.

Temos cinco possibilidades de escolha de calas e, para cada cala, h duas possibilidades de escolha
de blusa. O quadro a seguir sintetiza essa anlise:

5 * 2 = 10
calas blusas conjuntos

Assim sendo, h 10 possibilidades de combinarmos roupas utilizando essas peas.

103
Unidade IV

Exemplo 2: Arrumao de mesa de festa

Suponha agora que um buf tem disponveis, para a arrumao das mesas, trs tipos de pratos, um
faqueiro prateado e outro dourado e quatro modelos de toalhas. De quantas maneiras diferentes se
podem arrumar as mesas usando esses artigos?

Para responder a essa pergunta, novamente recorremos ao princpio da multiplicao:

5 * 2 * 4 = 40
pratos talheres toalhas conjuntos

H, portanto, 40 possibilidades de arrumao de mesa.

Para ilustrarmos a utilizao desse tipo de resultado no clculo de probabilidades, verificamos que a
probabilidade de um cliente vir a escolher certa combinao especfica ser dada por:

P = 1/40, logo P = 0,0025 ou P = 2,5%.

Note que o resultado anterior supe que todas as arrumaes fiquem igualmente harmnicas, de
modo tal que a escolha de todas elas seja igualmente provvel.

Exemplo 3: Prova de mltipla escolha

Outro exemplo de contagem dessa forma calcular quantas so as possibilidades de respostas em


uma prova de mltipla escolha.

Suponhamos uma prova de 4 questes, com 5 alternativas cada uma.

Utilizando o princpio da multiplicao, teremos:

5 * 5 * 5 * 5 = 625
questo 1 questo 2 questo 3 questo 4 total

Reescrevendo a conta acima de maneira mais sinttica, e chamando o nmero total de resultados
possveis de N, teramos:

N = 54, logo N = 625.

A partir disso, podemos calcular qual a probabilidade de um aluno, que escolha as respostas de
maneira aleatria, acertar todas as questes:

Existe apenas um conjunto de respostas corretas.


Existem 625 possibilidades de respostas.
104
ESTATSTICA

P = 1/625, logo P = 0,0016 ou P = 0,16%.

Suponhamos agora que a prova tenha 10 questes. Qual a probabilidade de tirar 10 na prova sem
saber nada da matria?

O nmero total de resultados ser: N = 510.


O nmero total de resultados ser: N = 9765625.
P = 1/9765625, logo P = 0,000000102 ou P = 0,0000102%.

Ou seja, se houver 10 questes, a probabilidade ser de aproximadamente 1 em 10 milhes.

7.4.2 Permutaes

Passaremos agora a utilizar a tcnica de contagem vista anteriormente para analisar casos de
permutaes, ou seja, em que h um conjunto de elementos cuja ordem ser alterada trocando-se suas
posies.

7.4.2.1 Permutas sem repetio

Como exemplo desse caso, pergunta-se: de quantas maneiras posso arrumar 4 livros em uma prateleira?

Para responder a essa pergunta, uma maneira de pensar a seguinte:

H 4 livros possveis para a primeira posio.


Para a segunda posio, como j foi colocado um livro, tenho somente 3 escolhas.
Para a terceira posio, haver 2 escolhas possveis.
A quarta posio ser ocupada pelo livro restante.

Utilizando o mesmo esquema da seo anterior, teremos:

4 * 3 * 2 * 1 = 24
posio 1 posio 2 posio 3 posio 4 total

Utilizando o mesmo tipo de raciocnio, responda: de quantas maneiras posso arrumar 8 livros em
uma prateleira?

A resposta a essa pergunta pode ser obtida seguindo o mesmo procedimento descrito anteriormente,
dessa forma, teremos:

N=8*7*6*5*4*3*2*1
N = 40320
105
Unidade IV

Poderamos utilizar esse procedimento para qualquer nmero de livros, no entanto, quando o nmero
de elementos cresce, torna-se cada vez menos prtico indicar a conta de maneira explcita. Para evitar
a necessidade de se escrever contas muito grandes, utiliza-se a notao fatorial.

Na notao fatorial, um ponto de exclamao aps o nmero indica a multiplicao sucessiva do


nmero pelo nmero anterior at que se chegue ao nmero 1. Ou seja:

4! = 4 * 3 * 2 * 1
8! = 8 * 7 * 6 * 5 * 4 * 3 * 2 * 1

Utilizando essa notao, ento teremos para permutas, num caso geral, o nmero de resultados
possveis para sequncias que envolvam n elementos ser dado por:

Pn = n!

Vale ressaltar o caso especial em que n = 0:

0! = 1

Vejamos um exemplo que ilustra esse resultado: se tivermos n = 0, ou seja, nenhum livro para
colocar na prateleira, haver apenas uma possibilidade: deixar a prateleira vazia.

7.4.2.2 Permutas com repetio

Nos exemplos anteriores, supusemos sempre que os livros em questo eram diferentes. Mas, se
houver livros iguais, haver sequncias repetidas entre as que contamos. Assim sendo, nos casos em que
h elementos repetidos, preciso dividir o nmero de permutaes encontradas pelo nmero de vezes
em que cada uma aparece.

Tomemos como exemplo o caso em que temos 5 livros, sendo que 2 deles so iguais.

Primeiro, fazemos as contas sem nos preocuparmos com as repeties:

P5 = 5! = 5 * 4 * 3 * 2 * 1 = 120
P5 = 5 * 4* 3 * 2 * 1
P5 = 120

Para analisar as repeties, escolhemos uma sequncia determinada qualquer para analisar quantas
iguais a ela haver:

Como so 2 iguais, tenho 2 posies com livros iguais.

Para a primeira posio, tenho duas escolhas de livro.


106
ESTATSTICA

O segundo livro vai no lugar restante.


Ou seja, sero 2 repeties.

Como cada resultado aparece 2 vezes, tenho, em realidade, metade das sequncias inicialmente
supostas.

Assim:

N = P5/2

N = 120/2

N = 60

Faamos agora o mesmo raciocnio para o caso de haver 3 livros iguais:

Novamente comeamos sem nos preocupar com as repeties:

P5 = 120

Para analisar as repeties, escolhemos uma sequncia determinada qualquer para analisar quantas
iguais a ela haver:

Como so 3 iguais, tenho 3 posies com livros iguais.


Para a primeira posio, tenho 3 escolhas de livro.
Para a segunda posio, tenho 2 escolhas de livro.
O terceiro livro igual vai no lugar restante.
Ou seja, sero 3! repeties.

Como cada resultado aparece 3! vezes, tenho, em realidade, um sexto das sequncias inicialmente
supostas.

Assim:

N = P5/3!

N = 120/6

N = 20

Finalmente, faamos a mesma anlise para o caso de haver 3 livros de um tipo e 2 livros de outro.

107
Unidade IV

Sem nos preocuparmos com as repeties:

P5 = 120

Temos agora duas classes de repeties, uma referente ao livro que aparece 2 vezes, outra referente
ao livro que aparece 3 vezes.

Quando h 2 iguais, o nmero de repeties 2!


Quando h 3 iguais, o nmero de repeties 3!
O nmero total de repeties ser o produto de 2! por 3!

O resultado final ser, portanto, o nmero sem repeties dividido por 2! e tambm por 3!.

Assim:

N = P5/(2!3!)

N = 120/(2*6)

N = 120/(12)

N = 10

Generalizao e formalizao

Para efetuar a contagem do nmero de sequncias possvel na permuta de n elementos temos:

Pn = n!

Lembrando que 0! = 1

Se houver elementos repetidos, preciso considerar esse fato dividindo o resultado inicial pelo
nmero de repeties, como segue:

n!
Pna,b,c... =
a!b!c!...

Onde a, b e c so o nmero de vezes em que os diferentes elementos A, B e C se repetem no conjunto.

Exemplos adicionais: anagramas

Anagramas so rearranjos de letras de uma dada palavra. O clculo do nmero de anagramas que
se pode formar com as letras de uma dada palavra so um exemplo clssico de utilizao do clculo de
permutaes. Vejamos alguns:
108
ESTATSTICA

Calcular os anagramas da palavra lpis.


Temos 5 letras, sem repetio.

N = P5
N = 5!
N = 120

Calcular os anagramas da palavra papel.


Temos 5 letras, com a letra p aparecendo 2 vezes.
2
N = P5
5!
N=
2!
120
N=
2
N = 60

Calcular os anagramas da palavra telefone.


Temos 8 letras, com a letra e aparecendo 3 vezes.

N = P83
8!
N=
3!
N= 40320
6
N = 6720

Calcular os anagramas da palavra comodidade.


Temos 10 letras, com a letra d aparecendo 3 vezes e a letra o duas vezes.

3,2
N = P10

10!
N=
3!2!
3628800
N= 6 2
N = 302400
109
Unidade IV

7.4.3 Arranjos

Vamos agora analisar situaes similares s permutas, mas com a seguinte caracterstica adicional:
h mais elementos que posies a serem ocupadas.

Por exemplo: quantos resultados possveis h num campeonato em que participem 8 atletas,
considerando as 3 primeiras posies?

Para responder a isso, procedemos de maneira similar aos exemplos referentes permuta.

Uma maneira de pensar o problema a seguinte:

H 8 atletas possveis para a primeira posio.


Para a segunda posio, como j foi atribuda a medalha de ouro, tenho somente 7
possibilidades.
Definidas as medalhas de ouro e prata, restaro 6 atletas possveis para a medalha de bronze.

Utilizando o mesmo esquema da seo anterior, teremos:

8 * 7 * 6 = 336
ouro prata bronze total

Ou seja, embora a compreenso disso seja semelhante do caso das permutaes, dado que nesse
caso utilizamos uma lgica similar, preciso buscarmos uma maneira de representar esse raciocnio para
casos gerais.

Imagine como seria escrever uma situao em que houvesse 200 elementos para ocupar 150 posies.
Ainda que o raciocnio seja o mesmo, escrever o produto de 150 nmeros no nada prtico. Vamos,
ento, buscar uma maneira de indicar a conta a ser feita de modo sinttico.

Como temos um produto de nmeros sequenciais, natural pensarmos que a formalizao utilizar
a notao fatorial.
Como esse produto vai ser truncado em algum ponto, preciso indicar esse truncamento, ou seja,
indicar at que nmero vai a multiplicao.

A maneira de escrever de forma apropriada a descrio dada acima, para um caso geral em que haja
n elementos para p posies, a seguinte:
n!
An,p =
(n p)!
Retomemos o exemplo do campeonato para compreendermos melhor a utilizao e o significado
dessa frmula.
110
ESTATSTICA

Em primeiro lugar, identificaremos os valores de n e de p:

n indica o total de elementos participantes, logo, n = 8.

p indica o total de posies a ocupar, logo, n = 3.

De posse dos valores de n e p, podemos utilizar a frmula:

Substitumos os valores de n e de p, como segue:

8!
A8,3 =
(8 3)!
Agora, efetuamos a conta indicada no denominador:

8!
A8,3 =
5!

Em seguida, expandimos os fatoriais:

8 7 6 5 4 3 2 1
A8,3 =
5 4 3 2 1

Ento, dividimos os termos que aparecem no numerador e tambm no denominador (ao que
chamamos comumente cortar):

8 7 6 54321
A8,3 =
54321

Com isso, chegamos expresso que havamos deduzido diretamente no incio desta seo:

A8,3 = 8 7 6
A8,3 = 336

Ou seja, a frmula geral dada exprime exatamente o mesmo raciocnio que foi exposto
anteriormente, mas utilizando uma notao formal e genrica que permite a descrio de qualquer
arranjo.

7.4.4 Combinaes

Neste item, vamos analisar as combinaes. Esses casos referem-se a situaes similares aos arranjos
em que a ordem seja indiferente.

111
Unidade IV

Tomando o exemplo da seo anterior, imaginemos que a ordem de classificao no importasse,


que em lugar de 3 medalhas fossem 3 vagas para as olimpadas. Desse modo, importariam somente
quais seriam os classificados e teramos situao equivalente quando os mesmos 3 atletas fossem
selecionados para formar a equipe. Nossa contagem consideraria isso dividindo a contagem referente ao
arranjo pelo nmero de possibilidades de haver um mesmo trio classificado, ou seja, temos que dividir
por 3! o resultado do arranjo, como veremos a seguir.

Pergunta-se, portanto, de quantas maneiras se pode formar uma equipe de 3 atletas escolhendo 3
entre 8?

Para responder a isso, comeamos novamente os clculos de maneira similar aos exemplos referentes
permuta.

H 8 atletas possveis para a primeira posio, 7 para a segunda e 6 para a terceira.

8 * 7 * 6 = 336
vaga 1 vaga 2 vaga 3 total

Como todas as vagas so equivalentes, a equipe ABC a mesma que BCA, por exemplo.

O nmero de repeties no caso em que h 3 posies ser dado por 3 * 2 * 1, ou seja, 3!


876
Desse modo, nossa contagem fica sendo: N =
3!
336
Efetuando as multiplicaes, temos N =
6
Logo, N = 56.

Novamente, para que seja vivel descrever qualquer situao similar, preciso buscar uma maneira
de representar esse raciocnio para casos gerais, a exemplo do que fizemos para os arranjos.

Como a diferena entre a contagem dos arranjos e a das combinaes se d pela diviso do nmero
de repeties, ento a maneira apropriada de escrever a contagem descrita anteriormente para um caso
geral em que haja n elementos para p posies a seguinte:

n!
Cn,p =
p! (n p)!

Retomemos o exemplo para compreender melhor a utilizao dessa frmula.

Em primeiro lugar, identificaremos os valores de n e de p:

n indica o total de elementos participantes, logo, n = 8.

p indica o total de posies a ocupar, logo, p = 3.


112
ESTATSTICA

De posse dos valores de n e p, podemos utilizar a frmula:

Substitumos os valores de n e de p, como segue:


8!
C8,3 =
3! (8 3)!

Agora, efetuamos a conta indicada no denominador e teremos:

8!
C8,3 =
3!5!

Em seguida, expandimos os fatoriais:

8 7 6 5 4 3 2 1
A8,3 =
3 2 1 5 4 3 2 1

Ento, dividimos os termos que aparecem no numerador e tambm no denominador:

876 5 4 3 2 1
A8,3 =
3 2 1 5 4 3 2 1

Com isso, chegamos expresso que havamos deduzido diretamente no incio desta seo:
876
C8,3 =
3 2 1
C8,3 = 56

7.5 Distribuies de probabilidade

As distribuies de probabilidade so modelos estatsticos que descrevem as probabilidades dos


diversos resultados de um determinado universo ou espao amostral.

Assim como no estudo de anlise combinatria, h situaes de interesse que possuem caractersticas
tais que permitem um tratamento comum. Na contagem, os casos vistos foram as permutas, os arranjos
e as combinaes.

Nas distribuies de probabilidade veremos tambm dois casos de maior interesse: a distribuio
binomial e a distribuio normal.

Observao

H diversos tipos de distribuio de probabilidades, mas no buscamos um


estudo exaustivo do tema, vamos enfocar somente os dois de maior interesse.
113
Unidade IV

7.5.1 Variveis aleatrias

Uma varivel aleatria aquela cujo valor depende de fatores imponderveis do acaso.

So variveis aleatrias o resultado de um sorteio, a quantidade de pessoas que passar numa rua
num determinado horrio, o horrio em que a chuva comea etc.

7.5.2 Tipos de distribuio

Podemos classificar a distribuio de probabilidades de acordo com o carter de sua varivel.

Distribuies discretas

Quando a varivel aleatria em estudo discreta, a distribuio de probabilidades correspondente


tambm ser discreta.

A distribuio de probabilidades, nesse caso, ser dada pela probabilidade de cada um dos valores
possveis especficos.

Existem diversas distribuies discretas, dadas pela natureza da situao estudada. Neste curso
estudaremos somente a distribuio binomial.

Distribuies contnuas

Quando a varivel aleatria em estudo contnua, a distribuio de probabilidades correspondente


tambm ser contnua.

Quando a varivel contnua, no tratamos mais de probabilidades referentes a valores individuais,


mas sim referentes a intervalos de valores. A distribuio de probabilidades nesses casos nos dar a
probabilidade de encontrar o valor da varivel dentro de certo intervalo.

Tambm existem diversas distribuies contnuas, dadas pela natureza da situao estudada, mas,
em virtude da natureza desta disciplina, abordaremos apenas a distribuio normal.

Observao

O tipo de distribuio depender, entre outros fatores, do tipo de


grandeza que estamos estudando.

7.6 Distribuio binomial

A distribuio binomial se aplica a situaes que possuem as seguintes caractersticas:


114
ESTATSTICA

A varivel aleatria discreta.


n eventos so independentes.
Para cada evento, dois resultados possveis e complementares (sucesso e insucesso).

Probabilidade de sucesso (de ocorrer o evento escolhido): p.


Probabilidade de insucesso (de no ocorrer o evento escolhido): q.
q=1-p

Quando esses requisitos so atendidos, a distribuio binomial nos d a maneira de calcular a


probabilidade de que o evento escolhido ocorra um nmero p de vezes, sendo que essa quantidade
poder variar entre 0 e n.

Buscando construir a distribuio, vamos utilizar um exemplo de fcil visualizao. Depois de


formalizado o clculo, resolveremos outros exemplos.

7.6.1 Jogo de n moedas

Para construir a distribuio binomial, tomemos como exemplo o jogo de n moedas. Note-se,
inicialmente, que esse exemplo atende aos requisitos listados anteriormente.

No jogo de uma nica moeda, o resultado da jogada um impondervel. Podemos escolher como
varivel aleatria o nmero de faces cara obtidas, ao que chamaremos k. Em n jogadas ou eventos,
teremos certo nmero k de moedas que terminem com a face cara para cima, variando entre 0 e n.
Assim, a distribuio de probabilidades consistir em analisar qual a probabilidade de obtermos cada
um dos resultados k.

O resultado face cara ser considerado um sucesso, e sua probabilidade ser p = 0,5. O resultado face
coroa significa a no ocorrncia de face cara, logo, o chamaremos de insucesso, com probabilidade q.
Como os eventos so complementares, temos q = 1 - p e, portanto q = 0,5.

Utilizando essas informaes buscaremos a expresso geral a partir das expresses referentes a
n = 1, n = 2 e n = 3.

Jogo de 1 moeda (n = 1)

Como estamos considerando o jogo de somente uma moeda, os valores possveis dessa varivel
sero k = 0 e k = 1. Formalmente, podemos construir a distribuio de probabilidades para a obteno
de face cara no jogo de uma moeda da seguinte forma:

115
Unidade IV

Probabilidade de nenhuma face cara:

k=0

P(0) = p, logo, P(0) = 0,5.

Probabilidade de uma face cara:

k=1

P(1) = q, logo, P(1) = 0,5.

Em resumo:

k P(k)
0 0,5
1 0,5
0,6

0,5

0,4

0,3

0,2

0,1

0
0 1

Jogo de 2 moedas (n = 2)

Como temos 2 moedas, os valores da varivel escolhida sero k = 0, k = 1 e k = 2. Lembrando


que os eventos so independentes, visto que o fato de uma moeda cair com certa face para
cima no interferir na face que ficar para cima da outra moeda, ento a probabilidade de um
resultado especfico para o conjunto ser dada pelo produto das probabilidades de cada resultado
especfico.

Ou seja, se escolho como resultado que a primeira moeda ter face cara e a segunda moeda
face coroa, a probabilidade desse resultado especfico do conjunto ser dada pelo produto da
probabilidade de a primeira ser cara (p) e a probabilidade de a segunda ser coroa (q), o que se
escreve como:

116
ESTATSTICA

P = p.(1 - q)

P = 0,5*(1 - 0,5)

P = 0,25

Passamos agora a construir a distribuio nesse caso.

Probabilidade de nenhuma face cara (k = 0):

2 insucessos: P = q.q = 0,5*0,5 = 0,25

1 maneira de obter 2 insucessos: CC.

P(0) = 1*0,25

P(0) = 0,25

Probabilidade de uma face cara (k = 1):

1 sucesso e 1 insucesso: P = p.q = 0,5*0,5 = 0,25.

2 maneiras de obter 1 sucesso: KC ou CK.

P(1) = 2*0,25

P(1) = 0,5

Probabilidade de duas faces cara (k = 2):

2 sucessos: P = p.p = 0,5*0,5 = 0,25.

1 maneira de obter 2 sucessos: KK.

P(0) = 1*0,25

P(0) = 0,25

Em resumo:

k P(k)
0 0,25
1 0,5
2 0,25

117
Unidade IV

0,6

0,5

0,4

0,3

0,2

0,1

0
0 1 2

Jogo de 3 moedas (n = 3)

Como temos 3 moedas, os valores da varivel escolhida sero agora k = 0, k = 1, k = 2 e k = 3.

A distribuio de probabilidades nesse caso ser:

Probabilidade de nenhuma face cara (k = 0):

3 insucessos: P = q.q.q = q3 = 0,5*0,5*0,5 = 0,125.


1 maneira de obter 3 insucessos: CCC.
P(0) = 1*0,125
P(0) = 0,125

Probabilidade de uma face cara (k = 1):

1 sucesso e 2 insucessos: P = p.q.q = p.q2= 0,5*0,5*0,5 = 0,125.


3 maneiras de obter 1 sucesso: KCC ou CKC ou CCK.
P(1) = 3*0,125
P(1) = 0,375

Probabilidade de duas faces cara (k = 2):

2 sucessos: P = p.p.q = p2.q = 0,5*0,5*0,5 = 0,125.


3 maneiras de obter 2 sucessos: KKC ou KCK ou CKK.
P(0) = 3*0,125
P(0) = 0,375

118
ESTATSTICA

Probabilidade de trs faces cara (k = 3)

3 sucessos: P = p.p.p = p3 = 0,5 * 0,5 * 0,5 = 0,125


1 maneira de obter 3 sucessos: KKK.
P(0) = 1 * 0,125
P(0) = 0,125

Em resumo:
k P(k)
0 0,1250
1 0,3750
2 0,3750
3 0,1250

0,4

0,35

0,3

0,25

0,2

0,15

0,1

0,05

0
0 1 2 3

Jogo de n moedas

Assim como feito anteriormente, para obtermos a distribuio de probabilidades se tivermos n moedas,
temos que analisar a probabilidade de termos resultados que variam entre k = 0 e k = n.

Para isso, primeiro temos que avaliar a probabilidade de uma jogada especfica.

Se temos k sucessos, o nmero de insucessos ser n - k, ou seja, o restante das moedas.

A probabilidade ser dada pelo produto das probabilidades p (k vezes) e q (n - k vezes) referentes
a cada moeda. Ou seja, os expoentes das probabilidades sero o nmero de vezes que o evento
ocorre. Ou seja, a probabilidade de sucessos, p, ter expoente k. A probabilidade de insucessos, q,
ter expoente correspondente ao restante das vezes, n - k:

119
Unidade IV

P = pk qnk

Em seguida, preciso avaliar quantas vezes cada resultado especfico aparecer:

So n moedas para serem colocadas em k lugares.


A ordem em que as moedas com o resultado escolhido aparece no relevante.
Temos, portanto, um caso de combinao, e o nmero de maneiras que podemos obter um certo
valor k ser dado por:
n!
C n,k =
k! (n k!)

A probabilidade referente a certo valor de k ser p, produto da probabilidade de uma vez pelo
nmero de maneiras que esse resultado aparece.
n!
P (k ) = pkqnk
k! (n k!)

Utilizando essa frmula geral para um caso j calculado, o jogo de 3 moedas com 2 resultados cara,
teremos:

Identificao dos termos da expresso:

Nmero de moedas: n = 3.
Nmero de sucessos: k = 2.
Probabilidade de sucessos: p = 0,5.
Probabilidade de insucessos: q = 1 - 0,5, q = 0,5.

Substituio dos termos na expresso:


3!
P (2) = 0,52 0,5(32)
2! (3 2!)

Realizar operaes:
3!
P (2) = 0,52 0,51
2! (1!)

P (2) = 3 2 1 0,25 0,5


2 11
6
P (2) = 0,125
2

120
ESTATSTICA

P(2) = 3*0,125
P(2) = 0,375

7.6.2 Caso geral

comum representar a frmula do clculo de combinaes por meio da representao do binmio


de Newton, de onde se origina a denominao da distribuio. O binmio dado por:

n n!
k = k! (n k )!

Utilizando essa notao e escrevendo explicitamente q como 1 - p, a expresso encontrada passa a


ser escrita assim:

n nk
P (k ) = pn (1 p)
k

Vale notar que, em um caso geral, ao contrrio do que tnhamos no exemplo da moeda, as
probabilidades de sucesso e insucesso podem ser diferentes.

Por exemplo, se tivermos n = 5, k = 2 e p = 0,1, o clculo da probabilidade ser realizado da seguinte


forma:
5 5 5 2
P (2) = 0,1 (1 0,1)
2
5!
P (2) = 0,15 0,93
2! (5 2)!
120
P (2) = 0,15 0,93
26
P (2) =10 0,00001 0,73
P(2)=0,0729

Observao

Na prtica, atualmente, os valores do binmio so geralmente calculados


com a utilizao de planilhas eletrnicas.

Mdia e desvio-padro

A mdia de valores, quando temos uma distribuio binomial, dada por:

121
Unidade IV

x = n.p

O desvio-padro dado por:

= n.p.q

Exemplo

Vamos analisar um caso em que temos n = 5 e p = 0,3.

Em primeiro lugar, podemos calcular a mdia e o desvio-padro:

x = 5 0,3 =1,5 e = 5 0,3 0,7 =1,05

Agora, vejamos a distribuio de probabilidades. O procedimento para o clculo j foi apresentado


no exemplo anterior de maneira detalhada, assim, apresentaremos somente os resultados finais para
cada valor de k.

k P(k)
0 0,1681
1 0,3602
2 0,3087
3 0,1323
4 0,0284
5 0,0024

0,4

0,35

0,3

0,25

0,2

0,15

0,1

0,05

0
0 1 2 3 4 5
Note que, ao contrrio do exemplo da moeda, agora o grfico no mais simtrico. Isso acontece
porque a probabilidade de o evento ocorrer menor que a de no ocorrer, assim, as probabilidades
relacionadas a um maior nmero de ocorrncias passa a ser menor.

122
ESTATSTICA

7.6.3 Aplicao

Vamos agora construir e analisar alguns exemplos de distribuies binomiais de probabilidade para
algumas escolhas de n e p.

O procedimento para o clculo j foi apresentado no exemplo anterior de maneira detalhada, assim,
os exemplos a seguir traro somente os resultados finais para cada valor de k.

Defeitos em produtos

Estima-se que cerca de 5% das cadeiras produzidas por um fabricante apresentem algum tipo de
defeito. Em um lote de 10 cadeiras, qual a probabilidade de no haver nenhuma defeituosa?

Identificao dos termos da expresso:

Nmero de eventos (cadeiras no lote): n = 10.


Nmero de sucessos (cadeiras com defeito): k = 0.
Probabilidade de sucessos (proporo de defeitos): p = 0,05.
Probabilidade de insucessos: q = 1 - 0,05, q = 0,95.

Substituio dos termos na expresso:

10!
P ( 0) = 0,050 0,95(100)
0! (10 0)!

Realizar operaes:
10!
Lembrando que 0! = 1 e 0,50 = 1: P ( 0) = 1 0,6
110!
10!
P ( 0) = 0,6
10!
P(0) = 0,6

Ou seja, com uma proporo de 5% de peas defeituosas, um lote de 10 cadeiras tem a probabilidade
de no ter nenhuma com defeito de 60%.

Outra pergunta relevante e bastante fcil de responder, utilizando-se as propriedades da distribuio


binomial, o nmero mdio de cadeiras com defeito num lote de 10 peas.

bvio que no se pode ter meia cadeira com defeito. O significado do nmero anterior fica mais
claro se pensarmos que, em mdia, a cada 2 lotes deve haver uma cadeira com defeito.

123
Unidade IV

Atrasos de pagamento

Uma prestadora de servios verificou que cerca de 10% dos 20 clientes de uma certa modalidade de
atendimento costuma atrasar o pagamento de suas prestaes.

Um primeiro nmero de interesse saber qual a mdia de clientes em atraso a cada ms.

x = n.p = 20 0,1
x =2

E qual a probabilidade de no termos atrasos acima da mdia?

Para responder a isso, precisamos inicialmente entender que se o nmero de sucessos (atrasos) deve
ser de, no mximo, 2, esse nmero pode ser 0 ou 1 ou 2, logo, tenho que fazer as contas para k = 0, k =
1 e k = 2 e somar as probabilidades encontradas.

Para efetuar os clculos, seguimos o procedimento j ilustrado anteriormente:

Identificao dos termos da expresso:

Nmero de eventos (clientes): n = 20.


Probabilidade de sucesso: p = 0,1.
Probabilidade de insucessos: q = 1 - 0,1, q = 0,9.

Clculo de P(0), P(1) e P(2) substituindo os valores correspondentes na frmula, conforme j


discutido.

Novamente, sero apresentados os resultados finais para cada valor de k, com aproximao de 4
casas decimais:

k P(k)

0 0,1216

1 0,2702

2 0,2852

P(k<3) = 0,1216 + 0,2702 + 0,2852

P(k<3) = 0,677

Ou seja, h uma probabilidade de quase 70% de o nmero de atrasos no ser maior que a mdia.

124
ESTATSTICA

Com relao a esse exemplo, vale tecer um comentrio a respeito da utilizao desses dados.

Uma probabilidade de 70% de os atrasos no serem maiores que a mdia significa tambm que h uma
probabilidade de 30% de haver atrasos acima da mdia. Se um gestor conta com esses pagamentos para
efetuar pagamentos e avalia somente o nmero mdio de atrasos, contando com 18 pagamentos, haver uma
probabilidade de aproximadamente 30% de no haver o dinheiro disponvel dentro desse planejamento.

No poder contar com a entrada de dinheiro programada implica, muitas vezes, em pagamentos de juros e
multas, o que pode comprometer o oramento da empresa. Como, ento, trabalhar com segurana?

No grfico a seguir, apresentamos a distribuio de probabilidades para esse exemplo:


0,30

0,25

0,20
P(k)

0,15

0,10

0,05

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
nmero de atrasos (k)

O grfico nos mostra que a probabilidade de haver mais de 7 atrasos praticamente inexistente,
sendo que podemos trabalhar com alto grau de segurana se contarmos com um nmero mximo de 5
atrasos de pagamento.

Uma anlise desse tipo pode evitar, portanto, grandes problemas de fluxo de caixa.

7.7 Distribuio uniforme de probabilidades

Uma distribuio de probabilidades uniforme aquela em que a varivel aleatria contnua


e todos os valores so igualmente provveis. Para facilitar a compreenso, vamos introduzir
alguns aspectos das distribuies contnuas de probabilidade por meio de um exemplo bastante
intuitivo.

Imagine que, para realizar um sorteio em uma festa, uma semente pequena e dura seja acrescentada
a uma massa de bolo. O ganhador do sorteio seria aquele que a encontrasse em sua fatia.

Como no existe motivo algum para que haja uma posio preferencial da semente dentro da massa,
podemos assumir que todos os pontos do bolo tm igual probabilidade de conter a dita semente e,
portanto, temos um caso de distribuio uniforme de probabilidades.

125
Unidade IV

Supondo que o bolo seja retangular e tenha 1 metro de comprimento, a cada centmetro de bolo
teramos uma probabilidade de 1% de encontrar a semente.

Formalmente, diramos que:

f(x) = 0,01

A distribuio uniforme de probabilidades, em razo da posio, est descrita no grfico a seguir:

0,01

0
0 10 20 30 40 50 60 70 80 90 100

Teramos, ento a situao em que a probabilidade de encontrar a semente seria tanto maior quanto
mais larga fosse a fatia de bolo.

P(x) = 0,1*x

Se o primeiro convidado a se servir pegasse uma fatia de 20 cm, sua probabilidade de ganhar o
prmio seria:

P(20) = 0,1*20

P(20) = 0,2

Para entender melhor o resultado, observe que uma fatia de 20 cm equivale a ter 20% do bolo.
Formalmente, isso corresponde rea destacada no grfico, conforme ilustramos a seguir:

0,01

0
0 10 20 30 40 50 60 70 80 90 100

126
ESTATSTICA

Suponhamos agora que o segundo convidado pegasse uma fatia de 10 cm. A probabilidade de ele
ser sorteado seria de 10%, conforme ilustrado na figura a seguir.

0,01

0
0 10 20 30 40 50 60 70 80 90 100

Assim, vimos que para distribuies contnuas, para determinar a probabilidade desejada deve-se
obter a rea do grfico da distribuio.

No caso da distribuio uniforme, as figuras para as quais queremos calcular a rea so retangulares,
o que permite realizar a conta diretamente. No entanto, para outras distribuies, o clculo bastante
complexo e essa determinao se faz por meio de valores tabelados.

7.8 Distribuio normal de probabilidades

A distribuio normal, tambm conhecida como distribuio gaussiana, uma das mais importantes
no estudo da estatstica. Vamos agora estudar suas caractersticas e ver como utiliz-la para determinar
probabilidades.

7.8.1 Condies de validade

Em termos gerais, dizemos que a distribuio normal descreve situaes em que as caractersticas a
seguir so observadas:

Varivel aleatria em questo contnua.


A probabilidade de ocorrncia dos eventos possveis depende somente da mdia e do desvio-
padro do conjunto.

Lembrete

Mdia: x =
xi
N
2 (
x x)
2

Varincia: =
N
Desvio-padro: = 2
127
Unidade IV

Nesses casos, temos uma distribuio de probabilidades, cuja forma geral traduz as seguintes
caractersticas:

Valor mdio o mais provvel.


Quanto mais longe da mdia, menos provvel.
O grfico da distribuio tem um formato de sino.

Formalmente, a descrio das caractersticas necessrias ao conjunto so mais complexas, mas para
o nvel de discusso que cabe neste curso, elas so suficientes.

Apresentamos a seguir a expresso referente curva gaussiana, bem como um grfico em formato
de sino, mas j adiantamos que essa expresso no ser usada diretamente, pois sua utilizao exige um
domnio de matemtica bastante avanado e fora do escopo deste curso. Na prtica, utilizam-se valores
tabelados, como veremos adiante.

Vale notar apenas que a funo depende do valor mdio e do desvio-padro. A varivel x refere-se
ao valor da varivel aleatria em estudo.

(x x )
2
1
f (x ) = e
2 22

7.8.2 A varivel z

Para a construo da tabela padronizada, primeiro se utiliza, em lugar do valor x da varivel, o valor z,
que nos diz quanto acima ou abaixo da mdia est o valor da varivel em unidades de desvio-padro.

O clculo de z dado por:


xx
z=

Note que, quando o valor de x igual mdia, o valor de z ser zero.

Assim, se tivermos, por exemplo, um conjunto cuja mdia seja 50 e o desvio-padro seja igual a 10:

O valor x = 40 corresponder a:

40 50 10
z= =
10 10
z = 1

128
ESTATSTICA

Significado: o valor 40 est um desvio-padro abaixo da mdia.

Se x = 65, teremos:

65 50 15
z= =
10 10
z = 1,5

Significado: o valor 65 est um desvio-padro e meio acima da mdia.

Para x = 50, que a prpria mdia, teremos:

50 50 0
z= =
10 10
z=0

Significado: o valor 50 no est nem acima nem abaixo da mdia.

Efetuando-se a substituio de x por z no clculo da distribuio de probabilidades, teremos a funo


de distribuio dada por:

1 z2
f (x ) = e
2 2

O grfico da funo anterior ter um mximo quando o valor de x for igual mdia, portanto, z = 0.
medida que o valor de x se afasta deste, a funo vai decaindo, sem nunca chegar a anular-se.

O grfico a seguir explicita essa descrio.

-5 -4 -3 -2 -1 0 1 2 3 4 5

Assim como no exemplo para a distribuio uniforme, as probabilidades de se encontrar o valor


da varivel dentro de certo intervalo corresponder rea do grfico localizada no interior dos limites

129
Unidade IV

desse intervalo. Como a probabilidade de a varivel ter qualquer valor possvel de 100%, a rea sob a
curva de toda a figura tem de ter valor 1.

No entanto, as fatias de probabilidade tm agora um tamanho difcil de determinar, pois esse bolo
foi feito em forma de sino. Para que essa determinao seja possvel, preciso usar valores tabelados.

7.8.3 Distribuio normal padronizada

Para calcular as reas, utilizaremos a tabela que nos d a rea, sob a curva gaussiana, padronizada em razo
do valor de z. Assim, se temos um dado valor de x, precisamos inicialmente calcular o valor correspondente
de z, a partir dos valores da mdia e do desvio-padro, conforme vimos na seo anterior.

A tabela apresentada na pg. 115 nos trar a rea correspondente ao intervalo entre 0 e z, conforme
ilustrado na figura a seguir. Veremos adiante como determinar as probabilidades de intervalos diferentes
deste a partir dos valores tabelados.

-5 -4 -3 -2 -1 0 z 2 3 4 5

Leitura da tabela

Na tabela citada h a informao sobre a rea subentendida pela curva normal reduzida de 0 a z.

Dado um valor de z, devemos procurar na tabela qual o valor da rea que corresponde a ele da
seguinte forma:

Na primeira coluna da tabela, o valor de z dado at sua primeira casa decimal.

Na primeira linha da tabela colocam-se os valores referentes segunda casa decimal.

O valor da rea em questo ser aquele que esteja na linha e coluna correspondentes.

Vejamos alguns exemplos:

rea para z = 1,68.

130
ESTATSTICA

-5 -4 -3 -2 1 0 1,68

Procure a linha cuja primeira coluna tenha o valor 1,6, a qual reproduzimos a seguir para
facilitar a compreenso:

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

Nessa linha, procure a coluna correspondente segunda casa decimal, ou seja, a coluna indicada
pelo 0,08.

A rea indicada na figura, compreendida pela fatia que vai do z = 0 ao z = 1,68 ser, portanto,
A = 0,4535.

rea para z = 0,5

-5 -4 -3 -0,5 0
Procure a linha cuja primeira coluna tenha o valor 0,5:

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


0,5 0,1915 0,195 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,219 0,2224

Lembrando que 0,5 = 0,50, procure nessa linha a coluna correspondente segunda casa decimal,
ou seja, a coluna indicada pelo 0.

A rea compreendida pela fatia que vai do z = 0 ao z = 0,5 ser, portanto, A = 0,1915.

Clculo das probabilidades

Veremos agora diversos exemplos de como utilizar a tabela para determinar probabilidades que
sigam a distribuio normal.

131
Unidade IV

Uma empresa que realiza manuteno de computadores atende em mdia 25 clientes por dia, com
desvio-padro de 4,6.

Em primeiro lugar, notamos que esse caso passvel de utilizao da distribuio normal, pois:

A probabilidade de atender um nmero acima ou abaixo da mdia , em princpio, a mesma.


Embora a varivel nmero de clientes seja discreta, o parmetro de anlise a varivel z. Como
a mdia e o desvio-padro podem assumir qualquer valor, a diviso que leva obteno de z
tambm pode ter como resultado qualquer valor real, portanto, a varivel em anlise contnua.

Passamos, ento, a analisar as probabilidades.

1. Qual a probabilidade de termos entre 25 e 28 clientes num dia?

Identificao da rea:

Valor mnimo: 25
Valor mximo: 28

Clculo de z:
25 25
x1 = 25: z = , logo, z1 = 0
4,6
28 25
x2 = 28: z = , logo, z2 = 0,65
4,6

Identificao grfica da rea:

-5 -4 -3 -2 -1 0 z 2 3 4 5

Determinar o valor da rea:

z1 = 0, logo, o valor da rea ser o valor dado na tabela para z2

rea para z = 0,65: A(0,65) = 0,2422


132
ESTATSTICA

Determinar o valor da probabilidade:

A probabilidade igual rea dada, logo, P = 0,2422

2. Qual a probabilidade de termos entre 23 e 25 clientes num dia?

Identificao da rea:

Valor mnimo: 23

Valor mximo: 25

Clculo de z:
23 25
x1 = 23: z = , logo, z2 = -0,43
4,6
x2 = 25, logo z1 = 0

Identificao grfica da rea:

-5 -4 -3 -2 z 0 2 3 4 5

Determinar o valor da rea:

Por simetria, a rea compreendida entre z = -0,43 e z = 0 igual rea entre z = 0 e z = 0,43
dada na tabela.

rea para z = -0,43: A(0,43) = 0,1664

Determinar o valor da probabilidade:

A probabilidade igual rea dada, logo, P = 0,1664

3. Qual a probabilidade de termos entre 23 e 28 clientes num dia?

133
Unidade IV

Identificao da rea:

Valor mnimo: 23
Valor mximo: 28

Clculo de z:
23 25
x1 = 23: z = , logo, z2= -0,43
4,6
28 25
x2 = 28: z = , logo, z1 = 0,65
4,6
Identificao grfica da rea:

-5 -4 -3 -2 z1 0 z2 3 4 5

Determinar o valor da rea:


A rea total a soma das reas correspondentes aos valores de z1 e z2.
rea para z = -0,43: A(0,43) = 0,1664
rea para z = 0,65: A(0,65) = 0,2422
rea indicada: A = A(0,43) + A(0,65) = 0,1664 + 0,2422 = 0,4086

Determinar o valor da probabilidade:


A probabilidade igual rea dada, logo, P = 0,4086

4. Qual a probabilidade de termos mais de 25 clientes num dia?

Identificao da rea:
Valor mnimo: 25
Valor mximo: infinito
Clculo de z:

134
ESTATSTICA

x1 = 25, logo, z2 = 0
x2 = , logo, z1 =

Identificao grfica da rea:

-5 -4 -3 -2 z1 0 Z2 3 4 5

Determinar o valor da rea:


A curva simtrica, logo, o valor da rea indicada corresponde metade da rea total da
curva.
Como a rea total 1, A = 0,5

Determinar o valor da probabilidade:


A probabilidade igual rea dada, logo, P = A = 0,5

5. Qual a probabilidade de termos entre 26 e 30 clientes num dia?

Identificao da rea:
Valor mnimo: 26
Valor mximo: 30

Clculo de z:
26 25
x1 = 26: z = , logo, z2= 0,21
4,6
30 25
x2 = 30: z = , logo, z1 = 1,09
4,6

135
Unidade IV

Identificao grfica da rea:

-5 -4 -3 -2 0 z1 z2 3 4 5

Determinar o valor da rea:

Para encontrar a rea total, preciso descontar da rea cujo limite superior z2 a rea delimitada
por z1.
rea para z = 0,21: A(0,21) = 0,0832
rea para z = 1,09: A(1,09) = 0,3621
rea indicada: A = A(1,09) - A(0,21) = 0,3621 - 0,0832 = 0,2789

Determinar o valor da probabilidade:

A probabilidade igual rea dada, logo, P = 0,2789.

Tabela

rea subentendida pela curva normal reduzida de 0 a z.


z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0 0,004 0,008 0,012 0,016 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,091 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,148 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,17 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,195 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,219 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,258 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,291 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,334 0,3365 0,3389
1 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,377 0,379 0,381 0,383
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,398 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

136
ESTATSTICA

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,437 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,475 0,4756 0,4761 0,4767
2 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,483 0,4834 0,4838 0,4842 0,4846 0,485 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,489
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,492 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,494 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,496 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,497 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,498 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,499 0,499
3,1 0,499 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5 0,5 0,5 0,5 0,5 0,5 0,5 0,5 0,5 0,5

8 INFERNCIA E ESTIMAO

Como tpicos finais do curso, passaremos agora a discutir dois temas de grande interesse na rea
da estatstica.

Num primeiro bloco trataremos da questo do uso de amostras e da confiabilidade dos resultados
obtidos a partir de dados amostrais.

Em seguida discutiremos brevemente como mtodos estatsticos verificam haver, ou no, relaes
entre diferentes grandezas e o significado da existncia de correlaes.

8.1 Definies

Basta um pequeno gole de suco para saber que gosto ele tem, mas alguns gros de feijo no lhe
permitiro conhecer todo o sabor de uma feijoada. Nesses dois casos, a questo podermos conhecer
o todo a partir de uma parcela.

137
Unidade IV

A possibilidade de se estudar o todo a partir do conhecimento de uma parte s absolutamente


crucial quando queremos conhecer as caractersticas de um conjunto muito grande. Imagine, por
exemplo, como seria impraticvel ter ndices de inflao, por menores que fossem, se tivssemos que
saber todos os preos de todos os produtos em todas as lojas do pas. No entanto, se a escolha da
amostra no for benfeita, poderemos ter uma descrio que no condiga com os fatos.

H diversos mtodos estatsticos que buscam garantir e analisar o grau de confiabilidade nesses
casos. Uma discusso aprofundada do assunto bastante complexa e no cabe no mbito deste curso,
assim, em muitos momentos, vamos tratar as questes referentes amostragem de maneira puramente
qualitativa.

8.1.1 Populao e amostra

Chamamos de populao um conjunto de indivduos com pelo menos uma caracterstica observvel.
Por exemplo, podemos ter como populao o conjunto de preos praticados no varejo para um dado
produto.

Uma populao pode ser considerada finita ou infinita, dependendo da existncia de uma limitao
da quantidade de elementos de que composta.

Dizemos que a populao finita quando o nmero de indivduos limitado. Temos como exemplo
disso o nmero de alunos de uma faculdade, a quantidade de indstrias em uma cidade etc.

Chamamos de infinita uma populao com nmero ilimitado de elementos ou, mais especificamente,
com populaes cujos elementos so processos que geram itens. Um exemplo disso seria o jogo sucessivo
de um dado, pois podemos continuar indefinidamente fazendo novas jogadas se for de interesse, o que
d um carter ilimitado ao nmero de jogadas.

O estudo de uma populao pode ser feito a partir da obteno de dados de apenas parte dos
elementos dela. Chamamos de amostra a esse subconjunto da populao.

Uma amostra tem por objetivo representar uma populao de tal modo, que as informaes a
respeito dela sejam significativas para toda a populao. Assim, as escolhas de amostras devem ser feitas
de maneira criteriosa e de acordo com as caractersticas da populao.

8.1.2 Censo e amostragem

Para obtermos informaes a respeito de uma populao h duas possibilidades: podemos averiguar
a informao para todos os elementos da populao ou podemos escolher apenas parte do conjunto
para tal averiguao.

Quando o universo estudado inclui toda a populao, temos a realizao de um censo.

Quando o universo subconjunto finito da populao, ento temos um caso de estudo por amostragem.
138
ESTATSTICA

A utilizao de censo ou amostragem num estudo depende de uma srie de fatores. O mais usual
utilizar amostras por causa da dificuldade ou, mesmo, impossibilidade de se estudarem todos os
componentes da populao.

Vantagens do censo

A utilizao do censo tem como principal vantagem a possibilidade de termos preciso completa
nos resultados. Quando isso necessrio, a nica abordagem possvel o censo. No entanto,
importante notar que, na prtica, h poucos casos que exigem estudos estatsticos em que tal preciso
requerida.

Uma segunda situao em que a utilizao de censo mais indicada aquela em que uma populao
to pequena que o custo e o tempo gastos com a realizao de um censo so pouco maiores que para
uma amostra. Por exemplo, se quisermos estudar alguma caracterstica referente a uma determinada
turma de um curso, mais trabalhoso estudar as maneiras de montar uma amostra apropriada que
obter diretamente os dados de todos os alunos.

De forma similar, se o tamanho da amostra grande, em relao ao da populao, o esforo adicional


requerido por um censo pode ser pequeno. Com relao ao tamanho da amostra e preciso do estudo,
vamos discutir esse assunto detalhadamente mais adiante.

Vantagens da amostra

Na maior parte dos casos, revela-se mais vantajosa a utilizao da amostra que a utilizao do
censo.

A primazia da amostragem evidente em casos em que so necessrios testes destrutivos. Um


exemplo claro disso so os estudos de qualidade de um produto quanto resistncia, durabilidade
etc. Quase anedtico seria pensar em um estudo sobre a qualidade de produo de fsforos em que um
censo implicaria, necessariamente, na destruio de toda a produo.

Tambm melhor utilizar a amostragem quando estudamos alguma informao que varia
rapidamente, pois a obteno de uma grande quantidade de dados pode demorar mais do que o
tempo em que a informao permanece estvel. Imagine, por exemplo, um levantamento de preos
que levasse em conta todos os estabelecimentos comerciais do pas. At que fossem coletados os
dados, os preos j teriam sido reajustados diversas vezes e a informao recolhida no teria mais
significado.

Outra razo para escolher o estudo de amostras o custo, pois em diversos casos os gastos necessrios
para a realizao de um censo podem ser proibitivos.

Dissemos na seo anterior que o censo traz a possibilidade de preciso absoluta. No entanto, na
prtica, a realizao de um censo pode ter uma complexidade tal que pode acarretar erros durante a
coleta dos dados. Imagine o censo realizado pelo IBGE, em que h milhares de recenseadores buscando
139
Unidade IV

coletar informaes a respeito de milhes de pessoas. fcil imaginar a impossibilidade de ocorrer tal
coleta de dados sem que haja erros.

Outra razo de escolha de estudo por amostragem diz respeito variedade e profundidade de
informaes que se busca. Por questes de custo e tempo, especialmente, um censo limita a pesquisa a
poucas caractersticas por item.

8.2 Tcnicas de amostragem

Existem diversas tcnicas para a obteno de amostras. Citamos aqui algumas das principais
caractersticas das classes de tcnicas existentes.

8.2.1 Classificao

Podemos classificar as amostras em dois grandes grupos: o das probabilsticas e o das no


probabilsticas.

Probabilsticas

As amostras probabilsticas so aquelas em que a escolha dos elementos feita de forma aleatria,
utilizando-se alguma maneira para sortear os elementos. Essa tcnica segura para inferir caractersticas
da populao e a mais comumente utilizada nos estudos de carter econmico e social.

No probabilsticas

As tcnicas no probabilsticas utilizam escolha deliberada dos elementos e nem sempre permitem
generalizar os resultados para a populao, pois essa opo pode enfatizar ou atenuar alguma
caracterstica. Essas tcnicas so bastante utilizadas em estudos mdicos, por exemplo.

8.2.2 Duas tcnicas probabilsticas

Amostragem aleatria simples

Essa tcnica mais elementar frequentemente utilizada e consiste em sortear elementos da


populao de maneira completamente aleatria.

Como todos os elementos da populao tm a mesma probabilidade de ser selecionados, deduz-se


que a amostra tem alta probabilidade de ter composio representativa das propores encontradas na
populao.

Por exemplo, se queremos estudar a opinio dos alunos de uma faculdade a respeito do lanamento
de um produto, podemos sortear alunos para responder a um questionrio. Se a faculdade tiver um
grande nmero de mulheres, bastante provvel que sejam sorteadas mais mulheres que homens, e
assim as caractersticas da populao de alunos fica representada na amostra.
140
ESTATSTICA

Amostragem estratificada

A amostragem estratificada realiza tambm sorteios para a montagem da amostra, mas considera as
diferenas relevantes entre as caractersticas dos subconjuntos, ou seja, de seus diversos estratos.

No caso em que temos diferenas significativas e queremos ter certeza de que cada grupo est bem
representado, o sorteio dos elementos leva em considerao tais divises.

Por exemplo, uma populao composta de 20% de mulheres e 80% de homens e quero fazer uma
amostra composta de 100 pessoas. Se for relevante ter uma proporo correta de homens e mulheres
no estudo, sorteamos 20 mulheres e 80 homens para compor a amostra.

8.2.3 Duas tcnicas no probabilsticas (no aleatrias)

Muito embora as tcnicas probabilsticas nos permitam realizar estudos mais confiveis, em geral h
situaes em que amostras no probabilsticas se mostram mais interessantes ou viveis.

Amostragem acidental

Em algumas ocasies, as amostras so formadas por elementos escolhidos somente por causa de sua
disponibilidade.

Essa forma de escolha muito comum em pesquisas de opinio, em que os entrevistados so


acidentalmente escolhidos ao passarem por uma praa movimentada, por um grande supermercado ou por
outro lugar qualquer em que entrevistadores so colocados para selecionar as pessoas aleatoriamente.

Tambm comum essa forma de amostragem no caso de estudos de novos medicamentos, quando se
constri a amostra em razo de haver pessoas que buscam tratamento para a doena para a qual o remdio
foi desenvolvido e que se disponham a tom-lo apesar de ainda no ser completamente conhecido.

Amostragem intencional

Por fim, podemos ter ainda a escolha intencional, segundo um critrio preestabelecido. Essa tcnica
indicada quando se tem interesse apenas em informaes sobre um conjunto restrito ou quando se
avalia que as opinies de certos indivduos sejam mais significativas.

Por exemplo, um gerente-geral pode considerar que a opinio de certo conjunto de funcionrios
antigos, a respeito de uma alterao na poltica da empresa, seja mais significativa que a opinio da
totalidade dos funcionrios, por causa do conhecimento que j adquiriram sobre seu local de trabalho.

8.3 Representatividade da amostra

Discutimos anteriormente alguns critrios qualitativos para escolha de amostra. Agora, preciso
analisar a confiabilidade deles no que diz respeito a inferir caractersticas da populao como um
todo a partir dos dados desse subconjunto.
141
Unidade IV

Por exemplo, vemos em pesquisas de inteno de voto que o resultado tem certa margem de
erro. Se essa margem for de 3%, sabemos que se dois candidatos tm menos do que esse percentual
de diferena, eles esto na verdade empatados, ou se um candidato teve uma variao de 2% na
proporo de eleitores que dizem pretender votar nele, pode ser que na verdade ele tenha se
mantido estvel. Considerar, nessas condies, que somente o nmero, sem ver qual sua incerteza,
pode trazer anlises incorretas da realidade, e, se for preciso tomar decises em que esses dados
sejam relevantes, um erro de anlise desse tipo pode levar a decises tambm errneas.

Em suma, quando realizamos um estudo por amostragem, a grande questo que se coloca :
quo representativa certa amostra?

A determinao precisa dessas incertezas depende, muitas vezes, de conhecimentos de estatstica


que vo alm da proposta deste curso, no entanto crucial ter noes de como essas anlises so
feitas.

Para mostrar qual tipo de procedimento se utiliza nesse tipo de anlise, vamos ver como se
determina o erro de uma mdia amostral, ou seja, como se compara a mdia obtida por amostragem
com a mdia real da populao quando conhecemos o desvio-padro para a populao.

8.4 Distribuies amostrais

Para uma mesma populao, podemos selecionar uma amostra com um nmero menor de
elementos de diversas maneiras. O conjunto de todas as amostras possveis com um determinado
nmero de elementos chamado de distribuio amostral.

Para que fiquem claros os critrios de comparao, vamos ver como se comparam a mdia real e as
mdias de cada uma das amostras em um caso em que todos, populao e amostra, so conhecidos.

8.4.1 Nova notao

Como agora teremos valores de mdia e desvio referentes a cada amostra, ao conjunto das
amostras e populao, preciso denot-las de maneira diferente:

Populao

O smbolo a ser utilizado a partir de agora para a mdia da populao ser a letra grega .

O smbolo a ser utilizado no desvio-padro da populao ser a letra grega .

Amostra especfica

= x . e
O smbolo para uma mdia especfica ser

No discutiremos aqui os desvios de amostras especficas.


142
ESTATSTICA

Distribuio amostral

A mdia do conjunto de amostras ser indicada por x.

O smbolo x denotar o desvio-padro da distribuio amostral.

O objetivo agora ser mostrar como se comparam a mdia e o desvio-padro de uma distribuio
amostral, x e x, com os respectivos valores para a populao, e , que so os valores reais.

Exemplo

Vamos ver em detalhes um exemplo em que temos os dados referentes a gasto com roupas de
uma populao de 5 pessoas e analisaremos a mdia que seria obtida para as amostras compostas
de 2 elementos.

Ressalto que um estudo por amostragem, nesse caso, no teria razo de ser, mas o objetivo aqui
no obter informaes a respeito do conjunto, mas sim mostrar didaticamente como se comparam
a mdia de uma populao com as mdias de suas amostras e, para efetuar tal comparao,
necessrio que conheamos todos os dados.

Dados da populao

Na tabela a seguir so apresentados os gastos das 5 pessoas que fazem parte da populao a
ser analisada.

Pessoa A B C D E

Valor 100 130 150 170 200

A partir desses valores, calculamos a mdia e o desvio para populao, seguindo o procedimento
j estudado. Esses so os valores que nos serviro de parmetro na comparao com as mdias
amostrais:

= 150 e = 38

A partir de agora, vamos analisar as mdias encontradas caso tenhamos amostras compostas de
somente 2 elementos.

Construo das amostras

Existem 10 maneiras de se escolher 2 elementos entre 5, pois este um caso de combinao,


onde se escolhem 2 elementos entre 5 e a ordem de escolha no importante. Logo, o nmero
possvel de amostras ser:

143
Unidade IV

5! 5*4
N= = = 10
2!(5 2)! 2

As amostras possveis sero: AB, AC, AD, AE, BC, BD, BE, CD, CE e DE.

Mdia e desvio de cada amostra

Na tabela a seguir colocamos os valores individuais e a mdia para cada uma das dez
amostras.

Amostra Gastos (x) Mdia (x)


1 AB 100 130 115
2 AC 100 150 125
3 AD 100 170 135
4 AE 100 200 150
5 BC 130 150 140
6 BD 130 170 150
7 BE 130 200 165
8 CD 150 170 160
9 CE 150 200 175
10 DE 170 200 185

Note, em primeiro lugar, que os valores mais prximos da mdia real, digamos at R$ 10,00
acima ou abaixo da mdia, so mais frequentes que os valores mais distantes, uma vez que na
prpria populao mais fcil encontrarmos os valores similares mdia real.

Se fizermos a mdia das mdias das amostras teremos:

130 +150 +170 + 200 +150 +170 + 200 +170 + 200 + 200
x =
10
1500
x = =150
10
Esse valor chamado de mdia da distribuio amostral, pois a mdia dos valores encontrados
para as diversas amostras possveis. Note que esse valor igual mdia da populao.

O fato de termos a mdia da distribuio igual mdia da populao esperado, visto que cada
elemento aparece um mesmo nmero de vezes nas amostras. Nesse caso, cada elemento apareceu
4 vezes. Assim, a distribuio amostral ter contribuio equivalente de todos os elementos da
populao e, com isso, mesma mdia.

No que diz respeito ao desvio-padro, no entanto, essa igualdade no se observa. O desvio-padro


da populao 38 e o desvio-padro das mdias da populao 22.
144
ESTATSTICA

Lembrando que o desvio-padro uma medida de disperso, que reflete a diversidade


de valores, podemos entender tal diferena pelo fato de uma amostra ter diversidade menor
que uma populao e, desse modo, os valores referentes disperso tendero a ser menores
tambm.

8.4.2 Comparao entre distribuio amostral e populao

Vejamos agora o caso geral em que temos uma distribuio amostral para amostras com n
elementos.

Assim como no exemplo estudado, a mdia da distribuio igual mdia da populao e o


desvio-padro tende a ser menor que o desvio referente populao. Em estudos reais, em que h
um grande nmero de dados, a distribuio dos valores das mdias tende a seguir a curva normal,
com distribuio em torno da mdia da populao.

A mdia da distribuio ser, portanto:

x =

A disperso da distribuio ser tanto maior quanto maior for a disperso na populao de onde
as amostras so extradas e tanto menor quanto maior for a amostra, seguindo a relao a seguir:


x =
n

8.5 Estimao

Na seo anterior vimos como se distribuem os valores das mdias referentes a todas as
possibilidades de amostras de um dado tamanho n. Nesta seo discutiremos como estimar a
mdia da populao a partir da mdia de uma amostra.

Em razo dos objetivos desta disciplina, no cabe realizar uma discusso quantitativa extensa
deste tema, portanto escolhemos abordar somente o caso em que o desvio-padro da populao
conhecido e em que a incerteza do valor seja igual para valores acima ou abaixo da mdia
encontrada.

Note que o objetivo desta seo apenas fazer com que voc, aluno conhea o tipo de
procedimento que nos permite estimar a confiabilidade de um valor obtido por amostragem, sem
esperarmos que ele domine de fato a execuo do procedimento descrito.

8.5.1 Intervalos de confiana bilateral para conhecido

Suponhamos um estudo amostral em que foi obtida uma mdia x representando uma populao
cujo valor mdio .
145
Unidade IV

A diferena entre o valor medido e o valor real ser chamado de erro, o qual ser
denotado pela letra e. Vamos analisar a probabilidade de termos um determinado erro
mximo.

Para certo erro, e, estima-se que o valor real esteja dentro do intervalo:

= xe

No qual e o erro estimado dado por:

z.
e=
n

O valor de z a distncia da mdia em unidades de desvio-padro, conforme j discutido, para a


distribuio normal padronizada. Como essa grandeza serve como referncia para a determinao
das reas sob a curva gaussiana, e, portanto, para a determinao da probabilidade de intervalos
de valores da grandeza estudada, esse parmetro nos dar o grau de confiana que se pode ter no
valor medido para a mdia.

Podemos utilizar essa expresso para estimarmos o erro de uma mdia com certa probabilidade
de acerto.

Essa estimao envolve determinar o valor de z correspondente a certa probabilidade. J


havamos visto como determinar a probabilidade a partir de z, agora, vamos trilhar o caminho
oposto. Vejamos nos exemplos a seguir como se d na prtica tal determinao.

Determinao de z para uma dada probabilidade

Vimos anteriormente como determinar a probabilidade a partir de valores para z. Agora,


utilizaremos a mesma tabela para encontrar o valor de z que corresponde a certa probabilidade.

Digamos que eu queira, por exemplo, estimar uma mdia com 90% de certeza. Para isso, em
primeiro lugar, tenho que encontrar o z que corresponde a tal probabilidade, ou seja, o valor de z
que delimita uma regio da curva normal com 0,45 para cada lado em torno da mdia.

Na prtica, isso significa encontrar na tabela da distribuio normal padronizada o nmero


mais prximo a 0,45.

Conforme vemos na reproduo da linha 1,6 da tabela citada, o valor mais prximo quele que
procuramos o 0,4505, que corresponde a termos z = 1,65.

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

146
ESTATSTICA

Dessa maneira, verificamos que 90% dos resultados possveis esto localizados na regio em
que -1,65 < z < 1,65.

Fazendo o mesmo para a probabilidade de 80%, procuraremos o valor mais prximo a 0,40 na
tabela. Conforme vemos a seguir, o valor mais prximo o 0,4015, que corresponde a z = 1,29.

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,398 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

O procedimento anterior utilizado para a escolha de qualquer intervalo de confiana, no


entanto, usual utilizar confianas de 90%, 95% ou 99%, que correspondem, respectivamente, a
z = 1,65, z = 1,96 e z = 2,58.

Intervalo de confiana

Uma vez encontrado o z, utilizamos a expresso dada anteriormente para determinar o erro
associado mdia:

z.
e=
n

Assim, se tivermos, por exemplo, uma mdia x = 24,2, obtida a partir de uma amostra com n =
36, numa populao com desvio-padro = 3, estimamos o erro da seguinte maneira:

Em primeiro lugar, substitumos os valores de n e na expresso:


z.3 z.3 z
e= = =
36 36 2

Se quisermos saber com 90% de confiana qual a mdia da populao, constaremos que z =
1,65 e, portanto, o erro ser de 0,825.

O valor real tem 90% de probabilidade de estar entre o valor da mdia mais o valor do erro e o
valor da mdia menos o valor do erro:

Limite inferior do intervalo: 24,2 - 0,825 = 23,375.

Limite inferior do intervalo: 24,2 + 0,825 = 25,025.

Em suma, a mdia da populao tem 90% de probabilidade de estar entre os valores 23,375 e
25,025.

147
Unidade IV

Se quisermos uma maior certeza de que o valor real esteja no intervalo, realizamos o
procedimento descrito para o percentual desejado e utilizamos o valor correspondente de z para
encontrar o valor do erro nesse caso.

Na tabela a seguir, apresentamos os resultados para confianas desejadas de 90%, 95% e


99%:

Confiana desejada z e Intervalo


90% 1,65 0,825 23,375 a 25,025
95% 1,96 0,980 23,220 a 25,180
99% 2,58 1,290 23,110 a 25,690

Ou seja, encontrando a mdia 24,2 nas condies citadas, sabemos que:

H 90% de probabilidade de o valor real estar ente 23,375 e 25,025.

H 95% de probabilidade de o valor real estar ente 23,220 e 25,180.

H 99% de probabilidade de o valor real estar ente 23,110 e 25,690.

8.5.2 Observaes finais

Vimos aqui algumas caractersticas principais das anlises que se devem realizar quando
fazemos um estudo por amostragem.

Abordamos somente um caso mais simples, em que se busca a mdia de uma populao com
desvio-padro conhecido e estimamos a incerteza no valor da mdia considerando incerteza para
valores acima ou abaixo daquele encontrado.

Estudos reais exigem cuidados muito mais abrangentes e minuciosos, porm, esses detalhamentos
e aprofundamentos seguem todos uma metodologia cujas caractersticas bsicas esto presentes
nas discusses apresentadas.

Por exemplo, quando o desvio-padro desconhecido, utiliza-se um procedimento


similar ao descrito anteriormente, mas a estimativa dessa incerteza no utiliza a
distribuio normal, mas sim outra chamada de distribuio de student. Nesses casos, h
alguns parmetros adicionais a considerar, mas o importante aqui saber que ela nos
dar uma incerteza maior nos valores, refletindo o fato de termos menos informaes a
respeito da populao.

Alm da mdia, outras grandezas, como a proporo de cada tipo de dado, podem ser obtidas
utilizando amostras. Tambm para essas grandezas temos tcnicas de anlise de confiabilidade
similares s expostas para a mdia.

148
ESTATSTICA

O ponto crucial, entretanto, saber que estudos estatsticos a partir de amostras permitem
de fato a obteno de dados a respeito da populao e que existem tcnicas que nos permitem
conhecer os nveis de confiabilidade dos valores assim obtidos. Tambm importante ressaltar que
sempre existe a probabilidade de o valor real no estar dentro da margem de erro estimada, mas
que, na maioria das vezes essa probabilidade muito pequena e os resultados podem ser utilizados
como parmetro para a compreenso do conjunto.

Exemplos de aplicao

1) Imagine uma situao em que seja mais indicado utilizar um censo em lugar de um estudo por
amostragem. Para isso, escolha a grandeza a ser estudada e considere fatores como confiabilidade,
custo, viabilidade etc.

2) Imagine uma situao em que seja mais indicado utilizar uma amostra para se estimar uma certa
grandeza. Descreva a grandeza e a populao escolhidas e justifique sua escolha.

a) Considere uma populao finita.

b) Considere uma populao infinita.

3) Imagine uma situao em que seja indicado utilizar uma tcnica no probabilstica de
amostragem:

a) Amostragem acidental.

b) Amostragem intencional.

4) Para escrever uma reportagem a respeito de uma nova lei municipal de uma cidade com cerca de
10.000 habitantes, um jornalista resolve realizar uma pesquisa de opinio. Para cada abordagem
a seguir, aponte o problema de ele escolher:

a) Fazer um censo de opinies na cidade.

b) Entrevistar todos os alunos da escola ao lado.

c) Entrevistar as primeiras 20 pessoas que passarem em frente ao jornal.

d) Entrevistar somente pessoas da cidade vizinha.

5) Uma empresa tem 5 funcionrios que realizam atendimento ao pblico. O nmero de atendimentos
realizado por empregado em uma semana listado na tabela a seguir:

Abel Slvia Denise Fbio Glson


72 54 51 63 60

149
Unidade IV

a) Calcule a mdia e o desvio-padro dessa populao.

b) Determine quantas amostras de 3 pessoas so possveis para esse universo.

c) Construa cada uma das amostras e calcule a mdia amostral de cada uma delas.

d) Calcule a mdia da distribuio e seu desvio-padro.

e) Compare os valores da distribuio com os valores da populao.

6) Uma empresa que presta assistncia tcnica realizou um estudo detalhado a respeito de
atendimento de clientes, tendo verificado que a nota mdia de satisfao dos clientes era 7, com
desvio-padro 2. Buscando melhorar esse ndice, foi contratada uma empresa de treinamento
para aperfeioar o desempenho dos funcionrios. Aps o treinamento, foi feito um estudo por
amostragem, utilizando 25 atendimentos, e obteve-se a nota 8. Utilizando o procedimento
descrito no texto:

a) Construa os intervalos de confiana para a mdia encontrada aps o treinamento.

b) Com base no resultado anterior, discuta se se pode considerar que o treinamento foi
eficiente.

Resoluo

1) Pergunta com resposta aberta. Deve-se escolher uma situao em que o nmero de elementos
no conjunto universo seja pequeno ou algum caso em que seja realmente importante termos
preciso absoluta.

2) Pergunta com resposta aberta.

a) Deve-se escolher uma situao que no exija preciso absoluta e em que seja pouco vivel
fazer uma tomada de dados que inclua todos os elementos.

b) Nos casos em que a populao infinita sempre necessrio utilizar amostras.

3) Pergunta com resposta aberta.

a) Deve-se escolher uma situao em que no seja prtico ou vivel fazer uma escolha aleatria.

b) Deve-se escolher uma situao em que haja algum subconjunto que, por si, seja mais
representativo. Por exemplo, numa pesquisa de opinio a respeito do lanamento de um
programa, perguntar a opinio somente de alguns tcnicos experientes da rea, escolhidos por
causa de seu conhecimento.

150
ESTATSTICA

4)
a) No vivel perguntar a opinio de todos os moradores para fazer uma reportagem em um jornal.

b) O conjunto no seria representativo, por incluir somente pessoas de um mesmo grupo social.

c) O conjunto poderia no ser representativo, por ter um nmero muito pequeno de pessoas na
amostra.

d) O conjunto no seria representativo, j que a amostra teria sido escolhida em um universo


diferente daquele que se queria estudar.

5)
a) Mdia: 60, desvio-padro: 8,2.

b) N = (5*4*3)/(3!) = 10

c)
Amostra Atendimentos Mdia
1 asd 72 54 51 59
2 asf 72 54 63 63
3 asg 72 54 60 62
4 adf 72 51 63 62
5 adg 72 51 60 61
6 afg 72 63 60 65
7 sdf 54 51 63 56
8 sdg 54 51 60 55
9 sfg 54 63 60 59
10 dfg 51 63 60 58

d) Mdia: 60, desvio-padro: 3,2.

e) Conforme esperado, as mdias so iguais. O desvio-padro da distribuio amostral menor,


pois as amostras tm menos diversidade que a populao. O valor no coincide com a diviso
pela raiz de n porque a populao e a amostra so pequenas e essa relao s vlida no limite
de grandes conjuntos.

6)
a) Construa os intervalos de confiana para a mdia encontrada aps o treinamento.

Confiana desejada z e Limite mnimo Limite mximo


90% 1,65 0,66 7,34 8,66
95% 1,96 0,78 7,22 8,78
99% 2,58 1,03 6,97 9,03

151
Unidade IV

b) Sim, podemos considerar que o treinamento foi eficiente, visto que apenas quando a confiana
exigida de 99% que vemos aparecer a probabilidade de a nota real ser igual nota obtida
antes do treinamento.

Resumo

Noes de probabilidade

1. Variveis aleatrias so aquelas cujo resultado depende do acaso.

2. O estudo das probabilidades busca determinar quais dos resultados


possveis sero mais raros ou comuns.

3. Para calcular uma probabilidade, devemos dividir o nmero de


eventos favorveis ao aspecto escolhido pelo nmero total de eventos
possveis (ou espao amostral).

4. Os valores para calcular probabilidades podem ser empricos ou analticos.

5. Uma probabilidade sempre ser um nmero entre 0 e 1.

Anlise combinatria

1. A contagem de eventos independentes associados se baseia no


princpio da multiplicao.

2. H algumas situaes especficas de maior interesse.

3. Permuta sem repetio:

a) Troca de n elementos diferentes em n posies.

b) Pn = n!

4. Permuta com repetio:

a) Troca de n elementos em n posies, havendo elementos repetidos ou


iguais.
n!
b) Pna,b,c... =
a!b!c!...

152
5. Arranjo:

a) Maneiras possveis de se ter n elementos em p posies quando a


ordem relevante.
n!
b) An,p =
(n p)!
6. Combinao:

a) Maneiras possveis de se ter n elementos em p posies, quando a


ordem no relevante.
n!
b) Cn,p =
p! (n p)!

Distribuies de probabilidade

1. Trazem as probabilidades de cada evento possvel do universo


estudado.

2. H distribuies discretas e contnuas.

3. A distribuio binomial discreta e segue a expresso:

n!
P (k ) = pkqnk
k! (n k!)

4. A distribuio normal contnua e para a obteno da probabilidade


referente a um intervalo utilizamos a tabela da distribuio normal
padronizada.

Inferncia e estimao

1. H diversas situaes em que um estudo estatstico feito utilizando


dados apenas a respeito de parte dos elementos do conjunto estudado.

2. Quando se obtm dados de todos os elementos, temos a realizao


de um censo; quando temos dados somente de parte dos elementos,
temos um estudo por amostragem.

3. Para um mesmo conjunto universo h diversas possibilidades de


escolha de amostra. O conjunto dos resultados possveis para as
diversas amostras chamado de distribuio amostral.
153
4. Existem tcnicas que nos permitem selecionar amostras de maneira
tal que a escolhida seja representativa do conjunto.

5. Existem maneiras de se estimar qual o grau de confiabilidade de


resultados utilizando amostras.

6. A mdia encontrada em uma pesquisa amostral no precisa ser


idntica da populao.

7. O valor para amostra ser tanto mais confivel quanto maior o


tamanho da amostra e menor o desvio-padro (menor diversidade,
menor disperso).

Exerccios

Questo 1. O seu chefe precisa tomar uma deciso acerca da implantao de uma nova unidade
e pediu para voc fazer uma estimativa dos gastos com salrios. Para tanto, voc fez uma pesquisa
com 225 trabalhadores da regio em que ser instalada a fbrica, seguindo a distribuio de cargos e
funes, e chegou mdia de R$ 1.950,00, com desvio-padro de R$ 298,00. Baseado nesses dados,
qual foi a estimativa apresentada com 95% de confiabilidade?

A) 1950 79,6 reais

B) 1950 43,4 reais

C) 1950 38,9 reais

D) 1950 31,4 reais

E) 1950 28,0 reais

Resposta correta: alternativa C.

Anlise da alternativa

A sequncia de clculos necessria a seguinte:

Valor estimado = Valor provvel erro esperado

Valor provvel = 1950

Erro esperado = zc erro padro = 1,96 19,9 = 38,9


154
zc = 1,96 (coeficiente para 95% de confiabilidade, vide tabela)

298
Erro-padro => x = = 19,9
225

Valor estimado = 1950 38,9 reais com 95% de confiabilidade.

Portanto, a alternativa que apresenta o valor correto a C.

Questo 2. (ENADE) Uma empresa metal-mecnica produz um tipo especial de motor. A quantidade
em estoque desse motor segue uma distribuio normal com mdia de 200 unidades e desvio-padro de
20. O grfico a seguir representa a distribuio normal padro (mdia igual a 0 e desvio-padro igual a 1),
em que as porcentagens representam as probabilidades entre os valores de desvio-padro.

Qual a probabilidade de, em um dado momento, o estoque da empresa apresentar mais de 220
unidades?

0,13% 0,13%
2,14% 13,60% 34,13% 34,13% 13,60% 2,14%

-3 -2 -1 0 1 2 3
Desvios-padro

A) 84,13%.

B) 68,26%.

C) 34,13%.

D) 15,87%.

E) 13,60%.

Resoluo desta questo na Plataforma.

155
FIGURAS E ILUSTRAES

Grfico 1

Colunas para as frequncias referentes varivel sabor.

Grfico 2

Colunas para as frequncias referentes varivel tamanho.

Grfico 3

Colunas para as frequncias referentes varivel preo.

Grfico 4

Colunas para as frequncias referentes varivel vendas.

Grfico 5

Diagrama circular para a varivel sabor.

Grfico 6

Diagrama circular para a varivel tamanho.

Grfico 7

Diagrama circular para a varivel preo.

Grfico 8

Diagrama circular para a varivel vendas.

Grfico 9

Representao de dois conjuntos com interseo.

Grfico 10

Representao grfica de dois conjuntos com interseo pertencentes a um conjunto universo com
elementos que no pertencem a A ou a B.

Grfico 11

Representao de dois conjuntos sem interseo e conjunto universo indicado explicitamente.


156
Grfico 12

Representao de um conjunto contido em outro.

Grfico 13

Representao de trs conjuntos sem interseo.

Grfico 14

Representao com a contagem de elementos dos conjuntos dados no grfico 9.

Grfico 15

Representao com a contagem de elementos dos conjuntos dados no grfico 10.

Grfico 16

Representao com a contagem de elementos dos conjuntos dados no grfico 11.

Grfico 17

Representao com a contagem de elementos dos conjuntos dados no grfico 12.

Grfico 18

Representao com a contagem de elementos dos conjuntos dados no grfico 13.

Grfico 19

Representao com a contagem de elementos dos conjuntos dados no grfico 13, enfatizando o
conjunto A.

Grfico 20

Representao com a contagem de elementos dos conjuntos dados no grfico 13, enfatizando os
elementos que pertencem a cada um dos conjuntos A, B e C.

Grfico 21

Representao com a contagem de elementos dos conjuntos dados no grfico 13, enfatizando os
elementos que pertencem a B e C.

157
Grfico 22

Representao com a contagem de elementos dos conjuntos dados no grfico 13, enfatizando os
elementos que no pertencem a B.

Tabela 1

Dados brutos para a compra de sucos.

Tabela 2

Frequncias e frequncias relativas para a varivel sabor.

Tabela 3

Frequncias e frequncias relativas para a varivel tamanho.

Tabela 4

Frequncias sem perda de informao para a varivel preo.

Tabela 5

Frequncias para a varivel preo, com agrupamento por intervalos.

Tabela 6

Frequncias sem perda de informao para a varivel vendas.

Tabela 7

Frequncias para a varivel vendas, com agrupamento por intervalos de tamanho 5.

Tabela 8

Frequncias para a varivel vendas, com agrupamento por intervalos de tamanho 3.

Tabela 9

Quantidade de impressoras e multifuncionais vendida na loja A.

Tabela 10

Quantidade de impressoras e multifuncionais vendida na loja A.


158
Tabela 11

Quantidade de impressoras e multifuncionais vendida na loja A.

Tabela 12

Idades dos integrantes de uma famlia.

Tabela 13

Gastos efetuados para a realizao do jantar por participante do grupo de amigos.

Tabela 14

Gastos efetuados por ocupante da mesa da lanchonete.

Tabela 15

Frequncia para os gastos efetuados por ocupante da mesa da lanchonete.

Tabela 16

Quadro esquemtico para clculo de mdias a partir de tabela de frequncias.

Tabela 17

Frequncias para os valores de uma varivel x genrica.

Tabela 18

Clculo do valor mdio de um conjunto de dados para uma varivel x genrica a partir de sua tabela
de frequncias.

Tabela 19

Clculo do valor mdio de um conjunto de dados a partir da tabela de frequncias dada por intervalos
de valores.

Tabela 20

Exemplo de clculo de mdias com ponderao: notas de alunos.

Tabela 21

Exemplo de clculo de mdia aritmtica para um conjunto de aumento de preos (em valores
percentuais).

159
Tabela 22

Exemplo de clculo de mdias com ponderao para aumento de preos (em valores percentuais).

Tabela 23

Exemplos de ndices de preos.

Tabela 24

Clculo da comparao de valores individuais e mdia para o exemplo de gastos na lanchonete.

Tabela 25

Clculo da varincia e do desvio-padro para o primeiro exemplo de gastos na lanchonete.

Tabela 26

Clculo da varincia e do desvio-padro para o segundo exemplo de gastos na lanchonete.

Tabela 27

Clculo da varincia e do desvio-padro para o segundo exemplo de gastos na lanchonete.

Tabela 28

Clculo do desvio-padro para um conjunto de dados brutos de uma amostra.

Tabela 29

Clculo do desvio-padro para um conjunto de dados amostrais agrupados.

Tabela 30

Clculo do desvio-padro para um conjunto de dados amostrais agrupados numa tabela de


frequncias.

Tabela 31

Clculo do desvio-padro para um conjunto de dados amostrais com ponderao.

Tabela 32

Frequncias para as idades das crianas participantes de uma festa escolar.


160
REFERNCIAS

Textuais

CRESPO, A. A. Estatstica fcil. 18. ed., So Paulo: Editora Saraiva, 2002.

DOWNING, D.; CLARK, J. Estatstica aplicada. So Paulo: Editora Saraiva, 1999.

FONSECA, J. S.; MARTINS G. A.; TOLEDO, G. L. Estatstica aplicada. So Paulo: Atlas, 1995.

GUERRA, M. J.; DONAIRE, D. Estatstica aplicada. So Paulo: Cincia e Tecnologia, 1991.

KUME, H. Mtodos estatsticos para a melhoria da qualidade. So Paulo: Gente, 1993.

MEDEIROS, E. et al. Estatstica para os cursos de economia, administrao e cincias contbeis, 3. ed.
So Paulo: Atlas, 1995/1999.

MILONE, G.; ANGELINI, F. Estatstica aplicada. So Paulo: Atlas, 1995.

SILVA, E. M. et al. Tabelas de estatstica. 2. ed. So Paulo: Atlas, 1999.

STEVENSON, W. J. Estatstica aplicada administrao, So Paulo: Harbra, 1983.

VIEIRA, S. Elementos de estatstica. 4. ed. So Paulo: Atlas, 2003.

Exerccios

Unidade VI Questo 2: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANSIO


TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (ENADE) 2009: Administrao.
Questo 32. Disponvel em: < http://public.inep.gov.br/enade2009/ADMINISTRACAO.pdf>. Acesso em:
06 jun. 2011.

161
162
163
164
165
166
167
168
Informaes:
www.sepi.unip.br ou 0800 010 9000

Vous aimerez peut-être aussi