Vous êtes sur la page 1sur 195

%

Estatística
Ricardo Saraiva Diniz
Ricardo Saraiva Diniz

ESTATÍSTICA

Belo Horizonte
Novembro de 2015
COPYRIGHT © 2015
GRUPO ĂNIMA EDUCAÇÃO
Todos os direitos reservados ao:
Grupo Ănima Educação

Todos os direitos reservados e protegidos pela Lei 9.610/98. Nenhuma parte deste livro, sem prévia autorização
por escrito da detentora dos direitos, poderá ser reproduzida ou transmitida, sejam quais forem os meios
empregados: eletrônicos, mecânicos, fotográficos, gravações ou quaisquer outros.

Edição
Grupo Ănima Educação

Vice Presidência
Arthur Sperandeo de Macedo

Coordenação de Produção
Gislene Garcia Nora de Oliveira

Ilustração e Capa
Alexandre de Souza Paz Monsserrate
Leonardo Antonio Aguiar

Equipe EaD
Conheça
o Autor
Ricardo Saraiva Diniz é licenciado em
Matemática, com especialização em Educação
Matemática e em Gestão Educacional e
mestre em Educação e Sociedade.

É professor há mais de 19 anos, tendo


experiência nos ensinos fundamental, médio,
superior e em pós-graduação. Também
trabalhou em cursinhos pré-vestibulares e
preparatórios para concursos. Atua no ensino
superior desde 2002.

Hoje em dia, é professor do Centro


Universitário UNA, desde 2011, onde leciona as
disciplinas Estatística, Métodos Quantitativos,
Matemática Financeira e Matemática Básica.
É professor da disciplina Estatística na
modalidade EAD desde 2012.
Apresentação
da disciplina
Na disciplina Estatística, vamos compreender a importância da mesma
como ferramenta fundamental na coleta, análise e interpretação dos
dados. Também é responsabilidade da disciplina fazer a apresentação
dos dados coletados, tanto por meio de tabelas quanto de gráficos.
É preciso compreender que existe variabilidade em tudo, pouca ou
muita. Portanto, é função da Estatística fornecer ferramentas para que
seja possível conviver com essa variabilidade. Assim, ela investiga a
regularidade nos dados oriundos das pesquisas.
UNIDADE 1  003
Introdução ao estudo da estatística 004
O que é estatística? 005
Por que estudar estatítisca?  005
O método estatístico 006
As fases do método estátistico 006
O conceito de variáveis 008
Dados versus informações 011
Notação Sigma 011
O arredodamento de dados 012
A notação por meio de índices 014
População e amostra 014
Tipos de amostragem 016
Revisão 024

UNIDADE 2  026
Séries estatísticas, gráficos estatísticos e números índices  027
A tabela e o Rol  028
Distribuição de frequências, tipos de frequências e elementos da
distribuição de frequências  028
Dados absolutos e dados relativos 029
A distribuição de frequências sem intervalos de classe 031
Distribuição de frequências em intervalos de classe: número
de classes e intervalos de classe 037
A distribuição de frequências e a sustentabilidade 043
Revisão 050

UNIDADE 3  052
Os gráfico  053
O histograma  054
Diagrama ou gráfico de colunas  058
Diagrama ou gráfico de barras 060
Diagrama ou gráfico de pareto 061
Diagrama ou gráfico de setores 062
Diagrama ou gráfico de ogiva 064
Gráfico pictório ou pictograma 065
Os gráficos e a sustentabilidade 067
Revisão 078

UNIDADE 4  079
Medidas de posição 080
Medida aritmética ( x ) 081
Mediana (Md)082
Moda (Mo) 090
Revisão 106
UNIDADE 5 107
Medidas de dispersão e de variabilidade  108
Amplitude total  109
Desvio médio absoluto (DMA)  112
Variância (S2), desvio padrão (s) e coeficiente de variação (CV) 114
Revisão 125

UNIDADE 6 126
Regressão e correlação – medidas de assimetria e de curtose  127
Medidas de assimetria e curtose  128
Correlação e regressão linear 131
Revisão 145

UNIDADE 7  147
Probabilidade  148
Experimento aleatório 149
Espaço amostral  149
Eventos151
Probabilidade152
Probabilidade da união de dois eventos: eventos mutuamente exclusivos 157
Probabilidade condicional: eventos independentes 162
Probabilidade de dois eventos simultâneos (ou sucessivos):
eventos independentes 164
Revisão 169

UNIDADE 8  171
Distribuição binomial e normal  172
Variável aleatória  173
Distribuição de probabilidade  174
Distribuição binomial 177
Distribuição normal - curva normal 180
Revisão 188

REFERÊNCIAS 189
Introdução ao
estudo da
estatística
• O que é
Introdução Estatística?
• Por que estudar
Na Unidade 1, serão apresentados conceitos fundamentais e Estatística?
elementares referentes à Estatística, os objetivos de estudar essa • O método
área da Matemática, bem como suas aplicações nas diferentes estatístico
áreas do conhecimento, e de forma especial no processo de tomada • Fases do
de decisões. método
estatístico
• O conceito de
Vamos destacar também ao longo da unidade que a Estatística tem
variáveis
como principal objetivo coletar e analisar dados para extrair deles
• Dados versus
informações relevantes, bem como a definição e classificação das informações
variáveis, pois de acordo com essa classificação serão utilizados
• A notação
procedimentos diferentes para a organização e análise dos dados. sigma
Além disso, vamos estudar as técnicas de amostragem, que • O
garantem processo de escolha da amostra e têm como objetivo arredondamento
maior resumir as informações a respeito da população.
de dados
• A notação por
meio de índices
Como se trata da unidade de introdução à disciplina, serão
revisitados alguns conceitos necessários para a melhor
• Definição de
população e
compreensão da Estatística ao longo das demais unidades, como amostra
a notação por meio de índices, as regras de arredondamento e a
• Técnicas de
notação sigma. amostragem
• Revisão
ESTATÍSTICA

O que é Estatística?
De acordo com LARSON e FARBER (2010, p. 3), a Estatística “é
a ciência que coleta, analisa e interpreta dados para a tomada
de decisões”. Assim, ao analisar a definição de Estatística
apresentada pelos autores, pode-se afirmar que é possível, por
meio da Estatística, apresentar o desempenho de uma empresa
ao longo dos anos, destacar que a população brasileira tem
crescido num ritmo menor que há 30 anos, ou mesmo mostrar o
aproveitamento dos times de futebol num campeonato qualquer,
como o Campeonato Brasileiro ou Copa do Brasil. Há estatísticas
da administração pública que são acompanhadas com muita
frequência, como o PIB do país, e podemos citar, entre outras, a
taxa de inflação, a taxa de desemprego e o índice de pessoas sem
Ainda de acordo
acesso a saneamento básico. com o conceito
de Estatística
Ainda de acordo com o conceito de Estatística apresentado, de forma apresentado, de
forma mais ampla,
mais ampla, podemos destacar o papel importante dessa ciência
podemos destacar
nas diversas situações cotidianas. De posse de um conjunto de o papel importante
dados numéricos, é fundamental que os mesmos sejam analisados dessa ciência nas
para extrair as informações mais importantes. Por exemplo, para
diversas situações
cotidianas.
indicar a venda média de determinado produto da empresa durante
um ano será utilizada a média aritmética, que representará a média
das vendas dos produtos dos 12 meses em um único valor.

Por que estudar


Estatística?
Nos dias atuais, a Estatística é ferramenta imprescindível para
qualquer profissional que precisa avaliar informações para tomar
decisões com maior grau de certeza. Nesse contexto, é possível
afirmar que diferentes profissionais das diversas áreas tomem
decisões todos os dias. Um administrador ou gestor recorrem à
Estatística para organizar, dirigir e controlar as organizações.

005
unidade 1
ESTATÍSTICA

É possível perceber a importância da Estatística também no


poder público. Os governos têm institutos oficiais próprios para a
realização de estudos estatísticos, com o objetivo de analisar a sua
população de diferentes prismas, como índice de analfabetismo,
riqueza da população, percentual de famílias sem saneamento
básico, entre outros. No Brasil esse instituto é o IBGE (Instituto
Brasileiro de Geografia e Estatísticas).

O método estatístico
O método estatístico tem como objetivo principal fornecer
embasamento teórico e prático para tratar as informações oriundas
de uma pesquisa de forma adequada, e assim fornecer o suporte
O primeiro passo
necessário para auxiliar a tomada de decisão a respeito do que fundamental no
está sendo estudado. O primeiro passo fundamental no método método estatístico
é compreender
estatístico é compreender a pergunta de pesquisa que necessita ser
a pergunta de
respondida, ou seja, o que realmente precisa ser estudado. pesquisa que
necessita ser
Nesse contexto, o método estatístico compreende duas partes: respondida, ou seja,
o que realmente
o cálculo do tamanho da amostra e a análise estatística, que são
precisa ser estudado.
utilizados para responder as perguntas da pesquisa. Outra situação
na qual a Estatística está envolvida diretamente é nas técnicas de
amostragem, pois com alguma frequência é necessário utilizar
técnicas matemáticas para determinar uma amostra representativa.

As fases do método
estatístico
A Estatística oferece meios para que seja possível coletar, organizar,
descrever, analisar e interpretar dados. Após todo esse processo,
você (ou qualquer pesquisador) terá em mãos resultados que
podem ser utilizados em várias situações, seja para planejamento,
tomadas de decisões ou formulação de soluções.

006
unidade 1
ESTATÍSTICA

É importante destacar que grandes empresas sempre utilizam o


método estatístico, com o objetivo de minimizar riscos no momento
de definir um novo investimento. É fato que as empresas atuais
exigem de seus administradores e estrategistas a tomada de
decisões, cada vez com maior grau de precisão, sem espaço para
erros. Logo, o domínio de conceitos de Estatística facilita o trabalho
desses profissionais no que se refere a organizar, dirigir e controlar
a empresa.

Nesse contexto, é fundamental que os administradores conheçam


as novas demandas e a nova realidade social do país, os recursos
financeiros disponíveis, o que pensam seus colaboradores, os
atuais consumidores e os mercados que podem se abrir.

Portanto, o método estatístico compreende todos os meios que É importante


permitem a organização das informações para atingir determinado destacar que
grandes empresas
objetivo. São passos da metodologia estatística ou fases do método
sempre utilizam o
estatístico, de acordo com TIBONI (2010, p. 2): método estatístico,
com o objetivo de
• Definição dos objetivos; minimizar riscos
no momento de
• Planejamento e elaboração da coleta de dados; definir um novo
investimento.
• Classificação dos dados e apresentação dos valores
numéricos;

• Análise dos resultados;

• Elaboração do relatório com as conclusões.

A seguir, vamos destacar cada um dos passos:

1º) Definição dos objetivos: É a definição do planejamento da


pesquisa, em que serão definidos o plano de trabalho, os
objetivos que se pretendem atingir com a pesquisa e quais
recursos estatísticos serão utilizados.

2º) Planejamento e elaboração da coleta de dados: Após a definição

007
unidade 1
ESTATÍSTICA

dos objetivos, é necessário iniciar a coleta dos dados numéricos


ou não essenciais à sua descrição.

3º) Classificação dos dados e apresentação dos valores numéricos:


Também chamada de tratamento dos dados, a classificação
dos dados nada mais é do que o processamento dos dados
obtidos, e a disposição mediante critérios que permitam o
estabelecimento de categorias. Já a apresentação dos valores
se preocupa em dispor, por meio de tabelas e gráficos, os dados
coletados, para tornar mais fácil o estudo e a interpretação do
que está sendo estudado.

4º) Análise dos resultados: É a chamada Estatística Indutiva ou


Inferencial. Consiste na interpretação dos dados por meio de As variáveis são
comparações e generalizações que vão revelar as vantagens e as características
desvantagens dos resultados obtidos.
que podem ser
analisadas (ou
estudadas, ou
5º) Elaboração do relatório com as conclusões: Geralmente esta mesmo medidas)
tarefa é de responsabilidade de um especialista da área do em cada indivíduo da
população, ou seja,
conhecimento que está sendo estudada, não necessariamente
é um conjunto de
de um especialista da Estatística ou Matemática. O relatório resultados possíveis
deve apresentar as conclusões de maneira que sejam mais de um fenômeno
facilmente entendidas por todos que tenham contato com o qualquer.
mesmo.

O conceito de variáveis
As variáveis são as características que podem ser analisadas (ou
estudadas, ou mesmo medidas) em cada indivíduo da população,
ou seja, é um conjunto de resultados possíveis de um fenômeno
qualquer.

Veja a tabela abaixo, que apresenta algumas informações a


respeito dos veículos que estão à venda em uma concessionária de
seminovos:

008
unidade 1
ESTATÍSTICA

TABELA 1 – Informações sobre veículos à venda na concessionária “X”

MODELO ANO PREÇO CILINDRADAS SITUAÇÃO DO IPVA


(em reais) (em cv)

Ford Ka 2006 11.990 53 Pago

Fox 2008 20.090 56 Pago

Gol 2004 17.900 106 A pagar

Palio 2005 16.990 60 Pago

Fonte: Tabela divulgada pela concessionária em propaganda veiculada nos jornais.

Portanto, na população representada pelos veículos à venda em


uma concessionária, é possível identificar variáveis como: modelo,
ano, preço, cilindradas e situação do IPVA.

A variável pode ser classificada de duas formas distintas, que serão


definidas a seguir:

a) Qualitativa: Quando a informação contida se refere a uma


categoria, ou é expressa por uma qualidade ou atributo. Na tabela
do exemplo acima as variáveis “modelo” e “situação do IPVA”
são qualitativas. Outros exemplos de variável qualitativa são: cor
preferida, sexo, estado civil, bairro onde mora, cantor favorito,
nome, animal de estimação.

Para você identificar uma variável qualitativa, basta verificar a resposta

dada à pergunta. Se a resposta for expressa por meio de “palavras”, a

variável analisada é qualitativa.

b) Quantitativa: Quando é possível fazer comparações e


operações matemáticas, ou seja, quando os valores são
expressos por números. Ainda recorrendo ao exemplo do
quadro com informações a respeito dos veículos à venda,
as variáveis, “ano”, “preço” e “cilindradas” são exemplos de
variáveis quantitativas, pois permitem comparação. Assim,

009
unidade 1
ESTATÍSTICA

variável “ano” permite comparar qual carro é mais novo.

Para você identificar uma variável quantitativa, basta verificar a resposta

dada à pergunta. Se a resposta for expressa por meio de “valores

numéricos”, a variável analisada é quantitativa.

Contudo, é preciso destacar que nem sempre a variável representada


por meio de números é quantitativa. Por exemplo, o RA (Registro
Acadêmico) de um aluno não é quantitativa, pois representa o aluno.
Outro exemplo:

Classifique a seguinte afirmação:

“O prefeito da cidade está desempenhando bem as suas funções.”


Os números
(1) Concordo totalmente apresentam
atributos, não
(2) Concordo parcialmente representando
variável
(3) Discordo totalmente quantitativa.

Os números apresentam atributos, não representando variável


quantitativa.

A variável quantitativa pode ser classificada como discreta ou


contínua. A variável discreta é aquela que resulta de contagens e
é apresentada através de números inteiros. Assim, idade, número
de viagens que você fez num ano, número de televisores de uma
residência são exemplos de variável discreta.

Já a variável contínua é aquela que pode assumir inúmeros valores


numéricos entre dois limites, ou seja, pode assumir valores decimais.
Isto é, se não for possível ser representada por um número inteiro,
é chamada de contínua. A altura de uma pessoa e o seu peso são
exemplos de variável contínua.

010
unidade 1
ESTATÍSTICA

Uma variável quantitativa discreta passa a ser classificada como contínua

caso seja representada com maior precisão. Exemplo: A pessoa diz que

seu peso é 68 kg, mas a balança indica 68,2. No primeiro caso é uma

variável discreta, mas no segundo caso é contínua.

Dados versus
informações
É muito comum lermos e ouvirmos a respeito de dados e
informações. Segundo BRUNI (2007, p. 4) “o objeto de trabalho da
Estatística é formado pelo conjunto de dados que serão analisados”,
ou seja, os dados são muito importantes para a Estatística. O dado
é elemento que representa eventos ocorridos, por exemplo, na
Ao longo de todo
o livro, vamos
empresa. Em um estudo a respeito das idades dos funcionários de nos referir muitas
uma empresa, a idade de cada um deles corresponde a um dado. vezes aos dados
e por várias vezes
utilizá-los para
Contudo, o dado não tem importante significado e não permite
obter informações
qualquer compreensão. Já a informação é a organização dos relevantes.
dados de modo que os mesmos tenham significado e possam ser
compreendidos. Ou seja, quando começo a analisar as idades dos
funcionários levantados no exemplo e identifico que a idade média
deles é 28 anos, aí temos informações e é possível fazer análises e
talvez tomar alguma decisão a respeito.

Ao longo de todo o livro, vamos nos referir muitas vezes aos dados
e por várias vezes utilizá-los para obter informações relevantes.

Notação Sigma
De acordo com Bruni (2007), a notação sigma (Σ) é bastante comum
em Estatística. Se considerarmos o seguinte conjunto de dados, a
sua soma pode ser representada por Σx e significa:

011
unidade 1
ESTATÍSTICA

Σx = 3 + 7 + 9 + 12 = 31

Por outro lado, se pretendemos calcular a soma dos números


elevados ao quadrado, pode ser utilizada a notação Σx2. No caso do
nosso conjunto de dados, teremos:

Σx2 = 32 + 72 + 92 + 122 = 9 + 49 + 81 + 144 = 283

A soma dos números ao quadrado é diferente da soma elevada ao

quadrado dos números, ou seja:

Σx2 ≠ (Σx)2

No exemplo, Σx2 = 283 enquanto (Σx)2 = (31)2 = 961.

Se o algarismo a
ser eliminado for
O arredondamento maior ou igual a 5,
acrescentamos uma
de dados unidade ao primeiro
algarismo que
está situado à sua
Muitas vezes, tanto em Estatística como em outras áreas do esquerda.
conhecimento ou mesmo em situações do dia a dia, quando
trabalhamos com números é comum utilizar algumas técnicas de
arredondamento. Vamos às regras:

• Se o algarismo a ser eliminado for maior ou igual a 5,


acrescentamos uma unidade ao primeiro algarismo que
está situado à sua esquerda.

Exemplo: 25,637867

Se vamos arredondar com duas casas decimais, o primeiro


algarismo a ser eliminado é 7, logo vamos acrescentar uma
unidade ao algarismo 3, então: 25,64;

Se vamos arredondar com três casas decimais, o primeiro


algarismo a ser eliminado é 8, e vamos acrescentar uma

012
unidade 1
ESTATÍSTICA

unidade ao algarismo 7, logo: 25,638;

Já se o arredondamento for com quatro casas decimais,


o primeiro algarismo a ser eliminado é 6, portanto vamos
acrescentar uma unidade ao algarismo 8, e temos: 25,6379;

Em caso de arredondamento para número inteiro, o primeiro


algarismo a ser eliminado é o 6, então vamos acrescentar
uma unidade ao algarismo 5 e vai ficar 26.

• Se o algarismo a ser eliminado for menor que 5, não vamos


alterar o algarismo da esquerda.

Exemplo: 154,273148

No caso de números
Se vamos arredondar com duas casas decimais, o primeiro
decimais, não
algarismo a ser eliminado é 3, logo não vamos acrescentar existe regra para
uma unidade ao algarismo 7, então: 154,27; a quantidade de
casas decimais a
serem utilizadas,
Se vamos arredondar com três casas decimais, o primeiro
mas devemos utilizar
algarismo a ser eliminado é 1, e vamos manter o algarismo o maior número
3, logo: 154,273; de casas decimais
possível, de modo a
diminuir o erro.
Já se o arredondamento for com quatro casas decimais, o
primeiro algarismo a ser eliminado é 4, portanto não vamos
acrescentar uma unidade ao algarismo 1, e temos: 154,2731;

Em caso de arredondamento para número inteiro, o primeiro


algarismo a ser eliminado é o 2, então vamos manter o
algarismo 4 e vai ficar 154.

No caso de números decimais, não existe regra para a quantidade de

casas decimais a serem utilizadas, mas devemos utilizar o maior número

de casas decimais possível, de modo a diminuir o erro.

013
unidade 1
ESTATÍSTICA

A notação por meio


de índices
O símbolo xi representa qualquer um dos n valores x1, x2, x3, x4, ... xn
que podem ser assumidos pela variável x. A letra i que acompanha
a variável x é chamada índice e pode representar qualquer um dos
números 1, 2, 3, ..., n.

Vale destacar que pode ser utilizada qualquer outra letra no lugar de i. Você

vai encontrar a notação por índice muitas vezes nas fórmulas.

População e Vale destacar que


pode ser utilizada
amostra qualquer outra letra
no lugar de i. Você
vai encontrar a
População: Quando nos referimos a todos os indivíduos ou a todos notação por índice
os objetos do grupo que queremos analisar. Ou seja, a população muitas vezes nas
fórmulas.
se caracteriza por ser o conjunto dos elementos que formam o
universo do que está sendo estudado.

Vale destacar que a população pode ser formada por pessoas, por
cadeiras, por animais, por eletroeletrônicos à venda em uma loja,
entre outros.

Amostra: É um conjunto de elementos retirados da população em


estudo. Devemos destacar que apesar da população ser constituída
por uma parte da população que está sendo estudada, por meio da
amostra temos que obter os dados que representam a população.

Acompanhe alguns exemplos:

• População: os eleitores brasileiros;

014
unidade 1
ESTATÍSTICA

• Amostra: 2025 eleitores entrevistados por um instituto de


pesquisa.

• População: os 25 tipos de salgados diferentes oferecidos


por um buffet;

Amostra: 10 tipos de salgados diferentes experimentados por um


potencial cliente.

• População: os contribuintes que fazem a declaração de


“imposto de renda” para a Receita Federal;

Amostra: os contribuintes que são escolhidos pela receita para a


“malha fina”.

• Observe o esquema abaixo, que representa a relação entre


amostra e população:
Quando não é
FIGURA 1 – Amostra x população possível pesquisar
todos os elementos
da população,
utilizamos a
Amostra amostra.

População

Fonte: Elaborado pelo autor.

Quando não é possível pesquisar todos os elementos da população,


utilizamos a amostra. Então, a pergunta a ser respondida é: “quando
devemos estudar amostras e não toda a população?”.

São muitos os motivos que respondem essa pergunta, mas


alguns deles são mais importantes. Um dos mais importantes é
quanto ao custo excessivo. Estudar toda a população pode ser
muito caro, por isso escolhemos uma amostra dessa população.
Como exemplo dessa situação, podemos destacar uma pesquisa

015
unidade 1
ESTATÍSTICA

feita com os alunos de uma faculdade que tem 2000 estudantes.


Se vamos entrevistar todos os alunos por meio de questionário
impresso, serão no mínimo 2000 questionários impressos; ao
passo que se trabalharmos com uma amostra de 200 alunos,
serão apenas 10% dos questionários.

Outro motivo é a dificuldade de estudar toda a população. O IBGE


faz o censo demográfico a cada dez anos porque, além do alto
custo desse levantamento, há muita dificuldade de conseguir
entrevistar todas as residências do país. Em muitas casas não
se encontra ninguém, em outras as pessoas não querem receber
os pesquisadores, o que é cada vez mais comum por causa da
insegurança. Por isso, anualmente realiza a PNAD (Pesquisa
Nacional por Amostra de Domicílios), que entrevista apenas uma
parte dos domicílios do país.

Além desses dois motivos relevantes, há pelo mais um a ser A amostragem é


destacado, que é o fato de o processo de pesquisa destruir o mecanismo que
o elemento pesquisado. Por exemplo: para saber o peso que utilizamos para
coletar dados.
uma cadeira suporta, colocamos peso na mesma até que não
suporte mais e se quebre. Se isso for feito com todas as cadeiras
produzidas por uma fábrica, não haverá cadeiras para serem
vendidas.

Tipos de amostragem
A amostragem é o mecanismo que utilizamos para coletar dados.
É o processo de escolha da amostra, e tem como objetivo maior
resumir as informações a respeito da população. Contudo, torna-se
necessário cuidar para que a amostra seja realmente representativa
da população e, pode-se afirmar, que se isso for garantido as
conclusões obtidas da amostra podem ser generalizadas para toda
a população. Essa situação pode ser representada pela imagem a
seguir:

016
unidade 1
ESTATÍSTICA

FIGURA 2 – Comparação população x amostra

Fonte: Elaborado pelo autor.

Trabalhar com a população é mais caro e demanda mais tempo, enquanto

que se for com a amostra é mais barato e mais rápido.

Para garantir que os resultados das pesquisas com amostras sejam


É preciso determinar
um número mínimo
realmente representativos, a escolha dos elementos que farão parte de elementos para
da pesquisa deve ser muito criteriosa, e assim permitir que os compor a amostra,
entrevistados tenham características socioeconômicas, culturais mas não há regra
fixa para determinar
e religiosas tão próximas da população a qual os resultados da
o tamanho da
pesquisa serão estendidos. Além disso, é preciso garantir que amostra.
cada um dos elementos da população tenha a mesma chance
de ser escolhido, pois aí permitimos que a amostra represente
efetivamente a população.

É preciso determinar um número mínimo de elementos para compor a

amostra, mas não há regra fixa para determinar o tamanho da amostra.

Contudo, uma boa dica é que em populações pequenas ou médias o

tamanho da amostra não deva ser menor que 10% do total de elementos

da população.

Existem algumas técnicas para a determinação da amostragem,


das quais vamos destacar as que são mais usuais:

017
unidade 1
ESTATÍSTICA

Amostragem casual ou aleatória simples: Qualquer elemento


pertencente à população estudada deve ter a mesma chance de ser
selecionado. Como o nome indica, a escolha da amostra deve ser
aleatória, por meio de sorteio.

Assim, listamos ou numeramos todos os elementos da população a


ser analisada, e então selecionamos a amostra por meio de sorteio.
Como esse processo pode ser trabalhoso, costumamos utilizar
tabelas que já existem para essa finalidade, chamadas tabelas de
números aleatórios.

Amostragem proporcional estratificada: Nesta técnica a população


é considerada como estratos, ou seja, dividida em subconjuntos,
de modo que cada um deles tenha características comuns entre os
seus elementos. O objetivo é dividir a população em subgrupos de
elementos com características semelhantes.
É utilizada quando
todos os elementos
da população podem
É utilizada quando todos os elementos da população podem ser ser divididos em
divididos em grupos homogêneos em relação à característica que grupos homogêneos
em relação à
se quer medir. Assim, conhecendo-se o tamanho da população,
característica que se
calcula-se a “fração de amostragem” e a amostra será proporcional quer medir.
aos estratos da população.

Exemplo: Uma empresa de informática tem 460 funcionários, dos


quais 278 são do sexo feminino e 182 masculino. Considerando a
variável sexo para estratificar essa população, foi selecionada uma
amostra proporcional estratificada de 50 funcionários. Calcule a
proporção de funcionários de cada sexo contida na amostra.

Resposta: Para manter a proporcionalidade, utilizaremos uma regra


de três simples, acompanhe:

Sexo feminino Sexo masculino


460 → 278 460 → 182
50 → x 50 → x
x = 30,217 ≈ 30 x = 19,782 ≈ 20

018
unidade 1
ESTATÍSTICA

Nas amostras vamos trabalhar com valores inteiros, então é preciso

utilizar os critérios de arredondamento, já abordados acima. Não faz

sentido trabalhar com uma amostra de 30,217 mulheres, por exemplo.

Ou seja, deverão fazer parte da pesquisa 30 mulheres e 20 homens.


Observe a proporcionalidade:

278 30
460 = 0,6043 ≈ 0,60 e 460 = 0,60

182 20
460 = 0,3956 ≈ 0,4 e 50 = 0,40

Isso indica que a amostra selecionada é proporcional à quantidade


de funcionários de cada sexo.
Nas amostras
Amostragem sistemática: É um método que oferece procedimento vamos trabalhar
com valores inteiros,
para a amostragem aleatória, utilizado para situações em que os
então é preciso
elementos da população já estão ordenados. utilizar os critérios de
arredondamento, já
abordados acima.
Como selecionar os elementos de uma amostra sistemática de
uma população? Basta seguir os passos:

N
I (intervalo de seleção) I=
n

onde N é o tamanho da população e

n o tamanho da amostra (n < N)

m →→ posição do 1º elemento da amostra, obtido por sorteio (é


importante destacar que m deve ser um número menor ou igual a I)

m + I →posição do 2º elemento da amostra

m + 2I → posição do 3º elemento da amostra

019
unidade 1
ESTATÍSTICA

(...)

m + (n – 1).I →posição do último elemento da amostra

Acompanhe alguns exemplos:

1º) Uma empresa tem um banco de dados com 4000 clientes


cadastrados, e decidiu fazer uma pesquisa com esses clientes
para saber quais produtos novos eles querem. Para tal, será
escolhida uma amostra sistemática de 500 clientes.

a) D
 eterminar os números dos quatro primeiros clientes que
participarão da pesquisa, sabendo que o primeiro cliente (obtido
por sorteio) seja o de número 7.

b) Qual o número do último cliente selecionado?

Resposta:

N = 4000 e n = 500,

4000
logo, I = 500 = 8, ou seja, a cada 8 clientes um será escolhido para
participar da pesquisa

a) O 1º elemento da amostra: 7 (determinado por sorteio, e é menor


que I);

o 2º elemento da amostra: m + I = 7 + 8 = 15;

o 3º elemento da amostra: m + 2I = 7 + 2.8 = 7 + 16 = 23;

o 4º elemento da amostra: m + 3I = 7 + 3.8 = 7 + 24 = 31.

b) O último elemento da amostra:

m + (n – 1).I = 7 + (500 – 1) . 8 = 7 + 499 . 8 = 7 + 3992 = 3999

020
unidade 1
ESTATÍSTICA

2º) Uma faculdade tem 3500 alunos e pretende fazer uma pesquisa
com uma amostra sistemática de 310 alunos.

a) S
 abendo que o primeiro aluno sorteado é de número 10, determine
os cinco primeiros alunos que participarão da pesquisa.

b) Qual o número do último aluno selecionado?

Resposta:

N = 3500 e n = 310,

3500
portanto: I = = 11,29
310

a) 1º elemento: 10 (que é menor que I);

2º elemento: 10 + 11,29 = 21,29 = 21;

3º elemento: 10 + 2. 11,29 = 10 + 22,58 = 32,58 = 33;

4º elemento: 10 + 3. 11,29 = 10 + 33,87 = 43,87 = 44;

5º elemento: 10 + 4. 11,29 = 10 + 45,16 = 55,16 = 55.

b) O último elemento:

10 + (310 – 1) . 11,29 = 10 + 309 . 11,29 = 10 + 3488,61 = 3498,61 = 3499

Para que você possa treinar, faça os exercícios referentes a esta unidade:

1- Qual a importância da “Estatística Descritiva” no processo de análise

dos dados estatísticos?

2- Numa grande comunidade do Norte do Brasil, deseja-se fazer uma

021
unidade 1
ESTATÍSTICA

pesquisa da porcentagem de pessoas que contraíram uma doença

contagiosa. Nessa situação, os pesquisadores devem utilizar o censo

ou amostragem? Por quê?

3- Foi tomada uma amostra de um grupo de estudantes de certo curso de

graduação para verificar o conhecimento desses alunos sobre o conteúdo

de uma determinada disciplina. Os estudantes foram selecionados ao

acaso, prestaram um exame e obtiveram as notas indicadas na tabela a

seguir, onde é também indicado o sexo do aluno.

Estudante A B C D E F G H I J K L M N O P Q R S T
Sexo M M F F F F M F F M M M M M F F F F M F
Nota 46 48 51 52 57 60 60 65 65 67 68 68 70 70 70 73 74 74 75 77

a) Quais as variáveis obtidas?

b) Quais são os tipos (qualitativa ou quantitativa) dessas variáveis?

c) Para essa situação, descreva qual é a população. Qual é a amostra?

4- Em uma pesquisa, o pesquisador decidiu fazer as perguntas

relacionadas a seguir.

PERGUNTAS RESPOSTAS

a) Qual o seu nome? ________________________

b) Quantos anos você tem? ____________

c) Você tem filhos? ( ) SIM ( ) NÃO

d) Qual o seu gênero? (1) M (2) F

e) Qual o seu salário mensal? ____________

f) Em que cidade você nasceu? _________________

g) Você é casado? ( ) SIM ( ) NÃO

h) Você mora com quantas pessoas? ____________

i) Classifique a seguinte afirmação:

022
unidade 1
ESTATÍSTICA

“O Brasil é o país mais democrático da América Latina”:

(1) Concordo totalmente

(2) Concordo parcialmente

(3) Discordo totalmente

Classifique as variáveis formadas a partir das respostas fornecidas às

perguntas em quantitativas ou qualitativas.

5- C
 lassifique as variáveis em quantitativas discretas, quantitativas

contínuas ou qualitativas:

a) Altura

b) Peso

c) Religião

d) Cidade natal

e) Estado civil

f) Número de carros emplacados

g) Bairro onde mora

h) Volume

i) Número de funcionários de uma empresa

j) Marcas de eletrodomésticos

6- Com o objetivo de divulgar um de seus produtos, determinada indústria

entrevistou 700 pessoas para saber qual veículo de informação

(jornal, rádio, revista e televisão) era mais utilizado por elas. Dentre os

entrevistados, 97 preferiam jornal, 300 rádio, 63 preferiam revista e

240 televisão. Considerando a variável número de entrevistados para

estratificar essa população, foi selecionada uma amostra proporcional

estratificada de 90 entrevistados. Calcule a quantidade de entrevistados

de acordo com o veículo de informação contido na amostra.

7- A cartela de clientes que fazem aplicações em poupança de um banco

tem 8200 investidores. O banco pretende fazer uma campanha com

parte deles para oferecer nova opção de rendimento seguro como

a poupança, mas que renda mais ao cliente. Decidiu que os 400

investidores que deverão participar da pesquisa serão escolhidos por

meio de amostra sistemática. Sabendo que o primeiro deles a participar

(definido por sorteio) é o de número 15, determine os números dos

próximos seis clientes selecionados, e também o número do último.

023
unidade 1
ESTATÍSTICA

RESPOSTAS:

1- A Estatística Descritiva tem como principal função resumir os dados

e informações investigadas, com o objetivo de expor os mesmos

de modo mais fácil possível. É a parte mais conhecida da Estatística,

representada pelas médias, índices e gráficos presentes nas notícias

que circulam pelos jornais, revistas, televisão, sites, etc.

2- Amostragem, pois como se trata de uma grande população, analisar

o número de pessoas contagiadas levaria muito tempo e seria de alto

custo. Além disso, são muitas variáveis a serem consideradas, o que

pode modificar a população original e invalidar o censo.

3- a) As variáveis são sexo e nota.

b) Qualitativa: sexo; quantitativa: nota.

c) P
 opulação: estudantes de um curso de graduação; amostra: os 20

alunos que foram selecionados para a pesquisa.

4 - Qualitativa: letras a, c, d, f, g, i

Qualita tiva: letras b, e, h

5- a) Quantitativa contínua b) Quantitativa contínua

c) Qualitativa d) Qualitativa

e) Qualitativa f) Quantitativa discreta

g) Qualitativa h) Quantitativa contínua

i) Quantitativa discreta j) Qualitativa

6- Jornal: 12 Rádio: 39 Revista: 8 Televisão:31

7- 36 ;56, 77; 97; 118; 138

Último elemento: 8195

Revisão
Ao longo da unidade, foram apresentados conceitos relacionados
à introdução à Estatística, além de relembrar alguns conceitos
matemáticos elementares para a compreensão da disciplina.
Acompanhe o esquema a seguir:

024
unidade 1
ESTATÍSTICA

UNIDADE 1 - INTRODUÇÃO À ESTATÍSTICA

DEFINIÇÃO REVISÃO Técnicas de


amostragem

Método Dados e População A notação A notação Regras de


Estatística Variedades Aleatória
estratégico informações e amostra por meio Sigma arrendon-
de índices damento simples

A importância
Fases Qualitativa X1 representa
da estatística
qualquer Proporcional
valor da estratificada
variável
estatística
Qualitativa

Sistemática

Para saber mais sobre o assunto, leia os livros abaixo:

STENVENSON, Willian J. Estatística aplicada à administração. São Paulo:

Harbra, 2001.

TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2008.

025
unidade 1
Séries estatísticas,
gráficos
estatísticos e
números índices
Introdução

Nesta unidade será destacada a importância da organização


• A tabela e o rol
dos dados coletados em uma pesquisa, os chamados dados
brutos. Sem qualquer tipo de organização, eles permitem poucas • Distribuição de
frequências, tipos
inferências a respeito do tema em estudo, por isso a importância de de frequências
organizá-los em uma tabela chamada distribuição de frequências. e elementos da
distribuição de
requências
Serão consideradas três situações em relação à origem dos dados.
• Dados absolutos
Se os dados são oriundos de variável qualitativa, a organização
e dados relativos
dos dados é mais simples (BRUNI, 2007). Já no caso de variáveis
• A distribuição
quantitativas, é preciso verificar os dados para escolher a melhor de frequências
forma de organizá-los. No caso de os dados se repetirem várias sem intervalos de
classe
vezes, fazemos a organização na tabela em ordem crescente e
contamos a quantidade de vezes que cada um dos valores se • A distribuição
de frequências
repete. Então é realizado o registro chamado de frequência absoluta em intervalos de
e depois a frequência relativa, que é a representação percentual da classe: número
de classes e
frequência absoluta.
intervalos de
classe
A terceira situação a ser considerada é quando os dados coletados • A distribuição
também são de variável quantitativa, mas aparecem mais dados de frequências e a
sustentabilidade
que têm pouca ou nenhuma repetição. Nesse caso, é praticamente
impossível analisá-los sem que sejam organizados em classes. • Revisão
ESTATÍSTICA

A tabela e o rol
Acompanhe o conjunto de dados abaixo que se referem à
quantidade de unidades produzidas por uma pequena empresa
durante os doze meses de um ano, de acordo com a demanda do
mercado:

500 485 510 389 523 411


453 398 489 485 503 470

Esse conjunto de dados é chamado de tabela primitiva, pois os dados ainda não foram
organizados, ou seja, são chamados dados brutos. Dados brutos são aqueles que não foram
numericamente organizados.

Quando organizamos esse conjunto de dados brutos em ordem crescente ou decrescente,


chamamos essa organização de rol (SPIEGEL & STEPHENS, 2009), veja:

389 398 411 453 470 485


485 489 500 503 510 523

Com o rol fica mais fácil identificar informações no conjunto de dados,


tal como o maior e o menor valor, os dados que se repetem, etc.

Distribuição de
frequências, tipos de
frequências e elementos
da distribuição de
requências
A distribuição de frequências é uma forma pela qual podemos
descrever os dados estatísticos resultantes de variáveis
quantitativas ou qualitativas. Segundo BRUNI (2007, p. 9) “o objetivo

028
unidade 2
ESTATÍSTICA

maior da construção de tabelas de frequência envolve facilitar a


extração de informações das diferentes bases de dados analisados”.

Os dados das variáveis quantitativas basicamente são organizados


e classificados de duas formas diferentes: sem intervalos de
classes e em intervalos de classes. Quando os dados são de origem
qualitativa, os dados são organizados sem intervalos de classes.

A distribuição de frequências deve conter as seguintes colunas:

• Variável estatística (xi): é a coluna inicial da distribuição,


em que registraremos os diferentes valores, de acordo com
o que está sendo estudado. Também chamado de rol, é a
ordenação dos valores obtidos segundo algum critério,
geralmente em ordem crescente ou decrescente, ou em
Também chamado
ordem alfabética, quando se referir a dados qualitativos; de rol, é a ordenação
dos valores obtidos
• Frequência absoluta (fi): essa coluna indica a quantidade
segundo algum
de vezes que cada elemento aparece na amostra ou a critério, geralmente
quantidade de elementos que pertencem a uma classe; em ordem crescente
ou decrescente, ou
• Frequência relativa (fri): essa coluna se caracteriza pela em ordem alfabética,
representação da frequência absoluta em porcentagem em
quando se referir a
dados qualitativos.
relação ao total de dados;

• Frequência absoluta acumulada (Fi): nessa coluna os


valores são obtidos adicionando a cada frequência absoluta
os valores das frequências anteriores;

• Frequência relativa acumulada (Fri): os valores dessa


coluna são obtidos adicionando a cada frequência relativa
os valores das frequências anteriores.

Dados absolutos e
dados relativos
Os dados absolutos são aqueles obtidos diretamente por meio da

029
unidade 2
ESTATÍSTICA

pesquisa, sem qualquer manipulação. Quando se refere a um grupo


de “20 funcionários do setor de vendas da empresa”, esse número é
um dado absoluto.

Já quando utilizamos os dados absolutos para fazer qualquer


comparação por meio de uma razão (divisão), estamos trabalhando
com dados relativos. Os dados relativos podem ser apresentados
por coeficientes ou porcentagens. Assim, no exemplo dos 20
funcionários do setor de vendas da empresa, se o comparamos por
meio de uma razão com o total de funcionários dessa empresa, que
são 160, temos os dados relativos, veja:

nº de funcionários do setor de vendas


= 20 = 0,125 que é um coeficiente
(nº de funcionários da empresa) 160 Os dados absolutos
e relativos são
Se multiplicarmos o coeficiente 0,125 por 100, temos a muito utilizados,
por exemplo, na
representação relativa por meio de porcentagem: 0,125 x 100 =
imprensa, quando
12,5% querem facilitar a
compreensão por
parte da população.
Geralmente utilizam
as expressões do
Os dados absolutos e relativos são muito utilizados, por exemplo, tipo “em números
na imprensa, quando querem facilitar a compreensão por parte da absolutos” e “em
números relativos”.
população. Geralmente utilizam as expressões do tipo “em números
absolutos” e “em números relativos”.

Acompanhe outro exemplo:

Uma loja de departamentos tem na saída da loja um painel em que


convida os clientes a realizarem a avaliação da satisfação do cliente
com o atendimento recebido. Ao final de um dia, o resultado foi o
seguinte:

030
unidade 2
ESTATÍSTICA

TABELA 2 - Grau de satisfação dos


clientes da loja de departamentos

GRAU DE SATISFAÇÃO QUANTIDADE DE CLIENTES

Muito Satisfeito 5

Satisfeito 38

Pouco Satisfeito 12

Insatisfeito 10

TOTAL 65

Fonte: Elaborado pelo autor.

Observe que a quantidade de clientes que participou da pesquisa é


a quantidade absoluta. Acompanhe a tabela em que apresentamos
esses dados absolutos também em coeficiente e em porcentagem.

TABELA 3 – Distribuição de frequências

GRAU DE SATISFAÇÃO QUANTIDADE DE CLIENTES COEFICIENTE PORCENTAGEM

Muito Satisfeito 5 5 0,076923 x 100 = 7,6923 %


65 = 0,076923

Satisfeito 38 38 0,584615 x 100 = 58,4615 %


65 = 0,584615

Pouco Satisfeito 12 12 0,184615 x 100 = 18,4615 %


65
= 0,184615

Insatisfeito 10 10 0,153846 x 100 = 15,3846 %


65
= 0,153846

TOTAL 65 0,999999 = 1 99,9999 % = 100%

Fonte: Elaborado pelo autor.

A distribuição de
frequências sem
intervalos de classe
Trata-se da organização e da classificação de dados de variáveis
quantitativas não agrupadas em intervalos de classe. Utilizamos
essa situação quando temos poucos dados na frequência relativa e
estes repetem-se mais vezes.

031
unidade 2
ESTATÍSTICA

Exemplos:

1º) O quadro abaixo apresenta as notas dos 35 alunos de uma


turma em avaliação da disciplina Fundamentos e Metodologia
da Matemática II, cujo valor foi 20,0 créditos.

7,0 13,0 12,0 15,0 3,0 15,0 17,0 10,0 17,0 7,0 10,0
18,0 15,0 12,0 10,0 12,0 11,0 11,0 11,0 16,0 15,0 10,0
12,0 11,0 10,0 12,0 13,0 12,0 18,0 16,0 12,0 13,0 15,0
18,0 10,0

Com base nesses dados, deve-se construir a distribuição de


frequências.

Em seguida, responda às seguintes questões:

a) 
Quantos alunos conseguiram nota menor que 12,0 nessa
avaliação?

b) Considerando que a média nessa avaliação é 12,0, qual a


porcentagem de alunos que conseguiu alcançar ou superar a
média?

Resposta:

A variável estatística (xi) é “nota dos alunos”. Vamos organizar os


dados em ordem crescente, ou seja, o rol:

3,0 – 7,0 – 7,0 – 10,0 – 10,0 – 10,0 – 10,0 – 10,0 – 10,0 – 11,0 –
11,0 – 11,0 – 11,0 12,0 – 12,0 – 12,0 – 12,0 – 12,0 – 12,0 – 12,0 –
13,0 – 13,0 – 13,0 – 15,0 – 15,0 – 15,0 – 15,0 – 15,0 – 16,0 – 16,0
– 17,0 – 17,0 – 18,0 – 18,0 – 18,0

Com os dados em rol, é possível identificar que a menor nota é


3,0 e a maior nota é 18,0. Veja agora a distribuição de frequências
completa com todas as colunas:

032
unidade 2
ESTATÍSTICA

TABELA 4 – Distribuição de frequências

Xi fi Fri (%) Fi Fri (%)


(Variável (Freq (Freq relativa) (Freq absoluta (Freq relativa acumulada)
estatística) absoluta) acumulada)

3,0 1 1/35 x 100 = 2,857 1 2,857

7,0 2 2/35 x 100 = 5,714 1+2=3 2,857 + 5,714 = 8,571

10,0 6 6/35 x 100 = 17,143 3+6=9 8,571 + 17,143 = 25,714

11,0 4 4/35 x 100 = 11,429 9 + 4 = 13 25,714 + 11,429 = 37,143

12,0 7 7/35 x 100 = 20,0 13 + 7 = 20 37,143 + 20 = 57,143

13,0 3 3/35 x 100 = 8,571 20 + 3 = 23 57,143 + 8,571 = 65,714

15,0 5 5/35 x 100 = 14,286 23 + 5 = 28 65,714 + 14,286 = 80

16,0 2 2/35 x 100 = 5,714 28 + 2 = 30 80 + 5,714 = 85,714

17,0 2 2/35 x 100 = 5,714 30 + 2 = 32 85,714 + 5,714 = 91,428

18,0 3 3/35 x 100 = 8,571 32 + 3 = 35 91,428 + 8,571 = 100

∑ 35 100,0

Fonte: Elaborado pelo autor.

Observe que consideramos três casas decimais e utilizamos as regras de

arredondamento, já que a maioria das divisões geram dízimas.

Com os dados organizados, é mais simples conseguir qualquer


informação a respeito do conjunto de dados. Fica mais fácil
responder as perguntas:

a) 
Para responder essa pergunta, basta consultar a coluna Fi.
Quando pede nota menor que 12,0, então é até 11,0. Logo, são 13
alunos (confira na 4ª coluna).

b) Nesse caso, vamos consultar a coluna Fri. Basta tirar do total


(100%) a porcentagem das notas menores que 12,0 (37,143%.
Consulte a 5ª coluna).

033
unidade 2
ESTATÍSTICA

Então: 100 – 37,143 = 62,857 %

2º) A tabela abaixo apresenta as vendas diárias de um determinado


aparelho elétrico por uma rede que tem cinco lojas em uma
cidade durante um mês (vale ressaltar que nessa cidade as lojas
não abrem aos domingos).

14 12 11 13 14 13 12 14 13 14 11 12

11 12 14 10 13 15 11 15 13 16 17 14
14

Forme uma distribuição de frequências. Em seguida, responda às


seguintes questões:

a) Qual a porcentagem de dias em que as vendas superaram 14


aparelhos elétricos?

b) Qual a quantidade de dias em que as vendas não chegaram a


atingir 13 unidades desse aparelho elétrico?

Resposta:

A variável estatística (xi) é “quantidade de venda diária”. Vamos


organizar os dados em ordem crescente.

O rol:

10 – 11 – 11 – 11 – 11 – 12 – 12 – 12 – 12 – 13 – 13 – 13 – 13 –
13 – 13 – 14 – 14 – 14 -14 – 14 – 14 – 14 – 15 – 15

A menor quantidade vendida é 10 e a maior é 17.

Veja a distribuição de frequências:

034
unidade 2
ESTATÍSTICA

TABELA 5 – Distribuição de frequências

Xi fi Fri (%) Fi Fri (%)

10 1 1/25 x 100 = 4 1 4

11 4 4/25 x 100 = 16 1+4=5 4 + 16 = 20

12 4 4/25 x 100 = 16 5+4=9 20 + 16 = 36

13 5 5/25 x 100 = 20 9 + 5 = 14 36 + 20 = 56

14 7 7/25 x 100 = 28 14 + 7 = 21 56 + 28 = 84

15 2 2/25 x 100 = 8 21 + 2 = 23 84 + 8 = 92

16 1 1/25 x 100 = 4 23 + 1 = 24 92 + 4 = 96

17 1 1/25 x 100 = 4 24 + 1 = 25 96 + 4 = 100

∑ 25 100,0

Fonte: Elaborado pelo autor.

a) Do total (100%), tirar os dias em que as vendas foram de 14 ou


menos (84%): 100 – 84 = 16%

b) Nesse caso, queremos a quantidade de dias em que as vendas


foram menores que 13, ou seja, até 12. Logo, conferindo na 4ª
coluna: 9 dias

Para contar quantas vezes cada dado da variável estatística aparece,

risque cada dado contado para você não se perder e ganhar tempo.

2ª situação: Organização e classificação de dados de variáveis


qualitativas: Os dados qualitativos também, após a coleta,
necessitam ser organizados e classificados. Nesse caso, vamos
utilizar a tabela de distribuição frequência, mas em geral apenas
a frequência absoluta e a frequência relativa.

Acompanhe o exemplo:

035
unidade 2
ESTATÍSTICA

Foi realizada uma pesquisa com os compradores de refrigerantes


em um supermercado durante um dia. Cada comprador informou
qual o refrigerante havia adquirido.

TABELA 6 - Dados de uma amostra de compras de refrigerantes em um supermercado.

Coca Cola Pepsi Twist Coca Cola Pepsi Twist Guaraná

Guaraná Coca Cola Guaraná Coca Cola Pepsi Twist

Coca Cola Pepsi Twis Sprite Guaraná Coca Cola

Coca Cola Coca Cola Guaraná Sprite Guaraná

Sprite Coca Cola Coca Cola Guaraná Sprite

Coca Cola Pepsi Twist Pepsi Twist Coca Cola Coca Cola

Coca Cola Coca Cola Coca Cola Coca Cola Guaraná

Guaraná Coca Cola Guaraná Guaraná Coca Cola

Coca Cola Guaraná Guaraná Coca Cola Sprite

Pepsi Twist Sprite Coca Cola Pepsi Twist Guaraná

Fonte: Elaborado pelo autor.

Com base nesse levantamento, construa a tabela de frequências e


determine quantas pessoas foram entrevistadas, e a marca mais
comprada:

Resposta:

xi → “marca de refrigerante comprada”

É preciso organizar os dados da variável estatística segundo algum


critério. Nesse caso vamos utilizar a ordem alfabética:

036
unidade 2
ESTATÍSTICA

TABELA 7 – Distribuição de frequências

Xi fi Fri (%)

Coca cola 22 22/50 x 100 = 44

Guaraná 14 14/50 x 100 = 28

Pepsi twist 8 8/50 x 100 = 16

Sprite 6 6/50 x 100 = 12

∑ 50 100

Fonte: Elaborado pelo autor.

Ao analisar os dados organizados, é possível responder as


perguntas que foram feitas no enunciado: foram entrevistadas 50
pessoas e a marca mais comprada foi a Coca cola.

A distribuição de Ao analisar os dados

frequências em organizados, é
possível responder

intervalos de classe: as perguntas que


foram feitas no
enunciado.
número de classes e
intervalos de classe
Em muitas situações, os dados coletados de variáveis quantitativas
aparecem com poucas repetições, o que inviabiliza a organização
dos mesmos em tabelas como na 1ª situação descrita. Quando
isso acontecer, é preciso agrupar os valores coletados em classes.

Ao organizar os dados em classes ganhamos muito em praticidade,


pois é possível evitar tabelas muito extensas, com muitos dados
se repetindo poucas vezes, o que facilita a visualização e a
interpretação dos dados coletados. Contudo, é claro que perdemos
em qualidade da informação, pois, ao agrupar os dados em classes,
eles perdem a individualidade, não sendo possível saber quais
dados foram coletados.

037
unidade 2
ESTATÍSTICA

Para organizar os dados em classes é necessário determinar as


seguintes variáveis:

• a amplitude total (AT), que é a diferença entre o maior e o menor


valor do conjunto de dados;

• o número de classes (k);

• a amplitude do intervalo de classes (h).

Todas essas variáveis podem ser determinadas pelo pesquisador, que

tem liberdade para decidir qual o melhor número de classes e também o

intervalo de classes para organizar os dados. Porém, com o objetivo de

uniformizar o processo, utilizamos meios estatísticos para tal organização.

Vamos utilizar aqui a fórmula mais simples para a determinação do


número de classes:

K = √n , onde n é o número de dados

Já a amplitude do intervalo de classe é dada por:

h = AT
k

Acompanhe os exemplos de aplicação.

1º) O quadro abaixo apresenta as notas dos 36 alunos de uma


turma em avaliação da disciplina Estatística, cujo valor foi 20,0
créditos:

7,0 13,0 12,5 15,0 5,0 15,0 17,0 10,5 17,5 7,0 9,5
19,0 15,5 12,0 10,0 12,0 11,5 11,0 11,0 16,0 14,0 10,0
12,0 11,5 10,5 12,0 13,0 12,0 8,5 16,0 12,0 8,0 14,5 9,5
10,0 6,5

038
unidade 2
ESTATÍSTICA

Com base nesses dados, construa a distribuição de frequências em


classes.

Resposta:

Observe que aparecem muitos dados, mas que se reptem poucas


vezes, por isso é preciso organizar os dados em classes.

Vamos construir o rol:

5,0 – 6,5 – 7,0 - 7,0 – 8,0 – 8,5 – 9,5 - 9,5 – 10,0 – 10,0 – 10,0 –
10,5 – 10,5 – 11,0 – 11,0 - 11,5 – 11,5 – 12,0 – 12,0 – 12,0 – 12,0
– 12,0 – 12,0 – 12,5 – 13,0 – 13,0 – 14,0 – 14,5 – 15,0 – 15,0 – 15,5
– 16,0 – 16,0 – 17,0 – 17,5 – 19,0

Para isso, é preciso determinar:

n (quantidade de dados) = 36
De acordo com
Maior valor = 19,0
o conjunto de
dados podemos
Menor valor = 5,0 “arredondar” a
amplitude.
AT = maior valor – menor valor = 19,0 – 5,0 → AT = 14

K = √n = √36 → k = 6

14
h = 6 → h = 2,333...

h ≅≈ 2,5

De acordo com o conjunto de dados podemos “arredondar” a


amplitude. É uma questão de coerência, isto porque as notas (dados
brutos) são compostas apenas por valores inteiros e decimais, no
caso de 0,5 em 0,5.

xi →→ notas dos alunos

A construção das classes

039
unidade 2
ESTATÍSTICA

TABELA 8 – Distribuição de frequências

Xi

5,0 |⎯ 7,5 Menor valor do conjunto de dados (5,0) + h (2,5)

7,5 |⎯ 10,0 Limite superior da classe anterior (7,5) + h (2,5)

10,0 |⎯ 12,5 Limite superior da classe anterior (10,0) + h (2,5)

12,5 |⎯ 15,0 Limite superior da classe anterior (12,5) + h (2,5)

15,0 |⎯ 17,5 Limite superior da classe anterior (15,0) + h (2,5)

17,5 |⎯ 20,0 Limite superior da classe anterior (17,5) + h (2,5)

Fonte: Elaborado pelo autor.

Vale explicar o símbolo | , que é o intervalo fechado à esquerda e


aberto à direita, ou seja, “inclui” o limite inferior- é contado na
classe- e “exclui” o limite superior- não é contado na classe.

Quando aparecer o símbolo | |, trata-se do intervalo fechado à


esquerda e fechado à direita.

Com as classes definidas, é hora de construir a distribuição de


frequências.

TABELA 9 – Distribuição de frequências

Xi fi fri (%) Fi Fri (%)


4
5,0 |⎯ 7,5 1 36 = 0,1111 x 100 = 11,11
4 11,11

7,5 |⎯ 10,0 4 4 4+4=8 11,11 + 11,11 = 22,22


36 = 0,1111 x 100 = 11,11

10,0 |⎯ 12,5 4 15 8 + 15 = 23 22,22 + 41,67 = 63,89


36 = 0,4167 x 100 = 41,67

12,5 |⎯ 15,0 5 5 23 + 5 = 28 63,89 + 13,89 = 77,78


36 = 0,1389 x 100 = 13,89

15,0 |⎯ 17,5 7 6 28 + 6 = 34 77,78 + 16,67 = 94,45


36 = 0,1667 x 100 = 16,67

17,5 |⎯ 20,0 2 2 34 + 2 = 36 94,45 + 5,56 = 100


36 = 0,0556 x 100 = 5,56

∑ 1 100

Fonte: Elaborado pelo autor.

040
unidade 2
ESTATÍSTICA

2º) No quadro a seguir estão registradas as massas, em


quilogramas, de 50 pessoas que passaram no consultório de
um médico durante um dia.

72 81 57 64 87 90 74 69 77 73
80 96 55 58 88 92 47 60 68 80
77 76 59 57 83 81 90 68 65 74
91 97 86 82 73 64 69 71 88 94
77 72 81 91 49 75 52 50 63 70

Determine um intervalo com amplitude conveniente e elabore um


quadro de

distribuição de frequências.

Resposta:

Observe que, como no exercício anterior, aparecem muitos dados,


mas que se reptem poucas vezes e, por esse motivo, é necessário
organizar os dados em classes.

O rol:

47 – 49 – 50 – 52 – 55 – 57 – 57 - 58 – 59 – 60 – 63 – 64 – 64 –
65 – 68 – 68 - 69 – 69 – 70 – 71 – 72 – 72 – 73 – 73 – 74 – 74
– 75 – 76 – 77 – 77 – 77 – 80 – 80 – 81 – 81 – 81 – 82 – 83 – 86
– 87 – 88 – 88 – 90 – 90 – 91 - 91 – 92 – 94 - 96 – 97

Para tanto, é preciso determinar:

Maior valor = 970

Menor valor = 47

n = 50

AT = 97 – 47 → AT = 50

K = √50 → k = 7,071

041
unidade 2
ESTATÍSTICA

50
h= → h = 7,071...
7,071

h ≈≅8

De acordo com o conjunto de dados, podemos “arredondar”


a amplitude. Como os dados brutos são todos inteiros, foi
arredondado para o número inteiro maior que o valor encontrado.

xi → notas dos alunos

A construção da classe

Com as classes
TABELA 10 – Distribuição de frequências definidas, é o
momento de
Xi fi
construir a
47 |⎯ 55 Menor valor do conjunto de dados (47) + h (8) distribuição de
frequências, como
55 |⎯ 63 Limite superior da classe anterior (55) + h (8) foi feito no exemplo
anterior.
63 |⎯ 71 Limite superior da classe anterior (63) + h (8)

71 |⎯ 79 Limite superior da classe anterior (71) + h (8)

79 |⎯ 87 Limite superior da classe anterior (79) + h (8)

87 |⎯ 95 Limite superior da classe anterior (87) + h (8)

95 |⎯ 103 Limite superior da classe anterior (87) + h (8)

Fonte: Elaborado pelo autor.

Com as classes definidas, é o momento de construir a distribuição


de frequências, como foi feito no exemplo anterior.

042
unidade 2
ESTATÍSTICA

TABELA 11 – Distribuição de frequências

Xi fi fri (%) Fi Fri (%)

47 |⎯ 55 4 8 4 8

55 |⎯ 63 6 12 10 20

63 |⎯ 71 9 18 19 38

71 |⎯ 79 12 24 31 62

79 |⎯ 87 8 16 39 78

87 |⎯ 95 9 18 48 96

95 |⎯ 103 2 4 50 100

∑ 50 100

Fonte: Elaborado pelo autor.

A preservação do
A distribuição de meio ambiente
é cada vez mais
frequências e a tema discutido,
especialmente nas
sustentabilidade grandes empresas,
e a coleta de lixo é
A preservação do meio ambiente é cada vez mais tema discutido, sempre uma grande
preocupação.
especialmente nas grandes empresas, e a coleta de lixo é sempre
uma grande preocupação. Neste sentido, alguns bancos têm
disponibilizado em suas agências uma inciativa interessante
em que coletores são colocados para que os clientes e pessoas
em geral deixem, principalmente, pilhas e baterias de portáteis,
como de máquinas digitais e de celulares, para que as mesmas
não sejam descartadas no lixo comum, pois assim evitam os
resíduos tóxicos que causam riscos ao meio ambiente e à saúde
da humanidade.

Para verificar a eficiência dessa iniciativa, o banco escolheu uma


agência em cada capital dos estados brasileiros e em Brasília para
verificar a quantidade recolhida desse material, durante o segundo
ano dessa iniciativa. O resultado está apresentado abaixo, em Kg:

043
unidade 2
ESTATÍSTICA

11,5 5 9 17 2 4 8 6,5 13 10,5 14,5 3,5


7 3 11 21 9,5 8,5 10 15 6 12,5 5,5 12
7,5 4,5 14 9

Com os dados de recolhimento do material para reciclagem,


construa a distribuição de frequências:

Resposta:

O primeiro passo é construir o rol:

2 – 3 – 3,5 – 4 – 4,5 – 5 – 5,5 – 6 - 6,5 – 7 – 7,5 – 8 – 8,5 – 9 – 9


– 9,5 – 10 – 10,5 – 11 – 11,5 – 12 – 12,5 - 13 – 14 – 14,5 – 15 –
17 – 21

Nesse caso é preciso determinar se a distribuição de frequências


será construída em classes ou sem intervalos de classes. Observe
que temos poucos dados repetidos, logo, é preciso construir as
classes.

n = 28

Maior valor = 21

Menor valor = 2

AT = 21 – 2 = 19

K = √28 → k = 5,2915

19
h = 5,2915 → h = 3,5907

h ≈≅ 3,5 (o arredondamento foi realizado de acordo com a natureza


do conjunto de dados.)

044
unidade 2
ESTATÍSTICA

TABELA 12 – Distribuição de frequências

Xi fi

2 |⎯ 5,5 Menor valor do conjunto de dados (2) + h (3,5)

5,5 |⎯ 9 Limite superior da classe anterior (5,5) + h (3,5)

9 |⎯ 12,5 Limite superior da classe anterior (9) + h (3,5)

12,5 |⎯ 16 Limite superior da classe anterior (12,5) + h (3,5)

16 |⎯ 19,5 Limite superior da classe anterior (16) + h (3,5)

19,5 |⎯ 23 Limite superior da classe anterior (19,5) + h (3,5)

Fonte: Elaborado pelo autor.

Com as classes definidas, é o momento de construir a distribuição


de frequências, como foi feito no exemplo anterior.

TABELA 13 – Distribuição de frequências

Xi fi fri (%) Fi Fri (%)

2 |⎯ 5,5 6 21,429 6 21,429

5,5 |⎯ 9 7 25 13 46,429

9 |⎯ 12,5 8 28,571 21 75

12,5 |⎯ 16 5 17,857 26 92,857

16 |⎯ 19,5 1 3,571 27 96,428

19,5 |⎯ 23 1 3,571 28 100

∑ 28 100

Fonte: Elaborado pelo autor.

Para treinar, faça agora as atividades referentes a essa unidade.

1- Com o objetivo de divulgar um de seus produtos, determinada indústria

entrevistou 600 pessoas para saber qual veículo de informação

(internet, rádio, revista e televisão) era mais utilizado por elas. Dentre os

045
unidade 2
ESTATÍSTICA

entrevistados, 210 preferiam internet, 276 rádio, 42 preferiam revista e

72 televisão.

Construir uma tabela relacionando os quatro veículos de informação e a

distribuição de frequências.

2- Dada a distribuição de frequência abaixo:

xi 3 4 5 6 7 8

fi 5 2 8 3 12 10

Determine:

a) ∑ fi.

b) as frequências relativas.

c) as frequências acumuladas.

d) construir a ogiva de frequência absoluta acumulada.

3 - Os valores abaixo representam as estaturas, em centímetros, de 40

alunos de uma turma de 1º ano do ensino médio de uma escola:

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Elaborar a distribuição de frequências com os dados agrupados em

classes.

4 - Foi realizada uma pesquisa com 40 pessoas que procuravam um

carro popular usado para comprar, de modo a levantar o carro que

pretendiam comprar. A pesquisa foi encomendada por um centro de

vendas de carro aqui de Belo Horizonte e apresentou os seguintes

resultados:

046
unidade 2
ESTATÍSTICA

Uno Pálio Uno Corsa Sedan Ford Ka Gol Ford Ka Gol

Pálio Gol Uno Uno Pálio Uno Pálio Uno

Pálio Gol Uno Gol Ford Ka Corsa Sedan Pálio Uno

Ford Ka Ford Ka Gol Uno Pálio Gol Pálio Ford Ka

Uno Pálio Uno Uno Gol Gol Gol Corsa Sedan

A partir desse levantamento, construa uma tabela com as frequências

e o histograma. Determine o carro mais procurado e também o menos

procurado.

5 - O quadro mostra a distribuição de frequências dos salários mensais

(agrupados em classes) de 50 empregados de uma firma:

TABELA 14 – Salários dos funcionários da firma

SALÁRIO (EM REAIS) NÚMERO DE EMPREGADOS (fi)

1 000 |⎯ 1 100 9

1 100 |⎯ 1 200 15

1 200 |⎯ 1 300 18

1 300 |⎯ 1 400 5

1 400 |⎯ 1 500 3

Fonte: Elaborado pelo autor.

Nessas condições:

a) Qual a amplitude do intervalo de classe?

b) Elabore um quadro de distribuição de frequências.

c) Quantos empregados ganham menos de R$1.200,00 mensais?

d) Qual o índice, em porcentagem, de empregados que ganham R$ 1.200,00

ou mais?

e) 
Quantos empregados ganham entre R$1 000,00 (inclusive) e

R$1.300,00?

047
unidade 2
ESTATÍSTICA

f) Qual o índice, em porcentagem, de empregados que ganham menos que

R$1.200,00?

RESPOSTAS:

1-
TABELA 15 – Distribuição de frequências

VEÍCULO DE INFORMAÇÃO fi fri (%)

Internet 210 35

Rádio 276 46

Revista 42 7

Televisão 72 12

∑ 600 100

Fonte: Elaborado pelo autor.

2- a) 40

b), c)

TABELA 16 – Distribuição de frequências

Xi fi fri (%) Fi Fri (%)

3 5 12,5 5 12,5

4 2 5 7 17,5

5 8 20 15 37,5

6 3 7,5 18 45

7 12 30 30 75

8 10 25 40 100

∑ 40 100 - -

Fonte: Elaborado pelo autor.

048
unidade 2
ESTATÍSTICA

3-
TABELA 17 – Distribuição de frequências

Xi fi fri (%) Fi Fri (%)

150 |⎯ 154 4 10 4 10

154 |⎯ 158 9 22,5 13 32,5

158 |⎯ 162 11 27,5 24 60

162 |⎯ 166 8 20 32 80

166 |⎯ 170 5 12,5 37 92,5

170 |⎯ 174 3 7,5 40 100

∑ 40 100 - -

Fonte: Elaborado pelo autor.

4-

TABELA 18 – Distribuição de frequências

VEÍCULO PRETENDIDO fi fri (%)

Corsa Sedan 3 7,5

Ford kA 6 15

Gol 10 25

Pálio 9 22,5

Uno 12 30

∑ 40 100

Fonte: Elaborado pelo autor.

049
unidade 2
ESTATÍSTICA

5- a) 100

b)

TABELA 19 – Distribuição de frequências

Xi fi fri (%) Fi Fri (%)

1 000 |⎯ 1 100 9 18 9 18

1 100 |⎯ 1 200 15 30 24 48

1 200 |⎯ 1 300 18 36 42 84

1 300 |⎯ 1 400 5 10 47 94

1 400 |⎯ 1 500 3 6 50 100

∑ 50 100 - -

Fonte: Elaborado pelo autor.

c) 24

d) 52%

e) 42

f) 48 %

Revisão
Nessa unidade abordamos a organização dos dados de uma
pesquisa. Foi abordado que, após a coleta dos dados brutos,
existe a necessidade da organização dos mesmos em uma tabela,
chamada distribuição de frequências. Vimos que, de acordo com a
origem dos dados, a organização vai acontecer de uma forma.

Acompanhe o esquema a seguir que resume os principais conceitos


tratados na unidade:

050
unidade 2
ESTATÍSTICA

A organização
dos dados

A tabela e o rol

Elementos da A distribuição de
A distribuição Tipos de
distribuição de frequências e a
de frequências frequências
frequências sustentabilidade

Dados Dados Variável


qualitativos absolutos estatística (xi)

Sem intervalos Dados Frequência


de classes relativos absoluta

Em intervalos Frequência
de classes relativa

Frequência
absoluta
acumulada

Frequência
relativa
acumulada

Fonte: elaborado pelo autor.

Para saber mais, pesquise os livros a seguir:

STENVENSON, Willian J. Estatística aplicada à administração. São Paulo:

Harbra, 2001.

TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2008.

051
unidade 2
Os gráficos
Introdução

Na Unidade 2 estudamos as distribuições de frequências, que na


verdade são tabelas que nos permitem apresentar e interpretar os
dados. Agora, vamos estudar os gráficos que permitem ao leitor
compreender de forma eficiente e mais simples os dados numéricos
coletados na pesquisa, ou seja, “uma das mais simples formas de
transmissão das informações contidas em diferentes conjuntos de
dados” (BRUNI, 2007, p.23).

Portanto, quando construímos um gráfico, devemos ter como


objetivo maior a transmissão da informação. Segundo Triola (2013,
p. 49), o “objetivo é identificar um gráfico adequado para representar
um conjunto de dados. O gráfico deve ser eficaz em revelar as
• O histograma
características importantes dos dados”.
• Diagrama
ou gráfico de
A seguir vamos abordar os principais tipos de gráficos que podem colunas
ser utilizados para apresentar um conjunto de dados. • Diagrama ou
gráfico de barras
• Diagrama ou
gráfico de Pareto
• Diagrama ou
gráfico de setores
• Diagrama ou
gráfico de ogiva
• Os gráficos e a
sustentabilidade
• Revisão
ESTATÍSTICA

O histograma
É um dos mais simples e eficientes gráficos utilizados para
apresentar dados, e representa as frequências simples ou relativas.
É um diagrama de colunas em que cada retângulo relaciona-se com
a distribuição de frequências. Tiboni (2010) destaca que a diferença
entre o histograma e o gráfico de coluna é que no primeiro não
há separação entre os retângulos para facilitar a visualização dos
dados. O histograma é utilizado para analisar a forma de distribuição
dos dados e é basicamente uma versão gráfica de uma distribuição
de frequências.

Em geral, no eixo
Em geral, no eixo das abscissas (ou eixo horizontal) representamos a das abscissas (ou
eixo horizontal)
variável estatística e no eixo das ordenadas (ou eixo vertical), a frequência
representamos a
absoluta ou relativa, de acordo com o que se pretende destacar. variável estatística
e no eixo das
Vamos representar alguns dos exemplos organizados na ordenadas (ou eixo
vertical), a frequência
distribuição de frequências em histogramas.
absoluta ou relativa,
de acordo com o que
1º) A tabela abaixo representa a distribuição de frequências das se pretende destacar.
notas dos 35 alunos de uma turma em avaliação da disciplina
Fundamentos e Metodologia da Matemática II, cujo valor foi
20,0 créditos.

Resposta:

Lembrando que a variável estatística (xi) é a “nota dos alunos” e a


frequência (fi) indica quantos alunos tiraram a referida nota.

054
unidade 3
ESTATÍSTICA

TABELA 20 – Notas dos alunos na disciplina


Fundamentos e Metodologia da Matemática

Xi fi

3,0 1

7,0 2

10,0 6

11,0 6

12,0 7

13,0 3

15,0 5

16,0 2

17,0 2

18,0 3

Fonte: Elaborado pelo autor.

Veja a representação no histograma:

FIGURA 3 – Histograma

Fonte: Elaborado pelo autor.

2º) Veja agora um histograma para variável qualitativa.

Foi realizada uma pesquisa com os compradores de refrigerantes


em um supermercado em um dia. Cada comprador informou qual

055
unidade 3
ESTATÍSTICA

o refrigerante havia adquirido. A tabela organizada ficou da seguinte


maneira:

A variável estatística é “marca de refrigerante comprada” e a


frequência absoluta indica quantos clientes compraram cada
marca.

TABELA 21 – Marca de refrigerante comprada no supermercado

Xi fi

Coca cola 22

Guaraná 14

Pepsi twist 8

Sprite 6

Fonte: Elaborado pelo autor.

Resposta:

Veja o histograma:

FIGURA 4 - Histograma

Fonte: Elaborado pelo autor.

3º) Agora vamos acompanhar um exemplo com os dados


agrupados em classes.

056
unidade 3
ESTATÍSTICA

A tabela abaixo apresenta as notas dos 36 alunos de uma turma em


avaliação da disciplina Estatística, cujo valor foi 20,0 créditos.

xi → notas dos alunos e fi indica quantos dados estão em cada


classe.

TABELA 22 – Notas dos alunos na disciplina Estatística

Xi fi

5,0 | 7,5 4

7,5 | 10,0 4

10,0 | 12,5 15

12,5 | 15,0 5

15,0 | 17,5 6

17,5 | 20,0 2

Fonte: Elaborado pelo autor.

Acompanhe a representação da tabela no histograma.

Resposta:

FIGURA 5 - Histograma

Fonte: Elaborado pelo autor.

057
unidade 3
ESTATÍSTICA

Observe como fica fácil visualizar a classe que tem mais notas.
Ao visualizar o histograma, percebe-se que as notas dos alunos
concentraram-se na classe entre 10,0 e 12,5.

Há outros tipos de histograma, como o polígono de frequência, o


polígono de frequência acumulada, que não serão abordados no
livro, mas em outros objetos da unidade.

Diagrama ou gráfico
de colunas
É um tipo de gráfico com características bem próximas ao
histograma. Como destacado no histograma, a diferença é que
no gráfico de colunas, estas, verticais, apresentam uma distância
de uma para a outra. Pode ser construído tanto com a frequência
absoluta quanto com a frequência relativa e vai utilizar um ou o É um tipo de gráfico
com características
outro de acordo com qual deles você pretende apresentar.
bem próximas ao
histograma.
Veja um exemplo de gráfico de colunas.

FIGURA 6 – Número de veículos roubados


em uma capital, de acordo com o ano

Fonte: Elaborado pelo autor.

058
unidade 3
ESTATÍSTICA

Agora, vamos acompanhar um conjunto de dados apresentados


em tabela e no gráfico de colunas.

Exemplo: foi realizada uma pesquisa em um dos campi de


importante Faculdade de Belo Horizonte, com os alunos. A tabela
apresenta a quantidade de alunos pesquisados por curso.

TABELA 23 – Alunos pesquisados por curso

CURSO fi

Administração 8

Engenharia Civil 12

Engenharia de Produção 9

Gestão Comercial 5

Gestão Financeira 6

Gestão da Qualidade 4

Processos Gerenciais 14

Σ 58

Fonte: Elaborado pelo autor.

Veja o gráfico de coluna com os dados da tabela.

FIGURA 7 – Gráfico de colunas

Fonte: Elaborado pelo autor.

059
unidade 3
ESTATÍSTICA

Diagrama ou
gráfico de barras
Também é um gráfico com características próximas ao histograma,
mas seu maior objetivo é apresentar as frequências na forma de
barras horizontais (BRUNI, 2007). Assim como o gráfico de coluna,
as barras são separadas entre si e também pode ser construído
tanto com a frequência absoluta quanto com a frequência relativa.
Veja o exemplo: Também é um
gráfico com
características
FIGURA 8 – Gráfico cor preferida próximas ao
histograma, mas
seu maior objetivo
é apresentar as
frequências na forma
de barras horizontais
(BRUNI, 2007).

Fonte: Elaborado pelo autor.

Agora, com os mesmos dados utilizados no gráfico de colunas,


vamos construir um gráfico de barras. Acompanhe o resultado:

060
unidade 3
ESTATÍSTICA

FIGURA 9 – Gráfico de barras

Assim como os
gráficos anteriores
Fonte: Elaborado pelo autor.
– de colunas e de
barras – o gráfico de
Pareto também tem
Diagrama ou semelhanças com o
histograma.
gráfico de Pareto
Assim como os gráficos anteriores – de colunas e de barras – o
gráfico de Pareto também tem semelhanças com o histograma. O
gráfico de Pareto tem como principal característica apresentar os
dados do maior valor para o menor valor. Ele tem muita utilização
no meio empresarial, quando se pretende, por exemplo, estudar
falhas no processo de produção, de modo a priorizar aquelas falhas
que têm maior representatividade.

Acompanhe o exemplo:

061
unidade 3
ESTATÍSTICA

FIGURA 10 – Gráfico: erros hospitalares

Fonte: Elaborado pelo autor.

Popularmente
Ao analisar o gráfico, é fácil ver que as “Falhas na comunicação interna” chamado de
é o primeiro erro que deve ser analisado; em seguida a “Insuficiência gráfico de pizza, o
de treinamento”, e assim sucessivamente. Desse modo, é mais fácil
gráfico de setores
também representa
identificar o que deve ser “atacado” primeiro por um hospital que as frequências
pretende minimizar os erros que acometem seus resultados. absolutas ou
relativas pela forma
de setores de círculo.
Diagrama ou gráfico
de setores
Popularmente chamado de gráfico de pizza, o gráfico de setores
também representa as frequências absolutas ou relativas pela
forma de setores de círculo. Sua aplicação geralmente ocorre
“quando todos os dados analisados correspondem ao universo de
observações” (BRUNI, 2007, p. 30), ou seja, quando correspondem
ao todo. O gráfico de setores deve ser evitado quando os dados
são distribuídos ao longo do tempo, e também quando há muitos
elementos na variável estatística.

Vamos retomar a tabela dos alunos que participaram de pesquisa


no campus, por curso:

062
unidade 3
ESTATÍSTICA

TABELA 24 – Alunos pesquisados por curso

CURSO fi

Administração 8

Engenharia Civil 12

Engenharia de Produção 9

Gestão Comercial 5

Gestão Financeira 6

Gestão da Qualidade 4

Processos Gerenciais 14

Σ 58

Fonte: Elaborado pelo autor.

Veja o gráfico de setores resultante dessa tabela.

FIGURA 11 – Gráfico de setores

Fonte: Elaborado pelo autor.

Veja que, ao olhar para o gráfico, conseguimos identificar com


facilidade o curso que teve maior participação dos alunos na
pesquisa, mesmo sem olhar a tabela com os valores, ou seja, é de
fácil visualização.

063
unidade 3
ESTATÍSTICA

Diagrama ou
gráfico de ogiva
Também chamado de gráfico de linha ou polígono de frequência, ele
representa as frequências que foram apresentadas no histograma.

Vamos utilizar esse modelo de gráfico na seguinte tabela de


frequências:

TABELA 25 – Notas dos alunos na disciplina Estatística

Xi fi

5,0 | 7,5 4

7,5 | 10,0 4
Também chamado
10,0 | 12,5 15
de gráfico de linha
ou polígono de
12,5 | 15,0 5 frequência, ele
representa as
15,0 | 17,5 6
frequências que
17,5 | 20,0 2 foram apresentadas
no histograma.
Fonte: Elaborado pelo autor.

Observe o resultado:

FIGURA 12 – Gráfico de ogiva

Fonte: Elaborado pelo autor.

064
unidade 3
ESTATÍSTICA

Gráfico pictórico ou
pictograma
É um modelo de gráfico muito interessante, pois é construído a
partir das figuras referentes ao assunto para chamar a atenção
leitor. É muito utilizado pela mídia impressa para dar relevância ao
que quer que seja ilustrado. É preciso destacar que os símbolos
devem ser autoexplicativos e expressos por uma quantidade
maior de símbolos para valores maiores que o símbolo básico, e o
contrário, em caso de valores menores.

Acompanhe alguns exemplos de situações em que foram utilizados


os pictogramas.

1º)

FIGURA 13 – Educação e rendimento

Fonte: [Educação e Rendimento] Disponível em: <www.ibge.gov.br/home/estatistica/populacao/


trabalhoerendimento/pnad2004/suplemento_educacao/graficos_dinamicos/>. Acesso em 05 ago. 2015.

Neste caso, o tema central de que trata o gráfico são as crianças e,


por isso, são utilizadas imagens de crianças.

2º)

065
unidade 3
ESTATÍSTICA

FIGURA 14 – Gráfico pictórico

Número de
Percentual
matrículas do
do total de
ensino privado, no
matrículas
Brasil em milhões

Fonte: INEP (Instituto Nacional de Estudos e Pesquisas Educacionais)

Para ilustrar o aumento de matrículas no ensino privado foi utilizado


um lápis, ou seja, um objeto que se relaciona com a educação.

3º)

FIGURA 15 – Onde o sapato aperta

Onde o sapato aperta Centro-Oeste: 4%


Em relativos e absolutos, Sul: 8%
o Nordeste concentra
maior número de Sudeste: 22%
pobres no Brasil Nordeste: 53%
Norte: 135

Fonte: URBIM, Emiliano. Onde estão os pobres do Brasil? In: site “Superinteressante”. São Paulo: Abril, ano 23, n 1,
jan 2009, p. 36-7.

Nesse caso, como é muito utilizada a expressão “fatia” da


economia, foi utilizada a imagem de um pão de forma em fatias.

066
unidade 3
ESTATÍSTICA

Apesar dos gráficos serem muito utilizados por agilizarem o processo de

análise de um conjunto de dados, em determinadas situações eles podem

transmitir conteúdo que pode não ser verdadeiro. Um dos principais

motivos para levar a esse erro acontece quando há excesso de figuras

e pouca informação. As figuras acabam por deixar em segundo plano a

informação que se deseja apresentar.

Os gráficos e a As figuras acabam


por deixar em
sustentabilidade segundo plano a
informação que se
Os gráficos são recursos muito utilizados por todos aqueles
deseja apresentar.
envolvidos com as necessidades atuais dos seres humanos,
como o governo e ONGs, sem comprometer o futuro das próximas
gerações. Assim, gráficos que acompanham o desmatamento na
Amazônia ao longo dos anos ou mesmo que trazem ações que
visam utilizar os recursos naturais de forma inteligente para que
eles se mantenham no futuro são muito comuns para facilitar a
divulgação e compreensão por parte da população, de modo a
sensibilizá-la da necessidade de preservar. Acompanhe a seguir
alguns exemplos de gráficos envolvendo o tema.

067
unidade 3
ESTATÍSTICA

FIGURA 16 - Desmatamento na Amazônia no século XXI (em Km2)

Fonte: [Desmatamento na Amazônia - INPE/PRODES.*Dados Preliminares] Disponível em: <http://www.mma.gov.


br/redd/index.php/pt/gr%C3%A1ficos/desmatamento-na-amaz%C3%B4nia>. Acesso em 05 ago. 2015

Esse é um gráfico de colunas que pretende destacar que, a partir da


criação do PPCDAm (Plano de Ação para Prevenção e Controle do
Desmatamento na Amazônia Legal), em 2004, houve considerável
redução do desmatamento.

Exemplo 2: Um projeto do Banco Santander, em que se instalou


coletores de baterias de telefones celulares, pilhas, enfim, produtos
que são tóxicos se descartados de qualquer maneira no meio
ambiente. Geralmente, esses objetos são de difícil descarte, pois
o acesso da população aos corretos locais para isso são muito
reduzidos.

068
unidade 3
ESTATÍSTICA

FIGURA 17 – Histórico papa pilhas

Fonte: [Histórico Papa Pilhas] Disponível em: <https://descarteinteligente.wordpress.com/2012/05/15/papa-


pilhas-santander-programa-de-reciclagem>. Acesso em 05 ago. 2015.

Pelo gráfico é fácil visualizar que desde a sua criação, o programa


“papa-pilhas” do banco aumentou em volume coletado e também
em pontos de coleta, mostrando que se o acesso for fácil, a
população procura fazer o descarte de forma correta.

Faça agora os exercícios da unidade:

1- (Enem 2011) O gráfico representa a relação entre o tamanho e a

totalidade dos imóveis rurais no Brasil. Que característica da estrutura

fundiária brasileira está evidente no gráfico apresentado?

069
unidade 3
ESTATÍSTICA

FIGURA 18 - A relação entre o tamanho


e a totalidade dos imóveis rurais no Brasil

Fonte: Incra, Estatísticas cadastrais 1998

a) A concentração de terras nas mãos de poucos.

b) A existência de poucas terras agricultáveis.

c) O domínio territorial dos minifúndios.

d) A primazia da agricultura familiar.

e) A debilidade dos plantations modernos.

2- (ENEM 2011) Uma enquete, realizada em março de 2010, perguntava

aos internautas se eles acreditavam que as atividades humanas

provocam o aquecimento global. Eram três alternativas possíveis e 279

internautas responderam à enquete, como mostra o gráfico.

FIGURA 19 – Apresentação da enquete

Fonte: Época. Edição 619, março 2010 (adaptado)

070
unidade 3
ESTATÍSTICA

Analisando os dados do gráfico, quantos internautas responderam “NÃO”

à enquete?

a) menos de 23.

b) mais de 23 e menos de 25.

c) mais de 50 e menos de 75.

d) mais de 100 e menos de 190.

e) mais de 200.

3- (ENEM 2011) O termo agronegócio não se refere apenas à

agricultura e à pecuária, pois as atividades ligadas a essa produção

incluem fornecedores de equipamentos, serviços para a zona rural,

industrialização e comercialização dos produtos.

O gráfico seguinte mostra a participação percentual do agronegócio no

PIB brasileiro.

FIGURA 20 – A participação percentual


do agronegócio no PIB brasileiro

Fonte: Centro de Estudos Avançados em Economia Aplicada (CEPEA). Almanaque


Abril 2010. São Paulo: Abril, ano 36 (adaptado)

Esse gráfico foi usado em uma palestra na qual o orador ressaltou uma

queda da participação do agronegócio no PIB brasileiro e a posterior

recuperação dessa participação, em termos percentuais. Segundo o

gráfico, o período de queda ocorreu entre os anos de

a) 1998 e 2001.

b) 2001 e 2003.

c) 2003 e 2006.

d) 2003 e 2007.

e) 2003 e 2008.

4- O gráfico mostra o percentual de áreas ocupadas, segundo o tipo de

071
unidade 3
ESTATÍSTICA

propriedade rural no Brasil, no ano de 2006.

FIGURA 21 - Área ocupada pelos imóveis rurais

Brasil Norte Nordeste Sudeste Sul Centro-


Oeste
Minifúndio 7,5 5,3 14,3 9,0 14,5 2,0
Imóveis improdutivos 63,8 82,6 69,7 48,4 38,3 63,5
Imóveis Produtivos 28,7 12,1 16,0 42,6 47,2 34,5
MDA/INCRA (DIEESE, 2006).Disponível em: http://www.sober.org.br. Acesso em: 6 ago. 2009.

De acordo com o gráfico e com referência à distribuição das áreas rurais

no Brasil, conclui-se que:

a) imóveis improdutivos são predominantes em relação às demais formas

de ocupação da terra no âmbito nacional e na maioria das regiões.

b) o
 índice de 63,8% de imóveis improdutivos demonstra que grande parte

do solo brasileiro é de baixa fertilidade, impróprio para a atividade agrícola.

c) o percentual de imóveis improdutivos iguala-se ao de imóveis produtivos

somados aos minifúndios, o que justifica a existência de conflitos por terra.

d) a região Norte apresenta o segundo menor percentual de imóveis

produtivos, possivelmente em razão da presença de densa cobertura

florestal, protegida por legislação ambiental.

e) a
 região Centro-Oeste apresenta o menor percentual de área ocupada

por minifúndios, o que inviabiliza políticas de reforma agrária nesta

região.

5 - (OBMEP 2013) O gráfico mostra o número de casos notificados de

dengue, a precipitação de chuva e a temperatura média, por semestre,

dos anos de 2007 a 2010 em uma cidade brasileira. Podemos afirmar

que:

072
unidade 3
ESTATÍSTICA

FIGURA 22 – Notificações de dengue, precipitação


e temperatura entre 2007 e 2010 em certa cidade
3000 28,5
28,0

Temperatura média (oC)


Número de casos notificados

2500
Precipitação de chuva (mm)

27,5
2000
27,0
1500 26,5
26,0
1000
25,5
5000
25,0
0 24,5

tre

tre

tre
tre

tre

tre

tre
tre

es

es

es
es

es

es

es
es

08

09

10
2 0 07

1 0 08

09

10
1 0 07

m
m

m
m

20

20

20
Se

Se

Se
20

20

20

20
Se

Se

Se

Se
20
Se

20

20

20
10

10
Número de casos Precispitação Temperatura média

A) O período de maior precipitação foi o de maior temperatura média e

com o maior número de casos de dengue notificados.

B) O período com menor número de casos de dengue notificados também

foi o de maior temperatura média.

C) 
O período de maior temperatura média foi também o de maior

precipitação.

D) O período de maior precipitação não foi o de maior temperatura média e

teve o maior número de casos de dengue notificados.

E) Quanto maior a precipitação em um período, maior o número de casos

de dengue notificados.

6- A tabela a seguir apresenta os números do desmatamento na Amazônia

entre os anos de 2001 e 2009:

073
unidade 3
ESTATÍSTICA

TABELA 26 – Desmatamento da Amazônia

Fonte: [Desmatamento Amazônia.] Disponível em: <http://


portaldoprofessor.mec.gov.br/storage/discovirtual/galerias/
imagem/0000000977/0000010817.jpg>. Acesso em 05 ago.
2015.

Apresente a tabela na forma de gráfico, nos seguintes modelos:

a) gráfico de setores.

b) gráfico de colunas.

c) gráfico de ogiva.

A seguir, responda:

I- 
O desmatamento é decrescente durante todo o período

analisado?

II- O
 s três modelos de gráfico apresentados permitem a análise do

decrescimento do desmatamento no período? Explique:

*
Acompanhe abaixo parte da reportagem da revista PRO-TESTE,

de novembro de 2006, a respeito da eficácia de alguns inseticidas

encontrados no mercado.

074
unidade 3
ESTATÍSTICA

Matam, mas nem todos os insetos

Além de rápidos, os inseticidas também precisam ser eficazes. De que adianta começar a agir logo se não conseguir

eliminar todos os bichos? Por isso, analisamos a eficácia desses produtos contra cada tipo de inseto. O critério que

julgamos aceitável é que o inseticida extermine, pelo menos, 60% dos insetos em 24 horas, 80% em 48 horas e 100%

após 72 horas.

Fonte: elaborado pelo autor

7- Analisando o gráfico, podemos afirmar que:

A) Todos os inseticidas analisados têm eficiência igual ou superior a 60%

em relação aos insetos que prometem combater.

B) O inseticida SBP tem 100% de eficácia no combate às baratas voadoras.

C) O inseticida Baygon teve eficácia superior a 60% no combate aos três

tipos de insetos analisados.

D) O inseticida Rodasol foi considerado o pior do teste entre as marcas

pesquisadas na eliminação de insetos nas primeiras 24 horas.

8- Utilizando o critério adotado pela revista, é INCORRETO afirmar que:

A) O inseticida Rodasol não conseguiu atingir o índice de aceitável no

combate às pequenas baratas em 24 horas.

B) O inseticida Raid atingiu o índice aceitável no combate a todos os

insetos em 24 horas de utilização do mesmo.

C) No combate às moscas, todos os inseticidas conseguiram atingir o

075
unidade 3
ESTATÍSTICA

índice aceitável de, pelo menos, 60% de insetos mortos em 24 horas.

D) O inseticida Uffa atingiu o índice aceitável em 24 horas após seu uso no

combate às moscas e também no combate às baratas voadoras.

RESPOSTAS:

1-A

2-C

3-C

4-A

5-D

6 - a)

FIGURA 23 – Desmatamento da Amazônia

Fonte: [Desmatamento da Amazônia] Disponível em: <http://


portaldoprofessor.mec.gov.br/storage/discovirtual/galerias/
imagem/0000000977/0000010818.jpg>. Acesso em: 05 ago. 2015.

076
unidade 3
ESTATÍSTICA

b)

FIGURA 24 – Área desmatada anualmente na Amazônia

Fonte: [Área desmatada anualmente na Amazônia] Disponível


em: <http://portaldoprofessor.mec.gov.br/fichaTecnicaAula.
html?aula=23097>. Acesso em: 05 ago. 2015.

c)

FIGURA 25 - Desmatamento da Amazônia em números

Fonte: [Desmatamento da Amazônia em números] Disponível em:


<http://portaldoprofessor.mec.gov.br/storage/discovirtual/galerias/
imagem/0000000977/0000010820.jpg>. Acesso em 05 ago. 2015.

I- Não. Há períodos de crescimento do desmatamento e outros em que há


decrescimento.

II- O
 bserve que o gráfico de setores dificulta uma análise visual que permita a
rápida observação do que acontece com o desmatamento na Amazônia no
período. Por isso, a apresentação dos dados da tabela em colunas ou em ogiva
são opções mais adequadas.

7- D

8- C

077
unidade 3
ESTATÍSTICA

Revisão
Essa unidade foi dedicada aos gráficos. O estudo dos gráficos
merece especial atenção, pois esta linguagem é cada vez mais
utilizada nas revistas, jornais escritos e também nos jornais da
televisão, já que facilitam a visualização da informação que está
sendo abordada. Além disso, no meio empresarial, conforme
destacado ao longo da unidade, os gráficos são recursos muito
utilizados para analisar o desempenho dos diferentes setores da
empresa.

Devido a importância dos gráficos, foram abordados os seguintes


tipos, lembrando que há outros:

GRÁFICOS

Importantes na
visualização dos dados
coletados da pesquisa.

Histograma Colunas Barras Pareto Setores Ogiva Pictórico

Simples e Diferencia Barras Apresenta Ou de pizza. Ou de linha. Utiliza


eficiente do separadas e dados do Utilizado Permite símbolos
histograma na horizontal maior valor quando acompanhar auto-
pelas para os dados evolução explicativos
colunas o menor referem-se
separadas ao todo.

Fonte: elaborado pelo autor.

Para saber mais sobre o assunto, recomendo a leitura do livro:

STENVENSON, Willian J. Estatística aplicada à administração. São Paulo:

Harbra, 2001.

078
unidade 3
Medidas
de posição
Introdução

Nesta unidade, estudaremos as medidas que permitem a definição


do centro dos dados (BRUNI, 2007), que são a média, a moda e a
mediana. Essas medidas caracterizam os grupos como um todo
e os descrevem de maneira mais organizada do que as tabelas e
os gráficos. Assim, serão abordados, de forma clara, os conceitos
acerca das medidas de tendência central, bem como o cálculo
dessas medidas, tanto para dados sem organização quanto para
dados organizados sem classes e também em classes.

• Média
aritmética ( x )
• Mediana (Md)
• Moda (Mo)
• Revisão 106
ESTATÍSTICA

Média aritmética ( x )
A média aritmética talvez seja a medida mais utilizada em Estatística
e uma das mais importantes. Pode ser calculada diretamente,
usando calculadoras, como a científica e a financeira, bem como
depender de todos os dados da distribuição e que estiverem à
disposição (BRUNI, 2007).

Contudo, destaca-se o fato de que a média é sensível aos valores


muito extremos do conjunto de dados. Para chegar a ela, é preciso
considerar se os dados estão agrupados ou não, pois, em cada
caso, o cálculo se dará de uma maneira diferente.

* Média aritmética de dados não agrupados: é a média aritmética


simples ou simplesmente média. A média é definida como o
somatório dos dados dividido pela quantidade de dados analisados.
A média é definida
Essa definição pode ser representada matematicamente pela como o somatório
fórmula: dos dados dividido
pela quantidade de
x + x2 + x3 + ... + xn
n dados analisados.
x= 1 ou x = ∑ xni
n i=1

Acompanhe alguns exemplos.

1º) Um professor define que, para ser aprovado em sua disciplina,
o aluno precisa tirar média igual ou superior a 6,0 nas cinco
avaliações que ele aplica durante o semestre – cada uma no
valor de 10,0 créditos. Analise se os alunos destacados abaixo
seriam aprovados segundo o critério definido pelo professor:

TABELA 27 – Aluno A x Aluno B

Aluno A 1 5 6 8 7

Aluno B 4 6 9 5 9

Fonte: Elaborado pelo autor.

081
unidade 4
ESTATÍSTICA

Resposta:

Para analisar se os alunos A e B foram ou não aprovados é


necessário calcular a média aritmética. Como na definição, temos
que somar as notas conseguidas em cada avaliação e dividir pela
quantidade de notas, no caso 5:

1+5+6+8+7 27
Aluno A: x = →x= → x = 5,4
5 5

4+6+9+5+9 33
Aluno B: x = →x= → x = 6,6
5 5

Logo, o aluno A seria reprovado, e o aluno B seria aprovado.

2º) O gerente de um banco registrou, mês a mês, durante um ano, o


número de clientes que o procurou e efetivou uma aplicação na
bolsa de valores. A tabela abaixo apresenta o levantamento feito
pelo gerente.

TABELA 28 - Levantamento feito pelo gerente

Mês Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez

Nº. de apólices vendidas 16 12 26 29 20 24 13 32 24 15 25 16

Fonte: Elaborado pelo autor.

Calcule a média mensal de aplicações na bolsa de valores efetivadas


durante o ano.

Resposta:

Basta fazer a média dos 12 meses.

16 + 12 + 26 + 29 + 20 + 24 + 13 + 32 + 24 + 15 + 25 + 16 252
x= →x= → x = 21
12 12

O resultado informa que, na média, foram efetivadas 21 aplicações


mensais.

082
unidade 4
ESTATÍSTICA

3º) O gráfico abaixo mostra o crescimento do PIB argentino no


período de 2003 a 2010 e a previsão de crescimento para o ano
de 2011.

FIGURA 26 – Crescimento anual do PIB

Crescimento anual do PIB (em %)

8,9 8,9 9,1 9,1


8,4 8,6
8,0
6,8

0,8

Posse do Eleição de Crise


Néstor Cristina mundial

2003 2004 2005 2006 2007 2008 2009 2010 2011

Fonte: [Crescimento anual do PIB) Disponível em: Revista Veja, p.


O que significa
96 (19 de outubro de 2011) que a média de
crescimento do PIB
Calcule o crescimento médio do PIB argentino no período 2003 – entre 2003-2010 é
de aproximadamente
2010.
7,6% ao ano.

Resposta:

Para determinar o crescimento médio é preciso fazer a média do


período.

8,9 + 8,9 + 9,1 + 8,4 + 8,6 + 6,8 + 0,8 + 9,1 60,6


x= →x= → x = 7,575%.
8 8

O que significa que a média de crescimento do PIB entre 2003-2010


é de aproximadamente 7,6% ao ano.

Agora observe o que acontece se desconsiderarmos o ano de 2009.

8,9 + 8,9 + 9,1 + 8,4 + 8,6 + 6,8 + 9,1 59,8


x= →x= → x = 8,54%.
7 7

083
unidade 4
ESTATÍSTICA

O índice 0,8% foi muito abaixo dos outros valores, comprovando o


que foi falado no início, ou seja, que a média é muito sensível aos
valores extremos.

1.1- M
 édia aritmética de dados agrupados, mas não organizados
em classes: chamada de média aritmética ponderada é
quando os dados estão organizados, contados e organizados
na frequência. Nesse caso, as variáveis têm importâncias
diferentes, de acordo com a quantidade de vezes que cada
dado aparece.

n
x= ∑ xi . ƒi
x1. ƒ1 + x2. ƒ2 + x3. ƒ3 + ... xn. ƒn i=1
x= ou n
ƒ1 + ƒ2 + ƒ3 + ... + ƒn
∑ ƒi
i=1

Exemplos: Nesse caso, as


variáveis têm
1º) O quadro abaixo apresenta as notas dos 35 alunos de uma
importâncias
diferentes, de acordo
turma em avaliação da disciplina Fundamentos e Metodologia com a quantidade de
da Matemática II, cujo valor foi 20,0 créditos. vezes que cada
dado aparece.
7,0 13,0 12,0 15,0 3,0 15,0 17,0

10,0 17,0 7,0 10,0 18,0 15,0 12,0

10,0 12,0 11,0 11,0 11,0 16,0 15,0

10,0 12,0 11,0 10,0 12,0 13,0 12,0

18,0 16,0 12,0 13,0 15,0 18,0 10,0

Calcule a nota média da turma.

Resposta:

Para calcular a média, é bem mais fácil utilizar a tabela com os


dados organizados, na qual é necessário considerar a quantidade
de alunos que tirou determinada nota.

084
unidade 4
ESTATÍSTICA

Observe que a tabela abaixo apresenta os mesmos dados, porém


organizados.

TABELA 29 – Organização das notas dos alunos

Xi fi

3,0 1

7,0 2

10,0 6

11,0 6

12,0 7

13,0 3

15,0 5

16,0 2

17,0 2

18,0 3

Fonte: Elaborado pelo autor.

Acompanhe o cálculo. Observe que a nota 7,0, por exemplo, aparece


duas vezes. Logo, isso precisa ser considerado no momento
de calcular a média, inclusive com o restante dos dados que se
repetem:

3,0x1 + 7,0x2 + 10,0x6 + 11,0x4 + 12,0x7 + 13,0x3 + 15,0x5 + 16x2 +17,0x2 + 18,0x3 439
x= →x= → x = 12,54
1+2+6+4+7+3+5+2+2+3 35

Então, a nota média da turma é 12,5.

2º) A tabela a seguir mostra os salários do setor de produção de


uma empresa.

085
unidade 4
ESTATÍSTICA

TABELA 30 – Salário dos funcionários do setor de produção

SALÁRIO (em reais) Número de funcionários

800,00 10

1.200,00 11

1.500,00 6

2.000,00 6

4.500,00 9

Fonte: Elaborado pelo autor.

Qual é a média salarial desse setor da empresa?

Resposta:

Nesse caso, também é necessário considerar a quantidade de


funcionários que recebem determinado salário. Acompanhe o
cálculo:

800x10 + 1200x11 + 1500x6 + 2000x6 + 4500x9 82700


x= 6→x= → x = 1 969,048 ≈ 1 969,05
10 + 11 + 6 + 6 + 9 42

1.2- M
 édia aritmética de dados agrupados em classes: o cálculo
da média para dados agrupados é muito parecido com a
média ponderada. A diferença é que, quando os dados estão
organizados em classes, precisamos calcular o ponto médio
dessas classes.

n
x= ∑ PMi . ƒi No qual:
i=1
n
∑ ƒi PM = ponto médio das classes
i=1

Para calcular o ponto médio de uma classe, basta fazer uma média

aritmética dos extremos da classe, ou seja, somar o seu limite inferior com

o seu limite superior e dividir o resultado por 2.

086
unidade 4
ESTATÍSTICA

Acompanhe alguns exemplos disponibilizados abaixo.

1º) O quadro mostra a distribuição da frequências dos salários


mensais (agrupados em classes) de 50 empregados de uma
firma.

TABELA 31 – Salário em classes dos empregados de uma turma

SALÁRIO (em reais) NÚMERO DE EMPREGADOS (fi)

1 000 |⎯ 1 100 9

1 100 |⎯ 1 200 15

1 200 |⎯ 1 300 18

1 300 |⎯ 1 400 5

1 400 |⎯ 1 500 3

Fonte: Elaborado pelo autor.

Calcule o salário médio desse grupo de empregados.

Resposta:

O primeiro passo é determinar o ponto médio de cada classe.

TABELA 32 – Salário em classes dos empregados de uma turma

SALÁRIO (em reais) PONTO MÉDIO DA CLASSE NÚMERO DE EMPREGADOS (fi)

1 000 |⎯ 1 100 1000 + 1100 9


2
= 1050

1 100 |⎯ 1 200 1100 + 1200 15


2
= 1150
1200 + 1300
1 200 |⎯ 1 300
2
= 1250 18

1 300 |⎯ 1 400 1300 + 1400 5


2
= 1350
1400 + 1500
1 400 |⎯ 1 500
2
= 1450 3

Fonte: Elaborado pelo autor.

087
unidade 4
ESTATÍSTICA

Agora, para calcular a média, é simples:

1050x9 + 1150x15 + 1250x18 + 1350x5 + 1450x3 60300


x= →x= → x = 1206
(9 + 15 + 18 + 5 + 3) 50

Salário médio do grupo de funcionários: R$1 206,00.

2º) O quadro abaixo apresenta as notas dos 36 alunos de uma


turma em avaliação da disciplina Estatística, cujo valor foi 20,0
créditos.

xi → notas dos alunos e fi indica quantos dados estão em cada


classe.

TABELA 33 – Notas em classes da turma em Estatística

Xi fi

5,0 | 7,5 4

7,5 | 10,0 4

10,0 | 12,5 15

12,5 | 15,0 5

15,0 | 17,5 6

17,5 | 20,0 2

Fonte: Elaborado pelo autor.

Qual é a nota média da turma?

Resposta:

Encontrar os pontos médios das classes facilita o cálculo.

088
unidade 4
ESTATÍSTICA

TABELA 34 – Notas em classes da turma em Estatística

Xi PONTO MÉDIO DA CLASSE fi

5,0 | 7,5 6,25 4

7,5 | 10,0 8,75 4

10,0 | 12,5 11,25 15

12,5 | 15,0 13,75 5

15,0 | 17,5 16,25 6

17,5 | 20,0 18,75 2

Fonte: Elaborado pelo autor.

6,25x4 + 8,75x4 + 11,25x15 + 13,75x5 + 16,25x6 + 18,75x2 432,5


x= →x= → x = 12,014
4 + 4 + 15 + 5 + 6 + 2 36

Nota média: 12,01.

Mediana (Md)
É uma medida de tendência central que divide o conjunto de dados
analisado em duas partes iguais, cada um com o mesmo número
de elementos. Isso significa que “abaixo da mediana deverão estar
50% dos elementos analisados. Acima da mediana deverão estar
50% dos dados analisados” (BRUNI, 2007, p. 49).

Tem sua aplicação conveniente quando o conjunto de dados


analisados tem valores extremos, ou seja, há valores grandes e
pequenos dentro do mesmo conjunto de dados.

2.1- M
 ediana para dados não agrupados: nesse caso, devemos
considerar a quantidade de elementos presentes na série que
está sendo analisada.

1º) Se a quantidade de dados for ímpar: a mediana é o elemento


central. A posição do elemento central é dada pela fórmula:

089
unidade 4
ESTATÍSTICA

n+1
, em que n é o número de dados.
2

2º) Se a quantidade de dados for par: a mediana é igual à média


aritmética simples dos dois elementos centrais.

Acompanhe os exemplos disponibilizados abaixo.

1º) O preço, em reais, de alguns aparelhos de TV 20 polegadas são


os seguintes:

500 640 470 520 420 480 440

Com base nos preços levantados:

a) encontre o preço mediano.

Se a quantidade
b) o estoque do aparelho de TV cujo preço é R$ 420,00 acabou. Qual
de dados for par: a
é o preço mediano dos aparelhos restantes? mediana é igual à
média aritmética
simples dos dois
Resposta
elementos centrais.

a) O primeiro passo é ordenar os dados na ordem crescente:

420 440 470 480 500 520 640

Observe que é uma quantidade ímpar de dados. Por isso, podemos


n+1
utilizar a fórmula , em que n= 7:
2

7+1
2 = 4, uou seja, a mediana deverá ser o 4º valor, garantindo que
teremos três valores menores e três valores maiores que ela. Logo,
Md = 480.

b) Também aqui o primeiro passo é fazer a ordenação crescente:

090
unidade 4
ESTATÍSTICA

440 470 480 500 520 640

Nesse caso, temos quantidade par de dados, logo, é a mediana que


deve ter três dados maiores e três dados menores que ela. Assim,
a mediana está entre o 480 e 500 e, para determiná-la, devemos
calcular a média aritmética entre os dois.

480 + 500
Md = = 490
2

2º) 
Suponha que você esteja gerenciando um restaurante e
mantendo o controle da venda dos diversos pratos oferecidos
pelo estabelecimento. Considere que tenha observado os
seguintes valores de venda semanais do prato “Papillote de
berinjelas à Provençal” durante um período de nove semanas: Assim, a mediana
está entre o 480
e 500 e, para
40 56 38 38 63 59 52 49 46
determiná-la,
devemos calcular
Determine a mediana do conjunto de dados. a média aritmética
entre os dois.

Resposta:

Colocando em forma crescente:

38 38 40 46 49 52 56 59 63

A quantidade de dados é ímpar. Por isso, podemos utilizar a fórmula


n+1
, em que n= 9:
2

9+1
= 5, ou seja, a mediana deverá ser o quinto valor, garantindo
2
que teremos quadro valores menores e quatro valores maiores que
ela. Logo, Md = 49.

3º) No dia 3 de outubro de 1996, foram realizadas eleições para

091
unidade 4
ESTATÍSTICA

prefeito e vereador em todo o país. Nessa ocasião, estava sendo


inaugurado o voto eletrônico. Em determinada seção eleitoral,
um repórter que cobria as eleições registrou o tempo que oito
eleitores gastaram para votar. O registro foi respectivamente:
1min 4s, 1min 32s, 1 min 12s, 1 min 52s, 1 min 24s, 1 min 2s,
1 min 46s e 1 min 40s. A mediana do tempo de votação (em
minutos e segundos) desses eleitores é:

Resposta:

Colocar os dados na ordem crescente:

1min2s _ 1min4s _ 1min12s _ 1min24s _ 1min32s _ 1min40s _ 1mi 46s _ 1mi 52s

É uma quantidade
É uma quantidade par de dados e, por isso, a mediana deve ter
par de dados e, por
quatro dados maiores e quatro dados menores que ela. Assim, isso, a mediana deve
a mediana está entre 1 min 24s e 1 min 32 s. Para determiná-la, ter quatro dados
devemos calcular a média aritmética entre os dois tempos. maiores e quatro
dados menores
1 min 24s + 1 min 32s
que ela.
Md = = 1min 28s → Md = 1min 28s
2

2.2 - M
 ediana para dados agrupados sem intervalo de classe: o
cálculo é semelhante ao anterior, quando os dados não estão
agrupados. Contudo, a utilização da tabela com as frequências
acumuladas auxilia no trabalho.

Acompanhe os exemplos disponibilizados abaixo.

1º) A tabela seguinte apresenta a nota dos 35 alunos de uma turma


em avaliação da disciplina Fundamentos e Metodologia da
Matemática II, cujo valor foi 20,0 créditos.

092
unidade 4
ESTATÍSTICA

TABELA 35 – Notas da turma na disciplina Fundamentos e


Metodologia da Matemática II

Xi fi Fi

3,0 1 1

7,0 2 3

10,0 6 9

11,0 4 13

12,0 7 20

13,0 3 23

15,0 5 28

16,0 2 30

17,0 2 32

18,0 3 35

Fonte: Elaborado pelo autor.


Veja na tabela que,
até a quarta linha,
Calcule a mediana da turma. temos 13 notas e
até a quinta linha, já
temos 20 dados.
Resposta:

Há uma quantidade ímpar de dados, que já estão organizados. Então,


35 + 1
vamos ao cálculo: , o que indica que a mediana é o 18º dado.
2

Veja na tabela que, até a quarta linha, temos 13 notas e até a quinta
linha, já temos 20 dados. Portanto a mediana está na quinta coluna.
Logo: 14º, 15º, 16º, 17º, 18º, 19º e 20º dados apresentam nota 12,0,
ou seja, a mediana é 12,0.

Md = 12,0

2º) A tabela a seguir mostra os salários do setor de produção de


uma empresa.

093
unidade 4
ESTATÍSTICA

TABELA 36 – Salário dos funcionários do setor de produção

SALÁRIO (em reais) PONTO MÉDIO DA CLASSE Fi

800,00 10 10

1.200,00 11 21

1.500,00 6 27

2.000,00 6 33

4.500,00 9 42

Fonte: Elaborado pelo autor.

Qual é o salário mediano desse setor da empresa?

Resposta:

É quantidade par de dados, que já estão organizados. Então, 42 : 2 =


21, o que indica que a mediana tem que ter 21 dados menores que Mediana para
dados agrupados
ela e 21 maiores.
em intervalos de
classe: nesse caso,
21º salário: 1.200 para determinar
a mediana, é
necessário seguir
22º salário: 1.500 alguns passos.

1200 + 1500
Md = = 1.350 → Md = 1.350,00
2

2.3 - M
 ediana para dados agrupados em intervalos de classe:
nesse caso, para determinar a mediana, é necessário seguir
alguns passos. Veja:

n
1º p
 asso: determinar a posição da mediana, que é dada por 2 . É
preciso determinar que metade dos dados seja menor e a outra
metade seja maior que a mediana, sendo n é o número de dados.

2º p
 asso: determinar a classe mediana. Com o resultado do 1º
passo, basta procurar, na coluna da frequência acumulada, em
qual intervalo esse valor se enquadra. A classe mediana é a
classe na qual está a mediana.

094
unidade 4
ESTATÍSTICA

3º passo: determinar a mediana. Para isso, vamos usar a fórmula:

Em que:

l Md = limite inferior do intervalo de classe mediana

Fant = frequência acumulada da classe anterior à classe mediana

fMd = frequência simples da classe mediana

n = número de elementos coletados na pesquisa

hMd = amplitude do intervalo de classe

Exemplos
n = número de
1º) A tabela abaixo apresenta as notas dos 36 alunos de uma turma elementos
em avaliação da disciplina Estatística, cujo valor foi 20,0 créditos, coletados na
pesquisa
organizados em classes.

xi → notas dos alunos e fi indica quantos dados estão em cada


classe

TABELA 37 – Notas em classes da turma em Estatística

Xi fi Fi

5,0 | 7,5 4 4

7,5 | 10,0 4 8

10,0 | 12,5 15 23

12,5 | 15,0 5 28

15,0 | 17,5 6 34

17,5 | 20,0 2 36

Fonte: Elaborado pelo autor.

095
unidade 4
ESTATÍSTICA

Qual é a nota mediana da turma?

Resposta:

1º passo: posição da mediana:

n 36
n = 36 = = 18º valor da série
2 2

2º passo: localizando a classe mediana:

está na classe 10,0 | 12,5, ou seja, 3ª classe.

3º passo: o cálculo da mediana:

l Md = limite inferior da 3ª classe: 10,0

Fant = frequência acumulada da classe anterior à 3ª classe: 8

fMd = frequência simples da 3ª classe: 15

hMd = 2,5

2º) A tabela abaixo apresenta a idade das pessoas que visitaram um


evento em determinado shopping.

TABELA 38 – Idade dos visitantes do evento

IDADE (em anos) QTDE DE PESSOAS Fi

3|⎯9 2 2

9 |⎯ 15 5 7

15 |⎯ 21 8 15

21 |⎯ 27 10 25

27 |⎯ 33 14 39

Fonte: Elaborado pelo autor.

096
unidade 4
ESTATÍSTICA

Qual é a mediana?

Resposta

1º passo: posição da mediana.

n 39
n = 39 = = 19, 5º valor da série
2 2

2º passo: localizando a classe mediana.

está na classe 21 |⎯ 27, ou seja, 4ª classe.

3º passo: o cálculo da mediana.

l Md = limite inferior da 4ª classe: 21

Fant = frequência acumulada da classe anterior à 4ª classe: 15

fMd = frequência simples da 4ª classe: 10

hMd = 6

Moda (Mo)
Moda é o valor que ocorre com maior frequência na distribuição
dos dados. Quando não existe um valor com maior número de
repetições, a moda não existe. Daí dizemos que o conjunto de
dados é amodal. Ao contrário, se mais de um dado do conjunto
aparece com o mesmo e maior número de repetições, dizemos que
o conjunto de dados é multimodal.

Acompanhe os exemplos disponibilizados abaixo.

1º) Os preços, em reais, para alguns aparelhos de TV 21 polegadas,


estão abaixo.

097
unidade 4
ESTATÍSTICA

500 840 470 480 420 480 440

Qual é a moda para o conjunto de dados?

Resposta

Observe que o valor 480 aparece mais vezes (2). Por isso é a moda.

Mo = 480

2º) Os dados a seguir representam a massa, em quilogramas, das


atletas de uma equipe júnior de atletismo:

46, 44, 49, 45, 44, 48, 50, 42, 44, 45

Resposta

A tabela abaixo
Observe que o valor 45 aparece duas vezes e o valor 44 aparece três
apresenta as notas
vezes. Logo, a moda é 44. de dois alunos
em cinco provas
Mo = 480
que o professor
aplicou durante um
3º) A tabela abaixo apresenta as notas de dois alunos em cinco semestre.
provas que o professor aplicou durante um semestre. Cada
prova valia 10,0 créditos.

TABELA 39 – Notas dos alunos A e B

Aluno A 1 5 6 8 7

Aluno B 4 6 9 5 9

Fonte: Elaborado pelo autor.

Determine a moda das notas de cada aluno.

Resposta:

No caso do aluno A, não há valor que se repete e, portanto, a série é


amodal. No caso do aluno B, a moda é 9, pois aparece duas vezes.

098
unidade 4
ESTATÍSTICA

A tabela a seguir mostra os salários do setor de determinada


empresa.

TABELA 40 – Salários do setor de determinada empresa

SALÁRIO (em reais) Número de funcionários

800,00 10

1.200,00 11

1.500,00 6

2.000,00 6

4.500,00 9

Fonte: Elaborado pelo autor.

Qual é o salário que representa a moda desse setor da empresa?


Observe que o
salário com maior
frequência é de
Resposta: 1.200,00, o que
significa que a moda
Observe que o salário com maior frequência é de 1.200,00, o que é R$ 1.200,00.
significa que a moda é R$ 1.200,00.

4º) A tabela abaixo representa as marcas de refrigerante comprada


pelos clientes de um supermercado.

TABELA 41 – Marcas de refrigerante

MARCA DE REFRIGERANTE fi

Coca-Cola 22

Guaraná 14

Pepsi twist 8

Sprite 6

Fonte: Elaborado pelo autor.

099
unidade 4
ESTATÍSTICA

Qual é a marca mais comprada?

Resposta:

A moda também pode ser determinada para dados qualitativos.


Nesse exemplo, a marca mais comprada é a moda.

Mo = Coca-Cola , ou seja, a marca mais comprada é Coca-Cola .

3.1 - M
 oda para dados agrupados em intervalos de classe: aqui
utilizaremos a fórmula de King para o cálculo da moda.
Segundo Bruni (2007), há também as fórmulas de Czuber e a
de Pearson.

A fórmula é:

ƒ post
Antes de aplicar
Mo = l + xh a fórmula,
ƒan + ƒpost
primeiramente
é necessário
Sendo:
determinar a classe
modal, que é a
l = limite inferior da classe modal
classe com maior
fant = frequência da classe imediatamente anterior
frequência.

fpost = frequência da classe imediatamente posterior

h = amplitude da classe modal

Antes de aplicar a fórmula, primeiramente é necessário determinar


a classe modal, que é a classe com maior frequência.

Acompanhe os exemplos disponibilizados abaixo.

1º) A tabela seguinte apresenta as notas dos 36 alunos de uma


turma em avaliação da disciplina Estatística, cujo valor foi 20,0
créditos, organizados em classes.

100
unidade 4
ESTATÍSTICA

TABELA 42 – Notas de alunos

NOTAS QTDE DE ALUNOS

5,0 | 7,5 4

7,5 | 10,0 4

10,0 | 12,5 15

12,5 | 15,0 5

15,0 | 17,5 6

17,5 | 20,0 2

Fonte: Elaborado pelo autor.

Qual é a moda do conjunto de dados?

Resposta
O quadro mostra
A classe modal é 10,0 | 12,5. Portanto: a distribuição de
frequência dos
l = 10 salários mensais
(agrupados em
fant = 4 classes) de 50
empregados de
fpost = 5 uma firma.
h = 2,5
5
Mo = 10 + x 2,5 → Mo = 11,39
4+5

2º) O quadro mostra a distribuição de frequência dos salários


mensais (agrupados em classes) de 50 empregados de uma
firma.

101
unidade 4
ESTATÍSTICA

TABELA 43 – Distribuição de frequências dos salários mensais

SALÁRIO (em reais) NÚMERO DE FUNCIONÁRIOS (fi)

1 000 |⎯ 1 100 9

1 100 |⎯ 1 200 15

1 200 |⎯ 1 300 18

1 300 |⎯ 1 400 5

1 400 |⎯ 1 500 3

Fonte: Elaborado pelo autor.

Calcule é o salário modal desse grupo de funcionários?

Resposta

A classe modal é 1 200 | 1 300. Portanto:

l = 1 200

fant = 15

fpost = 5

h = 100

5
Mo = 1200 + x 100 → Mo = 1 200 + 0,25 x 100 → Mo = 1 225
15 + 5

Quando há valores razoavelmente próximos, ou seja, sem grande


variação, a média e a mediana são próximas uma da outra.

EXERCÍCIOS DA UNIDADE

1- Um radar fotográfico, instalado em uma rodovia na qual o limite de

velocidade é de 100 km/h, registrou, em uma semana x, multas por

excesso de velocidade, que foram assim distribuídas:

102
unidade 4
ESTATÍSTICA

TABELA 44 – Km

VELOCIDADE EM KM/H Nº. DE OCORRÊNCIA

101 |⎯ 108 34

108 |⎯ 115 41

115 |⎯ 122 35

122 |⎯ 129 22

129 |⎯ 136 18

Fonte: Elaborado pelo autor.

a) Determine o valor de x:

b) Calcule a média, a mediana e a moda para a distribuição:

2 - A altura dos jogadores de um time de basquete são 1,88 m, 1,98 m, 2,02

m, 1,93 m e 1,95 m. Qual é a média de altura desse time?

3 - Uma marca de fast food famosa vendeu, nas cinco últimas semanas,

950, 1.500, 1.300, 1.100 e 1.800 “casquinhas” em um quiosque de

determinado shopping. Qual foi a quantidade média vendida por

semana? E a mediana?

4 - Dos 100 operários de uma fábrica, 40 recebem R$ 6,00 por hora, 30

recebem R$ 4,00 e 30 recebem R$ 5,00. Qual é o salário médio por hora

dos operários?

5-
A tabela abaixo apresenta as idades de um grupo de alunos

matriculados na disciplina Métodos Quantitativos. Pede-se calcular a

média, a mediana e a moda das idades.

103
unidade 4
ESTATÍSTICA

TABELA 45 – Idades de um grupo de alunos

IDADE (EM ANOS) Fi

19 8

21 6

22 13

25 4

30 1

Fonte: Elaborado pelo autor.

6 - Calcule a mediana da seguinte amostra: {3; 4; 5; 7; 8; 10}.

7 - (ENEM – 2010) O quadro seguinte mostra o desempenho de um time

de futebol no último campeonato. A coluna da esquerda mostra o

número de gols marcados e a coluna da direita informa em quantos

jogos o time marcou aquele número de gols.

TABELA 46 – Desempenho time de futebol

GOLS MARCADOS QUANTIDADE DE PARTIDAS

0 5

1 3

2 4

3 3

4 2

5 2

7 1

Fonte: Elaborado pelo autor.

Se X, Y e Z, respectivamente, a média, a mediana e a moda desta

distribuição, então

A) X = Y < Z

B) Z < X = Y

104
unidade 4
ESTATÍSTICA

C) Y < Z < X

D) Z < X < Y

E) Z < Y < X

8 - Em um debate político, foi solicitado a uma amostra do público presente

dizer a qual partido político pertencia cada membro. As respostas estão

resumidas na tabela a seguir. Qual é a moda das respostas?

TABELA 47 – Partidos políticos

PARTIDO POLÍTICO FREQUÊNCIA

PSDB 56

PT 34

Outros 21

Não responderam 9

Fonte: Elaborado pelo autor.

RESPOSTAS:

1- a) 150 b) média: 116,12 moda: 111,55 e mediana: 115

2 - 1,95 m

3 - média: 1 330; mediana: 1 300

4 - R$ 5,10

5 - média: 21,69; mediana: 22; moda: 22

6-6

7-e

8 - PSDB

105
unidade 4
ESTATÍSTICA

Revisão
O resumo desta unidade está apresentado no esquema a seguir.

Medidas de
tendência central

Média aritmética Mediana Moda

Somatório dos dados Divide o conjunto de


Valor que se
dividido pela quantidade dados em duas partes
repete mais vezes
de dados iguais

Dados não agrupados Dados não agrupados Dados não agrupados

Dados agrupados Dados agrupados Dados agrupados


sem classes sem classes sem classes

Dados agrupados Dados agrupados Dados agrupados


em classes em classes em classes

Fonte: Elaborado pelo professor.

Para saber mais sobre o assunto abordado nesta unidade, consulte os

seguintes livros:

STENVENSON, Willian J. Estatística aplicada à administração. São Paulo:

Harbra, 2001.

TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2008.

106
unidade 4
Medidas de
dispersão e de
variabilidade
Introdução

Nesta unidade serão apresentadas e discutidas o uso das medidas


de dispersão que auxiliam na análise da informação dos dados
resultantes das variáveis quantitativas. Será destacado que as
medidas de dispersão analisam o afastamento dos dados em
relação à média, que é a medida de tendência central mais utilizada
no cotidiano, ou seja, complementam as informações contidas nas
medidas de tendência central.

Além disso, ressalta-se o fato de que quanto maior for a variação • Amplitude total
dos dados, menor é a representatividade da média. Essa variação • Desvio médio
absoluto (DMA)
é representada pelo desvio padrão, medida de dispersão mais
conhecida e com aplicação nas diferentes áreas. • Variância (s2),
desvio padrão (s)
e coeficiente de
variação (CV)
• Revisão
ESTATÍSTICA

Amplitude total
Cálculo da amplitude total para dados
não agrupados em intervalos de classe:
Nesse caso, a amplitude total é a diferença entre o maior e o menor
valor do conjunto de dados coletados.

Veja os exemplos:

1º) Os dados a seguir mostram o número de pedidos atendidos


mensalmente por uma fábrica de móveis nos anos de 2009 e
2010:

TABELA 48 - Pedidos atendidos nos anos de 2009 e 2010

ANO PEDIDOS ATENDIDOS A amplitude total


é a diferença entre
2009* 13; 22; 29; 37; 39; 46; 51; 58; 59
o maior e o menor
2010 14; 17; 22; 23; 29; 31; 35; 36; 43; 52 valor do conjunto de
dados coletados.
* A empresa foi aberta em março de 2009

Fonte: Elaborado pelo autor.

Determine a amplitude total em cada ano:

Resposta:

2009: o maior valor do conjunto de dados é 59, enquanto o menor é


13. Logo, a amplitude total é:

AT = 59 – 13 → AT = 46

2010: o menor valor é 14 e o maior, 52.

AT = 52 – 14 → AT = 38

Veja que no ano de 2010 a amplitude entre os dados é menor,


ou seja, os dados estão menos distantes.

109
unidade 5
ESTATÍSTICA

2º) O PROCON de uma cidade procurou um grande supermercado,


após muitas reclamações dos clientes, para realizar uma
pesquisa sobre o tempo que aguardavam na fila para passar
suas compras. O levantamento realizado gerou a tabela abaixo:

TABELA 49 - Tempo de espera para passar as compras

TEMPO DE ESPERA QUANTIDADE


(EM MINUTOS) DE CLIENTES
5 4

10 11

15 19

20 24

25 18

30 13

Fonte: Elaborado pelo autor. A amplitude total é


a diferença entre o
limite superior da
Determinar a amplitude total do conjunto de dados:
classe mais alta e
o limite inferior da
Resposta: classe mais baixa.

Observe que a variável que está em estudo é o “tempo de espera”,


assim o maior dado é 30 e o menor é 5:

AT = 30 – 5 → AT = 25, o que indica que a diferença entre um cliente


que espera menos tempo na fila e o que espera mais tempo é 25
minutos.

Cálculo da amplitude total para dados


agrupados em intervalos de classe:
A amplitude total é a diferença entre o limite superior da classe mais
alta e o limite inferior da classe mais baixa.

Veja o exemplo:

110
unidade 5
ESTATÍSTICA

Um radar fotográfico, instalado em uma rodovia na qual o limite de


velocidade é de 100 km/h, registrou em uma semana 150 multas
por excesso de velocidade, assim distribuídas:

TABELA 50 - Velocidade dos veículos registrados por um radar

VELOCIDADE EM KM/H Nº. DE OCORRÊNCIA

101 |⎯ 108 34

108 |⎯ 115 41

115 |⎯ 122 35

122 |⎯ 129 22

129 |⎯ 136 18

Fonte: Elaborado pelo autor.

A amplitude é
Determine a amplitude total do conjunto de dados. determinada de
modo fácil, mas
Resposta: como considera
apenas os valores
O limite superior da classe mais alta é 136 e o limite inferior da extremos, sua
interpretação fica
menor classe é 101, logo:
dificultada, podendo
distorcer
AT = 136 – 101 → AT = 35 as análises.

Veja que, nesse caso, utilizamos apenas os extremos, então não


consideramos os valores intermediários e a análise dos dados não
é tão representativa.

A amplitude é determinada de modo fácil, mas como considera apenas os

valores extremos, sua interpretação fica dificultada, podendo distorcer as

análises.

111
unidade 5
ESTATÍSTICA

Desvio médio
absoluto (DMA)
O desvio médio absoluto analisa a dispersão dos dados em torno
da média aritmética. Ele é dado pela fórmula:

n
∑ xi - x

DMA = i=1 , onde:


n

xi = elemento do conjunto

x = média aritmética

n = quantidade de elementos do conjunto

Acompanhe os exemplos:

O desvio médio
1º) Calcule o desvio médio absoluto da seguinte amostra: {3; 4; 5; 6; absoluto analisa a
8; 10}: dispersão dos dados
em torno da
média aritmética.
Resposta:

O 1º passo é calcular a média:


3 + 4 + 5 + 6 + 8 + 10 36
x= = =6→x=6
6 6

A seguir vamos determinar os desvios absolutos, que é a “distância”


(em módulo) de cada dado em relação à média:

3–6 =3
4–6 =2
5–6 =1
6–6 =0
8–6 =2
10 – 6 = 4

Agora é possível encontrar o desvio médio absoluto, que é a média

112
unidade 5
ESTATÍSTICA

aritmética dos desvios absolutos:

3+2+1+0+2+4 12
DMA = = = 2 → DMA = 2
6 6

O valor encontrado indica que os números se afastam, em média, 2


da média aritmética dos dados analisados.

2º) Dado o conjunto de dados 8 14, 6, 13, 17, 5, 10, 16, 7 e 12,
determine o desvio médio absoluto.

Resposta:

Determinando a média:

8 + 14 + 6 + 13 + 17 + 5 + 10 + 16 + 7 + 12 108
x= = = 10,8 → x = 10,8
10 10

Agora, calcule o desvio médio absoluto (lembrando que o valor é em


módulo):

DMA =
)

O desvio médio absoluto tem como vantagem trabalhar com todos os

dados da série, diferentemente da amplitude total, mas tem a desvantagem

de ser sensível a valores muito extremos.

113
unidade 5
ESTATÍSTICA

Variância (s2), desvio


padrão (s) e coeficiente
de variação (CV)
Variância (s2):

A variância considera todos os dados coletados para a variável que


está sendo estudada. É o valor que corresponde à média aritmética
dos quadrados dos desvios em relação à média. A variância é difícil
de ser interpretada (TIBONI, 2010). A fórmula para a determinação
da variância é:

n

2
xi - x

S2 = i=1 , onde: É chamada de variância populacional.


n
A variância considera
xi = elemento do conjunto
todos os dados
coletados para a
x = média aritmética variável que está
sendo estudada.
n = quantidade de elementos do conjunto

Contudo, quando o cálculo da variância trata de uma amostra e não


de uma população, o que é muito comum em estatística, a fórmula
sofre uma correção e o denominador será “n – 1” e não n. Esse
ajuste visa corrigir o fato do número de elementos da amostra ser
menor que o número de elementos da população. Então:

n

2
xi - x

S2 = i=1 , onde: Chamada variância amostral.


n-1

xi = elemento do conjunto

x = média aritmética

n = quantidade de elementos do conjunto

114
unidade 5
ESTATÍSTICA

Desvio padrão:
Essa medida de dispersão permite corrigir a dificuldade de
interpretação da variância. O desvio padrão corresponde à raiz
quadrada da variância. Assim:

s= √s 2

Quanto mais próximo de 0 for o desvio padrão, menor a dispersão do

conjunto de dados.

Coeficiente de variação (cv):


As medidas de dispersão relativas são aquelas que analisam uma
Quanto mais
medida de tendência central, geralmente a média aritmética, e as
próximo de 0 for
medidas de dispersão, em geral o desvio padrão, de uma única o desvio padrão,
vez. O coeficiente de variação é a medida de dispersão relativa menor a dispersão
do conjunto de
mais usual e representa a razão entre o desvio padrão e a média
dados.
aritmética. Pode ser representado da seguinte maneira:

s
cv =
x

Acompanhe os exemplos que envolverão as medidas de dispersão


apresentadas.

1º) A
 produção de queijos finos (em quilos) de uma pequena
fazenda do sul de Minas Gerais nos últimos seis meses está
apresentada na sequência a seguir:

11; 8; 4; 10; 9; 12

Calcule:

a) A média.

b) O desvio médio absoluto.

115
unidade 5
ESTATÍSTICA

c) A variância populacional.

d) O desvio padrão populacional.

Resposta:

11 + 8 + 4 + 10 + 9 + 12
a) x = = 9 →x=9
6

(11-9) + (8-9) + (4-9) + (10-9) + (9-9) + (12-9) = 12


b) DMA = = 2 → DMA = 2
6 6

(11-9)2 + (8-9)2 + (4-9)2 + (10-9)2 + (9-9)2 + (12-9)2 4+1+25+1+0+9 = 40


c) S2 = → S2 = 2 = = 6,6667
6 6

d) s = √6,6667 → s = 2,582

2º) Dada a amostra {3; 4; 5; 7; 8; 10}, calcule:

a) A média aritmética.

b) A variância amostral.

c) O desvio padrão amostral.

d) O coeficiente de variação.

Resposta:

116
unidade 5
ESTATÍSTICA

3º) A tabela abaixo apresenta as idades de um grupo de alunos


matriculados na disciplina Métodos Quantitativos.

TABELA 51 - Idade dos alunos matriculados


na disciplina Métodos Quantitativos

IDADE (EM ANOS) Fi

19 8

21 6

22 13

25 4

30 1

Fonte: Elaborado pelo autor.

Pede-se:

a) Calcular a média.

b) A variância e o desvio padrão populacional.

c) A variância e o desvio padrão amostral.

Resposta:

19 x 8 + 21 x 6 + 22 x 13 + 25 x 4 + 30 x 1 694
a) x = = = 21,69 → x = 21,69
8 + 6 + 13 + 4 + 1 32

b) 
Observe que os dados estão agrupados, então é necessário
considerar quantas vezes cada dado aparece, assim como
fizemos na média.

A variância populacional:

117
unidade 5
ESTATÍSTICA

4º) O quadro mostra a distribuição de frequências dos salários


mensais (agrupados em classes) de 50 empregados de uma
firma:

TABELA 52 - Salário dos funcionários da empresa

SALÁRIO (em reais) NÚMERO DE EMPREGADOS (fi)

1 000 |⎯ 1 100 9

1 100 |⎯ 1 200 15

1 200 |⎯ 1 300 18

1 300 |⎯ 1 400 5

1 400 |⎯ 1 500 3

Fonte: Elaborado pelo autor.

Calcule:

a) O salário médio desse grupo de funcionários.

b) O desvio padrão populacional.

c) O desvio padrão amostral.

Resposta:

O primeiro passo é determinar o ponto médio de cada classe:

118
unidade 5
ESTATÍSTICA

SALÁRIO (em reais) PONTO MÉDIO DA CLASSE NÚMERO DE EMPREGADOS (fi)

1 000 |⎯ 1 100 1000 + 1100 9


2
= 1050

1 100 |⎯ 1 200 1100 + 1200 15


2
= 1150
1200 + 1300
1 200 |⎯ 1 300
2
= 1250 18

1 300 |⎯ 1 400 1300 + 1400 5


2
= 1350
1400 + 1500
1 400 |⎯ 1 500
2
= 1450 3

1050 x 9 + 1150 x 15 + 1250 x 18 + 1350 x 5 + 1450 x 3 60300


a) x= → x= = x 1206
9 + 15 + 18 + 5 + 3 50

b) Nesse caso, os dados estão agrupados em classes, então é


necessário considerar quantas vezes cada classe aparece e
também os pontos médios de cada uma.

A variância populacional:

s2 =

(1050 −1206)2 x9 + (1150 −1206)2 x15 + (1250 −1206)2 x18 + (1350 −1206)2 x5 + (1450 −1206)2 x3
50

A :

(1050 −1206)2 x9 + (1150 −1206)2 x15 + (1250 −1206)2 x18 + (1350 −1206)2 x5 + (1450 −1206)2 x3
50 −1

5º) A
 companhe agora um exemplo de aplicação do conceito de
desvio padrão:

* A tabela a seguir mostra o número de votos por turma de dois

119
unidade 5
ESTATÍSTICA

candidatos que estão concorrendo a uma vaga de representante


na comissão de uma festa para arrecadar fundos para a formatura:

TABELA 53 - Votos dos candidatos


a comissão de formatura por turma

CANDIDATO 3º A 3º B 3º C 3º D 3º E 3º F

Gustavo 12 15 12 16 14 15

Alice 12 11 18 9 19 15

Fonte: Elaborado pelo autor.

a) Calcule o desvio-padrão de cada um desses candidatos.

b) Qual dos dois candidatos é o mais regular?

Resposta:

a) É
 preciso calcular o desvio padrão de cada um dos alunos.
Acompanhe:

Gustavo:

12 + 15 + 12 + 16 + 14 + 15 84
x= = 14 → x = 14
6 6

120
unidade 5
ESTATÍSTICA

b) Para responder à questão “b”, é preciso utilizar o conceito de


desvio padrão, pois se analisarmos a média aritmética apenas,
podemos afirmar que os dois alunos apresentam a mesma
regularidade. Contudo, quando analisamos o desvio padrão,
que mede a dispersão dos dados em relação à média de cada
conjunto, percebemos que Gustavo teve votação mais regular, já
que teve desvio padrão menor.

Nos exemplos apresentados para destacar o cálculo do desvio padrão

amostral e populacional, apresentamos o cálculo das duas formas.

Contudo, é preciso ficar atento à situação que será analisada. Quando a

situação referir a uma amostra, calcule o desvio padrão amostral, e quando

se referir à população, calcule o desvio padrão populacional.

Para treinar seus conhecimentos, faça as atividades a seguir:

1- Dez filmes concorrentes em um festival de cinema na categoria “filme

caseiro” foram apreciados por um júri que lhes atribuiu as seguintes

pontuações:

1; 5; 4; 3; 2; 1; 1; 1; 5; 2.

a) Elabore uma tabela para organizar os dados.

b) Determine o desvio padrão populacional e o coeficiente de variação.

2 - O tempo gasto por uma amostra de seis pessoas para responder a

uma pesquisa foi, em minutos, 6, 5, 5, 3, 3, 2. Nessas condições, calcule

a média aritmética, a variância amostral e o desvio padrão dessa

distribuição:

3 - As velocidades máximas das cinco voltas dadas em um teste da “Stock

Car”, em km/h, foram: 190, 198, 196, 204, 202. Nessas condições,

determine:

121
unidade 5
ESTATÍSTICA

a) A média das velocidades.

b) A variância populacional.

c) O desvio padrão populacional.

d) O coeficiente de variação.

4 - Feito um levantamento sobre os salários dos vinte e cinco funcionários

de uma pequena empresa, pode-se elaborar o seguinte quadro de

distribuição:

TABELA 54 - Salários dos funcionários da pequena empresa

CLASSES DE SALÁRIO FREQUÊNCIA

500 |⎯ 1000 3

1000 |⎯ 1500 6

1500 |⎯ 2000 10

2000 |⎯ 2500 4

2500 |⎯ 3000 2

Fonte: Elaborado pelo autor.

Determine:

a) A média dessa distribuição.

b) A variância e o desvio padrão.

c) O coeficiente de variação.

5 - Uma pesquisa dividiu em três microrregiões (A, B, C) a região do

Vale do Jequitinhonha do estado de Minas Gerais. Cada uma dessas

microrregiões foi dividida em seis municípios. A tabela seguinte

informa o grau de satisfação (notas de 0 a 100) da população de cada

município em relação à respectiva administração municipal:

122
unidade 5
ESTATÍSTICA

TABELA 55 - Grau de satisfação dos municípios por região

Região A 90 20 10 50 80 70

Região B 70 60 30 40 50 40

Região C 60 60 60 60 60 60

Fonte: Elaborado pelo autor.

a) Calcule o desvio padrão populacional das notas dadas à administração

municipal de cada região pesquisada

b) Classifique em ordem crescente as regiões em relação à regularidade

das notas atribuídas

6 - Os dados a seguir mostram o número de pedidos atendidos

mensalmente por uma fábrica de móveis nos anos de 2009 e 2010:

TABELA 56 - Pedidos atendidos nos anos de 2009 e 2010

ANO PEDIDOS ATENDIDOS

2009* 13; 22; 29; 37; 39; 46; 51; 58; 59

2010 14; 17; 22; 23; 29; 31; 35; 36; 43; 52

* A empresa foi aberta em março de 2009

Fonte: Elaborado pelo autor

Determine o desvio padrão de cada ano e o coeficiente de variação:

7- Abaixo estão representadas as idades de dois grupos de trabalho em

uma pesquisa científica:

TABELA 57 - Idades dos grupos de trabalho

I 25 28 31 34 37

II 17 23 30 39 46

Fonte: Elaborado pelo autor.

123
unidade 5
ESTATÍSTICA

Qual dos dois grupos é o mais regular? Por quê?

Respostas:

1) a)

PONTUAÇÃO Fi

1 4

2 2

3 1

4 1

5 2

b) Desvio padrão: 1,565. Coeficiente de variação: 62,6%

2) Média = 4. Variância = 2,4. Desvio padrão = 1,549

3) a) 198 km/h b) 24 c) 4,899 d) 2,47%

4) a) Média = R$1.670,00

b) Variância populacional = 293 600; desvio padrão = 541,85

c) 32,45%

5) a)

REGIÃO MÉDIA DESVIO PADRÃO

Região A 51,67 73,14

Região B 48,33 32,91

Região C 60 0

b) Região C, Região B, Região A

6)

124
unidade 5
ESTATÍSTICA

ANO DESVIO PADRÃO COEF DE VARIAÇÃO

2009 14,99 38,11%

2010 8,82 29,21%

7) Grupo I: desvio padrão = 4,24; Grupo II: desvio padrão = 10,49

O grupo I é mais regular, pois tem desvio padrão menor.

Revisão
Na Unidade 5 estudamos as medidas de dispersão que indicam o
quanto um conjunto de dados estão dispersos em relação à média.
Dentre essas medidas, a mais conhecida é o desvio padrão.

Amplitude
Total

Desvio
Médio Variância
Absoluto
MEDIDAS DE
DISPERSÃO

Desvio Coeficiente
Padrão de Variação

Para saber mais sobre o assunto, pesquise as obras a seguir:

BRUNI, Adriano Leal. Estatística Aplicada à Gestão Empresarial. São Paulo:

Atlas, 2007.

TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2008.

125
unidade 5
Regressão e
correlação –
medidas de
assimetria e de
curtose
Introdução

A Unidade 6 será dividida em duas partes. Na primeira vamos


fazer uma abordagem simples e apenas conceitual a respeito das
medidas de assimetria e de curtose. Essas medidas, juntamente
com as de posição e de dispersão, proporcionam a descrição e a
• Medidas de
compreensão completas da distribuição de frequência estudada. assimetria e
curtose

Já na segunda parte serão discutidos os itens mais importantes no • Correlação e


regressão linear
que se refere às análises de regressão e correlação linear, de modo
a definir os mesmos. Apresentaremos a relação entre as variáveis • Revisão

observadas, se existir tal relação, e qual a aplicação desses


conceitos na análise de dois conjuntos de dados.
ESTATÍSTICA

Medidas de assimetria
e curtose
Assimetria e curtose – uma visão geral

A assimetria é a propriedade que indica a tendência de concentração


maior dos dados em relação ao ponto central da distribuição, ou
“mede o grau de afastamento de uma distribuição em relação a um
eixo central” (BRUNI, 2007, p. 83).

Assim, quando nos referimos a esse eixo central, as curvas podem


ser chamadas, basicamente, de simétricas ou assimétricas. No
caso das curvas simétricas, é a média que representa o eixo de
simetria, sendo que as distribuições à esquerda e à direita desse
eixo são iguais. Uma curva será simétrica quando a média, a moda Já as curvas
assimétricas são
e a mediana são iguais, ou seja, apresentam um mesmo valor. Já as
aquelas em que
curvas assimétricas são aquelas em que a média não tem simetria. a média não tem
simetria.
FIGURA 27 - Curvas simétricas e assimétricas

Fonte: [Curvas simétricas e assimétricas]. In: LIÇÕES para melhoria do


processo para os líderes. “Vitaminas Dr. CEP.” Disponível em: <http://www.
datalyzer.com.br/site/suporte/administrador/info/arquivos/info18/18.html>.
Acesso em: 08 set. 2015.

Na figura, a curva B representa uma curva simétrica e as curvas


A e C são exemplos de curvas assimétricas. Ainda, ao analisar a
figura, é possível afirmar que a curva A representa uma assimetria
negativa, pois os valores estão concentrados à esquerda do

128
unidade 6
ESTATÍSTICA

eixo central e, nesse caso, de modo geral, a média é menor que a


mediana. Enquanto a curva C representa uma assimetria positiva e
os valores estão concentrados à direita do eixo central, e em geral a
média é maior que a mediana.

Já a curtose é a característica que analisa o grau de achatamento


ou alongamento de uma distribuição (BRUNI, 2007). Portanto, no
caso da curtose a análise é feita no eixo vertical.

FIGURA 28 - Diferentes curtoses

Ao analisar a figura,
Fonte: [Diferentes Curtoses]. In: Site “MSPC”. Disponível em: <http://www.mspc. é possível observar
eng.br/matm/prob_est320.shtml>. Acesso em: 08 set. 2015. que há três formas
diferentes para a
curtose.
Ao analisar a figura, é possível observar que há três formas
diferentes para a curtose. As curvas achatadas como a curva (c)
são chamadas de platicúrticas e dizemos que têm menor curtose,
enquanto as curvas alongadas como a curva (a) recebem o nome
de leptocúrtica e têm alta curtose. Já as curvas perfeitas, com
mediana curtose, como a curva (b), são chamadas de mesocúrticas
(BRUNI, 2007).

A análise da assimetria em relação a


média, moda e mediana
Conforme já destacado, as distribuições são classificadas como
simétricas quando a média, a moda e a mediana são iguais e, nesse
caso, o grau de assimetria será nulo.

129
unidade 6
ESTATÍSTICA

FIGURA 29 - Distribuição simétrica

Média - Moda - Mediana

Fonte: Disponível em: https://professordigital.wordpress.com/2012/annual-report/

Temos também as distribuições assimétricas, que podem ser


positivas ou negativas.

Observe que a
FIGURA 30 - Distribuição assimétrica positiva média é maior
que a mediana e a
mediana é maior que
a moda.

Disponível em: https://professordigital.wordpress.


com/2012/annual-report/ Acesso em 8/9/2015

Observe que a média é maior que a mediana e a mediana é maior


que a moda. Nesse caso temos muitos dados com valores baixos e
também muitos dados com valores altos. Um exemplo simples são
os salários no Brasil: temos muitos brasileiros que ganham pouco e
poucos brasileiros que ganham muito.

130
unidade 6
ESTATÍSTICA

FIGURA 31 - Distribuição assimétrica negativa

Fonte: [Distribuição assimétrica negativa]. In: Uso de


planilhas compartilhadas na web

2.0 como ferramentas pedagógicas auxiliares.


Avaliação escolar e web 2.0. BLOG PROFESSOR
DIGITAL. 26 jun. 2010. Disponível em: <htps://
professordigital.wordpress.com/tag/avaliacao-
escolar/>. Acesso em: 08 set. 2015.

Já nessa figura, a média é menor que a mediana e a mediana é


menor que a moda.

Em geral, dizemos

Correlação e que há correlação


entre duas variáveis
quando as mesmas
regressão linear estão relacionadas.

Correlação linear
Em geral, dizemos que há correlação entre duas variáveis quando
as mesmas estão relacionadas. Já a correlação linear entre duas
variáveis é quando o gráfico se aproxima de uma linha. Essa linha é
uma tendência, visto que a mesma tem por objetivo acompanhar a
tendência da distribuição de pontos, que pode ser uma reta ou uma
curva. Também podemos afirmar que a correlação linear é uma
linha média, pelo fato de procurar separar a mesma quantidade de
pontos abaixo e acima da linha.

Para expressar a correlação entre as variáveis, é necessário


equacionar a mesma para que seja possível medir o grau de
intensidade da correlação entre as variáveis, de modo a estabelecer
uma relação numérica que medirá o nível da correlação.

131
unidade 6
ESTATÍSTICA

Veja o quadro abaixo, que representa a correlação linear, curvilínea e


a ausência de correlação por meio do diagrama de dispersão.

FIGURA 32 - Modelos de correlação

Fonte: TIBONI, 2010, p. 305.

A correlação pode ser:

• positiva: quando as variáveis se comportam de forma


diretamente proporcional. Nesse caso o aumento dos
valores da variável independente x provoca o aumento dos
valores da variável dependente y. O coeficiente angular da
reta é positivo e a reta é ascendente.

• negativa: nesse caso as variáveis se comportam de


forma inversamente proporcional. O aumento da variável
independente x provoca a redução dos valores da variável
dependente y. Quando isso acontecer, o coeficiente angular
da reta é negativo e a reta é descendente.

132
unidade 6
ESTATÍSTICA

Coeficiente de correlação linear:


O coeficiente de correlação linear é uma medida de correlação
porque mede quanto a distribuição de pontos no diagrama de
dispersão se aproxima de uma reta. Isto significa que o coeficiente
de correlação indica o nível de intensidade que ocorre na correlação
entre as variáveis que pretendemos relacionar. Assim como a
correlação, o coeficiente de correlação linear pode ser positivo ou
negativo.

Para calcular o grau de correlação linear entre as variáveis


estudadas, utilizamos a equação desenvolvida por Pearson. Por
isso costumamos chamar de coeficiente de correlação de Pearson
ou método dos mínimos quadrados. A equação é a descrita abaixo:

Onde:

r: coeficiente de correlação de Pearson

n: número de observações das variáveis

xi: variável independente

yi: variável dependente

O coeficiente de correlação linear possui algumas propriedades,


que são:

-1 ≤ r ≤ 1 Significa que o valor de r varia dentro do intervalo fechado entre


-1 e +1.

r não tem dimensão  Significa que não tem unidade de medida, isto é, independe da
unidade de medida das variáveis.

133
unidade 6
ESTATÍSTICA

Há relação entre o sinal do coeficiente e o sentido da correlação,


conforme descrito abaixo:

Sinal positivo Indica que a reta é ascendente.

Sinal negativo Indica que a reta é descendente.

Também vale destacar a relação entre a intensidade da correlação


de Pearson e os valores numéricos de r (BRUNI, 2007):

Quanto mais o valor de r se Maior a correlação entre as


aproximar de -1 ou de +1 variáveis
Também vale
destacar a relação
Quanto mais o valor de r se Menor a correlação entre as
entre a intensidade
aproximar de 0 variáveis da correlação de
Pearson e os valores
numéricos de r

r = +1 ou r = -1 são valores bem improváveis nas relações


estatísticas, já que isso indica a relação perfeita entre as variáveis.
Esses valores servem de referência, o que indica que quanto mais o
coeficiente de correlação se aproximar deles, mais ela está perto de
ser “perfeita”.

Exemplos:

1º) O quadro a seguir apresenta a relação entre os gastos mensais


com publicidade e as vendas mensais de uma loja de sapatos
femininos.

134
unidade 6
ESTATÍSTICA

TABELA 58 - Relação entre gastos mensais e as vendas

GASTOS COM PUBLICIDADE VENDAS


(EM MILHARES DE REAIS) (EM MILHARES DE REAIS)

3 7

4 14

8 15

12 28

14 32

Fonte: Elaborado pelo autor.

A administração da loja quer verificar se há correlação significativa


entre os gastos com publicidade e as vendas.

Resposta:

Observe que a variável independente (xi) é “gastos com publicidade”


e a variável dependente (yi) é “vendas”. Assim, para verificar o nível
de intensidade da correlação, é preciso determinar o coeficiente de
correlação de Pearson. Para isso, vamos começar construindo uma
tabela contendo as variáveis dependentes, e independentes e os
produtos xi.yi, xi2 e yi2. Acompanhe:

xi yi xi2 yi2 xi.yi

3 7 9 49 21

4 14 16 196 56

8 15 64 225 120

12 28 144 784 336

14 32 196 1024 448

2 2
∑xi = 41 ∑yi = 96 ∑x = 429 ∑y = 2278 ∑x.y = 981

Fonte: Elaborado pelo autor.

135
unidade 6
ESTATÍSTICA

Agora basta substituir os valores obtidos na fórmula do coeficiente:

r = 0,9648 ou r = 96,48%

Observe que o valor está próximo de +1, o que indica que há forte
correlação positiva entre o gasto com publicidade e as vendas.

2º) Uma pesquisa tem por objetivo verificar numa empresa se há


correlação significativa entre o peso total do lixo descartado
com o peso do papel contido nesse lixo. Para isso, fez um
levantamento desses valores num período de 10 dias, e os
dados estão informados na tabela abaixo:

TABELA 59 - Peso do lixo e peso do papel contido no lixo

DIA 1º dia 2º dia 3º dia 4º dia 5º dia 6º dia 7º dia 8º dia 9º dia 10º dia

Peso total
10,74 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14
do lixo

Peso do 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
papel

Fonte: Elaborado pelo autor.

Resposta:

Observe que a variável independente (xi) é o “peso total do lixo” e a


variável dependente (yi) é o “peso do papel”.

Assim como no exercício anterior, o 1º passo é construir a tabela:

136
unidade 6
ESTATÍSTICA

xi yi xi2 yi2 xi.yi

10,74 2,43 109,62 5,9 25,44

19,85 5,12 394,02 26,21 101,63

21,25 6,88 451,56 47,33 146,2

24,36 6,22 593,41 38,69 151,52

27,38 8,84 749,66 78,15 242,04

28,09 8,76 789,05 76,74 246,07

33,61 7,54 1129,63 56,85 253,42

35,73 8,47 1276,63 71,74 302,63

38,33 9,55 1469,19 91,2 366,05

49,14 11,43 2414,74 130,64 561,67

2 2
∑xi = 288,21 ∑yi = 75,24 ∑x = 9377,52 ∑y = 623,47 ∑x.y = 2396,68

Fonte: Elaborado pelo autor.

Agora basta substituir os valores obtidos:

r = 0,9206 ou r = 92,06%

Observe que o valor está próximo de +1, o que indica que há forte
correlação positiva entre o peso total do lixo e o peso do papel

137
unidade 6
ESTATÍSTICA

Regressão linear simples:


A análise de regressão linear simples tem o objetivo de determinar
a equação matemática da reta que representa o melhor
relacionamento numérico linear entre o conjunto de pares de
dados em amostras selecionadas, das variáveis dependentes
e independentes. A equação da reta que se obtém pode ser
representada por:

y = a + bx

Onde:

x = variável independente

y = variável dependente
A correlação
a = constante numérica, representa a ordenada onde a reta e a regressão
são técnicas
intercepta o eixo y.
relacionadas, por
b = constante numérica, representa o coeficiente angular da reta de
isso a equação de
regressão linear
regressão.
somente será
calculada quando
existir a correlação
significativa entre
as variáveis.
A correlação e a regressão são técnicas relacionadas, por isso a
equação de regressão linear somente será calculada quando existir
a correlação significativa entre as variáveis.

Os coeficientes a e b, para estabelecer a equação da reta de


regressão podem ser determinados pelas fórmulas:

138
unidade 6
ESTATÍSTICA

Exemplos:

1º) O quadro abaixo apresenta a relação entre os gastos mensais


com publicidade e as vendas mensais de uma loja de sapatos
femininos.

TABELA 60 - Relação entre os gastos com publicidade e vendas

GASTOS COM PUBLICIDADE VENDAS


(EM MILHARES DE REAIS) (EM MILHARES DE REAIS)

3 7

4 14

8 15
Para a obtenção da
12 28 equação da reta de
regressão, utilizamos
14 32 a tabela contendo
as variáveis
Fonte: Elaborado pelo autor. dependentes e
independentes.
Determine a equação da reta que melhor ajusta os pontos, bem
como o valor estimado das vendas se o gasto com publicidade
atingir R$ 11 000,00 e R$ 20 000,00.

Resposta:

A variável independente (xi) é “gastos com publicidade” e a variável


dependente (yi) é “vendas”. Assim, para a obtenção da equação
da reta de regressão, utilizamos a tabela contendo as variáveis
dependentes e independentes, e os produtos xi.yi, xi2 e yi2, construída
para a determinação da correlação de Pearson:

139
unidade 6
ESTATÍSTICA

xi yi xi2 yi2 xi.yi

3 7 9 49 21

4 14 16 196 56

8 15 64 225 120

12 28 144 784 336

14 32 196 1024 448

2 2
∑xi = 41 ∑yi = 96 ∑x = 429 ∑y = 2278 ∑x.y = 981

Fonte: Elaborado pelo autor.

Agora basta substituir os valores obtidos nas fórmulas:

Então y = 2,075 + 2,088x, que é a equação da reta que melhor ajusta


os pontos.

Agora é possível determinar a estimação para os valores solicitados:

Quando o valor for R$ 20 000,00:

x = 20 → y = 2,075 + 2,088 x 20 → y = 2,075 + 41,76 → y = 43, 835

Ou seja, se o valor da publicidade for R$ 20 000,00, então as vendas


seriam estimadas em R$ 43 835,00.

Quando o gasto com publicidade for 11 000,00:

x = 11 → y = 2,075 + 2,088 x 11 → y = 2,075 + 22,968 → y = 25,043

140
unidade 6
ESTATÍSTICA

Ou R$ 25 043,00

Na primeira situação dizemos que foi feita uma extrapolação, pois


o valor considerado não pertence ao intervalo da tabela e não está
entre os dados coletados.

No caso da segunda dizemos que foi feita uma interpolação, pois o


valor está no intervalo da tabela, mas não é um dos dados coletados.

2º) Uma pesquisa tem por objetivo verificar numa empresa se há


correlação significativa entre o peso total do lixo descartado
com o peso do papel contido nesse lixo. Para isso, fez um
levantamento desses valores num período de 10 dias, e os
dados estão informados na tabela abaixo:

TABELA 61 - Peso do lixo e peso do papel contido no lixo

DIA 1º dia 2º dia 3º dia 4º dia 5º dia 6º dia 7º dia 8º dia 9º dia 10º dia

Peso total
10,74 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14
do lixo

Peso do 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
papel

Fonte: elaborado pelo autor.

Resposta:

A variável independente (xi) é o “peso total do lixo” e a variável


dependente (yi) é o “peso do papel”.

Assim como no exemplo anterior, para a obtenção da equação


da reta de regressão utilizamos a tabela contendo as variáveis
dependentes e independentes e os produtos xi.yi, xi2 e yi2, construída
para a determinação da correlação de Pearson:

141
unidade 6
ESTATÍSTICA

xi yi xi2 yi2 xi.yi

10,47 2,43 109,62 5,9 25,44

19,85 5,12 394,02 26,21 101,63

21,25 6,88 451,56 47,33 146,2

24,36 6,22 593,41 38,69 151,52

27,38 8,84 749,66 78,15 242,04

28,09 8,76 789,05 76,74 246,07

33,61 7,54 1129,63 56,85 253,42

35,73 8,47 1276,63 71,74 302,63

38,33 9,55 1469,19 91,2 366,05

49,14 11,43 2414,74 130,64 561,67

2 2
∑xi = 288,21 ∑yi = 75,24 ∑x = 9377,52 ∑y = 623,47 ∑x.y = 2396,68

Fonte: Elaborado pelo autor.

Agora basta substituir os valores obtidos:

Determine a equação da reta que melhor ajusta os pontos, bem


como o valor estimado das vendas se o gasto com publicidade
atingir R$ 11 000,00 e R$ 20 000,00.

142
unidade 6
ESTATÍSTICA

Realize agora as atividades a seguir:

1- Uma empresa de ônibus instalada em uma cidade estudou a demanda

de passagens em relação à variação do preço de venda entre a cidade e

algumas capitais brasileiras, e obteve os valores abaixo:

Demanda de passagens 33 25 24 18 12 10 8 4

Preço de venda (em reais) 300 400 500 600 700 800 900 1 000

a) Determine o coeficiente de correlação linear de Pearson e analise o valor

encontrado quanto ao nível da correlação entre as variáveis analisadas.

b) Determine a equação da reta de regressão linear.

2 - O dono de uma sorveteria instalada em uma capital do Nordeste decidiu

analisar alguns dados referentes aos últimos 10 meses. Analisou a

temperatura média mensal nesse período e o volume de vendas. O

levantamento realizado está resumido na tabela abaixo.

Temperatura (ºC) 32 28 33 27 26 36 34 30 31 29

Vendas (em mil unidades) 83 78 80 75 71 92 85 81 83 79

Determine:

a) O coeficiente de correlação.

b) Um modelo de ajuste linear entre os pontos (a equação da reta).

c) Para uma temperatura média mensal de 37ºC, qual o volume de vendas

projetado pelo modelo linear?

d) Para vendas iguais a 80 mil unidades, calcule qual deveria ser a

temperatura média mensal.

3 - Para cada uma das tabelas a seguir, determine o coeficiente de

correlação e o modelo de ajuste linear entre os pontos.

143
unidade 6
ESTATÍSTICA

a)

xi 3 5 8 10 15 17 20 22

y i 6 17 27 20 45 28 34 53

b)

xi 10 12 15 17 21

y i 4 5 7 9 12

4 - Uma loja decidiu analisar a relação existente entre a idade do

consumidor e o valor médio de suas compras no último ano. Para

isso, fez um levantamento com uma amostra de oito consumidores,

apresentada abaixo:

Idade (em anos) 32 17 26 36 34 53 31 29

Valor médio das compras 85 84 36 82 77 70 52 95

Determine o coeficiente de correlação linear entre a idade (x) e o valor

médio da compra (y), e comente a associação existente entre as variáveis.

5 -Uma pequena empresa registrou um aumento no lucro anual, conforme

a tabela abaixo:

Ano (x) 2003 2004 2005 2006 2007 2008

Lucro (em milhares de reais) 12,38 14,56 14,67 15,98 17,65 19,93

Determine:

a) O coeficiente de correlação

b) A reta de ajuste

c) O lucro estimado para 2009

d) O ano em que o lucro foi de 6,52 milhares de reais

RESPOSTAS:

1- a) r = -0,9843. O resultado indica forte correlação negativa entre as

144
unidade 6
ESTATÍSTICA

variáveis. Pode-se afirmar que existe correlação entre a demanda de

passagens e a variação do preço de venda.

b) y = 42,75 - 0,04x

2- a) r = 0,9269 b) y = 30,097 + 1,654x c) 91,30 d) 30,17

3- a) r = 0,8574 y = 5,592 + 1,853x b) r = 0,9961 y = -3,749 + 0,743x

4- r = - 0,0045. Como r é muito próximo de zero, é possível afirmar que não

existe relação entre as variáveis.

5- a) r = 0,9764 b) y = -2 753,45 + 1,38x c) 18,97 d) 2 000

Revisão
Na primeira parte da Unidade estudamos as medidas de assimetria
e curtose. Nela, vimos que essas medidas utilizam como referências
as medidas de tendência central.

FIGURA 33 - Medidas de assimetria e curtose

MEDIDAS DE ASSIMETRIA
E CURTOSE

ASSIMETRIA: mede o grau de CURTOSE: analisa o grau de


afastamento da distribuição em relação achatamento ou alongamento
às medidas de tendência central. de uma distribuição.

Já na segunda parte foram abordadas a correlação e a regressão


linear, que estudam a ocorrência de relação entre duas grandezas.
No caso da correlação, o coeficiente indica o grau de relação entre
as duas variáveis em estudo. Após verificar se há a correlação, é
possível identificar a melhor equação que a descreve.

145
unidade 6
ESTATÍSTICA

FIGURA 34 - Correlação e regressão linear

CORRELAÇÃO E
REGRESÃO LINEAR

Correlação Correlação
Linear Linear

Seu objetivo é
Positiva: as Coeficiente de correlação: calcular a equação
Negativa: as
variáveis se variáveis se indica o quanto a matemática que
comportam distribuição se aproxima representa a relação
comportam
de forma de uma reta. Varia de -1 a + entre as variáveis,
de forma
diretamente 1. Quanto mais próximo de chamadas de
inversamente
proporcional. zero, menor a correlação. dependentes e
proporcional.
independentes.
É representada
por y = a + bx.
Fonte: elaborado pelo autor.

Para saber mais sobre o assunto, indico a leitura da seguinte obra:

TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2013.

146
unidade 6
Probabilidade
Introdução

A probabilidade estuda o risco e o acaso em eventos futuros, de


modo a determinar a chance ou não do mesmo acontecer. A teoria
de probabilidade consiste em utilizar a intuição humana para
estudar os fenômenos do nosso cotidiano de trabalho. Para isso,
vamos utilizar a ideia de experimento.

Vale destacar que os experimentos que vamos estudar são os


aleatórios, dos quais não sabemos o resultado a priori, ou seja, são • Experimento
acontecimentos cujos resultados não conseguimos prever. aleatório
• Espaço
Portanto, nesta unidade pretendemos explicar os conceitos amostral

relacionados à teoria das probabilidades e sua aplicação prática em • Eventos


diferentes situações. • Probabilidade
• Probabilidade
Vejamos alguns conceitos necessários ao estudo da probabilidade da união de dois
eventos: eventos
destacados a seguir.
mutuamente
exclusivos
• Probabilidade
condicional:
eventos
independentes
• Probabilidade
de dois eventos
simultâneos
(ou sucessivos):
eventos
independentes
• Revisão
ESTATÍSTICA

Experimento aleatório
Um experimento ou fenômeno aleatório é aquele que, repetido
em condições idênticas, apresenta resultados diferentes. É um
fenômeno que se caracteriza por múltiplos resultados possíveis,
para os quais modelos não determinísticos são apropriados.

Exemplos de experimentos aleatórios:

• Lança-se uma moeda e observa-se a face voltada para


cima.

• Joga-se um dado de seis faces e observa-se o número


mostrado na face de cima.

• Em uma linha de produção, fabricam-se peças em série e


conta-se o número de peças defeituosas em um período de
uma semana. Joga-se um dado
de seis faces e
• Em um bingo sorteia-se um número e observa-se o que foi observa-se o
sorteado. número mostrado na
face de cima.

Um experimento aleatório tem como característica principal poder se repetir

várias vezes nas mesmas condições, sendo conhecido como o conjunto de

todos os resultados possíveis. Dessa forma, não se pode prever o resultado.

Espaço amostral
É o conjunto de todos os possíveis resultados de um experimento.
Também é chamado de conjunto universo (TIBONI, 2010). Aqui
vamos representá-lo por Ω.

149
unidade 7
ESTATÍSTICA

1º: Lançamento de uma moeda para cima e observação de qual a face

está voltada para cima quando a mesma cair:

Ω = {cara (k), coroa (c)}

n(Ω) = 2 → número de elementos do espaço amostral

2º: Lançamento de um dado e observação da face voltada para cima:

Ω = {1, 2, 3, 4, 5, 6}

n(Ω) = 6

3º: Lançamento de duas moedas para cima e observação da face voltada

para cima:

Ω = {(k, c), (k, k), (c, k), (c, c)}

n(Ω) = 4

4º: Em uma linha de produção, fabricam-se peças em série e conta-se o

número de peças defeituosas em um período de uma semana:

Ω = {0, 1, 2, 3,..., n}, em que “n” é o número máximo de peças que podem

ser produzidas em uma semana.

5º: Lançamento de dois dados, um branco e um azul, e observação do

número da face voltada para cima:

TABELA 62 - Resultados possíveis do lançamento de dois dados simultaneamente

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)


(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) n(Ω) = 36
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Fonte: Elaborado pelo autor.

6º) Em uma roda de amigos, observa-se e registra-se o nome de todos

eles:

Ω = {Selma, Antônio, Cássia, Geraldo, Tiago, Aparecida, Leonardo}

n(Ω) = 7

150
unidade 7
ESTATÍSTICA

Eventos
É qualquer subconjunto de um espaço amostral.

1º) No lançamento das duas moedas:

E1: aparecer faces iguais;

E2: aparecer cara em pelo menos uma face.

Ω = {(k, c), (k, k), (c, k), (c, c)} (espaço amostral do experimento aleatório

“lançamento de duas moedas”).

E1: {(k, k), (c, c)} é o evento “faces iguais” a partir do espaço amostral.

E2: {(k, c), (c, k), (c, c)} é o evento “cara em pelo menos uma face” a partir do

espaço amostral.
É qualquer
2º) Uma urna contém 10 bolas numeradas de 1 a 10. Retira-se, ao acaso, subconjunto
uma bola dessa urna. Determinar o evento: “não ocorre múltiplo de de um espaço
amostral.
três”:

Ω = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} espaço amostral

E = {1, 2, 4, 5, 7, 8, 10} evento “não ocorre múltiplo de três”, a partir do

espaço amostral: bolas numeradas de 1 a 10.

3º) O Departamento Pessoal de uma empresa tem oito funcionários, que

estão listados a seguir:

Considerar os eventos:

• Ser funcionário do setor e do sexo masculino (E1);

• Ser funcionário do setor e do sexo feminino (E2).

Ω = {Andrea, Bianca, Sérgio, Carine, Izabela, Mônica, Pedro, Vânia}

E1 = {Andrea, Bianca, Carine, Izabela, Mônica, Vânia}

E2 = {Sérgio, Pedro}

151
unidade 7
ESTATÍSTICA

Eventos complementares
Dois eventos são complementares quando a soma entre eles é 1 ou
100%.

Portanto:

p+q=1

Exemplo: A chance de um time ser rebaixado para a segunda divisão


do campeonato brasileiro é 40%. Então, a probabilidade dele não ser
rebaixado será:

100% - 40% = 60%

Probabilidade
Dois eventos são
complementares
O cálculo da probabilidade: quando a soma entre
eles é 1 ou 100%.
Para o cálculo da probabilidade, vamos utilizar a seguinte fórmula:

p(E) = nº. de casos favoráveis


nº. de casos possíveis

ou

p(A) = n(A)
n(B)

onde:

p(A) = probabilidade do evento A ocorrer

n(A) = número de elementos do evento A

n(B) = número de elementos do evento B

152
unidade 7
ESTATÍSTICA

1º) De um baralho comum com 52 cartas (13 de cada naipe), uma é

selecionada ao acaso. Qual a probabilidade de observarmos:

a) o sete de copas?

b) o número sete?

c) um número diferente de sete?

Resposta:

O primeiro passo é determinar o número de elementos do espaço amostral,

no caso o número de cartas do baralho:

n(Ω) = 52

Agora basta determinar o número de elementos de cada evento:

a) n(E1) = 1, pois só há um “sete de copas” no baralho.


O primeiro passo é
O cálculo da probabilidade é simples: determinar o número
de elementos do
p(E1) = 1 = 0,01923 = x 100 = 1,923% espaço amostral, no
caso o número de
cartas do baralho.
O cálculo da probabilidade é simples:

p(E1) = 1 = 0,01923 = x 100 = 1,923%


52

Forma fracionária Forma decimal Forma percentual

b) n(E2) = 4, pois há um “sete” em cada naipe no baralho.

O cálculo da probabilidade:

p(E2) = 4 = 0,07692 x 100 = 7,69%


52
c) n(E3) = 4, pois se há 4 “sete” em cada naipe no baralho e 52 cartas no

total, n(E2) = 52-4 = 48

O cálculo da probabilidade:

p(E3) = 48 = 0,92308 x 100 = 92,31%


52

153
unidade 7
ESTATÍSTICA

2º) Lançando-se um dado, qual a probabilidade de sair um número ímpar

na face voltada para cima?

Resposta:

Número de elementos do espaço amostral:

n(Ω) = 6

Número de elementos do evento:

n(E) = 3 são os números 1, 3 e 5

O cálculo da probabilidade:

p(E) = 3 = 0,5 x 100 = 50%


6

3º) Escolhido ao acaso um elemento do conjunto dos divisores de 30,

determinar a probabilidade de que ele seja primo:

Resposta:
Número de
Número de elementos do espaço amostral: elementos
do espaço
n(Ω) = 8 → que são: {1, 2, 3, 5, 6, 10, 15, 30} amostral.

Número de elementos do evento:

n(E) = 3 são: 2, 3 e 5

O cálculo da probabilidade:

p(E) = 3 = 0,375 x 100 = 37,5%


8

4º) Lançando-se duas moedas para cima, qual a probabilidade de que nas

duas saia a face cara?

Resposta:

n(Ω) = 4

n(E) = 1 → apenas (k,k)

O cálculo:

p(E) = 1 = 0,25 x 100 = 25%

154
unidade 7
ESTATÍSTICA

5º) Construa o espaço amostral do evento: “lance de um dado honesto”.

Em relação ao espaço amostral, calcule:

a) A probabilidade de ocorrer face cinco.

b) A probabilidade de não ocorrer face três.

Resposta:

O espaço amostral:

Ω = {1, 2, 3, 4, 5, 6}

n(Ω) = 6

a) E1 = ocorrer face 5:

n(E1) = 1

O cálculo:

p(E1) = 1 = 0,1667 x 100 = 16,67%


6
b) E2 = não ocorrer face 3:

n(E2) = 5 (1, 2, 4, 5, 6)

p(E2) = 5 = 0,8333 x 100 = 83,33%


6

6º) A tabela a seguir mostra a distribuição dos salários de uma empresa:

TABELA 63 - Salário dos funcionários de uma empresa

SALÁRIO NÚMERO DE
(EM REAIS) FUNCIONÁRIOS

600,00 12

900,00 7

1 200,00 5

1800,00 6

4 500,00 8

Fonte: Elaborado pelo autor.

A empresa decide sortear o prêmio de um “salário extra” entre os seus

funcionários. Qual a probabilidade do funcionário sorteado receber:

a) R$ 1 800,00?

b) R$ até R$ 900,00?

c) mais de R$ 1 200,00?

155
unidade 7
ESTATÍSTICA

Resposta:

O primeiro passo é determinar o número de elementos do espaço amostral.

No caso, o número de funcionários:

n(Ω) = 12 + 7 + 5 + 6 + 8 = 38

a) n(E1) = 6

o cálculo:

p(E1) = 6 = 0,15789 x 100 = 15,79%


38
b) n(E2) = 12 + 7 = 19

o cálculo:

p(E2) = 19 = 0,5 x 100 = 50%


38
c) n(E3) = 6 + 8 = 14

o cálculo:

p(E3) = 14 = 0,36842 x 100 = 36,84%


38

7º) O quadro de distribuição de frequências abaixo representa os salários

mensais de 40 empregados de uma firma. Com a crise mundial, a

empresa decidiu dispensar, aleatoriamente, alguns funcionários.

Calcule a probabilidade de o primeiro funcionário dispensado receber:

a) menos de R$ 2 000,00?

b) um salário igual ou maior a R$ 2 200,00 e menor que R$ 2 600,00?

c) menos de R$ 2 400,00?

TABELA 64 - Salário dos funcionários de uma empresa

SALÁRIO NÚMERO DE
(EM REAIS) FUNCIONÁRIOS

1 800 │─ 2 000 4

2 000 │─ 2 200 18

2 200 │ ─ 2 400 10

2 400 │─ 2 600 5

2 600 │ ─ 2 800 3

Fonte: Elaborado pelo autor.

156
unidade 7
ESTATÍSTICA

Resposta:

O primeiro passo é determinar o número de elementos do espaço amostral,

no caso o número de funcionários:

n(Ω) = 4 + 18 + 10 + 5 + 3 = 40

a) n(E1) = 4

o cálculo:

p(E1) = 4 = 0,1x 100 = 10%


40

b) n(E2) = 10 + 5 = 15

o cálculo:

p(E2) = 15 = 0,375 x 100 = 37,5%


40

c) n(E3) = 4 + 18 + 10 = 32

o cálculo:
Quando não há
p(E3) = 32 = 0,8 x 100 = 80%
40 elementos comuns
entre os conjuntos:
os conjuntos são
chamados eventos
Probabilidade da união mutuamente
exclusivos.
de dois eventos: eventos
mutuamente exclusivos
• Quando não há elementos comuns entre os conjuntos: os
conjuntos são chamados eventos mutuamente exclusivos.

P(A U B) = P(A) + P(B)

• Quando há elementos comuns entre os conjuntos: a


interseção entre os conjuntos representa a ocorrência
simultânea dos eventos A e B.

P(A U B) = P(A) + P(B) – P(A ∩∩B)

157
unidade 7
ESTATÍSTICA

1º) Dois dados são lançados simultaneamente.

a) Qual a probabilidade de se obter a soma dos pontos igual a sete ou

números iguais?

b) Qual a probabilidade de se obter a soma dos pontos igual a seis ou

números iguais?

Resposta:

Já sabemos que o lançamento de dois dados gera um espaço amostral

com 36 elementos

n(Ω) = 36

Agora vamos determinar o número de elementos de cada evento:

a) E1 = soma dos pontos igual a 7: {(1, 6), (6, 1), (2, 5), (5, 2), (3, 4), (4, 3)}

→ n(E1) = 6

E2 = números iguais: {(1,1), (2,2), (3,3), (4,4), (5,5), (6,6)} → n(E2) = 6

Observe que não há elementos comuns entre os subconjuntos E1 e E2, ou

seja, são mutuamente exclusivos, por isso faremos:

p(E1) = 6 = 0,1667
36
p(E2) = 6 = 0,1667
36
p(E1) + p(E2) = 0,1667 + 0,1667 = 0,3334 x 100 = 33,34%

b) E1 = soma dos pontos igual a 6: {(1, 5), (5, 1), (2, 4), (4, 2), (3, 3)} →→ n(E1)

=5

E2 = números iguais: {(1,1), (2,2), (3,3), (4,4), (5,5), (6,6)} → n(E2) = 6

Observe que há elementos comuns entre os subconjuntos E1 e E2, ou seja,

há intersecção entre os subconjuntos, por isso precisamos identificar o

número de elementos que estão nos dois conjuntos:

E1∩∩ E2 = {(3,3)} → n(E1 ∩ E2) = 1

p(E1) = 6 = 0,1667
36

158
unidade 7
ESTATÍSTICA

p(E2) = 6 = 0,1667
36
p(E1 ∩ E2) = 1 = 0,0278
36
p(E1) + p(E2) - p(E1 ∩ E2) = 0,1667 + 0,1667 – 0,0278 = 0,3056 x 100 = 30,56%

2º) De uma urna com 20 bolinhas, numeradas de 1 a 20, retira-se ao acaso

uma delas. Calcular a probabilidade de essa bolinha ter um número

divisível por dois ou por três:

Resposta:

n(Ω) = 20

E1 = divisível por 2: {2, 4, 6, 8, 10, 12, 14, 16, 18, 20} → n(E1) = 10

E2 = divisível por 3: {3, 6, 9, 12, 15, 18} → n(E2) = 6

Observe que há elementos comuns entre os subconjuntos E1 e E2. Por isso

faremos:

E1 ∩ E2 = {6, 12, 18} → n(E1 ∩ E2) = 3

p(E1) = 10 = 0,5
20
p(E2) = 6 = 0,3
20
p(E1 ∩ E2 ) = 3 = 0,15
20
p(E1) + p(E2) – p(E1 ∩ E2) = 0,5 + 0,3 – 0,15 = 0,65 x 100 = 65%

3º) Num grupo de 80 alunos, 50 jogam futebol, 40 jogam vôlei e 20

jogam futebol e vôlei. Escolhendo ao acaso um dos alunos, qual a

probabilidade de ele jogar:

a) vôlei?

b) futebol?

c) vôlei e futebol?

d) vôlei ou futebol?

e) somente futebol?

f) não praticar nenhum desses esportes?

Resposta:

n(Ω) = 80

159
unidade 7
ESTATÍSTICA

E1 = jogar futebol →n(E1) = 50

E2 = jogar vôlei → n(E2) = 40

E1 ∩ E2 = jogar futebol e vôlei → n(E1 ∩ E2) = 20 (elementos comuns entre

os subconjuntos E1, E2,)

p(E1) = 50 = 0,625
80
p(E2) = 40 = 0,5
80
p(E1 ∩ E2 ) = 20 = 0,25
80
p(E1) + p(E2) – p(E1 ∩ E2) = 0,625 + 0,5 – 0,25 = 0,875 x 100 = 87,5%

4º) Um economista recém formado envia um currículo para duas

empresas, A e B, à procura de emprego. A probabilidade de ser aceito

pela empresa A é 25% e a de ser aceito pela B é 20%, e a probabilidade

de ser aceito por ambas é 8%.

a) Qual a probabilidade de ser aceito, ao menos, por uma das empresas?

b) Qual a probabilidade de ser aceito por exatamente uma empresa?

Resposta:

Veja que a probabilidade de ser aceito em cada empresa já está

determinada:

p(A) = 25%

p(B) = 20%

p(A ∩ B) = 8%

a) Ser aceito por uma das empresas é a probabilidade de ser aceito pela

empresa A ou pela empresa B:

p(A) + p(B) – p(A ∩ B) = 25% + 20% – 8% = 37%

b) Trata-se da probabilidade de ser aceito somente pela empresa A ou pela

empresa B. Para isso é necessário excluir a probabilidade de ser aceito

pelas duas empresas:

p(somente de A) = 25% - 8% = 17%

p(somente de B) = 20% - 8% = 12%

Logo, a probabilidade de ser aceito somente por uma das empresas é: 17%

160
unidade 7
ESTATÍSTICA

+ 12% = 29%

5º) Em uma escola de natação, a distribuição das idades dos alunos é

dada pelo gráfico seguinte:

GRÁFICO 1 - Distribuição das idades dos alunos

Fonte: Elaborado pelo autor.

Com base nos dados do gráfico, determine:

a) O número total de alunos do curso e o número de alunos com, no

mínimo, 19 anos.

b) Escolhido um aluno ao acaso, qual a probabilidade de sua idade ser no

mínimo 19 anos ou ser exatamente 16 anos?

Resposta:

a) O número de alunos do curso é 4 + 5 + 3+ 1 + 2 + 5 = 20

Já o número de alunos com no mínimo 19 anos é 1 + 2 + 5 = 8

b) E1 = idade no mínimo 19 anos → n(E1) = 8

E2 = exatamente 16 anos → n(E2) = 4

Não há elementos comuns entre E1 e E2, ou seja, não há alunos com no

mínimo 19 anos que têm exatamente 16 anos

p(E1) = 8 = 0,4
20
p(E2) = 4 = 0,2
20

161
unidade 7
ESTATÍSTICA

p(E1) + p(E2) = 0,4 + 0,2 = 0,6 x 100 = 60%

Probabilidade
condicional: eventos
independentes
Dizemos que a ocorrência do evento A está condicionada à
ocorrência do evento B. Indica-se por: A/B.

A/B significa a ocorrência do evento A, sabendo que B vai ocorrer ou


já ocorreu (os eventos A e B são dependentes).

É determinada pela fórmula:

P(A/B) = P(A ∩ B)
P(B)

1º) Na saída de um jogo Atlético x Cruzeiro, foram ouvidos, para fins de

pesquisa de opinião, 80 torcedores assim distribuídos:

TABELA 65 - Torcedores que participaram de uma pesquisa

HOMEM MULHER TOTAL

ATLÉTICO 27 14 41
CRUZEIRO 23 16 39
TOTAL 50 30 80

Fonte: Elaborado pelo autor.

Escolhemos, entre os entrevistados, uma pessoa ao acaso. Constatando

que a pessoa escolhida é homem, qual a probabilidade de que ele seja

torcedor do Atlético?

Resposta:

162
unidade 7
ESTATÍSTICA

p(Atlético / Homem)

Probabilidade de ser torcedor do Atlético, sabendo-se

que é homem.

Probabilidade de ser escolhido um homem:

p(H) = 50
80
Probabilidade de ser escolhido homem e ser torcedor do Atlético:

Nesse caso, reduzimos o espaço amostral, que passa a ser homem (e não

o total de torcedores), além de ser homem e torcedor:

ser homem:50; ser homem e atleticano: 27

p(H e Atleticano) = 27
80
Calculando, então, a probabilidade condicional, temos:

27
p(A ∩ B) = 80 = 27 x 80 = 27 = 0,54 x 100 = 54%
p(Atlético/Homem) 50 80 50 50
p(B)
80

Resposta:

Veja que não nos interessa todas as bolas numeradas, mas somente

aquelas que são maiores que 18, o que reduz o espaço amostral:

Ω = {19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30} n(Ω) = 12

Agora, ser múltiplo de quatro nesse espaço amostral:

E (ser múltiplo de quatro) = {20, 24, 28} n(E) = 3

p(ser múltiplo de quatro) = 3


30
p(ser maior que 18) = 12
30

3
Então, p(múltiplo de quatro4/ maior que 18) = 20 = 3 x 20 = 3 = 0,25 x 100 = 25%
12 20 12 12
20

163
unidade 7
ESTATÍSTICA

3º) Um dado é lançado e observa-se que o número obtido é par. Qual a

probabilidade de ele ser maior que três?

Resposta:

Definir o Ω = {4, 6} n(Ω) = 2

E (ser maior que três) = {4, 5, 6} n(E) = 3

p(par) = 2
6
p(ser maior que três) = 3
6

2
p(par/ maior que três) = 6 = 2 x 6 = 2 = 0,6667 x 100 = 66,67%
3 6 3 3
6

Probabilidade de dois
eventos simultâneos
(ou sucessivos): eventos
independentes
Usada para avaliar a probabilidade de ocorrerem dois eventos
simultâneos, o produto da probabilidade de ocorrer um deles e
a probabilidade de ocorrer o outro, sabendo que o primeiro já
aconteceu.

A fórmula para determinação da probabilidade de dois eventos


simultâneos é:

()
P A = P(A ∩B) →P (A ∩ B) = P A .P(B)
B
P(B)
B ()
Ou

P(A ∩B) = p(A).p(B)

164
unidade 7
ESTATÍSTICA

1º- N
 uma caixa estão guardados 20 livros, sendo 12 de Física e oito

de Matemática. Dois deles são retirados sucessivamente e sem

reposição.

a) Qual a probabilidade de terem sido escolhidos dois livros de Física?

b) Qual a probabilidade de terem sido escolhidos dois livros de Matemática?

c) Qual será, então, a probabilidade de escolhermos livros de assuntos

diferentes?

Resposta:

Total de elementos do espaço amostral:

n(Ω) = 20

a) Para o cálculo da probabilidade, vamos calcular cada uma de forma

separada:

1º: livro de Física:

n(E) = 12 p(E) = 12 = 0,6


20

2º: livro de Física:

p(E) = 11 = 0,5789, já que é sem reposição, o total de livros é19, e


19
somente 11 de Física

p(dois livros de Física) = 0,6 x 0,5789 = 0,3473 x 100 = 34,73%

b) Agora são dois livros de Matemática e o cálculo é semelhante:

1º: livro de Matemática:

n(E) = 8 p(E) = 8 = 0,4


20
2º: livro de Matemática:

p(E) = 7 = 0,3684
19
p(dois livros de Matemática) = 0,4 x 0,3684 = 0,1474 x 100 = 14,74%

165
unidade 7
ESTATÍSTICA

c) 
Nesse caso é a probabilidade de ser um livro de Física e um de

Matemática, e depois um livro de Matemática e um de Física:

p(livro de Física) = 12 = 0,6


20
p(livro de Matemática) = 8 = 0,4211 (observe que retiramos um livro de
19
Física)

p (livro de Física e um de Matemática) = 0,6 x 0,4211 = 0,2527

p(livro de Matemática) = 8 = 0,4


20
p(livro de Física) = 12 = 0,6316
19
p(livro de Matemática e um de Física) = 0,4 x 0,6316 = 0,2526

Probabilidade de livros de assuntos diferentes é o somatório de cada

situação calculada separadamente:

p (livro de Física e um de Matemática) + p(livro de Matemática e um de

Física) = 0,2527 + 0,2526 = 0,5053 x 100 = 50,53%

2º - Uma urna contém cinco bolas vermelhas e três brancas. Duas delas

são retiradas sucessivamente e sem reposição. Qual é a probabilidade

de terem saído duas bolas brancas?

Resposta:

A probabilidade da 1ª ser branca:

p(1ª B) = 3 = 0,375
8
A probabilidade da 2ª ser branca: (observe que é sem reposição)

p(2ª B) = 2 = 0,2857
7
Então, a probabilidade das duas serem brancas é:

0,375 x 0,2857 = 0,1071 x 100 = 10,71%

3º - Numa urna contém cinco bolas vermelhas e três brancas. Duas delas

são retiradas sucessivamente e com reposição. Qual é a probabilidade

de terem saído duas bolas brancas?

166
unidade 7
ESTATÍSTICA

Resposta:

A probabilidade da 1ª ser branca:

p(1ª B) = 3 = 0,375
8
A probabilidade da 2ª ser branca: (agora é com reposição, ou seja, a bola

retirada é colocada de volta)

p(2ª B) = 3 = 0,375
8
Então, a probabilidade das duas serem brancas é:

0,375 x 0,375 = 0,1406 = 14,06%

4º - A probabilidade de que um aluno A resolva certo

problema é de p(A)= 1 . A de que outro aluno B o


5
resolva é p(B)= 1 . E a de que um aluno C o resolva é p(C)= 1 . Calcule
2 6
a probabilidade de que os três resolvam o problema.

Resposta:

Nesse caso para calcular a probabilidade de que os três resolvam o

problema, basta multiplicar as probabilidades dos três alunos:

p (A, B, C) = p(A) x p(B) x p(C) = = 1 x 1 x 1 = 1 = 0,0167 x 100 = 1,67%


5 2 6 60

1- Construa o espaço amostral do evento “lance de um dado honesto”. Em

relação ao espaço amostral, calcule:

a) A probabilidade de ocorrer face cinco.

b) A probabilidade de não ocorrer face cinco.

c) A probabilidade de não ocorrer face três.

2- Determine o espaço amostral do evento extração de uma carta de um

baralho honesto com 52 cartas. Calcule a probabilidade de:

a) Extrair uma carta de copas.

b) Extrair um rei.

c) Extrair um valete de paus.

167
unidade 7
ESTATÍSTICA

3- Calcule a probabilidade de cada um dos seguintes eventos:

a) Uma conta a receber, escolhida ao acaso, estar atrasada. Sabe-se que

das 1800 contas a receber existentes 180 estão atrasadas.

b) Um funcionário, escolhido ao acaso, não ter mais que 25 anos. Do

universo de 560 funcionários, 340 possuem 25 anos ou mais.

4- Um grupo de 40 pessoas é formado por 17 homens e 23 mulheres. Em

relação ao sorteio de um elemento desse grupo, calcule:

a) A probabilidade de ser homem.

b) A probabilidade de ser mulher.

5- Uma urna contém exatamente mil etiquetas, numeradas de 1 a 1000.

Retirando uma etiqueta dessa urna, qual a probabilidade de obtermos

um número menor que 85?

6- No lançamento de duas moedas, a probabilidade de se obterem uma

cara e uma coroa é:

a) 25%

b) 30%

c) 40%

d) 50%

e) 75%

7- Em um prédio, o número de apartamentos habitados é o quádruplo

do número de apartamentos desabitados. Escolhe-se, aleatoriamente,

um apartamento desse prédio. Qual a probabilidade de que ele esteja

desabitado?

8- 
Uma urna contém bolas coloridas. Retirando-se uma bola dessa

urna, a probabilidade de se obter uma bola vermelha é 0,59. Qual é a

probabilidade de se obter uma bola que não seja vermelha?

9- (FGV-SP) Num certo país, 10% das declarações de imposto de renda são

suspeitas e submetidas a uma análise detalhada. Entre elas verificou-se

que 20% são fraudulentas. Entre as não suspeitas, 2% são fraudulentas.

a) Se uma declaração é escolhida ao acaso, qual a probabilidade de ela ser

suspeita e fraudulenta?

b) Se uma declaração é fraudulenta, qual a probabilidade de ela ter sido

suspeita?

168
unidade 7
ESTATÍSTICA

10- 
Numa caixa há oito bolas azuis e quatro bolas verdes. Qual é a

probabilidade de, ao acaso, retirar:

a) Uma bola azul?

b) Uma bola verde?

RESPOSTAS:

1- a) 16,67% b) 83,33% c)83,33%

2- a) 25% b) 7,69% c) 1,92%

3- a) 10% b) 39,29%

4- a) 42,5% b) 57,5%

5- 8,4%

6- d

7- 20%

8- 0,41

9- a) 2% b) 52,6%

10- a) 66,67% b) 33,33%

Revisão
Nessa unidade estudamos probabilidade e vimos que esta verifica
a chance matemática de algo acontecer. Destacamos que essa
chance não representa uma certeza, e que esse conceito possibilita
compreender diferentes situações.

Para compreender o conceito de probabilidade, é necessário


conhecer dois outros conceitos importantes: de espaço amostral e
de evento. O espaço amostral são todos os elementos do conjunto
que estão sendo analisados e o evento é um subconjunto do espaço
amostral.

Após conhecer os conceitos introdutórios sobre probabilidade,

169
unidade 7
ESTATÍSTICA

apresentamos como calcular a probabilidade, que é um conceito


bem simples. Além disso, também foi abordado que a probabilidade
é medida de 0 a 1 ou de 1 a 100%.

O passo seguinte foi conhecer os casos especiais de cálculo de


probabilidade. Estudamos os diferentes tipos de probabilidade: da
união de dois eventos, condicional e a de dois eventos simultâneos.

FIGURA 35 - A probabilidade

PROBABILIDADE

Espaço
Evento
amostral

O cálculo de União de Probabilidade Probabilidade


probabilidade dois eventos condicional de dois eventos
simultâneos
Fonte: Elaborado pelo autor.

BRUNI, Adriano Leal. Estatística Aplicada à Gestão Empresarial. São Paulo:

Atlas, 2007.

TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2013.

170
unidade 7
Distribuição
binomial e
normal
Introdução

O estudo de probabilidade foi introduzido na unidade anterior. Nesta


unidade enfocaremos as distribuições discretas de probabilidade
e serão abordadas, de modo especial, as distribuições de
probabilidade binomial e a distribuição normal.

Assim, serão apresentados os principais conceitos associados


às variáveis aleatórias e distribuições de probabilidades, que são
importantes quando se referem à modelagem de situações que
envolvem eventos caracterizados pela incerteza (BRUNI, 2007). • Variável
aleatória
Vale destacar que a compreensão de variáveis aleatórias tem como
• Distribuição de
objetivo simplificar determinado problema que abrange incertezas.
probabilidade
• Distribuição
binomial
• Distribuição
normal – curva
normal
• Revisão
ESTATÍSTICA

Variável aleatória
Uma variável aleatória é aquela cujo valor numérico é único para
cada resultado do experimento e é determinado por processos
acidentais, ao acaso, que não estão sob o controle do observador
(TIBONI, 2010).

A seguir, destaca-se alguns exemplos de variáveis aleatórias:

• O número de homens entre os 30 passageiros que


aguardam o trem numa estação.

• A altura de uma funcionária do sexo feminino selecionada


aleatoriamente em um supermercado.

• O número de acidentes com caminhões, escolhidos


aleatoriamente, entre 60 acidentes ocorridos nas estradas
federais de Minas Gerais em um mês.
A altura de uma
funcionária do sexo
Variável aleatória discreta feminino selecionada
aleatoriamente em
É aquela que admite um número finito de valores e, além disso, esse um supermercado.
número pode ser listado numa tabela com o valor da probabilidade
correspondente (TIBONI, 2010).

Veja:

Dos trinta passageiros que estavam aguardando o trem na estação, 18

eram homens:

Como são 18 homens, temos:

x = número de homens

p(x) = 18 =0,6
30

Homens: 18 Probabilidade: p(x) = 0,6

173
unidade 8
ESTATÍSTICA

Variável aleatória contínua


Essa variável é a que admite um número ilimitado de valores, ou
seja, infinito. Esse número não pode ser listado, pois é difícil elencar
todos os possíveis valores fracionários que podem ser assumidos
pela variável. Quando se trata desse tipo, há a necessidade de
estudar a função densidade e a curva de probabilidade.

Altura de uma funcionária do sexo feminino selecionada aleatoriamente

em um supermercado:

Essa variável é a que


x = altura da funcionária
admite um número
ilimitado de valores,
Se a funcionária tem uma altura entre 167 e 168 cm, o valor medido pode ir
ou seja, infinito
de 167,0001 cm até 167,999 cm.

Distribuição de
probabilidade
Após identificada a variável aleatória, há a necessidade de calcular
os valores das probabilidades correspondentes. Acompanhe os
exemplos:

1º) A tabela abaixo apresenta as idades de um grupo de alunos


matriculados na disciplina Métodos Quantitativos.

174
unidade 8
ESTATÍSTICA

TABELA 66 - Idade dos alunos (em anos)

IDADE (EM ANOS) Fi

19 8

21 6

22 13

25 4

30 1

Fonte: Elaborado pelo autor.

Como vimos na unidade anterior, para calcular a probabilidade é


necessário identificar o total de alunos matriculados, no caso, 32:

8
( )
• Probabilidade de ter 19 anos: 32 = 0,25


6
( )
Probabilidade de ter 21 anos: 32 = 0,188

• Probabilidade de ter 22 anos: ( 3213 )= 0,406



4
( )
Probabilidade de ter 25 anos: 32 = 0,125


1
( )
Probabilidade de ter 30 anos: 32 = 0,031

Veja essas probabilidades organizadas em uma tabela, denominada


distribuição de probabilidade.

175
unidade 8
ESTATÍSTICA

TABELA 67 - Idade dos alunos (em anos)

IDADE (EM ANOS) PROBABILIDADE

19 0,25

21 0,188

22 0,406

25 0,125

30 0,031

∑ 1

Fonte: Elaborado pelo autor.

2º) Feito um levantamento sobre os salários dos funcionários de


uma pequena empresa, pode-se elaborar o seguinte quadro de
distribuição:

TABELA 68 - Faixas salariais dos funcionários de uma empresa

CLASSES DE SALÁRIO (EM REAIS) FREQUÊNCIA

500 |⎯ 1 000 3

1 000 |⎯ 1 500 6

1 500 |⎯ 2 000 10

2 000 |⎯ 2 500 4

2 500 |⎯ 3 000 2

Fonte: Elaborado pelo autor.

Total de funcionários: 25

• Probabilidade de receber entre 500 | 1 000: ( 253 )= 0,12


1 500: ( 25) = 0,24
6
• Probabilidade de receber entre 1 000 |

2 000: ( 25 ) = 0,4
10
• Probabilidade de receber entre 1 500 |

2 500: (25) = 0,16


4
• Probabilidade de receber entre 2 000 |

3 000: (25) = 0,08


2
• Probabilidade de receber entre 2 500 |

176
unidade 8
ESTATÍSTICA

Organizando a tabela de distribuição de probabilidade, temos:

TABELA 69 - Faixas salariais x probabilidade

CLASSES DE SALÁRIO (EM REAIS) PROBABILIDADE

500 |⎯ 1 000 0,12

1 000 |⎯ 1 500 0,25

1 500 |⎯ 2 000 0,4

2 000 |⎯ 2 500 0,16

2 500 |⎯ 3 000 0,08

Fonte: Elaborado pelo autor.

Distribuição binomial
É um dos modelos de distribuição discreta de probabilidade e tem
como referência o processo de amostragem de Bernoulli (TIBONI,
2010).

Eventos binomiais têm como base a existência de duas únicas categorias,

mutuamente excludentes. Isso significa que uma categoria implica a

possibilidade da não-ocorrência simultânea da outra categoria. Também

são coletivamente exaustivas, a união de ambos os eventos resulta no

espaço amostral.

Nas análises estatísticas temos como exemplos mais comuns


de eventos binomiais os que permitem extrair probabilidades de
experimentos que apresentam apenas dois resultados. Chamados
de “sucesso” e “fracasso”. Por “sucesso” entende-se situações que
se referem ao que se deseja estudar. Já as situações de “fracasso”
são aquelas que não se deseja estudar, isto é, representam o
complemento do sucesso. Vale destacar que:

177
unidade 8
ESTATÍSTICA

1) as observações são eventos independentes, nos quais o resultado


de qualquer uma das provas não deve afetar os resultados das
provas seguintes;

2) as probabilidades de ocorrer p de sucesso e q de ser fracasso


permanecem constantes em cada tentativa. A relação entre as
probabilidades p e q é:

p+q=1→q=p-1

A probabilidade associada ao fato de encontrar x eventos com


sucesso em uma amostra formada por n eventos possíveis é
representada pela equação:

P(x) = Cn,xpxqn-x

Em que:

p = probabilidade de sucesso

q = (1 - p) = probabilidade de fracasso

n = número de eventos estudados

x = número de eventos desejados que tenham sucesso

Vale lembrar que Cn,x = n!


x! (n-x)!

Que pode ser substituído pelo número binomial ( x )


n

1º) Numa empresa mineira, de cada 80 peças vendidas, 50 são vendidas

no próprio estado. Na venda de 6 peças:

a) qual a probabilidade de que 4 sejam vendidas para Minas Gerais?:

b) qual a probabilidade de que 4 ou mais sejam vendidas para o próprio

estado?

c) q
 ual a probabilidade de que nenhuma das peças seja vendida para

Minas Gerais?

178
unidade 8
ESTATÍSTICA

d) qual a probabilidade de que no máximo 2 sejam para o próprio estado?

Resposta:

Vamos levantar os dados:

n = 6, ou seja, são estudados 6 eventos

p = probabilidade de sucesso → p = 50 = 0,625


80
q = probabilidade de fracasso → q = 1 – 0,625 = 0,375

Agora vamos ao que se pede:

a) P(x = 4) = C6,4 (0,625)4.(0,375)6-4 → C6,4 (0,625)4.(0,375)2

Lembrando: C6,4 = 6! = 6.5.4! = 15 ou


4!(6-4)! 4!2!

pelo número binomial – método prático: () 6


4 = 6.5.4.3 = 15
4.3.2.1
Então: P(x=4) = 15 . 0,153 . 0,141 = 0,322

b) N
 esse caso, a probabilidade de que seja 4 ou mais é igual a P(x=4) +

P(x=5) + P(x=6).

Acompanhe:

P(x=4) = 0,322 → já calculada

P(x=5) = C6,5 (0,625)5.(0,375)6-5 = 6 . 0,095 . 0,375 = 0,215

P(x=6) = C6,6 (0,625)6.(0,375)6-6 = 1 . 0,06 . 1 = 0,06

Então:

P(x=4) + P(x=5) + P(x=6) → 0,322 + 0,215 + 0,06 = 0,597

c) Nesse caso x = 0

Então:

P(x=0) = C6,0 (0,625)0.(0,375)6-0 → P(x=0) = 1 . 1 . 0,003 = 0,003

d) No caso de serem no máximo 2, temos P(x=0) + P(x=1) + P(x=2):

P(x=0) = 0,003

P(x=1) = C6,1 (0,625)1.(0,375)6-1 = 6 . 0,625 . 0,007 = 0,026

P(x=2) = C6,2 (0,625)2.(0,375)6-2 = 15 . 0,391 . 0,141 = 0,827

179
unidade 8
ESTATÍSTICA

Logo:

P(x=0) + P(x=1) + P(x=2)

0,003 + 0,026 + 0,827 = 0,856

2º) Uma moeda é lançada 6 vezes. Encontre a probabilidade de:

a) ocorrer 4 coroas:

b) ocorrer pelo menos 2 coroas:

Resposta:

n=6

p = 1 (k ou c)
2
q=1- 1 = 1
2 2

a) P(x=4) = C6,4 . ( )( )
1
2
4
.
1
2
6-4
= 15 . 0,0625 . 0,25 = 0,2344

b) P(x=2) + P(x=3) + P(x=4) + P(x=5) + P(x=6)

P(x=2) = C6,2 . ( )( )
1
2
2
.
1
2
6-2
= 0,2344

P(x=3) = C6,3. ( )( )
1
2
3
.
1
2
6-3
= 0,3125

P(x=4) = C6,4 . ( )( )
1
2
4
.
1
2
6-4
= 0,2344

P(x=5) = C6,5 . ( )( )
1
2
5
.
1
2
6-5
= 0,1172

P(x=6) = C6,6. ( )( )
1
2
6
.
1
2
6-6
= 0,0156

Logo: 0,2344 + 0,3125 + 0,2344 + 0,1172 + 0,0156 = 0,9141 = 91,41%

Distribuição normal –
curva normal
É, talvez, a mais utilizada e conhecida distribuição teórica de

180
unidade 8
ESTATÍSTICA

probabilidade (BRUNI, 2007). Trata-se de uma distribuição contínua


de probabilidades, em que a apresentação da distribuição de
frequências de uma variável quantitativa x, em geral, apresenta-se
em forma de sino e simétrica em relação à média. A distribuição
normal também é conhecida como distribuição de Gauss, Laplace
ou Laplace-Gauss, que foram matemáticos que contribuíram para o
desenvolvimento da distribuição.

Veja a representação:

FIGURA 36 - Exemplo curva normal de probabilidade

A distribuição normal
também é conhecida
como distribuição
de Gauss, Laplace
ou Laplace-
Gauss, que foram
matemáticos que
contribuíram para o
Fonte: Elaborado pelo autor
desenvolvimento da
distribuição.

Vejamos as características da curva normal de probabilidade:

• a distribuição é simétrica em torno da média;

• a curva não chega a tocar no eixo das abscissas, variando de

“negativo” a “positivo”;

• a distribuição normal fica delimitada pelo seu desvio padrão e

pela sua média;

• a área sob a curva corresponde à proporção 1 ou à porcentagem

100%;

• a área sob a curva entre dois pontos corresponde à probabilidade

181
unidade 8
ESTATÍSTICA

do valor de uma variável aleatória entre aqueles pontos;

• a curva normal admite uma única ordenada máxima, situada na

média.

Por isso, as medidas de tendência central, média, mediana e moda

apresentam o mesmo valor.

Para a determinação da distribuição normal, utilizamos as


chamadas tabelas da curva normal. Utilizaremos aqui a tabela
disponibilizada por TIBONI (2010), que está apresentada abaixo:

182
unidade 8
ESTATÍSTICA

Fonte: TIBONI, Conceição Gentil Rebelo. Estatística básica: para os


cursos de administração, ciências contábeis, tecnológicos e de gestão.
São Paulo: Atlas, 2010 p. 328 - 329

Consideramos uma variável aleatória, com distribuição normal.


Pode-se obter a probabilidade dessa variável assumir um valor em
determinado intervalo. Para determinar essa probabilidade, vamos
utilizar a seguinte fórmula:

z= x-x
s

Em que:

z = valor da probabilidade no intervalo

x = uma variável aleatória

x = valor médio da distribuição

s = desvio padrão

1º) Na fabricação de barras de um doce, há uma variação nas dimensões

e no peso entre eles, devido à deformidade nas formas em que o doce é

acondicionado. O peso médio do doce é de 900g, com desvio padrão de 50g.

Determinar a probabilidade de uma barra de doce ter peso entre 900 e 940g.

183
unidade 8
ESTATÍSTICA

Resposta:

x = peso das barras de doce – variável aleatória, que está entre 900 e 940

x = peso médio das barras = 900

z = x - x → z = 940 - 900 → z = 0,80


s 50

P(900 < x< 940) = P(0 < z < 0,80)

Veja a representação na distribuição de probabilidade:

FIGURA 37 - Exemplo curva normal de probabilidade

Fonte: Elaborado pelo autor

Determinado o valor de z, é o momento de consultar a tabela acima com o

objetivo de encontrar a área entre 0 e 0,80.

Agora também é o momento de consultar a tabela da curva normal: na 1ª

coluna procuramos o valor correspondente de z = 0,8 e na primeira linha,

o valor 0 (zero) [formando o valor 0,80]. A interseção entre a coluna 0,8 e a

linha 0 aponta o número 0,2881. Então:

P(900<x<940) = P(0<z<0,80) = 0,2881 = 28,81%

A probabilidade de a barra de doces ter entre 900 e 940 é de 28,81%.

2º) Agora vamos considerar o mesmo exemplo anterior, mas pretende-se

calcular a probabilidade de uma barra de doce ter entre 880 e 900g.

184
unidade 8
ESTATÍSTICA

Resposta:

Vamos determinar o valor de z:

x = 880

x = 900

s = 50

z = 880 - 900 = - 0,40


50

Não consideramos o valor negativo, ou seja, trabalhamos com módulo.

Assim, basta consultar a tabela, onde 0,4 é observado na 1ª coluna e 0 na

1ª linha, que indica o valor 0,1554

P(880<x<900) = P(-0,4<z<0) = 0,1554 = 15,54%

Portanto, a probabilidade de uma barra de doce ter entre 880 e 900g é de

15,54%

3º) Os números abaixo representam o resumo estatístico da análise da

altura (em cm) de um grupo de 10 amigos:

x = 174,8

s = 9,223

Md = 174,5

a) Qual a probabilidade de um dos amigos ter entre 174,8 e 180 cm?

b) Qual a probabilidade de um dos amigos ter entre 174,8 e 185 cm?

c) Qual a probabilidade de um dos amigos ter entre 170 e 180 cm?

d) Qual a probabilidade de um dos amigos ter entre 180 e 185 cm?

Resposta:

a) z = 180 - 174,8 = 0,56


9,223
Consultando a tabela, z = 0,56 resulta em 0,2123 ou 21,23%

b) z = 185 - 174,8 = 1,10


9,223
Consultando a tabela, z = 1,10 resulta em 0,3643 ou 36,43%

c) N
 esse caso, vamos calcular a probabilidade de ter entre 170 e 174,8 e

entre 174,8 e 180, e depois somamos os resultados:

185
unidade 8
ESTATÍSTICA

Entre 170 e 174,8: z = 170 - 174,8 = - 0,52


9,223
Consultando a tabela, z = 0,52 resulta em 0,1985

Entre 174,8 e 180: z = 180 - 174,8 = 0,56


9,223
Consultando a tabela, z = 0,56 resulta em 0,2123

Então, 0,1985 + 0,2123 = 0,411 ou 41,1%

d) Nesse caso, basta calcular a probabilidade entre 174,8 e 180 e

entre 174,8 e 185 e, em seguida, determinar a diferença entre uma

probabilidade e a outra:

• entre 174,8 e 180: 0,2123 (já calculado anteriormente);

• entre 174,8 e 185: 0,3643 (também já calculado anteriormente).

Logo: 0,3643 – 0,2123 = 0,152 ou 15,2%

1- Uma moeda é lançada sete vezes. Encontre a probabilidade de:

a) ocorrer cinco caras.

b) ocorrer pelo menos três coroas.

c) ocorrer no máximo quatro coroas.

d) não ocorrer cara.

2- Um time de futebol de botão tem 72% de probabilidade de vitória sempre

que joga. Se o time jogar sete partidas, calcule a probabilidade de ele:

a) vencer exatamente três partidas.

b) vencer ao menos uma partida.

c) vencer mais da metade das partidas.

3- Se 7% das lâmpadas de certa marca são defeituosas, ache a

probabilidade de que, numa amostra de 100 lâmpadas, escolhidas ao

acaso, tenhamos:

a) nenhuma defeituosa.

b) três defeituosas.

c) mais do que uma defeituosa.

186
unidade 8
ESTATÍSTICA

4- Uma prova de História apresentou notas normalmente distribuídas, com

média igual a 75 pontos e desvio padrão de 8 pontos. Determinar:

a) a probabilidade de um aluno ter nota entre 75 e 80 pontos.

b) a probabilidade de um aluno ter nota entre 65 e 75 pontos.

c) a probabilidade de um aluno ter nota entre 65 e 80 pontos.

5- Com o auxílio da tabela de distribuição normal disponibilizada,

estabeleça o valor da probabilidade para os seguintes valores de z:

a) 0 < z < 1,32

b) -2,51 < z < 0

c) -1,92 < z < 0

d) -2,15 < z < 0,58

e) 1,23 < z < 2,2

6- Uma fábrica de chocolates artesanais vende barras de chocolate que

pesam, em média, 200g. Os pesos são normalmente distribuídos e o

desvio padrão é 40 g. Calcule a probabilidade de uma barra de chocolate,

escolhida ao acaso, pesar:

a) entre 200 e 240g

b) entre 180 e 200g

c) entre 180 e 240 g

RESPOSTAS:

1- a) 16,41% b) 77,32% c) 77,32% d) 0,78%

2- a) 8,03% b) 99,99% c) 89,84%

3- a) 0,07% b) 4,86% c) 99,47%

4- a) 23,24% b) 39,44% c) 63,66%

5- a) 40,66% b) 49,41% c) 47,26% d) 70% e) 10%

6- a) 34,13% b) 19,15% c) 53,28%

187
unidade 8
ESTATÍSTICA

Revisão
Nessa unidade abordamos as distribuições de probabilidade. Para
iniciar os estudos da distribuição de probabilidade, conhecemos os
conceitos de variável aleatória e o que é variável aleatória discreta e
contínua.

Aprendemos também a calcular a distribuição binomial e a


distribuição normal. O caso da distribuição binomial, vimos que
precisamos utilizar conceitos análise combinatória, no caso,
combinação simples. Já no caso da distribuição normal, é
fundamental a tabela normal, que precisa ser consultada.

De forma esquemática, temos:

FIGURA 38 - Probabilidade e distribuição

Distribuição de
probabilidade

Casos de distribuição Variável


de probabilidade aleatória

Binominal Normal Discreta Contínua

Fonte: Elaborado pelo autor.

TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2013.

188
unidade 8
ESTATÍSTICA

Referências
BRUNI, Adriano Leal. Estatística Aplicada à Gestão Empresarial. São
Paulo: Atlas, 2007.

LARSON, Ron; FARBER, Elizabeth. Estatística aplicada. 2.ed. São Paulo:


Prentice Hall, 2004.

SPIEGEL, Murray R., STEPHENS, Larry J.. Estatística. Tradução: José


Lucimar do Nascimento. 4 ed. Porto Alegre: Bookman, 2009.

TIBONI, Conceição Gentil Rebelo. Estatística básica: para os cursos de


administração, ciências contábeis, tecnológicos e de gestão. São Paulo:
Atlas, 2010.

TRIOLA, Mário. Introdução à Estatística. 10 ed. São Paulo: LTC, 2008.

189
www.animaeducacao.com.br

Vous aimerez peut-être aussi