Estatística descritiva: gráficos, tabelas e medidas

NOÇÕES DE ESTATÍSTICA P/ Polícia Civil-DF
TEORIA E EXERCÍCIOS COMENTADOS

Prof. Arthur Lima – Aula 03
AULA 03: ESTATÍSTICA
SUMÁRIO PÁGINA
1. Teoria 01
2. Resolução de exercícios 30
3. Lista de exercícios resolvidos 79
4. Gabarito 97
Olá,
Na aula de hoje trabalharemos os seguintes tópicos do seu edital:
Estatística descritiva e análise exploratória de dados: gráficos, diagramas, tabelas,

medidas descritivas (posição, dispersão, assimetria e curtose).
1. TEORIA
1.1 Estatística descritiva e análise exploratória de dados: gráficos,
diagramas, tabelas. Variáveis aleatórias discretas e contínuas.
1.1.1 Conceitos introdutórios. Variáveis aleatórias.

A estatística descritiva trata de descrever um conjunto de dados. Utiliza para
isso tabelas, gráficos e medidas estatísticas. Antes de entrar propriamente no
estudo da Estatística Descritiva, precisamos conhecer alguns conceitos básicos:
- População: são todas as entidades sob estudo, possuindo pelo menos uma
característica em comum que permita delimitá-los. Ex.: População dos
moradores de Brasília; população dos alunos da escola A; população dos
animais de estimação do meu bairro;
- Censo: quando efetuamos o Censo de uma população, analisamos todos os

indivíduos que compõem aquela população. Por exemplo: podemos contar
um por um os moradores de Brasília, ou todos os alunos da escola A, ou
Prof. Arthur Lima www.estrategiaconcursos.com.br 1

todos os animais de estimação de meu bairro. Normalmente o nosso
interesse não é simplesmente contá-los, mas sim verificar um determinado
atributo, ou característica que esses indivíduos possuem. Exemplificando,
pode ser que queiramos saber, de todos os moradores de Brasília, quantos
são Homens, ou quantos tem mais de 1,80m de altura, ou quantos ganham
mais que R$1.000,00 por mês.
- Amostra: em muitos casos é inviável, custoso ou desnecessário, observar

um por um dos membros de uma determinada população. Se queremos
saber qual o percentual de homens na população de Brasília, podemos
analisar um subconjunto daquela população, isto é, uma amostra. Se a
amostra for suficientemente grande (e bem escolhida, de acordo com o que
veremos nesta aula), é possível que o percentual de homens da amostra seja
muito parecido com o que seria obtido se analisássemos toda a população.
Discorreremos mais sobre amostragem em outra aula.
- Variável: Veja que, em todos os exemplos dados, o nosso interesse é

descobrir como se comporta um determinado atributo (sexo, altura, salário
etc.). Em estatística, chamaremos esse atributo de variável. Note que essa
variável pode ser:
o qualitativa, quando não assume valores numéricos, podendo ser
dividida em categorias. Ex.: o sexo dos moradores de Brasília é uma
variável qualitativa, pois pode ser dividido nas categorias Masculino ou
Feminino. Se o objetivo fosse verificar quantos moradores possuem
AIDS, teríamos outra variável qualitativa, dividida nas categorias SIM e
NÃO, ou POSSUI e NÃO POSSUI.
o quantitativa, quando puder assumir diversos valores numéricos. Ex.: a
altura dos moradores é uma variável quantitativa: 1,80m; 1,55m;
1,20m; 2,10m etc. O mesmo ocorre com os salários desses
moradores. As variáveis quantitativas podem ser ainda divididas em:
contínuas: quando não é possível separar o valor de uma
variável em relação ao próximo valor que ela possa assumir.
Ex.: a variável Altura é contínua. Se alguém tem exatamente

1,80m, qual o valor de altura imediatamente seguinte? 1,81m?
Errado, pois é possível que alguém tenha, por exemplo,
1,80000001m. Ou 1,80000000001m. É impossível saber qual o
valor que vem logo após (ou antes de) 1,80m, ou seja, essa
variável é contínua.
discretas: quando podemos saber o valor que vem
imediatamente após (ou antes de) outro. Ex.: se nos dissessem
que só é possível medir as pessoas até a segunda casa
decimal, então a variável Altura torna-se discreta. Isso porque
sabemos que o próximo valor de altura é 1,81m, e o valor
anterior é 1,79m.
Chamamos uma variável de Variável Aleatória quando ela pode
assumir, de maneira aleatória, qualquer dos seus valores. Em estatística
trabalharemos sempre com variáveis aleatórias, que representamos por
letras maiúsculas. Ex.: X pode ser a variável idade dos moradores de
Brasília. Utilizamos letras minúsculas para representar valores específicos
daquela variável. Ex.: x = 25 anos é um dos valores possíveis para a variável
aleatória X.
- Observação: trata-se do valor da variável para um determinado membro da

população. Ex.: a observação da variável SEXO referente a João, membro da
população brasiliense, tem valor “Masculino”.
É preciso que você saiba ainda que as variáveis aleatórias podem ser
classificadas em:
- variáveis nominais: são aquelas definidas por “nomes”, não podendo ser colocadas
em uma ordem crescente. Ex.: a variável “sexo dos moradores de um bairro” é
nominal, pois só pode assumir os valores “masculino” ou “feminino”. Veja que não
há uma ordem clara entre esses dois possíveis valores (não há um valor maior e
outro menor).
- variáveis ordinais: são aquelas que podem ser colocadas em uma ordem
crescente, mas não é possível (ou não faz sentido) calcular a diferença entre um
valor e o seguinte. Ex.: numa escola onde as notas dos alunos sejam dadas em

letras (A, B, C, D ou E), sabemos que a menor nota é “E” e a maior é “A”. Porém
não podemos mensurar quanto seria, por exemplo, a subtração A – B.
- variáveis intervalares: são aquelas que podem ser colocadas em uma ordem
crescente, e é possível calcular a diferença entre um valor e o seguinte. Ex.: se as
notas dos alunos forem dadas em números (de 0 a 10), sabemos que a nota 5 é
maior que a nota 3, e que a diferença entre elas é 5 – 3 = 2.
1.1.2 Tabelas
Para descrever um conjunto de dados, um recurso muito utilizado são tabelas
como essa abaixo, referente à observação da variável Sexo dos moradores de
Brasília:
Valor da variável Frequências (Fi)
Masculino 23
Feminino 27
Note que na coluna da esquerda colocamos as categorias de valores que a

variável pode assumir, e na coluna da direita colocamos o número de Frequências,
isto é, o número de observações relativas a cada um dos valores. Note que foi
analisada uma amostra de 50 pessoas, das quais 23 eram homens e 27 mulheres.
Estes são os valores de frequências absolutas. Podemos ainda representar as
frequências relativas (percentuais): sabemos que 23 em 50 são 46%, e 27 em 50
são 54%. Portanto, teríamos:
Valor da variável Frequências relativas (Fi)
Masculino 46%
Feminino 54%
Se essa amostra foi bem escolhida, ela nos dá uma boa estimativa de como
é distribuída a população brasiliense: cerca de 46% são homens e 54% mulheres.
Quanto maior a amostra (e mais bem escolhida), mais nos aproximaremos dos
percentuais que seriam obtidos na análise de toda a população.
Note que a frequência relativa é dada por Fi / n, onde Fi é o número de
frequências de determinado valor da variável, e n é o número total de observações.

Agora, veja a tabela abaixo, referente à observações da variável Altura dos
moradores de Brasília:
1,50m 15
1,51m 5
1,53m 4
1,57m 2
1,60m 10
1,63m 8
1,65m 1
1,71m 20
1,73m 10
1,75m 3
1,83m 2
Quando temos uma variável como esta, que pode assumir um grande
número de valores distintos, é interessante “resumir” os dados, criando intervalos de
valores para a variável (que chamaremos de classes). Veja um exemplo:
Classe Frequências (Fi)

1,50| – 1,60 26
1,60| – 1,70 19
1,70| – 1,80 33
1,80| – 1,90 2
O símbolo | significa que o valor que se encontra ao seu lado está incluído na
classe. Por exemplo, 1,50| - 1,60 nos indica que as pessoas com altura igual a 1,50
são contadas entre as que fazem parte dessa classe, porém as pessoas com
exatamente 1,60 não são contabilizadas.
Assim, temos as seguintes formas de criar as classes, onde “li” é o limite
inferior da classe (menor valor, ex.: 1,50) e “Li” é o limite superior (o maior valor, ex.:
1,60):

- li| – Li : limite inferior incluído na classe
- li – |Li : limite superior incluído na classe
- li| – |Li : limite inferior e superior incluídos na classe
- li – Li : limite inferior e superior excluídos da classe
Veja abaixo novamente a última tabela, agora com a coluna Frequências
absolutas acumuladas à direita:
Classe Frequências (Fi) Frequências absolutas
acumuladas (Fac)
1,50| – 1,60 26 26
1,60| – 1,70 19 45
1,70| – 1,80 33 78
1,80| – 1,90 2 80
A coluna da direita exprime o número de indivíduos que se encontram naquela

classe ou abaixo dela. Isto é, o número acumulado de frequências do valor mais
baixo da amostra (1,50m) até o limite superior daquela classe. Veja que, para obter
o número 45, bastou somar 19 (da classe 1,60| - 1,70) com 26 (da classe 1,50| -
1,60). Isto é, podemos dizer que 45 pessoas possuem altura inferior a 1,70m (limite
superior da última classe). Analogamente, 78 pessoas possuem altura inferior a
1,80m.
De posse das frequências absolutas acumuladas, podemos calcular as
frequências relativas acumuladas, que nada mais é que o percentual de indivíduos
cujo valor da variável (altura) é inferior a um determinado limite. Veja isso na coluna
da direita da tabela abaixo:
Classe Frequências Frequências absolutas Frequências relativas
(Fi) acumuladas (Fac) acumuladas (Frc)
1,50| – 1,60 26 26 32,50%
1,60| – 1,70 19 45 56,25%
1,70| – 1,80 33 78 97,50%
1,80| – 1,90 2 80 100%
Portanto, podemos concluir que 32,50% dos indivíduos observados possuem

menos de 1,60m. Já 56,25% possuem menos de 1,70m, e 97,50% tem menos de

1,80. Por fim, todos os indivíduos (100%) tem altura inferior a 1,90m, já que o maior
valor observado foi 1,83m.
Note que, para calcular o valor das frequências relativas acumuladas (Frc),
bastou dividir o valor das frequências absolutas acumuladas (Fac) por n, que é o
total de observações (n = 80 neste exemplo).
1.1.3 Gráficos e diagramas

Gráficos também são muito utilizados no estudo da Estatística Descritiva. O
principal deles, conhecido como Histograma, é um gráfico de barras que representa,
no seu eixo horizontal, as classes de valores que uma variável pode assumir, e em
seu eixo vertical os valores das frequências de cada classe. Para exemplificar,
vamos utilizar os dados da tabela abaixo, que já usamos anteriormente:
Classe Frequências Frequências absolutas Frequências relativas
(Fi) acumuladas (Fac) acumuladas (Frc)
1,50| – 1,60 26 26 32,50%
1,60| – 1,70 19 45 56,25%
1,70| – 1,80 33 78 97,50%
1,80| – 1,90 2 80 100%
35
30
25
Frequências
20
15
10
0
1,50| – 1,60 1,60| – 1,70 1,70| – 1,80 1,80| – 1,90
Classes (intervalos)
O histograma das frequências de cada classe seria assim:

Note que, de fato, temos 26 frequências na classe 1,50| - 1,60; 19 na classe
1,60| - 1,70; e assim sucessivamente. Podemos traçar ainda o gráfico das
frequências absolutas acumuladas, que normalmente é representado por uma linha
como esta abaixo:
90
A
80
Frequências acumuladas (Fac)
70
60
50
40
30
20
10
0
1,6 1,7 1,8 1,9
Altura (somente o limite superior da classe)
Este gráfico de freqüências acumuladas acima, onde ligamos os pontos

extremos (limites superiores) das classes de valores, é conhecido como ogiva.
Chamamos a figura formada no gráfico de polígono de freqüências.
Note que no gráfico de frequências acumuladas, colocamos apenas o limite
superior de cada classe de dados.
Veja, por exemplo, que o ponto “A” no gráfico nos indica que 78 frequências
ocorrem abaixo de 1,80m. Finalmente, veja o gráfico das freqüências relativas
acumuladas:

Frequências relativas acumuladas (Frc) 120%
A
100%
80%
60%
40%
20%
0%
1,6 1,7 1,8 1,9
Altura (som ente o lim ite superior da classe)
Aqui, o ponto A nos indica que 97,50% das frequências encontram-se abaixo
de 1,80m.
Observe agora o seguinte Histograma, relativo à observação das idades dos

moradores de um determinado bairro:
25
20
Frequências (Fi)
15
10
0
0 - |10 10 - |20 20 - |30 30 - |40 40 - |50 50 - |60 60 - |70
Classes (intervalos de Idades)
Note que esse gráfico possui um pico na classe de 30 a 40 anos, e à medida

que as classes se afastam desta (para a esquerda ou para a direita), a quantidade
de frequências é igual, dando um aspecto de simetria (ex.: temos 15 frequências
tanto no intervalo 20 - |30 como no intervalo 40 - |50).
Podemos ter também histogramas assimétricos. Neste abaixo, temos uma
assimetria à direita (assimetria positiva), pois temos o pico em 10-20 anos e os

dados se estendem para a direita (sentido positivo), assumindo valores de até 70
anos.
25
20
Frequências (Fi)
15
10
0
0 - |10 10 - |20 20 - |30 30 - |40 40 - |50 50 - |60 60 - |70
Já o histograma abaixo apresenta um caso de assimetria à esquerda

(negativa) , onde os dados se estendem para a esquerda (sentido negativo):
25
20
Frequências (Fi)
15
10
0
0 - |10 10 - |20 20 - |30 30 - |40 40 - |50 50 - |60 60 - |70
1.2 Medidas descritivas (posição, dispersão, assimetria e curtose)

Além dos gráficos e tabelas, usamos também medidas estatísticas para
descrever uma série de observações a respeito de uma variável. O seu edital exigiu
que você conhecesse as medidas de posição, de dispersão, de assimetria e de
curtose. Vejamos cada uma delas.

1.2.1 Medidas de posição
Média aritmética:
É a soma de todos os valores da variável observada, dividida pelo total de
observações. Vamos usar a tabela abaixo para calcular a altura média:
1,50m 15
1,51m 5
1,53m 4
1,57m 2
1,60m 10
1,63m 8
1,65m 1
1,71m 20
1,73m 10
1,75m 3
1,83m 2
Veja que precisaremos somar as alturas de todos os indivíduos observados,

e a seguir dividor pelo número de indivíduos. Temos 15 indivíduos com 1,50m,
portanto a soma de suas alturas é 15 x 1,50 = 22,50m. Analogamente, temos 5
indivíduos com 1,51m, somando 5 x 1,51 = 7,55m. E assim por diante. Somando as
alturas de todos os indivíduos, temos:
Soma = 1,50x15 + 1,51x5 + 1,53x4 + 1,57x2 + 1,60x10 + 1,63x8 + 1,65x1 + 1,71 x

20 + 1,73x10 + 1,75x3 + 1,83x2 = 130,41m
Dividindo esse valor pelo total de indivíduos (isto é, soma de frequências Fi),
temos a média:
Média = 130,41 / 80 = 1,63m
Portanto, a fórmula para o cálculo da média de uma variável aleatória X é:

n
∑ Xi
Média = i =1
n
Caso tenhamos dados em uma tabela de frequências como a que vimos
acima, a média é dada por:
n
∑ ( Xi × Fi )
Média = i =1
n
∑ Fi
i =1
Nessas fórmulas, Xi representa cada um dos valores que a variável X (ex.:

altura) pode assumir, e Fi representa a frequência referente a cada um desses
valores.
Já se tivermos os dados agrupados em classes, devemos utilizar a seguinte
fórmula para calcular a média:
n
∑ ( PMi × Fi )
Média = i =1
n
∑ Fi
i =1
Nessa fórmula, PMi é o ponto médio da classe “i”. Por exemplo, se temos a
classe 1,50|---1,60, o ponto médio será o valor PM = 1,55 (que é justamente a
média aritmética entre o limite inferior e superior da classe).
Vejamos algumas propriedades relativas à média de um conjunto de dados

(muito cobradas!!!):
- somando-se ou subtraindo-se um valor constante em todas as observações,
a média desse novo conjunto será somada ou subtraída do mesmo valor. Ex.:
se somarmos 3cm na altura de cada pessoa, a média passará de 1,63m para
1,66m.
- multiplicando-se ou dividindo-se todos os valores observados por um valor
constante, a média desse novo conjunto será multiplicada ou dividida pelo
mesmo valor. Ex.: se dividirmos todas as alturas encontradas por 2, a média
também será dividida por 2, tornando-se igual a 0,815m.
- a soma das diferenças entre cada observação e a média é igual a zero. Ex.?
A diferença entre a observação 1,51m e a média 1,63m é de –0,12m. Já a

diferença entre a observação 1,80m e a média 1,63m é de 0,17m. Somando
todas as diferenças, obteremos o valor zero.
- O valor da média é calculado utilizando todos os valores da amostra.
Portanto, qualquer alteração nesses valores poderá alterar a média. Assim,
costumamos dizer que a média é afetada pelos valores extremos da
distribuição. Ex.: se incluíssemos na amostra uma pessoa com 2,00m, ou
outra com apenas 0,60m, isso alteraria a média.
Mediana:
É a observação “do meio” quando os dados são organizados do menor para o
maior. Abaixo da mediana encontram-se 50% (metade) das observações, e a outra
metade encontra-se acima da mediana. Se temos n dados em uma distribuição, a
mediana será termo que se encontra na posição (n+1)/2. Vamos encontrar a
mediana para o conjunto de dados abaixo:
1,50m 15
1,51m 5
1,53m 4
1,57m 2
1,60m 10
1,63m 8
1,65m 1
1,71m 20
1,73m 10
1,75m 3
1,83m 3
Observe que temos 81 dados (acrescentei um a mais na altura 1,83m). Além

disso, veja que os valores da variável altura estão ordenados do menor para o maior
nessa tabela. Portanto, a mediana será o valor da posição (81+1)/2 = 41, isto é, a
41ª posição, pois existem 40 valores abaixo dele e outros 40 acima.
Para encontrar o 41º valor, precisamos obter as frequências acumuladas.

Valor da variável Frequências (Fi) Frequências absolutas
acumuladas (Fac)
1,50m 15 15
1,51m 5 20
1,53m 4 24
1,57m 2 26
1,60m 10 36
1,63m 8 44
1,65m 1 45
1,71m 20 65
1,73m 10 75
1,75m 3 78
1,83m 3 81
Veja que até a altura 1,60m temos 36 pessoas. Temos mais 8 pessoas na
altura 1,63m (abrangendo do 37º até o 44º). Portanto, a posição 41 tem altura igual
a 1,63m. Isto é, mediana = 1,63m.
Se tivéssemos um número par de elementos, a conta (n+1)/2 não teria
resultado exato. Nesse caso a mediana seria dada pela média dos dois valores
centrais da amostra. Veja o exemplo abaixo, no qual temos listadas a idade de 10
pessoas:
{ 5, 6, 6, 7, 7, 8, 8, 8, 9, 11}
Veja que as idades já estão ordenadas da menor para a maior. Como temos
10 valores (número par), então (n+1)/2 = (10+1)/2 = 5,5. Não temos um elemento
central, que seria a mediana. Ao invés disso, vamos utilizar a média dos dois
elementos centrais, isto é, o 5º e o 6º elementos. Eles estão marcados em
vermelho:
{ 5, 6, 6, 7, 7, 8, 8, 8, 9, 11}
A Mediana será igual a (7 + 8)/2 = 7,5.
Muitas questões de concurso costumam exigir que o aluno conheça o método

de cálculo de mediana através de interpolação linear dos intervalos de classe. Esse
método é utilizado quando temos os dados distribuidos em intervalos de classes.

Vamos aprender a usar esse método através de um exemplo. A tabela abaixo
apresenta os intervalos de alturas de uma certa população, como já vimos
anteriormente nesta aula. Com base nisso, vamos obter a altura mediana.
Classe Frequências (Fi) Frequências absolutas

acumuladas (Fac)
1,50| – 1,60 26 26
1,60| – 1,70 19 45
1,70| – 1,80 33 78
1,80| – 1,90 2 80
1º passo: calcular a divisão n/2, onde n é o número total de frequências, obtendo a

posição da mediana.
Em nosso exemplo, n = 80 indivíduos, portanto a posição da mediana é 80/2

= 40. (muito cuidado, pois quando usamos esse método não calculamos (n+1)/2,
como vimos anteriormente).
2º passo: identificar a classe onde se encontra a mediana
Observe a coluna de frequências acumuladas. Veja que o elemento da

posição 40 encontra-se na classe 1,60|--1,70 (pois esta classe vai do 26 ao 45).
Portanto, essa é a classe da mediana.
3º passo: montar a proporção entre as frequências acumuladas e os limites da

classe da mediana
Neste passo vamos montar duas retas paralelas, como você vê abaixo, uma
delas com as frequências acumuladas e a outra com os valores de alturas
correspondentes:
Frequência: 26 40 45
|-----------------------------|----------------|
Valores: 1,60 X 1,70
|-----------------------------|----------------|

Repare eu associei (coloquei um em baixo do outro):
- a última frequência da classe anterior (26) com o limite de altura daquela classe
(1,60), que também é o limite inferior da classe da mediana;
- a frequência da mediana (40) com o valor da mediana (X), que buscamos;
- a última frequência da classe da mediana (40) com o limite de altura dessa classe
(1,70).
Feito isso, basta montar a proporção abaixo:
freq superior - freq mediana valorsuperior - valormediana

=
freq superior - freq inferior valorsuperior - valorinferior
Neste exemplo, teríamos:
45 - 40 1,70 - X
=
45 - 26 1,70 - 1,60
Feito isso, basta encontrar o valor de X, que neste caso é X = 1,67m. Esta é
a mediana pelo método da interpolação linear.
Para finalizar o estudo da Mediana, note que ela é única para um

determinado conjunto de observações, e o seu valor não é afetado pela inclusão ou
exclusão de algum valor extremo (máximo ou mínimo) na amostra.
Moda:
A moda é o valor da observação com maior número de frequências. Ao
contrário da média e da mediana, que são valores únicos, uma amostra pode ter 1,
2 ou mais modas (ser unimodal, bimodal etc.). Veja novamente o conjunto de
idades:
{ 5, 6, 6, 7, 7, 8, 8, 8, 9, 11}
Note que a idade 8 é a que aparece mais vezes (3 vezes). Portanto, a moda
deste conjunto é igual a 8. Já na tabela de alturas, que reproduzo novamente, a
moda é a altura de 1,71m, pois ela aparece 20 vezes:

1,50m 15
1,51m 5
1,53m 4
1,57m 2
1,60m 10
1,63m 8
1,65m 1
1,71m 20
1,73m 10
1,75m 3
1,83m 3
Os problemas mais difíceis envolvendo moda são aqueles onde é dada uma
tabela com classes de valores para a variável, como esta abaixo (que também já
utilizamos nessa aula):
Classe Frequências (Fi)
1,50| – 1,60 26
1,60| – 1,70 19
1,70| – 1,80 33
1,80| – 1,90 2
Para calcular a moda, você precisará seguir os seguintes passos:

1. Descobrir qual é a classe modal (CM). A classe modal é aquela que
apresenta o maior número de frequências. Neste caso, trata-se da classe
1,70| - 1,80, que apresenta 33 frequências. Já sabemos que a moda está ali
dentro, isto é, será um valor entre 1,70 e 1,80. Veja que o limite inferior dessa
classe é li = 1,70. Note ainda que todas as classes tem amplitude de 0,10m,
isto é, a diferença entre o menor (li) e maior (Li) valor da classe é de 0,10m.
2. Identificar a classe posterior (post) e a classe anterior (ant). Neste caso, a
classe posterior é a de 1,80| - 1,90, que possui 2 frequências; e a classe
anterior é a de 1,60| - 1,80, com 19 frequências.

3. Aplicar uma das duas fórmulas abaixo, dependendo do método de cálculo da
moda indicado pelo exercício:
a. Moda de King:
  fpost 
Moda = li +  c ×  
  fant + fpost  
Nesta fórmula, li é o limite inferior da classe modal (li = 1,70), c é a
amplitude da classe modal (c = Li – li), fpost é o número de frequências da
classe posterior (fpost = 2) e fant é o número de frequências da classe
anterior (fant = 19). Portanto, a moda será:
  2 
Moda = 1, 70 + 0,10 ×    = 1, 7095m
  2 + 19  
b. Moda de Czuber:
  fcm − fant 
Moda = li + c ×  
  2 fcm − ( fant + fpost )  
Nessa fórmula fcm é o número de frequências da classe modal, que
neste caso é fcm = 33. Portanto, a moda em nosso exemplo será:
  33 − 19 
Moda = 1,70 + 0,10 ×    = 1,731m
  2 × 33 − (19 + 2) 
Note que os valores obtidos são diferentes, motivo pelo qual você
precisará saber as duas fórmulas. Se a questão não especificar o método,
sugiro tentar primeiramente o método de Czuber.
E note um grande diferencial do método de Czuber: ele é o único que
leva em conta, no cálculo, as frequências da Classe Modal!
Finalizando o estudo da Moda, veja que o seu valor não é afetado pelos
valores extremos (mínimos e máximos) da amostragem.
Conhecendo a média, mediana e moda de uma amostra, podemos

determinar a simetria daquela distribuição de dados. Veja isso na tabela abaixo:

Simetria Média, Mediana e Moda
Simétrica Média = Mediana = Moda*
Assimétrica positiva (à direita) Média > Mediana > Moda
Assimétrica negativa (à esquerda) Média < Mediana < Moda
* se unimodal.
Você não precisa decorar essa tabela. Inicialmente, veja um exemplo de

distribuição simétrica, e perceba que, de fato, a média, mediana e moda encontram-
se na mesma posição:
Quanto às distribuições assimétricas, basta entender que uma curva com

assimetria negativa tem esse nome porque possui uma “cauda” para o lado
esquerdo, isto é, para o sentido negativo do eixo horizontal; e uma curva com
assimetria positiva possui uma cauda voltada para o sentido positivo do eixo
horizontal.
A existência de um prolongamento para um dos lados afeta a média,
“puxando-a” naquele sentido. Por exemplo, na curva com assimetria negativa, a
média é “puxada” para a esquerda, tornando-se a menor das três medidas de
posição. A moda corresponde ao pico da curva (maior número de freqüências), que
neste caso é “puxado” para a direita, tornando a moda o maior dos três valores:

No caso da assimetria positiva, a cauda se estende para a direita, puxando a

média para este lado. A moda é puxada para a esquerda, pois há um pico de
frequências à esquerda. Veja:
Média geométrica:
A média geométrica de um conjunto de “n” dados é simplesmente a raiz de
grau “n” do produto destes dados. Exemplificando, veja o conjunto abaixo:
A = {1, 25}
Temos um conjunto de 2 dados. Assim, a média geométrica é a raiz de grau

2 (isto é, a raiz quadrada) do produto destes números:

Média = 1× 25 = 5
2
Observe que o valor obtido é bem menor que obteríamos com a média
aritmética (que seria igual a 13). Vejamos este outro conjunto:
B = {3, 3, 81}
Temos 3 dados, de modo que a média geométrica será a raiz de grau 3 (raiz
cúbica) da multiplicação deles:
Média = 3 3 × 3 × 81 = 9
A média aritmética deste conjunto seria igual a 29. Assim, podemos afirmar
que a média geométrica de um conjunto de números é sempre menor ou igual à
média aritmética do mesmo conjunto.
Quartis, decis e percentis:

Assim como a mediana divide os dados em 2, os quartis dividem os dados em 4.
Isto é, abaixo do primeiro quartil estão 25% das observações. Dele até o segundo
quartil, outros 25%. E assim em diante. Note que o segundo quartil é a própria
mediana, pois 50% dos dados são inferiores a ele. Para exemplificar, vamos utilizar
novamente a tabela abaixo:
1,50m 15
1,51m 5
1,53m 4
1,57m 2
1,60m 10
1,63m 8
1,65m 1
1,71m 20
1,73m 10
1,75m 3
1,83m 2

Veja que temos 80 observações (frequências), isto é, n = 80.
O primeiro quartil (Q1) está localizado na posição (n+1)/4, que neste caso é
(80+1)/4 = 20,25. Veja que não existe a posição 20,25. Precisamos, portanto, fazer
a média entre o valor da posição 20 e o da posição 21. Na posição 20 temos 1,51m,
e na posição 21 temos 1,53m. Portanto, Q1 = (1,51 + 1,53)/2 = 1,52m. Ou seja, 25%
dos indivíduos observados possuem altura inferior a 1,52m.
Já o segundo quartil (Q2) é a própria mediana, localizada na posição
2(n+1)/4, ou simplesmente (n+1)/2. Com n = 80, o Q2 está na posição 40,5. Como
essa posição não existe, precisamos fazer a média entre o valor da posição 40 (que
é 1,63m) e o da posição 41 (que também é 1,63m). Portanto, Q2 = (1,63 + 1,63)/2 =
1,63m. Isto é, 50% dos dados encontram-se abaixo de 1,63m.
O terceiro quartil (Q3) está na posição 3(n+1)/4, que neste caso é igual a
60,75. Fazendo a média entre o valor da posição 60 (1,71) e o da posição 61
(também 1,71), temos que Q3 = 1,71m. Isto é, 75% das observações encontram-se
abaixo de 1,71m.
Resumindo, temos:
Quartil Posição
1 (n+1)/4
2 2(n+1)/4
3 3(n+1)/4
Analogamente aos quartis, que dividem os dados em 4 grupos, temos os

decis (que dividem em 10 grupos) e os percentis (que dividem em 100 grupos). Veja
que a mediana, o 2º quartil, o 5º decil e o 50º percentil são o mesmo valor.
Veja que o método da interpolação linear, visto para o cálculo da mediana,
pode ser usado perfeitamente aqui, com as devidas adaptações. Veremos isso nos
exercícios.
1.2.2 Medidas de dispersão

As medidas de dispersão medem o grau de espalhamento dos dados de uma
distribuição. Se você anotar as idades dos seus colegas de faculdade,
provavelmente verá que a maioria deles se concentra numa faixa muito estreita
(talvez entre 19 e 24 anos), com evidente predominância dos jovens, havendo um

ou outro caso que destoa dessa faixa. Agora, se você tentar anotar as idades das
pessoas que frequentam uma determinada praia, verá que a dispersão é muito
maior, isto é, existem quantidades significativas de crianças, jovens, adultos e
idosos.
Para quantificar essa dispersão (ou variabilidade) existem diversas medidas,
que conheceremos a seguir. Friso apenas que a variância e o desvio padrão são de
longe os mais cobrados em provas de concurso.
Amplitude Total (AT):

Trata-se da diferença entre o valor máximo observado (Xmáx.) e o valor
mínimo (Xmín.) da variável X. Isto é,
AT = Xmax – Xmín
Na tabela de alturas que estávamos trabalhando, a menor altura era Xmín =

1,50m, e a maior altura era Xmáx = 1,83m. Portanto, neste caso,
AT = 1,83 – 1,50 = 0,33m
Assim, 33 centímetros separam a pessoa mais baixa da mais alta.
Amplitude interquartílica (Dq):

Trata-se da diferença entre o 3º e 1º quartis:
Dq = Q3 - Q1
Em nossa tabela de alturas, tínhamos Q1 = 1,52m e Q3 = 1,71m. Portanto,

Dq = 1,71 – 1,52 = 0,19m
Isto é, a diferença de altura entre a pessoa em relação a qual 25% são mais
baixos (Q1) e a pessoa em relação a qual 25% são mais altos (Q3) é de 19
centímetros.
Amplitude semi-interquartílica (Dqm):

Trata-se da metade do valor anterior, isto é,
Dqm = Dq/2

Desvio médio (DM):
É a média das distâncias (absolutas) de cada observação até a média. Isto é,
∑
n
| Xi − X |
DM = 1
n
Se os dados estiverem agrupados em classes, podemos usar novamente os

Pontos Médios (PMi):
∑
n
( Fi× | Xi − X |)
DM = 1
∑
n
1
Fi
Em nossa tabela de alturas, tínhamos a média X = 1,63m. Ao todo tínhamos
∑
n
1
Fi = 80 alunos. Portanto, temos:
15× |1,50 − 1, 63 | +5× |1, 51 − 1, 63 | +4× |1,53 − 1, 63 | +2× |1, 57 − 1, 63 | +10× |1, 60 − 1, 63 | +8× |1, 63 − 1, 63 | +1× |1, 65 − 1, 63 | +20× |1, 71 − 1, 63 | +10× |1, 73 − 1, 63 | +3× |1, 75 − 1, 63 | +2× |1,83 − 1, 63 |
DM =
15 + 5 + 4 + 2 + 10 + 8 + 1 + 20 + 10 + 3 + 2
DM = 0,084m = 8,4cm
Variância:
Chamamos de variância a média do quadrado das distâncias de cada
observação até a média. Complicado? Vamos por partes...
A distância de uma observação Xi até a média X é dada pela subtração
X i − X . O quadrado desta distância é ( X i − X ) 2 . A média do quadrado dessas
distâncias é dado pelo somatório de todos os valores ( X i − X ) 2 , dividido pelo total
de observações (n). Portanto, a fórmula da variância é:

n
∑(X i − X )2
Variancia = σ 2 = 1
n
Como você viu nesta fórmula, costumamos simbolizar a variância por σ 2 .
Exemplificando, vamos calcular a variância do seguinte conjunto de dados: {1, 3, 5,
5, 8, 9}. Repare que temos n = 6 elementos, cuja média é:
1+ 3 + 5 + 5 + 8 + 9
X= =6
6
Assim, a variância é:

n
∑(X i − X )2
(1 − 6)2 + (3 − 6)2 + (5 − 6) 2 + (5 − 6)2 + (8 − 6)2 + (9 − 6) 2
σ2 = 1
=
n 6
25 + 9 + 1 + 1 + 4 + 9
σ2 = = 8,16
6
Esta é a fórmula básica da variância. Entretanto, dependendo do exercício
pode ser que seja mais conveniente usar alguma das fórmulas a seguir, que são
meras variações desta primeira:
Caso os dados estejam em uma tabela de frequências (fi):
n
∑[ f × ( X i i − X )2 ]
σ2 = 1
n
∑f
1
i
Caso os dados estejam em uma tabela de frequências, porém agrupados em

intervalos de classes, devemos usar os pontos médios PMi no lugar dos
valores individuais Xi:
n
∑ [ f × ( PM
i i − X )2 ]
σ2 = 1
n
∑f
1
i
Veja que em todas as fórmulas para cálculo da variância é preciso

inicialmente obter o valor da média da população. Entretanto, a fórmula abaixo nos
permite encontrar a variância sem precisar calcular a média:
2
n
1 n 
∑ X i − 
2
∑ Xi 
n  i =1 
σ 2 = i =1
n
Veja que, nesta fórmula, só é preciso obter o valor do somatório das
n
observações ( ∑ X i ), bem como o somatório dos quadrados das observações
i =1
n
( ∑ X i 2 ), que são cálculos relativamente fáceis.
i =1
Se os dados estiverem agrupados, você pode alterar esta última fórmula,

utilizando a seguinte:

2
n
1 n 
∑ ( X i ×2
f i ) −  ∑
n  i =1
( X i × fi ) 

σ 2 = i =1
n
E se estiverem em intervalos de classes, você pode utilizar os pontos médios:
2
n
1 n 
∑ ( PM i × f2
i ) −  ∑
n  i =1
( PM i × f i ) 

σ 2 = i =1
n
ATENÇÃO: todas as fórmulas vistas acima permitem calcular a variância de
uma POPULAÇÃO. Caso o exercício apresente apenas uma amostra da população,
devemos fazer uma pequena alteração nas fórmulas acima, calculando a variância
AMOSTRAL, que é simbolizada por s2. Esta alteração consiste em subtrair uma
unidade (1) no denominador das fórmulas.
n
∑(X i − X )2
Exemplificando, ao invés de σ 2 = 1
, teremos:
n
n
∑(X i − X )2
s2 = 1
n −1
n
∑[ f × ( X i i − X )2 ]
Analogamente, ao invés de σ 2 = 1
n
, teremos:
∑f 1
i
∑[ f × ( X
i i − X )2 ]
s2 = 1
n
∑f 1
i −1
2
n
1 n 
∑ ( PM i × f i ) −  ∑ ( PM i × f i ) 
2
n  i =1  , usaremos:
E ao invés de σ 2 = i =1
n
2
n
1 n 
∑ ( PM i
2
× f i ) −  ∑
n  i =1
( PM i × f i ) 

s 2 = i =1
n −1
Desvio padrão ( σ ):
Obtida a variância, fica fácil calcular o desvio-padrão de uma população ou
amostra. Basta tirar a raiz quadrada da variância. Isto é:

Desvio padrão = Variância
Assim, podemos dizer que σ = σ 2 (desvio padrão populacional) e que
s = s 2 (desvio padrão amostral).

Lembrando que o desvio-padrão e a variância são medidas de dispersão dos
dados, é bom você saber que, quanto maiores estes valores forem, mais
espalhados estão os dados (caso da praia), e quanto menor, mais próximos estão
os dados (caso da faculdade).
É importante você conhecer as seguintes propriedades do desvio padrão e
da variância (caem bastante!):
- se somarmos ou subtrairmos um mesmo valor de todos os elementos de uma
amostra, o desvio padrão e a variância permanecem inalterados. Isso porque essas
são medidas de dispersão. Ao somar o mesmo número em todos os elementos, eles
não se tornam mais dispersos (mais espalhados), apenas deslocam-se juntos para
valores mais altos.
- se multiplicarmos ou dividirmos todos os elementos da amostra pelo mesmo valor,
o desvio padrão é multiplicado/dividido por este mesmo valor. Já a variância é
multiplicada/dividida pelo quadrado desse valor (pois ela é igual ao quadrado do
desvio padrão).
Assim, se temos uma variável X, com desvio padrão σ x , e definimos uma
variável Y como sendo Y = a.X + b (ou seja, a distribuição Y é formada pelos

mesmos termos da distribuição X, porém multiplicados por a e depois somados com
b), podemos dizer que:
- o desvio padrão de Y será: σ y = a × σ x (veja que o b nem aparece aqui);
- a variância de Y será σ y 2 = a 2 × σ x 2
Em alguns (raros) casos, você pode ser apresentado a duas amostras

diferentes (ex.: moradores da cidade A e da cidade B), sendo fornecidos o número
de elementos de cada amostra (nA e nB), bem como a variância de cada amostra.
Com isso em mãos, é possível calcular a variância que teria uma amostra composta
pela união dos indivíduos de A com os indivíduos de B usando a fórmula abaixo:

Variância A × nA + VariânciaB × nB
Variância A∪ B =
n A + nB
Coeficiente de variação (CV):

Trata-se da razão entre o desvio padrão e a média, sendo normalmente
expresso na forma percentual:
σ
CV =
µ
1.2.3 Medidas de assimetria

Já conceituamos o que significa simetria e assimetria em uma distribuição de
dados. Agora veremos as principais medidas utilizadas para se quantificar essa
assimetria:
Coeficiente quartílico de assimetria:

É dado pela relação entre o 1º, 2º e 3º quartis (lembrando que o 2º quartil é a
Mediana – Md):
Q3 + Q1 − 2Md
AS =
Q3 − Q1
Em nossa tabela de alturas, descobrimos que Q1 = 1,52m, Q3 = 1,71m e

Mediana = 1,63m. Portanto,
1,71 + 1,52 − 2 × 1,63
AS = = −0,15
1,71 − 1,52
Coeficiente percentílico de assimetria:

Relação entre o 10º, 50º e 90º percentis:
P90 + P10 − 2P50
AS =
P90 − P10
1º Coeficiente de Pearson:

Trata-se de outra fórmula muito utilizada para medida da assimetria de uma
distribuição. Indica o grau de distorção de uma distribuição qualquer em relação a
uma distribuição simétrica:
X − Mo X − Mo
AS = ou AS =
σ s
(“Mo” é a moda da distribuição)
1.2.4 Medidas de curtose
Trata-se de uma medida do “achatamento” de uma distribuição, e pode ser

dada pelo coeficiente K abaixo:
Q3 − Q1
K=
2(P90 − P10 )
Veja que Q3 e Q1 são o 3º e 1º quartis, respectivamente, e P90 e P10 são o

90º e 10º percentis, ou 9º e 1º decis. Dependendo do valor de K, classificamos a
distribuição conforme a tabela abaixo:
Coeficiente K (curtose) Distribuição
K > 0,263 Platicúrtica
K = 0,263 Mesocúrtica
K < 0,263 Leptocúrtica
Veja na figura abaixo um exemplo de distribuições com mesma média, porém

diferentes valores de curtose. A distribuição verde, mais plana (achatada), é
platicúrtica, enquanto a distribuição azul, com um pico mais proeminente, é
leptocúrtica.

2. RESOLUÇÃO DE EXERCÍCIOS
1. CESPE – SERPRO – 2008) Uma empresa de consultoria realizou um
levantamento estatístico para obter informações acerca do tempo (T) gasto por
empregados de empresas brasileiras na Internet em sítios pessoais durante suas
semanas de trabalho. Com base em uma amostra aleatória de 900 empregados de
empresas brasileiras com um regime de trabalho de 44 h semanais, essa empresa
de consultoria concluiu que cada empregado gasta, em média, 6 h semanais na
Internet em sítios pessoais durante uma semana de trabalho; 50% dos empregados
gastam 5 h semanais ou mais na Internet em sítios pessoais durante uma semana
de trabalho; e o desvio padrão do tempo gasto na Internet em sítios pessoais
durante o regime de trabalho é igual a 4 h semanais por empregado.
Com base nas informações da situação hipotética acima descrita, julgue os itens a
seguir.
( ) Os empregados observados no levantamento gastaram, em média, mais de 12%

do regime de trabalho semanal na Internet em sítios pessoais.
( ) Os tempos gastos na Internet em sítios pessoais durante o regime de trabalho
pelos empregados observados no levantamento foram superiores a 2 h e inferiores
a 10 h semanais.
( )A mediana da distribuição dos tempos gastos na Internet é superior a 5,5
h/semana.
( ) Considerando que o tempo útil semanal do regime de trabalho seja a diferença
U = 44 – T (em horas), o desvio padrão de U será inferior a 5 h.
RESOLUÇÃO:
Os empregados gastaram, em média, 6 das 44 horas do regime de trabalho
semanal em sítios pessoais. Veja que 6/44 = 0,136 = 13,6%. Portanto, os
empregados gastaram, em média, mais de 12% do tempo em sítios pessoais. Item
CERTO.

a 10 h semanais.
O fato de a média ser igual a 6h e o desvio padrão ser igual a 4h não significa
que os tempos gastos estão, todos eles, entre 6 – 4 e 6 + 4 horas, apesar de ser
esperado que a maioria dos tempos encontre-se neste intervalo. Item ERRADO.

h/semana.
Como 50% dos empregados gastam 5h ou mais, então outros 50% gastam
menos de 5h. Logo, a mediana é igual a 5h. Item ERRADO.
( ) Considerando que o tempo útil semanal do regime de trabalho seja a diferença

U = 44 – T (em horas), o desvio padrão de U será inferior a 5 h.
Sabemos que a variável T possui média igual a 6 e desvio padrão igual a 4. A
variável U = 44 – T é formada pela multiplicação de T por (-1) e, a seguir, a soma de
44. Sabemos que a soma não afeta a variância (e por conseqüência o desvio
padrão), porém a multiplicação afeta. Como estamos multiplicando por (-1), então a
variância de U será igual a variância de T multiplicada por (-1)2, isto é, 1. Em outras
palavras, a variância de U será igual à variância de T, e por conseqüência o desvio
padrão também será o mesmo, ou seja, 4h. Item CERTO.
Resposta: C E E C
2. CESPE – INSS – 2008)

De acordo com dados do IBGE, em 2007, 6,4% da população brasileira tinha 65
anos de idade ou mais e, em 2050, essa parcela, que constitui o grupo de idosos,
corresponderá a 18,8% da população. Com base nessas informações e nas
apresentadas na tabela acima, julgue os itens seguintes.
( ) Segundo o IBGE, em 2007, para cada idoso com 65 anos de idade ou mais,
havia, em média, pelo menos, quatro crianças de 0 a 14 anos de idade. Em 2050,
para cada idoso com 65 anos de idade ou mais, haverá, em média, no máximo, uma
criança de 0 a 14 anos de idade.
( ) Considere-se que os anos de idade estejam distribuídos de forma eqüiprovável
na faixa de 15 a 18 anos. Nessa situação, a média e a mediana das idades nessa
faixa serão ambas iguais a 16,5 anos.
RESOLUÇÃO:
Vamos analisar separadamente cada um dos itens:
6,4% da população tinha 65 anos ou mais em 2007. Consultando a tabela
fornecida, vemos que neste mesmo período 27,5% da população tinha de 0 a 14
anos. Assim, naquele ano tínhamos 6,4 idosos para cada grupo de 27,5 crianças. A
regra de três abaixo nos permite obter a quantidade de crianças para 1 idoso:
6,4 idosos ------------------- 27,5 crianças

1 idoso -------------------- X
X × 6,4 = 1× 27,5
X = 4,29crianças
Assim, é correto dizer que em 2007 havia pelo menos 4 crianças para cada
idoso. Em 2050 teremos 18,8% de idosos e 17,7% de crianças. Observando que o
percentual de crianças é ligeiramente inferior ao de idosos, podemos dizer que

teremos menos de 1 criança para cada idoso (se preferir, você pode montar a
mesma regra de três acima).
Item CORRETO.

Dizer que a distribuição de idades entre 15 e 18 anos é equiprovável é
equivalente a dizer que esta distribuição é uniforme, ou seja, existe a mesma
probabilidade de encontrar indivíduos com qualquer idade neste intervalo. Assim, a
idade média desse grupo certamente será a média aritmética dos extremos do
intervalo:
18 + 15
Média = = 16,5 anos
2
Da mesma forma, essa distribuição de idades é simétrica, ou seja, metade
dos indivíduos deve estar entre 15 e 16,5 anos, e a outra metade entre 16,5 e 18
anos. Assim, a mediana também será igual a 16,5.
Item CORRETO.
Resposta: C C
3. CESPE – MEC – 2009) Merendas escolares demandadas em 10 diferentes

escolas:
200, 250, 300, 250, 250, 200, 150, 200, 150, 200.
Com base nessas informações, julgue os próximos itens.
( ) A mediana da distribuição do número diário de merendas escolares é igual a

225.
( ) O desvio padrão amostral dos números diários de merendas escolares é

superior a 50.
RESOLUÇÃO:

225.

Para obter a mediana, o primeiro passo é colocar os dados em ordem
crescente. Veja isso abaixo:
150, 150, 200, 200, 200, 200, 250, 250, 250, 300.
Temos 10 elementos, portanto n = 10. A seguir devemos calcular o valor de

(n+1)/2, que neste caso será (10+1)/2 = 5,5. Veja que não obtivemos um valor
exato, pois n é par. Assim, a mediana será a média aritmética dos dois termos
centrais da amostra, que são aqueles mais próximos da “posição” 5,5, ou seja, o 5º
e o 6º termo:
200 + 200
Mediana = = 200
2
Item ERRADO.

superior a 50.
O desvio padrão amostral é dado por:
n
∑( X i − X )2
s= i =1
n −1
onde n é o número de elementos (n = 10), Xi representa cada elemento da
amostra e X é a média da amostra. A média, neste caso, é:
150 + 150 + 200 + 200 + 200 + 200 + 250 + 250 + 250 + 300
X= = 215
10
Portanto, o desvio padrão será:

n
∑(X i − X )2
s= i =1
n −1
2 × (150 − 215)2 + 4 × (200 − 215)2 + 3 × (250 − 215)2 + 1× (300 − 215)2
s=
10 − 1
2 × ( −65)2 + 4 × ( −15)2 + 3 × (35)2 + 1× (85)2

s=
9
8450 + 900 + 3675 + 7225
s= = 2250
9

Observe que esse número é inferior a 50, pois 50 = 2500 . Assim, o item
está ERRADO.
Resposta: E E
4. CESPE – MEC – 2009) Em uma escola, há 2 mil estudantes distribuídos em 100

turmas: 50 são do turno matutino e as outras 50, do turno vespertino. A figura
abaixo representa a distribuição percentual desses estudantes segundo o turno em
que estão matriculados.
A média das idades dos estudantes matriculados no turno vespertino é 10%

superior à média das idades dos estudantes do turno matutino. A variância das
idades daqueles que estudam no turno matutino ( σ M 2 ) é igual à variância das
idades dos estudantes do turno vespertino ( σ V 2 ). Com base nessas informações,
julgue os itens que se seguem.
( ) O número médio de estudantes por turma no turno matutino é 50% maior que o
número médio de estudantes por turma no turno vespertino.
( ) A média das idades dos dois mil estudantes da referida escola é 4% maior que a
média das idades da parcela dos estudantes que estão matriculados no turno
matutino.
( ) Se a mediana das idades dos 2 mil estudantes da escola em questão for igual a
10 anos, então haverá, pelo menos, 200 estudantes no turno matutino com idades
iguais ou inferiores a 10 anos.
RESOLUÇÃO:

Temos 2000 estudantes ao todo, dos quais 60% estão no turno matutino. Isto
quer dizer que o número de alunos no turno matutino é igual a 0,60 x 2000 = 1200.
Da mesma forma, no turno vespertino estudam 0,40 x 2000 = 800 alunos.
Como temos 50 turmas em cada período, a média de alunos por turma no
turno matutino é de 1200 / 50 = 24. E a média de alunos por turma no turno
vespertino é de 800 / 50 = 16. Assim, é CORRETO dizer que a média de alunos por
turma no turno matutino é 50% maior que no vespertino, pois 24/16 = 1,50 (ou seja,
24 = 16 + 50% x 16).
matutino.
Imagine que a média de idade dos alunos do turno matutino é M. Como a
média de idade do turno vespertino é 10% maior, podemos dizer que esta média é
de 1,10xM, ou simplesmente 1,1M.
Lembrando que 60% dos alunos estão no turno matutino e 40% no
vespertino, a média de idades total dos alunos é:
Média = 60% × M + 40% × 1,1M = 1,04M
Veja que esta média é, de fato, 4% superior a M (média dos estudantes do
turno matutino). Item CORRETO.
Se a mediana for de 10 anos, então espera-se que cerca de metade dos
alunos (1000) tenham idade igual ou inferior a 10 anos. No turno matutino,
composto por 1200 estudantes, certamente mais de 200 deverão ter idades iguais
ou inferiores a esta. Item CORRETO.
Resposta: C C C

5. CESPE – CEHAP/PB – 2009)
O gráfico acima mostra a distribuição percentual de veículos de acordo com suas

velocidades aproximadas, registradas por meio de um radar instalado em uma
avenida. A velocidade média aproximada, em km/h, dos veículos que foram
registrados pelo radar foi
A) inferior a 40.
B) superior a 40 e inferior a 43.
C) superior a 43 e inferior a 46.
D) superior a 46.
RESOLUÇÃO:
A partir do gráfico dado podemos construir a tabela de freqüências abaixo
para auxiliar-nos no cálculo da média:
Velocidade Frequências (% de veículos)
10 0
20 5
30 15
40 30
50 40
60 7
70 2
80 1
90 0

100 0
Veja que para as velocidades de 60, 70 e 80km/h foi preciso “chutar” um

valor aproximado do percentual de veículos, olhando o gráfico. Esses chutes foram
dados de forma que o total da coluna de freqüências somasse 100%. Assim, temos:
Média = 5% × 20 + 15% × 30 + 30% × 40 + 40% × 50 + 7% × 60 + 2% × 70 + 1% × 80

Média = 43,9km / h
Esta velocidade média encontra-se entre 43 e 46km/h, conforme a alternativa

C.
Resposta: C
Texto para as 2 questões seguintes:

O custo médio nacional para a construção de habitação com padrão de acabamento
normal, segundo levantamento realizado em novembro de 2008, foi de R$ 670,00
por metro quadrado, sendo R$ 400,00/m2 relativos às despesas com materiais de
construção e R$ 270,00/m2 com mão-de-obra. Nessa mesma pesquisa, os custos
médios regionais apontaram para os seguintes valores por metro quadrado: R$
700,00 (Sudeste), R$ 660,00 (Sul), R$ 670,00 (Norte), R$ 640,00 (Centro-Oeste) e
R$ 630,00 (Nordeste).
Sistema Nacional de Pesquisa de Custos e Índices da Construção
C i v i l. S I NA P I / I BG E , n o v . / 2 0 0 8 ( c o m a d a p t a ç õ e s ) .
6. CESPE – CEHAP/PB – 2009) Com base nas informações apresentadas no texto,

assinale a opção correta.
A) A média aritmética dos custos médios regionais por metro quadrado é igual ao
custo médio nacional do metro quadrado.
B) O custo médio por metro quadrado relativo à região Sul corresponde à mediana
dos custos médios regionais por metro quadrado.
C) Mais de 65% do custo médio nacional do metro quadrado é relativo às despesas
com materiais de construção.

D) O custo médio por metro quadrado relativo à região Sudeste é 10% superior ao
custo relativo à região Nordeste.
RESOLUÇÃO:
Vamos analisar cada alternativa dada.
A média aritmética dos custos médios regionais por metro quadrado é dada
pelo cálculo abaixo:
700 + 660 + 670 + 640 + 630
Média = = 660
5
Veja que este valor é inferior ao custo nacional. Item ERRADO.
Para obter a mediana dos custos médios regionais, devemos primeiro colocá-
los em ordem:
630, 640, 660, 670, 700
Veja que temos n = 5 valores. Como n é ímpar, a mediana será simplesmente
o termo da posição central, que é a posição (n+1)/2 = (5+1)/2 = 3. O 3º termo é o
660. Portanto, a mediana tem o mesmo valor do custo da região Sul. Item
CORRETO.

Do total de 670 reais, temos que 400 referem-se a materiais. Para obter o
percentual representado pelos materiais, podemos usar a regra de três abaixo:
670 ---------------- 100%
400 ---------------- X
X = 59,7%
Veja que os materiais representam menos de 65% do total. Portanto, o item
está ERRADO.

O custo da região Nordeste é de 630, enquanto o da Sudeste é de 700. Para
saber quanto o custo da região Sudeste representa em relação a região Nordeste,
temos:
630 ---------------- 100%
700 ---------------- X
X = 111,1%
Portanto, o custo da região Sudeste é 11,1% (isto é, 111,1% - 100%) superior
ao da região Nordeste. Item ERRADO.
Resposta: B
7. CESPE – CEHAP/PB – 2009) O desvio padrão dos custos médios regionais por
metro quadrado foi
A) inferior a R$ 30,00.
B) superior a R$ 30,01 e inferior a R$ 40,00.

C) superior a R$ 40,01 e inferior a R$ 50,00.
D) superior a R$ 50,01
RESOLUÇÃO:
O cálculo do desvio padrão pode ser feito como vemos abaixo, lembrando
que a média é X = 670 e n = 5:
n
∑(X i − X )2
σ= i =1
n
(700 − 670)2 + (660 − 670)2 + (670 − 670)2 + (640 − 670)2 + (630 − 670)2
σ=
5
(30)2 + ( −10)2 + (0)2 + ( −30)2 + ( −40)2

σ=
5
900 + 100 + 0 + 900 + 1600
σ= = 700
5
Esse número é inferior a 30, pois 30 = 900 . Assim, a alternativa correta é a

letra A.
Resposta: A

Obs.: veja que nessa questão eu usei a fórmula do desvio padrão
populacional ( σ ), e não do desvio padrão amostral (s), uma vez que aqui foi
fornecida toda a “população” de regiões do Brasil, e não apenas uma amostra.
8. CESPE – ABIN – 2010) Considere que um estudo tenha sido realizado para
estimar a média das idades dos empregados de determinado segmento de
empresas, e que, na ocasião em que o estudo foi realizado, o tamanho da
população de funcionários era N = 5.000 funcionários. Essa população foi
estratificada em três grupos de tamanhos N1 = 1.000, N2 = 1.500 e N3 = 2.500. Da
população de funcionários, foi retirada uma amostra aleatória estratificada de
tamanho n = 100 com alocação proporcional ao tamanho dos estratos.
Considerando que o quadro acima mostra os resultados do estudo hipotético em

apreço, julgue os itens subsecutivos.
( ) A estimativa da média populacional das idades foi igual a 44 anos.
RESOLUÇÃO:
A estimativa da média populacional pode ser dada considerando a tabela
abaixo:
Frequências (número de
Estrato Idade média do estrato
indivíduos)
1 30 1000
2 40 1500
3 50 2500
Assim, a média é:

30 × 1000 + 40 × 1500 + 50 × 2500
Média = = 43anos
1000 + 1500 + 2500
Portanto, o item está ERRADO.
Resposta: E
9. CESPE – ABIN – 2010)
Considerando que o diagrama de ramos-e-folhas acima mostra a distribuição das

idades (em anos) dos servidores de determinada repartição pública, julgue os
próximos itens.
( ) O primeiro quartil e o terceiro quartil são, respectivamente, 34 e 46 anos de
idade.
( ) A mediana das idades dos servidores é igual a 39,5 anos.
RESOLUÇÃO:
Coloquei essa questão para apresentar a você o diagrama de ramos-e-
folhas. Trata-se simplesmente de outra forma de representar os dados de uma
distribuição. Neste diagrama, a primeira coluna apresenta o algarismo das dezenas
de cada observação, e as colunas à direita da linha vertical representam o algarismo
das unidades. Assim, os elementos dessa amostra são:
21, 23, 22, 26, 34, 33, 35, 38, 37, 46, 42, 41, 49, 46, 54, 52, 50, 55
Colocando-os em ordem crescente, temos:
21, 22, 23, 26, 33, 34, 35, 37, 38, 41, 42, 46, 46, 49, 50, 52, 54, 55
Temos n = 18 elementos. Podemos calcular a posição do primeiro quartil,

mediana (segundo quartil) e terceiro quartil com auxílio das fórmulas abaixo:
1º quartil (n+1)/4 = 19/4 = 4,75
Mediana (n+1)/2 = 19/2 = 9,5
3º quartil 3(n+1)/4 = 14,25

Veja que em nenhum caso encontramos posições exatas. Assim, devemos
calcular a média aritmética das posições anterior e posterior. No caso do 1º quartil,
devemos obter a média entre os elementos da 4ª e 5ª posições:
26 + 34
1º quartil = = 30
2
Para a mediana, devemos obter a média entre a 9ª e 10ª posições:
38 + 41
Mediana = = 39,5
2
Para o 3º quartil devemos obter a média entre os elementos da 14ª e 15ª
posições:
49 + 50
3º quartil = = 49,5
2
Assim, vemos que a mediana é realmente igual a 39,5, tornando o segundo
item CORRETO, porém o primeiro item encontra-se ERRADO.
Resposta: E C
10. CESPE – EBC – 2011)
Com base nos dados do quadro acima, em que se demonstra a distribuição de

frequência das receitas de todas as empresas de uma cidade, julgue os itens a
seguir.
( ) É correto inferir que a média das receitas das empresas da cidade em apreço é
inferior a R$ 332 mil.
( ) A frequência acumulada relativa das empresas que estão nas classes de 1 a 3 é
de 85%.
RESOLUÇÃO:

Veja que temos nessa tabela os valores de receitas organizados em
intervalos (de 0 a 200.000, de 200.001 a 400.000 etc.). Para calcular a média, o
primeiro passo é substituir os intervalos por seus “pontos médios”, que
correspondem à média aritmética das extremidades. Veja isso na tabela abaixo:
Quantidade de
Pontos médios
Classe Receitas (em R$) empresas
(PMi)
(freqüências - fi)
1 0 – 200.000 100.000 1100
2 200.001 – 400.000 300.000 900
3 400.001 – 600.000 500.000 550
4 600.001 – 800.000 700.000 300
5 800.001 – 1.000.000 900.000 150
Com isso em mãos, podemos calcular a média através da fórmula abaixo:
∑ PM × f i i
100.000 × 1.100 + 300.000 × 900 + 500.000 × 550 + 700.000 × 300 + 900.000 × 150
Média = i =1
=
n
1.100 + 900 + 550 + 300 + 150
∑f
i =1
i
Média = 333.333,33
Esse valor é superior a 332 mil reais, portanto o item está ERRADO.

de 85%.
Note que nessas 3 primeiras classes temos 1100 + 900 + 550 = 2550
empresas. Isso nos permitiria afirmar que a freqüência acumulada absoluta dessas
3 classes é de 2550.
Para obter o valor relativo, ou seja, o percentual que essa quantidade de
empresas no total, é preciso verificar que ao todo temos 3000 frequências
(empresas). Portanto, 2550 representam:
2550
Freq. acum. relativa = = 0,85 = 85%
3000

Assim, o item está CORRETO.
Resposta: E C
11. CESPE – TJ/ES – 2011) Julgue os itens que se seguem, a respeito de análise
de dados discretos.
Em uma amostra x1, x2, x3, ..., xn, em que xi ∈ N e n é ímpar, a mediana é um
número inteiro.
RESOLUÇÃO:
A mediana de um conjunto de “n” dados é:
- o termo da posição (n+1)/2, se n for ímpar;
- a média aritmética dos dois termos centrais, se n for par.
Portanto, se n for ímpar, a mediana será o valor x(n+1)/2. Se todos os valores xi
são inteiros, podemos afirmar que a mediana é um número inteiro. Item CORRETO.
Resposta: C
12. CESPE – CORREIOS – 2011)
Considere que determinado fabricante classifique suas embalagens de acordo com

a capacidade de armazenamento unitário (c), em kg, de determinado produto — por
exemplo, a embalagem do tipo 10 permite armazenar mais de 9 e até 10 kg do
produto. Com base nessas informações e na tabela acima, que mostra a distribuição
dos dez tipos de embalagens e a demanda observada em março de 2011 para cada
tipo, julgue os itens que se seguem.
( ) O valor máximo da variável capacidade foi igual a 20.

( ) Em março de 2011, a demanda total pelas embalagens foi superior a 100.

( ) Pelos menos metade da demanda foi por embalagens com capacidades
superiores a 2 kg.
( ) É correto afirmar que o nível de mensuração da variável c foi intervalar.
( ) A capacidade média das embalagens demandadas foi superior a 4 kg.
( ) A capacidade mediana das embalagens demandadas foi maior que a média da
capacidade das embalagens demandadas.
( ) Um quarto da demanda foi por embalagens com capacidades para mais de 4 kg.
RESOLUÇÃO:
ERRADO. O valor máximo da variável capacidade, conforme a tabela, é igual
a 10kg.

ERRADO. Somando as demandas presentes em cada linha da tabela (coluna
da direita), temos 86.

superiores a 2 kg.
CERTO. As embalagens com até 2kg tiveram demanda de 14 + 20 = 34. Em
uma demanda total de 86, este valor representa menos da metade. Logo, a
demanda por embalagens com capacidade superior a esta representa mais da
metade.

CERTO. A variável capacidade tem um valor numérico (kg) que nos permite
colocar os dados em uma ordem crescente, calcular diferenças, médias etc. Trata-
se de uma variável intervalar.

ERRADO. Para calcular a capacidade média, precisaremos considerar os
pontos médios de cada intervalo de dados. Veja:
Tipo Ponto médio da Demanda (d)

capacidade (kg)
1 0,5 14
2 1,5 20
3 2,5 16
4 3,5 10
5 4,5 9
6 5,5 5
7 6,5 5
8 7,5 4
9 8,5 2
10 9,5 1
Assim, a média pode ser calculada segundo a fórmula abaixo:

n
∑ ( PMi × Fi )
Média = i =1
n
∑ Fi
i =1
0, 5 × 14 + 1,5 × 20 + 2, 5 ×16 + 3,5 × 10 + 4, 5 × 9 + 5,5 × 5 + 6, 5 × 5 + 7,5 × 4 + 8, 5 × 2 + 9,5 × 1

Média =
86
269
Média = = 3,12kg
86
Veja que você poderia suspeitar que a média é inferior a 4kg, uma vez que a
maioria dos dados de demanda situam-se nas faixas de capacidade inferior a 4kg.

Temos n = 86 elementos de demanda. Utilizando o método da interpolação
linear, a mediana encontra-se na “posição” n/2 = 86/2 = 43. Calculando as
freqüências acumuladas (coluna da direita da tabela abaixo), vemos que a mediana
encontra-se na classe do tipo 3:

Ponto médio da Demanda
Tipo Demanda (d)
capacidade (kg) acumulada
1 c≤1 14 14
2 1< c ≤2 20 34
3 2< c ≤3 16 50
4 3< c ≤4 10 60
5 4< c ≤5 9 69
6 5< c ≤6 5 74
7 6< c ≤7 5 79
8 7< c ≤8 4 83
9 8< c ≤9 2 85
10 9 < c ≤ 10 1 86
Como a mediana encontra-se entre 2 e 3kg, ela certamente é inferior à

média (3,12kg, como calculamos anteriormente). Item ERRADO. Nem precisamos
montar a proporção e calcular o valor exato da mediana.
Olhando a tabela de freqüências acumuladas que calculamos no item
anterior, veja que até 4kg temos 60 frequências, restando 86 – 60 = 26 para as
capacidades superiores.
Como 26/86 = 0,302 = 30,2%, o item está ERRADO.
Resposta: E E C C E E E
13. CESPE – Polícia Federal – 2004) O ser humano tem impressos nos dedos das
mãos pelo menos quatro desenhos diferentes. Embora pessoas diferentes tenham
sempre digitais diferentes, esses desenhos formam padrões conhecidos como tipos
fundamentais de impressões digitais. Há raras exceções a essa regra de
classificação. Por isso, essa regra é utilizada para a identificação de uma pessoa.
Um perito, observando os dedos indicadores direitos de 200 indivíduos, obteve a
seguinte distribuição dos tipos fundamentais, segundo o gênero (homem/mulher).

No estudo desse perito, foram associados valores x, y e z para cada indivíduo, da

seguinte maneira: x = 1, caso o tipo fundamental da impressão digital do indivíduo
for verticilo e x = 0, caso contrário; y = 1 se o tipo fundamental da impressão digital
do indivíduo for arco e y = 0, caso contrário; z = 1 se o indivíduo for mulher e z = 0
se for homem. Como resultado desse procedimento, formam-se três séries
estatísticas, respectivamente, X, Y e Z, cada uma com duzentas observações. A
partir dessas informações, julgue os itens a seguir.
( ) A mediana de X é superior a 0,8.
( ) A variância de Y está entre 0,10 e 0,15.
( ) A média da soma X + Y é igual a 1.
( ) A mediana do produto X × Z é menor que 0,025.
RESOLUÇÃO:
Observe que x é igual a 1 para todos os indivíduos cujo tipo de impressão for
verticilo. Veja que temos 35 mulheres e 35 homens com este tipo de impressão,
totalizando 70 pessoas. Assim, das 200 observações da variável aleatória X, temos
que 70 possuem o valor 1 e as demais 130 possuem o valor 0. Colocando estas
observações em ordem crescente, teríamos algo assim:
{ 0, 0, 0, 0, ..., 1, 1, 1}
Como temos n = 200 elementos, a mediana seria o termo da posição (n+1)/2,
isto é, o termo da posição “100,5”. Teríamos que calcular a média aritmética dos
termos da posição 100 e da posição 101, porém ambos são iguais a zero (afinal
temos 130 zeros). Logo, a mediana da distribuição X é igual a 0. Item ERRADO.

A variável Y possui valor igual a 1 em 30 casos (indivíduos com impressão do
tipo arco) e igual a 0 nos demais 170 casos. A variância pode ser calculada pela
fórmula:

2
n
1 n 
∑ Yi −  ∑ Yi 
2
n  i =1 
s 2 = i =1
n −1
n
Veja que a soma dos valores de Y, isto é, ∑ Y , é igual a 30 (pois temos 30
i =1
i
valores 1 e 170 valores 0). Da mesma forma, o somatório dos quadrados dos
n
valores de Y, isto é, ∑Y
i =1
i
2
, também é igual a 30, pois 12 = 1 e 02 = 0. Além disso,
temos n = 200 observações. Logo, a variância de Y é:
1
30 − ( 30 )
2
s2 = 200 = 0,128
200 − 1
Item CERTO.

Aqui temos uma variável K formada pela soma de cada elemento x da
distribuição X com o respectivo valor y da distribuição Y. Isto é, K = X + Y. Neste
caso, a média de K é:
K=
∑ K = ∑(X
i i + Yi )
=
∑ X + ∑Y
i i
n n n
n n
Já vimos que ∑ Yi = 30, e você pode observar que
i =1
∑X
i =1
i =70 (pois temos 70
valores iguais a 1 e os demais valores iguais a 0). Portanto,

30 + 70
K= = 0,5
200
Item ERRADO.

Neste item é definida uma variável K formada pela multiplicação de cada
elemento x da distribuição X pelo respectivo valor z da distribuição Z. Veja que z = 0
quando o indivíduo é homem, portanto a distribuição K terá pelo menos 100 valores
iguais a 0 (afinal a multiplicação de 0 por qualquer valor de x será sempre igual a 0).

Além disso, z = 1 para as mulheres. Dentre as mulheres, x = 1 apenas para aquelas
15 que possuem o tipo verticilo, portanto teremos 35 valores iguais a 1 para a
distribuição K (afinal 1 x 1 = 1). As demais 65 mulheres terão o valor de K igual a 0,
pois apesar de terem z = 1, elas possuem x = 0 (pois não são do tipo verticilo).
Desta forma, a variável K = X × Z é formada por 200 observações, das quais
35 possuem valor igual a 1 e 165 possuem valor igual a 0. Portanto, a mediana será
igual a 0, assim como vimos no primeiro item.
Item CERTO.
Resposta: E C E C
14. CESPE – Polícia Federal – 2004)
De acordo com um levantamento estatístico, a média das idades de um grupo de

presidiários é igual a 31 anos de idade. Nesse levantamento, os presidiários foram
classificados como A ou B, dependendo da sua condição psicossocial. Constatou-se
que a média das idades dos presidiários classificados como A é menor que a média
das idades dos presidiários classificados como B. A tabela acima apresenta
algumas medidas estatísticas obtidas por meio desse levantamento.
A partir das informações acima, julgue os itens que se seguem.
( ) O número de presidiários classificados como A é igual ao dobro do número de
presidiários classificados como B.
( ) O valor de v está entre 65 e 75.
( ) Os valores de x e u são, respectivamente, iguais a 19 e 51 anos de idade.
RESOLUÇÃO:
Seja a o número de presidiários classificados como A, e b o número de
presidiários classificados como B. Neste caso, a média do grupo inteiro poderia ser
calculada assim:

MédiaA × a + MédiaB × b
Média =
a+b
A tabela nos diz que Média = 31, MédiaA = 30 e MédiaB = 33. Portanto:
30 × a + 33 × b
31 =
a+b
31a + 31b = 30a + 33b
a = 2b
Portanto, é certo dizer que o número de presidiários classificados como A é
igual ao dobro do número de presidiários classificados como B. Item CORRETO.

Veja que “v” é a variância da união entre A e B, que é dada por:
Variância A × nA + VariânciaB × nB
Variância A∪ B =
n A + nB
Assim,
49 × nA + 100 × nB
v=
n A + nB
Como vimos no item acima, o número de elementos de A é o dobro do
número de elementos de B, ou seja, nA = 2nB. Portanto:
49 × nA + 100 × nB 49 × 2nB + 100 × nB
v= = = 66
n A + nB 2nB + nB
Item CORRETO.

Na tabela, x representa o valor mínimo entre todos os presidiários, que é
igual a 18 (pois há pelo menos 1 presidiário do grupo B que possui 18 anos). Da
mesma forma, u representa a maior idade dentre todas, que é igual a 52 anos. Item
ERRADO.
Resposta: C C E

A fim de planejar o orçamento de uma grande empresa para o próximo ano, um

analista selecionou uma amostra aleatória de 10 produtos (i) das empresas filiais e
anotou as despesas (X) e os faturamentos (Y) totais decorrentes desses produtos
(em R$ milhões). Os resultados por ele obtidos são mostrados na tabela acima.
Com base nessas informações, julgue os itens subsecutivos.
( ) A variância de X foi inferior à metade da média da variável X.

( ) A média das despesas X por produto foi igual a R$ 9,3 milhões.
( ) A estimativa do faturamento médio por produto foi superior a 8 vezes o valor da
despesa média por produto.
RESOLUÇÃO:
A variância é dada por:
2
n
1 n 
∑ X i
2
−  ∑ X
n  i =1 
i 
1
945 − ( 93)
2
s 2 = i =1 = 10 = 8,9
n −1 10 − 1
E a média é:
X=
∑X i
=
93
= 9, 3
n 10
Item ERRADO.

A média, já calculada no primeiro item, é:
X=
∑X i
=
93
= 9, 3
n 10
Item CORRETO.

A média de faturamento é:
Y=
∑Y i
=
780
= 78
n 10
Dividindo o faturamento médio por produto pela despesa média por produto
temos:
78
= 8,38 (maior que 8)
9, 3
Item CORRETO.
Resposta: E C C
16. CESPE – STM – 2011) Com relação a representações gráficas, julgue os itens:
( ) Um histograma é um gráfico que representa a dispersão tanto de variáveis
discretas quanto de contínuas.
( ) A partir do histograma mostrado na figura abaixo, é correto inferir que a
distribuição da variável X é simétrica.
RESOLUÇÃO:
Os histogramas são gráficos de colunas utilizados, em regra, para
representar variáveis discretas. Item ERRADO.


Uma distribuição é simétrica quando, a partir de um “eixo central”, ela se
desenvolve de maneira idêntica (ou muito parecida) para a direita e para a
esquerda. O histograma da figura não apresenta esta característica, sendo
assimétrico. Item ERRADO.
Resposta: E E
17. CESPE – STM – 2011) Considere o seguinte conjunto de dados composto por
cinco elementos: {82,93; 94,54; 98,40; 115,41; 123,07}.
Com base nesses dados, julgue os itens subsequentes acerca das medidas de
tendência central.
( ) Em uma distribuição de dados unimodal, se a média e a mediana forem iguais,
não é possível determinar o valor da moda se todos os dados não estiverem
disponíveis.
( ) A média do conjunto de dados em questão é 102,87 e a mediana é 98,40. Se o
valor 123,07 for alterado para 200, a média irá aumentar, mas a mediana continuará
sendo 98,40.
( ) Se o valor de um dos elementos do conjunto não for fornecido, esse valor pode
ser determinado se a média do conjunto for conhecida, mas não será possível obter
esse valor conhecendo-se apenas a mediana.
RESOLUÇÃO:
disponíveis.
ERRADO, pois é possível determinar o valor da moda ainda que algum valor
esteja faltando. Exemplificando, veja a seguinte distribuição: {1; 1; 1; 1; 3,74; 6; 6; 7;
7}. Ela possui média igual a 3,74 e mediana também igual a 3,74. Ainda que não
soubéssemos um dos valores, já seria possível determinar que a moda é igual a 1.
Exemplificando, se tivéssemos: {1; 1; 1; 1; 3,74; X; 6; 7; 7}, onde o X representa um
valor desconhecido, já poderíamos afirmar que a moda é igual a 1, independente do
valor que X venha a assumir.

Obs.: a banca anulou este item por considerar que a redação prejudicou o
julgamento objetivo.

sendo 98,40.
A média do conjunto {82,93; 94,54; 98,40; 115,41; 123,07} pode ser calculada
somando-se todos os elementos (total = 514,35) e dividindo-se pela quantidade de
elementos (5). Assim, obtém-se o valor 102,87. A mediana é o termo central. Como
n = 5, a mediana é o 3º termo, que é igual a 98,40.
Trocando-se o último valor por um número maior (200), a média naturalmente
vai aumentar, pois ela é influenciada por todos os elementos da distribuição. Já a
mediana não será alterada, pois ela continua sendo igual ao termo central, que
manteve-se em 98,40.
Item CORRETO.
Item CORRETO, pois se não conhecemos apenas um valor, é possível obtê-
lo sabendo-se a média, o número de termos e o valor de cada um dos demais
termos (ou da soma dos demais termos). Isto porque todos os termos entram no
cálculo da média:
Média =
∑X i
∑X = Média × n X 1 + X 2 + ... + X n = Média × n
i
n
Já a mediana é obtida apenas a partir do termo central (se o número de
termos é ímpar), ou da média aritmética dos termos centrais (se o número de
termos é par). Assim, em regra não é possível obter um termo desconhecido
conhecendo-se apenas a mediana (a menos que o termo buscado seja o termo
central).
Obs.: novamente a banca entendeu ser melhor anular este item devido à
redação confusa. Apresentei nesta aula pois em provas futuras a banca pode cobrar
o mesmo assunto, porém aperfeiçoando a redação, para não dar margem à novas
anulações.

Resposta: E C C
18. CESPE – STM – 2011) Com relação às medidas de dispersão, considerando

que X representa a média aritmética de um conjunto de dados {X1, X2, ..., Xn}, julgue
os itens que se seguem.
( ) A expressão que se segue permite calcular corretamente a variância amostral do
conjunto de dados.
RESOLUÇÃO:
Sabemos que a variância amostral pode ser definida assim:
2
n
1 n 
∑
i =1
X i
2
− ∑ i X
n  i =1 
s =
2
n −1
Fazendo algumas manipulações algébricas, temos:
2
n
1 n2  n 
∑
i =1
X i − × 2
× ∑ i X
n n 2  i =1 
s =
2
n −1
2
 n 
n
n 2  ∑ Xi 
∑
i =1
X i 2 − ×  i =1
n  n


 
s =
2  
n −1
( )
n 2
∑X i
2
− n× X
s =
2 i =1
n −1
1  n 2
Var ( X ) = s =
2
×  ∑ X i2 − n × X 
n − 1  i =1 

Item CORRETO.
Resposta: C
19. CESPE – TJ/DF – 2008)
A tabela acima apresenta a distribuição de freqüência absoluta das notas dadas por
125 usuários de um serviço público, em uma avaliação da qualidade do
atendimento. Considerando essas informações, julgue os próximos itens.
( ) A média, a moda e a mediana dos valores apresentados na tabela são superiores
a 2,8 e inferiores a 3,3.
( ) O desvio-padrão das notas apresentadas na tabela é superior a 1,1.
RESOLUÇÃO:
Para resolver esta questão, vamos calcular a média, moda, mediana e
desvio-padrão das notas da tabela. A tabela abaixo nos auxilia a efetuar o cálculo:
Nota (Xi) Frequência (fi) Xi x fi Frequências
acumuladas
(fac)
0 2 0 2
1 10 10 12
2 20 40 32
3 47 141 79
4 46 184 125
- ∑f i = 125 ∑X i × f i = 375 -

Logo, a média é:
X=
∑X × f i i
=3
∑f i
A moda é a nota que possui mais frequências. Na tabela, vemos que a moda
é igual a 3, que possui 47 repetições.
Como temos n = 125 (número ímpar) repetições, a mediana é o termo da
posição (n+1)/2 = (125+1)/2 = 63. Olhando a coluna das frequências acumuladas
(fac), veja que temos 32 frequências até a nota 2, e 79 frequências até a nota 3.
Logo, a posição 63 só pode estar na classe da nota 3. Assim, Mediana = 3.
Para obter o desvio-padrão, vamos inicialmente calcular a variância. Repare
que vamos calcular a variância amostral, e não populacional (pois os 125 usuários
do serviço público são apenas uma amostra do total de usuários do serviço). Para
uma tabela de frequências, a fórmula é:
n
∑[ f × ( X i i − X )2 ]
s2 = 1
n
∑f 1
i −1
Antes de usar a fórmula, vamos continuar preenchendo a mesma tabela:

Nota (Xi) Frequência (fi) Xi − X ( X i − X )2 fi × ( X i − X )2
0 2 -3 9 18
1 10 -2 4 40
2 20 -1 1 20
3 47 0 0 0
4 46 1 1 46
- ∑f i = 125 n
∑[ f × ( X
i i − X ) 2 ] = 124
1
Portanto,
n
∑[ f × ( X
i i − X )2 ]
124
s2 = 1
= =1
n
125 − 1
∑f 1
i −1
Desta forma, é CORRETO dizer que a média/mediana/moda estão entre 2,8

e 3,3, porém é ERRADO dizer que o desvio-padrão é superior a 1,1.

Resposta: C E
20. CESPE – CORREIOS – 2011) Julgue os itens seguintes, relacionados aos

conceitos de estatística.
( ) Escolaridade e número de filhos são exemplos de variáveis quantitativas

ordenável e discreta, respectivamente.
( ) Quando a variável é qualitativa, a única medida de tendência que se pode utilizar

é a moda.
( ) Variância, desvio padrão e coeficiente de variação são tipos diferentes de

medidas de dispersão.
( ) A característica fundamental de uma distribuição simétrica, como a normal e a t-

Student, é apresentar média, moda e mediana iguais.
( ) Define-se variável como o conjunto de resultados possíveis para uma

característica avaliada.
RESOLUÇÃO:

A variável “Escolaridade” pode assumir valores como: Nível Fundamental,

Nível Médio, Nível Superior, Pós Graduação etc. Trata-se, portanto, de uma variável
qualitativa, e não quantitativa. Isto já torna o item ERRADO.
Já a variável número de filhos é, de fato, quantitativa. Trata-se realmente de

uma variável discreta, uma vez que o número de filhos pode ser {0, 1, 2, 3 ...}, mas
não pode assumir qualquer valor entre 0 e 1, ou entre 1 e 2, por exemplo.

é a moda.
Vamos utilizar como exemplo a variável Escolaridade, que já vimos ser

qualitativa. Se, em uma amostra, sabemos que 5 pessoas tem nível fundamental, 10
tem nível médio, 15 tem nível superior e 1 tem pós graduação, quais medidas de
posição (ou tendência central) podemos calcular? Ora, descabido é calcular a

média, afinal não faz sentido somar 5 fundamental + 5 médio + 15 superior + 1 pós,
e muito menos dividir por qualquer coisa. O mesmo vale para a mediana, cujo
cálculo exige que trabalhemos com variáveis numéricas e que possam ser
ordenadas da menor para a maior. Já a moda é definida como sendo o valor que
mais se repete. Neste exemplo, claramente a moda é “nível superior”, que é o valor
que possui o maior número de freqüências. Item CORRETO.

CORRETO. As três medidas de dispersão, ou variabilidade, que estudamos

foram exatamente a variância, o desvio padrão e o coeficiente de variação. Elas
medem quão próximos ou quão dispersos/afastados encontram-se os dados de
determinada amostra ou população.

Veja abaixo um exemplo de distribuição simétrica que vimos nesta aula:
Repare que tanto a média, a moda e a mediana encontram-se na mesma

posição. Item CORRETO.


CORRETO. Considerando a característica “idade” das pessoas, definimos a
variável Idade como sendo os valores desta característica em uma determinada
amostra ou população.
Resposta: E C C C C
21. CESPE – CNPq – 2011)
Considerando a figura acima, que ilustra a função de densidade de probabilidade de

uma variável aleatória X, julgue o seguinte item.
( ) Infere-se do gráfico acima que a distribuição é assimétrica à direita e, portanto, o

valor médio de X é maior que a sua mediana.
RESOLUÇÃO:
Uma distribuição é considerada assimétrica à direita quando possui uma

concentração na parte esquerda e uma longa cauda estendendo-se para o lado
direito. É exatamente isto que ocorre na figura acima.
A concentração de resultados na parte esquerda da curva “puxa” a mediana

para este lado, isto é, a diminui. E a presença de valores mais altos ao longo da
cauda aumenta o valor da média, “puxando-a” para a direita, isto é, a aumenta. Por
isso a média é superior à mediana neste caso. Item CORRETO.
Resposta: C

22. CESPE – TRE/ES – 2011)
A tabela acima apresenta uma distribuição hipotética das quantidades de eleitores

que não votaram no segundo turno da eleição para presidente da República bem
como os números de municípios em que essas quantidades ocorreram. Com base
nessa tabela, julgue os itens seguintes, relativos à análise exploratória de dados.
( ) Considerando-se os três intervalos de classe centrais, é correto afirmar que a

distribuição dos dados da tabela acima é aproximadamente simétrica em torno da
média.
( ) A moda da distribuição se encontra no mesmo intervalo de classe que contempla

a mediana e a média.
( ) A média e a mediana do número de eleitores que não votaram estão entre 4.000
e 6.000.
( ) Na tabela de frequências, o uso de intervalos de classe permite concluir que a

variável em questão é contínua.
RESOLUÇÃO:

média.
Vamos representar graficamente os três intervalos de classe centrais:

Observe que, de fato, temos um gráfico simétrico. Isto poderia ser percebido
com a mera análise da tabela, afinal tanto à direita quanto à esquerda da classe
com 3000 frequências temos classes com 1000 frequências cada. Item CORRETO.

A classe modal, isto é, a classe com maior número de freqüências, é a de

4000-6000 eleitores, pois ela possui 3000 municípios. Para saber onde se
encontram a mediana e a média, vamos utilizar a tabela abaixo, que já apresenta os
pontos médios de cada intervalo e também as freqüências acumuladas.
Quantidade de Pontos médios dos Quantidade de Frequências

eleitores intervalos (PMi) municípios (fi) acumuladas (fac)
0-2000 1000 364 364
2000-4000 3000 1000 1364
4000-6000 5000 3000 4364
6000-8000 7000 1000 5364
8000-10000 9000 200 5564

Repare que temos n = 5564 frequências, número par. Portanto, a mediana é
a média aritmética entre os termos ao redor da “posição” (5564+1)/2 = 2782,5, isto
é, os 2782º e 2783º termos.
Analisando a coluna de freqüências acumuladas, vemos que na classe de

4000-6000 temos da 1365ª até a 4364ª freqüências, logo a mediana está nesta
classe.
A média é dada por:
Média =
∑ PM × f
i i
∑f i
1000 × 364 + 3000 × 1000 + 5000 × 3000 + 7000 × 1000 + 9000 × 200
Média = = 4882
5564
Assim, a média também pertence à classe 4000-6000. Item CORRETO.
e 6.000.
Como já vimos no item anterior, a mediana e a média encontram-se na

classe de 4000-6000 eleitores, portanto o item está CORRETO.

Apesar da tabela do enunciado ter utilizado intervalos de classe, repare que

as variáveis “número de eleitores” ou “número de municípios”, não são contínuas.
Afinal, é possível ter 20 eleitores, ou 21, mas não é possível ter 20,5 eleitores.
Trata-se de variáveis discretas. Isto torna o item ERRADO.
Porém atenção: também é possível utilizar intervalos para representar

variáveis contínuas!
Resposta: C C C E

23. CESPE – TRE/ES – 2011)
Com base na tabela acima, referente às eleições de 2010, que apresenta a

quantidade de candidatos para os cargos de presidente da República, governador
de estado, senador, deputado federal e deputado estadual/distrital, bem como a
quantidade de candidatos considerados aptos pela justiça eleitoral e o total de
eleitos para cada cargo pretendido, julgue os itens a seguir.
( ) O histograma é a representação gráfica ideal para a distribuição de frequências

do número de candidatos aptos segundo o cargo pretendido.
( ) A variável “cargo” classifica-se como uma variável qualitativa ordinal.
RESOLUÇÃO:

Recorde-se da nossa definição de histograma: gráfico de barras que

representa, no seu eixo horizontal, as classes de valores que uma variável pode
assumir, e em seu eixo vertical os valores das frequências de cada classe.
Entretanto, a variável “cargo” é qualitativa. Assim, por mais que possamos

ordenar os cargos do menor para o maior, não podemos mensurar a diferença entre
eles para dispor na escala horizontal do gráfico. É possível, sim, fazer um gráfico de
barras que represente a variável cargo, mas este gráfico NÃO é um histograma, que
representa apenas variáveis quantitativas. Item ERRADO.

CORRETO. A variável “cargo” é qualitativa, como já dissemos, e os seus

valores podem ser ordenados do menor para o maior (de deputado estadual/distrital
até presidente da república). Assim, esta variável é “ordinal”. Se não pudéssemos
ordenar, esta variável seria qualitativa nominal. Um exemplo é a variável “sexo das
pessoas”. Esta variável pode assumir dois valores qualitativos (masculino e
feminino), porém estes valores não podem ser colocados em uma ordem crescente.
Resposta: E C
24. CESPE – MS – 2010)
A figura acima apresenta os totais anuais de casos de febre hemorrágica da

dengue, de 1988 a 2008, em Fortaleza, cidade em que a doença foi confirmada pela
primeira vez em 1994. A partir de 1998, verifica-se a ocorrência anual da
enfermidade, iniciando em um patamar de baixa incidência (1998 a 2000) e
seguindo para um patamar elevado que varia de 44 a 254 casos, com exceção de
2004.
Secretaria Municipal da Saúde de Fortaleza. Plano de contingência para o
controle da dengue no município de Fortaleza em 2009, (com adaptações).
Com base nas informações acima, considerando que a variável X representa o total
anual de casos de febre hemorrágica da dengue em Fortaleza, julgue os itens a
seguir.

( ) A média aritmética de X no triênio 2001-2003 foi igual a 75% da média aritmética
de X no triênio 2005-2007.
( ) Considerando o período de 1988 a 2008, a moda da variável X foi igual a 254.
( ) De 1988 a 2008, a mediana amostral de X foi superior a 3.
( ) A figura apresentada é um histograma da variável X.
( ) Considerando-se as observações no período de 1995 a 1999, a variância

amostral de X foi igual a 3.
RESOLUÇÃO:

Considerando os anos de 2001, 2002 e 2003 a média do total de casos de

febre é:
60 + 44 + 166
Média2001−2003 = = 90
3
Já nos anos de 2005, 2006 e 2007 a média é:
119 + 123 + 118

Média2005−2007 = = 120
3
Como 90/120 = 0,75 = 75%, o item está CORRETO.
A moda é definida como o valor da variável X que possui o maior número de

frequências. 254 é o maior número de frequências, que ocorre no ano de 2008.
Portanto, a moda é 2008. Item ERRADO.
Listando em ordem crescente todos os valores de X, temos:
{0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 4, 6, 21, 44, 60, 118, 119, 123, 166, 254}

Ao todo, temos n = 21 termos, de modo que a mediana será o termo da
posição (21 + 1)/2 = 11. Na 11ª posição temos o valor x = 2. Portanto, a mediana é
igual a 2, sendo inferior a 3. Item ERRADO.
ERRADO. Observe que X não é uma variável aleatória como outra qualquer,
trata-se de uma variável conhecida como “série temporal”, isto é, uma série de
observações de um mesmo fenômeno (casos de febre) ordenados no tempo. Não
temos um histograma, que se caracterizaria pela existência de intervalos de classes.

De 1995 a 1999 as frequências de X foram {0, 0, 0, 4, 1}, tendo média igual a

1. Portanto, a variância amostral é:
(0 − 1) 2 + (0 − 1) 2 + (0 − 1) 2 + (4 − 1) 2 + (1 − 1) 2
Var =
5 −1
1+1+1+ 9 + 0
Var = =3
4
Item CORRETO.
Resposta: C E E E C
25. CESPE – ANTAQ - 2009)

Considerando a tabela acima, que apresenta a movimentação anual de cargas no
porto de Santos de 2003 a 2007, em milhões de toneladas/ano e associa as
quantidades de carga movimentadas para exportação e importação às variáveis X e
Y, respectivamente, julgue os itens subsequentes.
( ) A quantidade de carga movimentada para exportação em 2007 foi, pelo menos,

35% maior que a quantidade de carga movimentada para exportação em 2003.
( ) A média das diferenças X – Y no período mostrado foi superior a 25,5 milhões de

toneladas/ano.
( ) Nesse período, a mediana dos totais movimentados (X+Y) foi inferior a 70

milhões de toneladas.
( ) A variância amostral de Y foi, no período, inferior a 8 (toneladas/ano)2.
( ) O coeficiente de variação da distribuição dos valores de X é superior ao

coeficiente de variação da distribuição dos valores de Y.
( ) X e Y são variáveis qualitativas em escala ordinal.
( ) Historicamente, de 2003 a 2007, a quantidade exportada X foi, pelo menos, duas

vezes maior que a quantidade importada Y.
RESOLUÇÃO:

As exportações em 2007 somaram 54 milhões de toneladas, e em 2003

somaram 40 milhões. Como 54 / 40 = 1,35 = 100% + 35%, podemos dizer que as
exportações de 2007 foram 35% maiores que as de 2003. Item CORRETO.

toneladas/ano.
Efetuando a subtração X – Y para cada ano, obtemos os valores {20, 25, 28,
28, 27}, cuja média é:
20 + 25 + 28 + 28 + 27
Média = = 25, 6
5

Portanto, o item está CORRETO.

Colocando os valores X+Y em ordem crescente, temos {60, 67, 72, 76, 81}.
São n = 5 termos, de modo que a mediana é o termo da posição (5+1)/2 = 3. O
terceiro termo é igual a 72, sendo a mediana. Este valor é superior a 70 milhões de
toneladas, tornando o item ERRADO.
A média de Y é:
Média = (20 + 21 + 22 + 24 + 27) / 5 = 22,8
Assim, a variância amostral é dada por:
(20 − 22,8) 2 + (21 − 22,8)2 + (22 − 22,8)2 + (24 − 22,8)2 + (27 − 22,8)2
Var =
5 −1
( −2,8) + ( −1,8) + ( −0,8) + (1, 2)2 + (4, 2) 2
2 2 2
Var = = 7, 7
4
Item CORRETO. Obs.: tente resolver este item utilizando a fórmula da

variância que não necessita do cálculo prévio da média.

Já sabemos que Var(Y) = 7,7, e Média(Y) = 22,8. O seu desvio padrão é:
σ y = Var (Y ) = 7, 7

Deste modo, o coeficiente de variação de Y é dado por:
σy 7, 7
CV y = =
Média (Y ) 22,8
Antes de efetuar esta conta, vamos obter a expressão para o coeficiente de

variação de X. A média de X é:
Média(X) = (40 + 46 + 50 + 52 + 54)/ 5 = 48,4
A variância amostral de X é:
(40 − 48, 4)2 + (46 − 48, 4) 2 + (50 − 48, 4) 2 + (52 − 48, 4) 2 + (54 − 48, 4)2
Var = = 30,8
5 −1
O desvio padrão de X é:
σ x = Var ( X ) = 30,8
Deste modo, o coeficiente de variação de X é dado por:
σx 30,8
CVx = =
Média ( X ) 48, 4
Para saber qual dos coeficientes de variação é maior, podemos comparar o

quadrado de cada um deles (CV2), ao invés de tirar as raízes. Veja:

( CV ) 7, 7 7, 7
2
y = 2
= = 0,0148
22,8 519,84
30,8 30,8
( CVx ) = = = 0, 0131
2
2
48, 4 2342,56
Como o quadrado de CVy é maior que o quadrado de CVx, podemos dizer

também que CVy > CVx. Item ERRADO.
X e Y representam os valores importados e exportados, que são variáveis

quantitativas. Item ERRADO.

Vejamos novamente a tabela fornecida no enunciado:
Repare que, a cada ano, o valor de X é maior ou igual ao dobro de Y, sendo

igual apenas nos anos de 2003 e de 2007. Portanto, é correto dizer que X foi, pelo
menos, duas vezes maior que Y neste período. Item CORRETO.
Resposta: C C E C E E C

26. CESPE – Banco do Brasil – 2002)
Com base nas informações acima, relativas ao canal do Panamá, julgue os itens
seguintes.
( ) O desvio-padrão da série numérica formada pelos totais de toneladas

movimentadas pelos países listados no gráfico I seria maior se dela fosse excluído o
valor correspondente aos EUA.
( ) No período mostrado no gráfico II, a mediana da série numérica formada pelos

percentuais de cargas destinadas ao Brasil ou dele originadas, que passaram pelo
canal do Panamá, é maior que a moda dessa série.
RESOLUÇÃO:

A carga dos EUA é aquela que visivelmente mais destoa das demais. Ao
retirá-la do gráfico, restariam valores que são mais próximos entre si, isto é, menos
dispersos. Portanto, a variância e o desvio padrão diminuiriam.
Item ERRADO.

Colocando os valores em ordem crescente, temos:
{1,3%; 1,4%; 1,4%; 1,5%; 1,8%; 1,9%}
A moda é o valor 1,4%, pois este é o único com mais de uma frequência.
Como temos n = 6 termos, a mediana é a média aritmética dos termos em torno da
posição (6+1)/2 = 3,5, isto é, a média entre o 3º e o 4º valores. Assim,
1, 4% + 1,5%
Mediana = = 1, 45%
2
Portanto, Mediana > Moda, conforme o enunciado. Item CORRETO.
Resposta: E C
BB lucra mais de R$ 1 bilhão
no 1.º semestre de 2003
O lucro líquido do BB no 1.º semestre de 2003 foi de R$ 1.079 milhões, valor 30%
superior ao registrado no 2.º semestre de 2002. Esse resultado deve-se à expansão
da base de clientes para 16,7 milhões e ao aumento das receitas de serviços e
controle de custos. Os principais destaques do período estão relacionados a seguir.

# O patrimônio líquido do BB totalizou R$ 10,2 bilhões e os ativos totais, R$ 204
bilhões, registrando-se, em relação ao 1.º semestre de 2002, crescimentos de 36%
e 20%, respectivamente.
# De 1.º/7/2002 a 30/6/2003, o BB aumentou significativamente o seu número de

clientes, tanto clientes pessoa física quanto pessoa jurídica. A evolução do número
de clientes do BB é mostrada no gráfico a seguir, em que os valores referem-se ao

final de cada trimestre correspondente.
# A carteira de crédito cresceu 20% nos primeiros seis meses de 2003, atingindo o
montante de R$ 72 bilhões. Merecem destaque as operações relacionadas ao
agronegócio, que, nesse período, cresceram 65%.
# Para a agricultura familiar e os micro e pequenos produtores rurais foram

concedidos R$ 659 milhões de crédito com recursos do PRONAF, PROGER Rural e
Banco da Terra e Reforma Agrária.
# Nos seis primeiros meses de 2003, as operações do proex-financiamento

alavancaram as exportações em US$ 112,8 milhões, contemplando 170
exportadores, sendo 140 de pequeno ou médio porte.
# De 1.º/1/2003 a 30/6/2003, as captações de mercado totalizaram R$ 140 bilhões,

divididas entre depósitos à vista, depósitos a prazo, depósitos em caderneta de
poupança, depósitos interfinanceiros e captações no mercado aberto.
Desses, R$ 20 bilhões foram depósitos à vista e R$ 25 bilhões foram depósitos em

cadernetas de poupança. O montante captado em depósitos a prazo correspondeu
a 10 vezes o captado como depósitos interfinanceiros, enquanto as captações no
mercado aberto totalizaram 4/5 do montante captado em depósitos a prazo.
Internet: <http://www.bb.com.br>. Acesso em ago./2003 (com adaptações).

Acerca das informações apresentadas no texto acima e dos temas a ele correlatos,
julgue os itens a seguir.
( ) No primeiro semestre de 2003, a média diária de obtenção de novos clientes no

BB foi inferior a 5.000.
( ) A moda e a mediana da seqüência numérica formada pelo número de clientes

pessoa jurídica do BB em cada final de trimestre representado no gráfico são iguais
RESOLUÇÃO:

Veja que aqui não foi feita distinção entre clientes pessoa física e pessoa
jurídica, portanto devemos soma-los para efetuar a análise.
Como pode ser visto no gráfico, ao final de 2002 (ou 4T02), o banco possuía
15,4 milhões de clientes. E, ao final do primeiro semestre de 2003 (ou 2T03), o
número de clientes chegou a 16,7 milhões.
Assim, houve um acréscimo de 16,7 – 15,4 = 1,3 milhões de clientes no

semestre. Considerando que o semestre possui cerca de 182 dias, a média de
novos clientes por dia foi aproximadamente:
Média = 1.300.000 / 182 = 7.142
Este número é superior a 5.000, tornando o item ERRADO.

Colocando os dados em ordem crescente, temos:
{0,9; 1,0; 1,0; 1,0; 1,1}
A moda claramente é igual a 1,0, pois este valor possui 3 repetições,

enquanto os demais possuem apenas uma cada.

A mediana destes n = 5 termos é o termo da posição (5+1)/2 = 3. O 3º termo
é igual a 1,0. Assim, a mediana e a moda possuem o mesmo valor. Item
CORRETO.
Resposta: E C
Obs.: você reparou que NÃO foi preciso ler o texto para resolver esses dois itens?
Bastava dar uma “passada de olho”. Preste atenção nisso, pois quem leu o texto
inteiro perdeu um tempo precioso!

3. LISTA DE EXERCÍCIOS RESOLVIDOS
1. CESPE – SERPRO – 2008) Uma empresa de consultoria realizou um
levantamento estatístico para obter informações acerca do tempo (T) gasto por
empregados de empresas brasileiras na Internet em sítios pessoais durante suas
semanas de trabalho. Com base em uma amostra aleatória de 900 empregados de
empresas brasileiras com um regime de trabalho de 44 h semanais, essa empresa
de consultoria concluiu que cada empregado gasta, em média, 6 h semanais na
Internet em sítios pessoais durante uma semana de trabalho; 50% dos empregados
gastam 5 h semanais ou mais na Internet em sítios pessoais durante uma semana
de trabalho; e o desvio padrão do tempo gasto na Internet em sítios pessoais
durante o regime de trabalho é igual a 4 h semanais por empregado.
Com base nas informações da situação hipotética acima descrita, julgue os itens a
seguir.

a 10 h semanais.
h/semana.
( ) Considerando que o tempo útil semanal do regime de trabalho seja a diferença U
= 44 – T (em horas), o desvio padrão de U será inferior a 5 h.
2. CESPE – INSS – 2008)

De acordo com dados do IBGE, em 2007, 6,4% da população brasileira tinha 65

anos de idade ou mais e, em 2050, essa parcela, que constitui o grupo de idosos,
corresponderá a 18,8% da população. Com base nessas informações e nas
apresentadas na tabela acima, julgue os itens seguintes.
3. CESPE – MEC – 2009) Merendas escolares demandadas em 10 diferentes

escolas:
200, 250, 300, 250, 250, 200, 150, 200, 150, 200.
Com base nessas informações, julgue os próximos itens.

225.

superior a 50.
4. CESPE – MEC – 2009) Em uma escola, há 2 mil estudantes distribuídos em 100

turmas: 50 são do turno matutino e as outras 50, do turno vespertino. A figura
abaixo representa a distribuição percentual desses estudantes segundo o turno em
que estão matriculados.
A média das idades dos estudantes matriculados no turno vespertino é 10%

superior à média das idades dos estudantes do turno matutino. A variância das
idades daqueles que estudam no turno matutino ( σ M 2 ) é igual à variância das
idades dos estudantes do turno vespertino ( σ V 2 ). Com base nessas informações,
julgue os itens que se seguem.
matutino.
5. CESPE – CEHAP/PB – 2009)

O gráfico acima mostra a distribuição percentual de veículos de acordo com suas

velocidades aproximadas, registradas por meio de um radar instalado em uma
avenida. A velocidade média aproximada, em km/h, dos veículos que foram
registrados pelo radar foi
A) inferior a 40.
B) superior a 40 e inferior a 43.
C) superior a 43 e inferior a 46.
D) superior a 46.
Texto para as 2 questões seguintes:

O custo médio nacional para a construção de habitação com padrão de acabamento
normal, segundo levantamento realizado em novembro de 2008, foi de R$ 670,00
por metro quadrado, sendo R$ 400,00/m2 relativos às despesas com materiais de
construção e R$ 270,00/m2 com mão-de-obra. Nessa mesma pesquisa, os custos
médios regionais apontaram para os seguintes valores por metro quadrado: R$
700,00 (Sudeste), R$ 660,00 (Sul), R$ 670,00 (Norte), R$ 640,00 (Centro-Oeste) e
R$ 630,00 (Nordeste).
Sistema Nacional de Pesquisa de Custos e Índices da Construção
C i v i l. S I NA P I / I BG E , n o v . / 2 0 0 8 ( c o m a d a p t a ç õ e s ) .
6. CESPE – CEHAP/PB – 2009) Com base nas informações apresentadas no texto,

assinale a opção correta.

7. CESPE – CEHAP/PB – 2009) O desvio padrão dos custos médios regionais por
metro quadrado foi
A) inferior a R$ 30,00.
B) superior a R$ 30,01 e inferior a R$ 40,00.

C) superior a R$ 40,01 e inferior a R$ 50,00.
D) superior a R$ 50,01
8. CESPE – ABIN – 2010) Considere que um estudo tenha sido realizado para
estimar a média das idades dos empregados de determinado segmento de
empresas, e que, na ocasião em que o estudo foi realizado, o tamanho da
população de funcionários era N = 5.000 funcionários. Essa população foi
estratificada em três grupos de tamanhos N1 = 1.000, N2 = 1.500 e N3 = 2.500. Da
população de funcionários, foi retirada uma amostra aleatória estratificada de
tamanho n = 100 com alocação proporcional ao tamanho dos estratos.
Considerando que o quadro acima mostra os resultados do estudo hipotético em

apreço, julgue os itens subsecutivos.
( ) A estimativa da média populacional das idades foi igual a 44 anos.

9. CESPE – ABIN – 2010)
Considerando que o diagrama de ramos-e-folhas acima mostra a distribuição das

idades (em anos) dos servidores de determinada repartição pública, julgue os
próximos itens.
( ) O primeiro quartil e o terceiro quartil são, respectivamente, 34 e 46 anos de
idade.
( ) A mediana das idades dos servidores é igual a 39,5 anos.
10. CESPE – EBC – 2011)
Com base nos dados do quadro acima, em que se demonstra a distribuição de

frequência das receitas de todas as empresas de uma cidade, julgue os itens a
seguir.
de 85%.
11. CESPE – TJ/ES – 2011) Julgue os itens que se seguem, a respeito de análise
de dados discretos.
Em uma amostra x1, x2, x3, ..., xn, em que xi ∈ N e n é ímpar, a mediana é um
número inteiro.

Considere que determinado fabricante classifique suas embalagens de acordo com

a capacidade de armazenamento unitário (c), em kg, de determinado produto — por
exemplo, a embalagem do tipo 10 permite armazenar mais de 9 e até 10 kg do
produto. Com base nessas informações e na tabela acima, que mostra a distribuição
dos dez tipos de embalagens e a demanda observada em março de 2011 para cada
tipo, julgue os itens que se seguem.

superiores a 2 kg.
13. CESPE – Polícia Federal – 2004) O ser humano tem impressos nos dedos das
mãos pelo menos quatro desenhos diferentes. Embora pessoas diferentes tenham
sempre digitais diferentes, esses desenhos formam padrões conhecidos como tipos
fundamentais de impressões digitais. Há raras exceções a essa regra de
classificação. Por isso, essa regra é utilizada para a identificação de uma pessoa.
Um perito, observando os dedos indicadores direitos de 200 indivíduos, obteve a
seguinte distribuição dos tipos fundamentais, segundo o gênero (homem/mulher).

No estudo desse perito, foram associados valores x, y e z para cada indivíduo, da

seguinte maneira: x = 1, caso o tipo fundamental da impressão digital do indivíduo
for verticilo e x = 0, caso contrário; y = 1 se o tipo fundamental da impressão digital
do indivíduo for arco e y = 0, caso contrário; z = 1 se o indivíduo for mulher e z = 0
se for homem. Como resultado desse procedimento, formam-se três séries
estatísticas, respectivamente, X, Y e Z, cada uma com duzentas observações. A
partir dessas informações, julgue os itens a seguir.
14. CESPE – Polícia Federal – 2004)
De acordo com um levantamento estatístico, a média das idades de um grupo de

presidiários é igual a 31 anos de idade. Nesse levantamento, os presidiários foram
classificados como A ou B, dependendo da sua condição psicossocial. Constatou-se
que a média das idades dos presidiários classificados como A é menor que a média
das idades dos presidiários classificados como B. A tabela acima apresenta
algumas medidas estatísticas obtidas por meio desse levantamento.
A partir das informações acima, julgue os itens que se seguem.

A fim de planejar o orçamento de uma grande empresa para o próximo ano, um

analista selecionou uma amostra aleatória de 10 produtos (i) das empresas filiais e
anotou as despesas (X) e os faturamentos (Y) totais decorrentes desses produtos
(em R$ milhões). Os resultados por ele obtidos são mostrados na tabela acima.
Com base nessas informações, julgue os itens subsecutivos.

16. CESPE – STM – 2011) Com relação a representações gráficas, julgue os itens:

17. CESPE – STM – 2011) Considere o seguinte conjunto de dados composto por
cinco elementos: {82,93; 94,54; 98,40; 115,41; 123,07}.
Com base nesses dados, julgue os itens subsequentes acerca das medidas de
tendência central.
disponíveis.
sendo 98,40.
18. CESPE – STM – 2011) Com relação às medidas de dispersão, considerando

que X representa a média aritmética de um conjunto de dados {X1, X2, ..., Xn}, julgue
os itens que se seguem.
( ) A expressão que se segue permite calcular corretamente a variância amostral do
conjunto de dados.

19. CESPE – TJ/DF – 2008)
A tabela acima apresenta a distribuição de freqüência absoluta das notas dadas por
125 usuários de um serviço público, em uma avaliação da qualidade do
atendimento. Considerando essas informações, julgue os próximos itens.
( ) A média, a moda e a mediana dos valores apresentados na tabela são superiores
a 2,8 e inferiores a 3,3.
( ) O desvio-padrão das notas apresentadas na tabela é superior a 1,1.
20. CESPE – CORREIOS – 2011) Julgue os itens seguintes, relacionados aos

conceitos de estatística.


é a moda.



21. CESPE – CNPq – 2011)
Considerando a figura acima, que ilustra a função de densidade de probabilidade de

uma variável aleatória X, julgue o seguinte item.
( ) Infere-se do gráfico acima que a distribuição é assimétrica à direita e, portanto, o

valor médio de X é maior que a sua mediana.
22. CESPE – TRE/ES – 2011)

A tabela acima apresenta uma distribuição hipotética das quantidades de eleitores
que não votaram no segundo turno da eleição para presidente da República bem
como os números de municípios em que essas quantidades ocorreram. Com base
nessa tabela, julgue os itens seguintes, relativos à análise exploratória de dados.

média.

e 6.000.

23. CESPE – TRE/ES – 2011)
Com base na tabela acima, referente às eleições de 2010, que apresenta a

quantidade de candidatos para os cargos de presidente da República, governador
de estado, senador, deputado federal e deputado estadual/distrital, bem como a

quantidade de candidatos considerados aptos pela justiça eleitoral e o total de
eleitos para cada cargo pretendido, julgue os itens a seguir.

24. CESPE – MS – 2010)
A figura acima apresenta os totais anuais de casos de febre hemorrágica da

dengue, de 1988 a 2008, em Fortaleza, cidade em que a doença foi confirmada pela
primeira vez em 1994. A partir de 1998, verifica-se a ocorrência anual da
enfermidade, iniciando em um patamar de baixa incidência (1998 a 2000) e
seguindo para um patamar elevado que varia de 44 a 254 casos, com exceção de
2004.
Secretaria Municipal da Saúde de Fortaleza. Plano de contingência para o
controle da dengue no município de Fortaleza em 2009, (com adaptações).
Com base nas informações acima, considerando que a variável X representa o total
anual de casos de febre hemorrágica da dengue em Fortaleza, julgue os itens a
seguir.



25. CESPE – ANTAQ - 2009)
Considerando a tabela acima, que apresenta a movimentação anual de cargas no

porto de Santos de 2003 a 2007, em milhões de toneladas/ano e associa as
quantidades de carga movimentadas para exportação e importação às variáveis X e
Y, respectivamente, julgue os itens subsequentes.


toneladas/ano.




Com base nas informações acima, relativas ao canal do Panamá, julgue os itens
seguintes.



BB lucra mais de R$ 1 bilhão
no 1.º semestre de 2003
O lucro líquido do BB no 1.º semestre de 2003 foi de R$ 1.079 milhões, valor 30%
superior ao registrado no 2.º semestre de 2002. Esse resultado deve-se à expansão
da base de clientes para 16,7 milhões e ao aumento das receitas de serviços e
controle de custos. Os principais destaques do período estão relacionados a seguir.
# O patrimônio líquido do BB totalizou R$ 10,2 bilhões e os ativos totais, R$ 204

bilhões, registrando-se, em relação ao 1.º semestre de 2002, crescimentos de 36%
e 20%, respectivamente.
# De 1.º/7/2002 a 30/6/2003, o BB aumentou significativamente o seu número de

clientes, tanto clientes pessoa física quanto pessoa jurídica. A evolução do número
de clientes do BB é mostrada no gráfico a seguir, em que os valores referem-se ao

final de cada trimestre correspondente.
# A carteira de crédito cresceu 20% nos primeiros seis meses de 2003, atingindo o
montante de R$ 72 bilhões. Merecem destaque as operações relacionadas ao
agronegócio, que, nesse período, cresceram 65%.
# Para a agricultura familiar e os micro e pequenos produtores rurais foram

concedidos R$ 659 milhões de crédito com recursos do PRONAF, PROGER Rural e
Banco da Terra e Reforma Agrária.
# Nos seis primeiros meses de 2003, as operações do proex-financiamento

alavancaram as exportações em US$ 112,8 milhões, contemplando 170
exportadores, sendo 140 de pequeno ou médio porte.

# De 1.º/1/2003 a 30/6/2003, as captações de mercado totalizaram R$ 140 bilhões,
divididas entre depósitos à vista, depósitos a prazo, depósitos em caderneta de
poupança, depósitos interfinanceiros e captações no mercado aberto.
Desses, R$ 20 bilhões foram depósitos à vista e R$ 25 bilhões foram depósitos em

cadernetas de poupança. O montante captado em depósitos a prazo correspondeu
a 10 vezes o captado como depósitos interfinanceiros, enquanto as captações no
mercado aberto totalizaram 4/5 do montante captado em depósitos a prazo.
Internet: <http://www.bb.com.br>. Acesso em ago./2003 (com adaptações).
Acerca das informações apresentadas no texto acima e dos temas a ele correlatos,
julgue os itens a seguir.



4. GABARITO
01 CEEC 02 CC 03 EE 04 CCC 05 C 06 B 07 A
08 E 09 EC 10 EC 11 C 12 EECCEEE 13 ECEC 14 CCE
15 ECC 16 EE 17 ECC 18 C 19 CE 20 ECCCC 21 C
22 CCCE 23 EC 24 CEEEC 25 CCECEEC 26 EC 27 EC

Estatística descritiva: gráficos, tabelas e medidas

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estatística descritiva: gráficos, tabelas e medidas

Transféré par

Droits d'auteur :

Formats disponibles

NOÇÕES DE ESTATÍSTICA P/ Polícia Civil-DF

TEORIA E EXERCÍCIOS COMENTADOS

AULA 03: ESTATÍSTICA

Estatística descritiva e análise exploratória de dados: gráficos, diagramas, tabelas,

1.1.1 Conceitos introdutórios. Variáveis aleatórias.

- Censo: quando efetuamos o Censo de uma população, analisamos todos os

Prof. Arthur Lima www.estrategiaconcursos.com.br 1

- Amostra: em muitos casos é inviável, custoso ou desnecessário, observar

- Variável: Veja que, em todos os exemplos dados, o nosso interesse é

Prof. Arthur Lima www.estrategiaconcursos.com.br 2

- Observação: trata-se do valor da variável para um determinado membro da

Prof. Arthur Lima www.estrategiaconcursos.com.br 3

Note que na coluna da esquerda colocamos as categorias de valores que a

Prof. Arthur Lima www.estrategiaconcursos.com.br 4

Classe Frequências (Fi)

Prof. Arthur Lima www.estrategiaconcursos.com.br 5

A coluna da direita exprime o número de indivíduos que se encontram naquela

Portanto, podemos concluir que 32,50% dos indivíduos observados possuem

Prof. Arthur Lima www.estrategiaconcursos.com.br 6

1.1.3 Gráficos e diagramas

O histograma das frequências de cada classe seria assim:

Prof. Arthur Lima www.estrategiaconcursos.com.br 7

Este gráfico de freqüências acumuladas acima, onde ligamos os pontos

Prof. Arthur Lima www.estrategiaconcursos.com.br 8

Frequências relativas acumuladas (Frc) 120%

Observe agora o seguinte Histograma, relativo à observação das idades dos

Note que esse gráfico possui um pico na classe de 30 a 40 anos, e à medida

Prof. Arthur Lima www.estrategiaconcursos.com.br 9

Já o histograma abaixo apresenta um caso de assimetria à esquerda

1.2 Medidas descritivas (posição, dispersão, assimetria e curtose)

Prof. Arthur Lima www.estrategiaconcursos.com.br 10

Veja que precisaremos somar as alturas de todos os indivíduos observados,

Soma = 1,50x15 + 1,51x5 + 1,53x4 + 1,57x2 + 1,60x10 + 1,63x8 + 1,65x1 + 1,71 x

Portanto, a fórmula para o cálculo da média de uma variável aleatória X é:

Prof. Arthur Lima www.estrategiaconcursos.com.br 11

Nessas fórmulas, Xi representa cada um dos valores que a variável X (ex.:

Vejamos algumas propriedades relativas à média de um conjunto de dados

Prof. Arthur Lima www.estrategiaconcursos.com.br 12

Observe que temos 81 dados (acrescentei um a mais na altura 1,83m). Além

Prof. Arthur Lima www.estrategiaconcursos.com.br 13

Muitas questões de concurso costumam exigir que o aluno conheça o método

Prof. Arthur Lima www.estrategiaconcursos.com.br 14

Classe Frequências (Fi) Frequências absolutas

1º passo: calcular a divisão n/2, onde n é o número total de frequências, obtendo a

Em nosso exemplo, n = 80 indivíduos, portanto a posição da mediana é 80/2

2º passo: identificar a classe onde se encontra a mediana

Observe a coluna de frequências acumuladas. Veja que o elemento da

3º passo: montar a proporção entre as frequências acumuladas e os limites da

Prof. Arthur Lima www.estrategiaconcursos.com.br 15

- a frequência da mediana (40) com o valor da mediana (X), que buscamos;

Feito isso, basta montar a proporção abaixo:

freq superior - freq mediana valorsuperior - valormediana

Neste exemplo, teríamos:

Para finalizar o estudo da Mediana, note que ela é única para um

Prof. Arthur Lima www.estrategiaconcursos.com.br 16

Para calcular a moda, você precisará seguir os seguintes passos:

Prof. Arthur Lima www.estrategiaconcursos.com.br 17

Conhecendo a média, mediana e moda de uma amostra, podemos

Prof. Arthur Lima www.estrategiaconcursos.com.br 18

Você não precisa decorar essa tabela. Inicialmente, veja um exemplo de

Quanto às distribuições assimétricas, basta entender que uma curva com

Prof. Arthur Lima www.estrategiaconcursos.com.br 19