Vous êtes sur la page 1sur 35

UNIVERSIDADE DE CAXIAS DO SUL

Professores:
Adriana Speggiorin
adrianaspegg@hotmail.com
Andr Mauro dos Santos de Espndola

Caxias do Sul, 2014.

PREZADO(A) ALUNO(A)

Este material de aula, por ns organizado, no tem a pretenso de ser


o substituto de um livro. O material um roteiro de parte do contedo
que veremos durante as aulas do semestre.
Sempre que necessrio voc deve recorrer a outras fontes
bibliogrficas.

Professora Adriana
Professor Andr

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

CAPTULO 1- INTRODUO

INTRODUO

A palavra estatstica provm do latim status, que significa estado. A primeira utilizao da
estatstica envolvia compilaes de dados e grficos que descreviam vrios aspectos de um estado ou
pas. Tem-se notcia de que cerca de 2.000 a.C. os chineses recenseavam sua populaes agrcolas.
Em 1662, John Graunt publicou informes estatsticos sobre nascimentos e mortes. O trabalho de
Graunt foi secundado por estudos de mortalidade e taxas de morbidade, tamanho de populaes,
rendas e taxas de desemprego. As famlias, os governos e as empresas se apiam largamente em
dados estatsticos. Assim que as taxas de desemprego, de inflao, os ndices do consumidor, as
taxas de natalidade e mortalidade so calculadas cuidadosamente a intervalos regulares, e seus
resultados so utilizados por empresrios para tomarem decises que afetam a futura contratao de
empregados, nveis de produo e expanso para novos mercados.
A coleta, o processamento, a interpretao e a apresentao de dados numricos pertencem
todos ao domnio da estatstica.
O CRESCIMENTO DA ESTATSTICA MODERNA
So vrias as razes para o desenvolvimento acentuado do objetivo da estatstica e da
necessidade de estud-la, nesses ltimos cinquenta anos. Uma delas a abordagem crescentemente
quantitativa utilizada em todas as cincias, na engenharia e em muitas outras atividades que afetam
diretamente nossas vidas. Isto inclui o uso de tcnicas matemticas na avaliao de controles de
poluio, no planejamento de inventrios, na anlise de problemas de trfego, no estudo dos efeitos
de vrios remdios, na avaliao de tcnicas de ensino, na anlise do comportamento competitivo de
administradores e governos, no estudo de dietas e longevidade, e assim por diante. Nossa capacidade
de lidar com informaes numricas aumentou enormemente com o advento de poderosos
computadores. Muitos tipos de computadores so tambm econmicos, possibilitando a execuo por
pequenas empresas, estudantes de universidade e at mesmo de cursos secundrios, de trabalhos
sofisticados.
A outra razo que a quantidade de dados coletados, processados e apresentados ao pblico,
por uma razo ou outra, aumentou alm de qualquer limite imaginvel; julgar que parte constitui boa
estatstica e que parte m estatstica fica a critrio do leitor. Para exercer vigilncia, torna-se
necessrio um nmero cada vez maior de pessoas que participem da coleta dos dados, da sua anlise
e, o que igualmente importante, de todo o planejamento preliminar. Sem este ltimo, difcil
imaginarmos os erros que podero ocorrer na compilao dos dados estatsticos. Os resultados de
custosas pesquisas podem tornar-se inteis, se as questes so ambguas ou formuladas
incorretamente, se so endereadas a pessoas erradas, no lugar errado e em momento inadequado.

A ESTATSTICA uma Cincia que fornece mtodos para a coleta, organizao, descrio,
anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.

Caracterstica importante da estatstica o uso de modelos. Estes so verses simplificadas


(abstraes) de algum problema ou situao reais. A caracterstica fundamental dos modelos o fato
reduzirem situaes complexas a formas mais simples e mais compreensveis, focalizando nossa
ateno apenas em alguns detalhes de uma dada situao.

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

VARIVEIS
A cada fenmeno corresponde um nmero de resultados possveis. Assim, por exemplo:
- para o fenmeno 'sexo' so 2 os resultados possveis;
- o nmero de crianas em uma famlia pode ser expresso por nmeros naturais:
0, 1, 2 , ...,n;
- para o fenmeno 'estatura' temos uma situao diferente, pois os resultados podem tomar
um nmero infinito de valores numricos dentro de um intervalo (depende da preciso da
medida).
Logo
Varivel um smbolo, como x, y, z, t, que pode assumir qualquer valor de um conjunto de
resultados possveis de um fenmeno.
ou

Varivel toda a caracterstica ou condio que pode ser mensurada ou observada.

A Varivel qualitativa
Quando uma caracterstica ou varivel no numrica. Aquelas que apresentam como possveis
realizaes uma qualidade (ou atributo) do indivduo pesquisado. As variveis qualitativas podem ser
classificadas como:
a) nominal, para a qual no existe nenhuma ordenao possvel; e
b) ordinal, para a qual existe uma ordem nos seus resultados.
Exemplos de variveis qualitativas:
- cor de um objeto;
- religio;
- naturalidade;
- cor dos olhos;
- faixa etria ( infncia, adolescncia, adulto, velho);
- classe social (baixa, mdia, alta).
Quando os dados so qualitativos, o interesse encontra-se, normalmente, na quantidade ou na
proporo de cada categoria em relao a um todo.
Exemplo: 23% das pessoas preferem carro de cor branca.
B Varivel quantitativa
Quando a varivel tem valor numrico mensurada com unidade.
Exemplos de variveis quantitativas:
- quantidade de alunos por sala de aula.
- nmero de aes de uma determinada empresa;
- tempo de durao de uma bateria de telefone celular.
As variveis quantitativas podem ser
a) discretas: so as que podem assumir apenas determinados valores.
Exemplos: - nmero de juntas defeituosas.
- nmero de passageiros em nibus de Caxias do Sul a Porto Alegre.

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

b) contnuas: so as que podem assumir qualquer valor dentro de uma determinada faixa de
valores, e representam uma medida (em qualquer grau de preciso). Na prtica, entretanto,
os mecanismos de medio tm preciso limitada, tal que os dados coletados de variveis
contnuas so necessariamente discretos.
Exemplos: - volume de ar contido num ambiente fechado;
- tempo de voo entre duas cidades;
- peso (massa).
POPULAO E AMOSTRA
Estatstica no interessa concluir a respeito de indivduos isoladamente observados, mas sim
de grupos ou conjuntos, porque seu objetivo o estudo da chamada populao.
Populao consiste na totalidade de unidades de observao a partir das quais se deseja
tomar uma deciso. Tambm chamada de universo.
Se a populao pequena, razovel observar toda ela. Todavia, examinar a populao
inteira nem sempre vivel. Por esse motivo, o estudo estatstico inicia-se com a coleta de parte de
uma populao, denominada amostra, constituda de um nmero finito de unidades de observao e
que devem ter as mesmas caractersticas da populao.
CENSO uma coleo de dados relativos a todos os elementos de uma populao.
No ambiente das cincias exatas, os dados quase sempre so uma amostra que foi
selecionada a partir de alguma populao. Geralmente esses dados so coletados de uma das duas
formas a seguir:
- estudo observacional os dados so obtidos medida que se tornam disponveis.
Exemplo: Medir e registrar o desempenho de um processo de fabricao de peas automotivas.
- experimento planejado observa e registra dados onde so feitas variaes propositais nas
variveis controlveis de algum processo
Exemplo: Medir e registrar concentrao de certo componente qumico a partir de avriaes na
temperatura de uma reao qumica.
ARREDONDAMENTO DE DADOS
Muitas vezes necessrio ou conveniente suprimir unidades inferiores s de determinada
ordem. Essa tcnica chamada arredondamento de dados.
1) Quando o primeiro algarismo a ser abandonado 0, 1, 2, 3 ou 4, fica inalterado o ltimo algarismo
a permanecer.
Exemplos: a) 92,24 passa a 92,2
b) 5,6254 passa a 5,625 (para a preciso de milsimos)
c) 5,6254 passa a 5,6 (para a preciso de dcimos)

2) Quando o primeiro algarismo a ser abandonado 5, 6, 7, 8 ou 9, aumenta-se de uma unidade o


algarismo a permanecer.
Exemplos: a) 13,67 passa a 13,7
d) 2,352 passa a 2,4

Adriana Speggiorin e Andr Espindola

b) 2,99 passa a 3,0


e) 25,6501 passa a 25,7

c) 41,08 passa a 41,1


f) 24,75 passa a 24,8

Probabilidade e Estatstica

Observaes
1) No devemos fazer arredondamentos sucessivos.
Exemplo: 17,3452 passa a 17,3 e no a 17,35 e por fim a 17,4
Se tivermos necessidade de um novo arredondamento, fica recomendada a volta aos dados originais.
2) Cuidado com o arredondamento em situaes como:
Dado o valor 2,46 milhes de reais, se arredondarmos para 2,5 milhes de reais estamos alterando a
quantidade em R$ 40.000,00.
EXERCCIOS
Classificar cada medida abaixo em varivel quantitativa (contnua ou discreta) ou
varivel qualitativa (ordinal ou nominal):
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
s)
t)

Peso do contedo de pacote de farinha: ....................


Dimetro de um rolamento: .....................
Nmero mdio dirio de clientes potenciais visitados por um vendedor durante o ltimo ms: ..........
Altura h de um indivduo: .....................
Volume de gs produzido numa reao qumica: ......................
Vida mdia de lmpadas: .............
Comprimento de 1000 parafusos: ...............
Nmero de livros de uma biblioteca : .....................
Satisfao com o governo: excelente, bom, regular, pssimo: ....................................
Estilo de construo de casa: colonial, moderno, contemporneo, europeu: ...............
Nmero de elementos qumicos de um composto orgnico: ....................
Classificao de restaurante (nmero de estrelas): .........................................
Nmero de artigos defeituosos produzidos por uma determinada mquina: ................
Temperatura de um lquido .........................................
ndice de massa corporal (IMC): .........................................
Densidade populacional (habitantes por km 2 ): .........................................
Time de futebol (Caxias, Grmio, Internacional, Juventude): ......................................
Concentrao de colesterol total no sangue (mg/dL): .........................................
Religio (catlico, protestante, evanglico, islmico): ....................................
Resposta de questionrio (fumante/no-fumante): .........................................

CAPTULO 2 LEVANTAMENTO DE DADOS E TCNICAS DE


AMOSTRAGEM
INTRODUO
Muitas vezes impraticvel para o pesquisador observar todos os elementos do grupo que
pretende estudar. preciso, ento, recorrer pesquisa com uma parte desse todo.
Todos os elementos do grupo a ser estudado constituem a populao (finita ou infinita). A parte
da populao efetivamente examinada a amostra.
Suponhamos uma pesquisa sobre o nvel de escolaridade de um grupo de 800 pessoas. Nesse
caso, a populao o conjunto das 800 pessoas. Se sentirmos desnecessrio ou impossvel examinar
os 800 elementos, podemos recorrer amostragem, ou seja, podemos examinar alguns desses
elementos.
claro que se escolhermos apenas dois desses 800 elementos, corremos o risco de selecionar
exatamente dois elementos com as mesmas caractersticas. Se os dois forem analfabetos, por
exemplo, podemos concluir que todos os elementos da populao tambm o so.
Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a concluses
erradas, mas esse risco diminui a medida que aumenta a quantidade de elementos a serem
examinados.
Os estudos que utilizam mtodos estatsticos vo desde os que so bem concebidos e
executados, dando resultados confiveis, aos que so concebidos deficientemente e mal executados,
levando a concluses enganosas e sem qualquer valor real. Eis alguns pontos importantes para o
planejamento de um estudo eficaz de produzir resultados vlidos:
1- Identificar com preciso a questo a ser respondida e definir com clareza a populao de
interesse.
2- (Tentar) Identificar os fatores importantes que afetam o problema em questo.
3- Propor um modelo para o problema
4- Estabelecer um plano adequado para coleta de dados. Esse plano deve descrever detalhadamente
a realizao de um estudo observacional ou de um experimento, e deve ser elaborado
cuidadosamente, de modo que os dados coletados representem efetivamente a populao em
questo.
5- Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem
resultar de uma coleta tendenciosa de dados.
6- Analisar os dados e tirar concluses. Identificar tambm possveis fontes de erros. As diferenas
entre as amostras so chamadas de erro amostral, embora nenhum erro tenha ocorrido.
AMOSTRAGEM ALEATRIA
Para que nossas inferncias sejam vlidas, a amostra tem de ser representativa da populao.
Amostras com observaes que sejam convenientes ou exeram julgamento na seleo podem
introduzir alguma tendncia. Para evitar essas dificuldades desejvel selecionar uma amostra
aleatria como o resultado de algum mecanismo de chance.
1) AMOSTRAGEM ALEATRIA SIMPLES
Em uma amostra aleatria, os elementos da populao so escolhidos de tal forma que cada
um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatria simples de n
elementos, de maneira que toda amostra de tamanho n possvel tenha a mesma chance de ser
escolhida).
As amostras aleatrias podem ser escolhidas por diversos mtodos, inclusive a utilizao de
programas computacionais para gerar nmeros aleatrios.
Este tipo de amostragem equivalente a um sorteio lotrico.
Na prtica, a amostragem aleatria simples pode ser realizada numerando-se a populao de 1
a N e sorteando-se, a seguir por meio de um dispositivo aleatrio qualquer, n nmeros dessa
sequncia, os quais correspondero aos elementos pertencentes amostra.

2) AMOSTRAGEM SISTEMTICA
Quando os elementos da populao j se acham ordenados, no h necessidade de construir
um sistema de referncia. So exemplos os pronturios mdicos de um hospital, dos prdios de uma
rua, as linhas de produo e etc. Nestes casos, a seleo dos elementos que constituiro a amostra
pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos
sistemtica.
Assim, no caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar um
para pertencer a uma amostra da produo diria. Neste caso estaramos fixando o tamanho da
amostra em 10% da populao.

Exemplo 2.1: No caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar um
para pertencer a uma amostra da produo diria. Neste caso estaramos fixando o tamanho da
amostra em 10% da populao. Esse mtodo simples e utilizado com frequncia.
Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

Exemplo 2.2: Deseja-se retirar uma amostra de n = 12 unidades de observao de uma populao de
tamanho N = 874. O intervalo de seleo , ento, 874/10 = 72,8(aproxima-se para menos, seno se
ultrapassar a ordem da ltima unidade). Desse modo, vo-se contando as unidades de observao e
escolhem-se aquelas que estiverem, por exemplo, nas seguintes posies: 72, 144, 216, 288, 360,
432, 504, 576, 648, 720, 792 e 864.
3) AMOSTRAGEM ESTRATIFICADA PROPORCIONAL
A amostragem estratificada proporcional recomendada quando existe uma diviso natural da
populao em grupos com nmeros de elementos diversos.
Com a amostragem estratificada, subdividimos a populao em, no mnimo, duas
subpopulaes (ou estratos) que compartilham das mesmas caractersticas (como sexo) e, em
seguida, extramos uma amostra de cada estrato.
Exemplo 2.3: Uma empresa cadastra seus funcionrios atravs do grau de instruo. A tabela a
seguir apresenta essa situao.
Se desejarmos uma amostra com 84 pessoas, elas ficariam distribudas conforme a
ltima coluna da tabela:

Grau de instruo
Ensino fundamental completo
Ensino mdio incompleto
Ensino mdio completo
Ensino superior incompleto
Ensino superior completo
Ps graduao
Total

Populao
Nmero de pessoas*
187
125
69
58
42
13

Amostra
Nmero de pessoas

4) AMOSTRAGEM POR CONGLOMERADOS


Nesse tipo de amostragem a populao total subdividida em vrias partes relativamente
pequenas, e algumas dessas subdivises, ou conglomerados, so selecionadas aleatoriamente e,
finalmente, tomamos todos os elementos desse conglomerado para integrarem a amostra global.

OBESRVAO
AMOSTRAGEM POR JULGAMENTO (no aleatria)
Os elementos escolhidos so aqueles julgados como tpicos da populao que se deseja
estudar. Por exemplo, num estudo sobre a produo cientfica dos departamentos de ensino de uma
universidade, um estudioso sobre o assunto pode escolher os departamentos que ele considera serem
aqueles que melhor representam a universidade em estudo.
EXERCCIOS
1) As afirmaes a seguir contm erro(s). Identifique-o(s).

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

a) sempre melhor fazer um censo do que extrair uma amostra.


b) Para sabermos se os frequentadores de um shopping lavam as mos aps utilizarem o banheiro, o
ideal entrevist-los na sada do banheiro.
c) Uma pesquisa de opinio pblica feita com brasileiros num site popular conseguiu 17.536 respostas.
A maioria dos respondentes disse que est insatisfeita com o governo federal. Como o tamanho da
amostra foi to grande, podemos ter certeza de que a maioria da populao brasileira pensa da
mesma maneira.
d) Para avaliar o funcionamento de uma mquina, toma-se uma amostra aleatria durante a primeira
hora de funcionamento da mesma.
e) A melhor forma de realizarmos uma pesquisa com donas de casa a nvel estadual enviando o
formulrio de coleta de dados pelo correio.
2) Numa escola da regio, para estudar a preferncia em relao a refrigerantes, sortearam-se 150
estudantes entre os 1000 matriculados. Responda:
a) Qual a populao envolvida na pesquisa?
b) Que tipo de amostragem foi utilizado e qual a amostra considerada?
3) Em uma certa cidade, quer-se estudar o interesse despertado por um programa de TV entre os
alunos de 7 anos de idade das escolas de ensino fundamental. Para isso, pretende-se levantar uma
amostra de 300 crianas. A partir dos dados abaixo, estratifique a amostra:
ESCOLA
A
B
C
D
E

POPULAO
400
300
350
450
520

4) Em uma cidade com 30.000 habitantes deseja fazer-se uma pesquisa sobre a preferncia por tipo
de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
a) Qual a populao envolvida na pesquisa?
b) Supondo que na cidade haja 5500 mulheres e 6000 homens, com 20 anos, determine uma
amostra com 1200 pessoas.
5) Uma populao encontra-se dividida em trs estratos, com tamanhos, respectivamente 40, 100 e
60 indivduos. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove
elementos foram retirados do 3 estrato, determine o nmero total de elementos da amostra.
6) Em uma empresa existem 250 funcionrios, sendo 35 na linha de produo A, 32 na linha de
produo B , 30 na linha de produo C, 28 na linha de produo D , 35 na linha de produo E, 32 na
linha de produo F, 31 na rea administrativa e 27 na engenharia. Obtenha uma amostra de 40
funcionrios.
7) Uma empresa apresenta o seguinte quadro de funcionrios:
Setor
Produo
Engenharia
Administrao
Qualidade
Total

Nmero de funcionrios
Masculino
Feminino
80
60
11
4
13
17
4
5
108
86

Obtenha uma amostra estratificada proporcional de 35 funcionrios.

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

8) Uma empresa que embala biscoitos realiza o controle de qualidade selecionando aleatoriamente 10
caixas da produo total diria e pesando os pacotes. Depois, eles abrem um pacote de cada caixa e
inspecionam o contedo.
A partir dessas informaes, identifique se possvel:
a) a populao
b) as variveis da populao em questo
c) a(s) amostra(s)
d) o mtodo amostral e dizer se foi aleatrio ou no
e) qualquer fonte potencial de tendenciosidade que voc pode detectar
Respostas
3)
ESCOLA
A
B
C
D
E
TOTAL

AMOSTRA
60
45
52
67
78
302

4-b) 574 mulheres e 626 homens


5) 30 elementos (15%)
6)
Setor
A
B
C
D
E
F
ADM
ENG
Total

Amostra (n de funcionrios)
6
6
5
5
6
6
5
5
44

7)
Setor
Produo
Engenharia
Administrao
Qualidade
Total

Nmero de funcionrios AMOSTRA (18,04%)


Masculino
Feminino
15
11
2
1
3
4
1
1
21
17

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

10

CAPTULO 3 - GRFICOS ESTATSTICOS


INTRODUO
Os mtodos grficos tem encontrado um uso cada vez maior devido ao seu apelo visual.
Normalmente, mais fcil para qualquer pessoa entender a mensagem de um grfico do que aquela
embutida em tabelas ou sumrios numricos.
A representao grfica de uma srie de dados permite, ao mesmo tempo, uma viso geral e
alguma caracterizao particular da populao por meio de uma correspondncia entre as categorias
ou valores e uma determinada figura geomtrica, de tal modo que cada valor ou categoria
representado por uma figura proporcional.
Os principais tipos de grficos so diagramas, cartogramas e pictogramas.
GRFICO EM LINHA
Os grficos de linha so bastante utilizados na identificao de tendncias de aumento ou
diminuio dos valores numricos de um fenmeno. Assim, vamos encontrar com frequncia esse tipo
de representao em anlises tais como lucros de empresas, incidncia de doenas, ndice de
crescimento populacional ou de mortalidade infantil, ndices de custo de vida, comportamento do
fenmeno ao longo do tempo etc.
No eixo horizontal, marca-se o tempo.
Exemplo 3.1: A tabela a seguir apresenta a variao (%) do ndice de preos ao consumidor amplo
Tabela: ndice de preos ao consumidor amplo - IPCA
Ms
Fevereiro 2010
Maro 2010
Abril 2010
Maio 2010
Junho 2010
Julho 2010
Agosto 2010
Setembro 2010
Outubro 2010
Novembro 2010
Dezembro 2010
Janeiro 2011

No ms

ltimos 12 meses

0,78
0,52
0,57
0,43
0,0
0,01
0,04
0,45
0,75
0,83
0,63
0,83

4,38
5,17
5,26
5,22
4,84
4,60
4,49
4,70
5,20
5,63
5,91
5,95

Fonte: IBGE

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

11

0,9
0,8
0,7
0,6

0,5

0,4
0,3
0,2
0,1
0

Figura: ndice de Preos ao Consumidor Amplo IPC


Fonte: IBGE
Exemplo 3.2: O grfico a seguir apresenta a concentrao de um componente A ao longo do tempo
de uma reao qumica.

Concentrao do componente A com o


passar do tempo
30
concentrao (g)

25
20
15

10
5
0

10 11 12 13 14 15 16 17 18 19 20 21
tempo (min)

Podemos, ainda, representar mais de um fenmeno num mesmo sistema de eixos.

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

12

Exemplo 3.3:
Tabela: Taxa de desemprego na grande So Paulo
Ano
Homens (%)
Mulheres (%)
1996
13,5
17,1
1997
14,1
18,3
1998
16,0
21,0
1999
17,5
21,8
2000
15,1
20,8
2001
15,0
20,7
Fonte: EXAME (MEU DINHEIRO), Abril 2002.

25
20
15
%

HOMENS

10

MULHERES
5
0
1996

1997

1998

1999

2000

2001

Ano

Figura: Taxa de desemprego na grande So Paulo


Fonte: EXAME (MEU DINHEIRO), Abril 2002.

Exemplo 3.4: O grfico a seguir apresenta a concentrao de um componente A e um componente B


ao longo do tempo de uma reao qumica.
35

concentrao (g)

30

25
20
15

10
5

0
0

10 11 12 13 14 15 16 17 18 19 20 21

tempo(min)
Componente B

Adriana Speggiorin e Andr Espindola

Componente A

Probabilidade e Estatstica

13

GRFICO EM COLUNAS E GRFICO EM BARRAS


a representao de uma srie por meio de retngulos, dispostos verticalmente (em colunas)
ou horizontalmente (em barras).
Quando em colunas, os retngulos tm a mesma base e as alturas so proporcionais aos
respectivos dados. Um grfico de colunas mostra as alteraes dos dados em um intervalo de tempo
ou ilustra comparaes entre categorias, as quais so organizadas de maneira horizontal e os valores
de maneira vertical para enfatizar a variao ao longo do tempo.
Quando em barras, os retngulos tm a mesma altura e os comprimentos so proporcionais
aos dados. Um grfico de barras ilustra comparaes entre categorias; estas so organizadas
verticalmente, enquanto os valores tm disposio horizontal, para enfatizar a comparao de valores
e dar menos nfase ao tempo.
No grfico de colunas e de barras, tambm indiferente a ordem de apresentao dos
retngulos, por se tratar de uma srie ordenada segundo uma caracterstica qualitativa. Nesses casos,
no h, em geral, uma ordem nica, tcnica e logicamente admissvel, podendo ocorrer diversas
ordens, correspondentes a diversos critrios.
Exemplo 3.5: A tabela a seguir apresenta dados relativos a uma pesquisa realizada em uma cidade
da regio. A questo era Como voc fica sabendo das promoes da loja XX?
Tabela: Como voc fica sabendo das promoes da loja XX?
Fonte

Frequncia*
68
65
36
31
28
23
13
1

TV
Amigos
Internet
Jornal
Rdio
Parentes
Encartes de jornal
Outros
*Mltiplas respostas

%
44,3
42,9
23,6
20,7
18,7
14,9
8,7
0,9

30%
25,7%
25%

24,5%

20%
13,6%

15%

11,7%

10,6%

10%

8,7%

4,9%

5%

0,4%
0%
TV

Amigos

Internet

Jornal

Rdio

Parentes

Encartes
de jornal

Outros

Figura: Como voc fica sabendo das promoes da loja XX? (Mltiplas respostas)
Fonte: A autora

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

14

Exemplo 3.6: Foi perguntado a um grupo de alunos de Ensino Mdio Como seu curso de graduao
seria financiado se voc continuasse estudando?. O grfico a seguir apresenta o resultado ao
questionamento.
Atravs de financiamento estudantil

3,2%

Com ajuda da empresa em que trabalho

6,9%

Meus pais ou familiares pagariam todo o curso

8,9%

Necessitaria de bolsa de estudo

24,8%

Eu proprio pagaria o curso

25,4%

Eu pagaria uma parte e meus familiares pagariam a outra

30,8%
0%

10%

20%

30%

40%

Figura: Como seus estudos seriam financiados?


Exemplo 3.7:

GRFICO EM SETORES (pizza)


A Estatstica recorre com frequncia a esse tipo de grfico, que consiste em distribuir num
crculo setores (ou categorias) proporcionais aos dados do problema.
Exemplo 3.8: O grfico a seguir apresenta dados de uma pesquisa feita com uma amostra de
microempresrios da regio, onde lhes foi questionado sobre o que faltava s suas empresas para
serem mais competitivas.

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

15

O que falta para sua empresa ser mais


competitiva?
Menores taxas
de
financiamento
25%

Capacitao de
mo de obra
75%

Fonte: A autora

O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes.
As reas dos setores so proporcionais aos dados da srie.

DIAGRAMA DE DISPERSO
O grfico de disperso apresenta duas variveis numricas. Ento temos pontos (pares
ordenados) representando a relao entre essas variveis.
Exemplo 3.9: Supe-se que o contedo de hidrognio seja um fator importante na porosidade de
fundies de liga de alumnio. A tabela a seguir apresenta os dados sobre contedo de hidrognio e
porosidade numa determinada srie de testes e o respectivo grfico.
Contedo de
hidrognio
Porosidade

0,18

0,2

0,21 0,21 0,21 0,22 0,23 0,23 0,24 0,24 0,25 0,28

0,3

0,46

0,7

0,41 0,45 0,55 0,44 0,24 0,47 0,22

0,72 0,75

Adriana Speggiorin e Andr Espindola

0,8

0,88

0,7

0,37

Probabilidade e Estatstica

16

1,00

Porosidade

0,80

0,60
0,40
0,20

0,00
0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

Contedo de hidrognio

GRFICOS QUE ENGANAM


Quando observar um grfico ou uma tabela, particularmente como parte de um anncio, seja
cauteloso. Observe as escalas usadas nos eixos horizontal e vertical. Pode-se distorcer a verdade com
as tcnicas estatsticas.
No exemplo a seguir, tm-se os ganhos mdios mensais de certa categoria de profissionais.
Exemplo 3.10
1300
1230

R$ 1100

980

900
Homens

Adriana Speggiorin e Andr Espindola

Mulheres

Probabilidade e Estatstica

17

1400

1230

1200
980

1000
800
R$
600
400
200
0
Homens

Mulheres

Qual a primeira impresso que se tem ao compararmos os dois grficos?


Exemplo 3.11
Os grficos a seguir apresentam o grau de satisfao dos estudantes com o transporte coletivo
da cidade (dados fictcios).
Pssimo
8%

timo
28%

Ruim
18%

Regular
14%
Bom
32%

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

18

50
40

32%
28%

30
%
18%

20
10

14%
8%

0
Pssimo

Ruim

Regular

Bom

timo

Em qual dois dois a leitura mais fcil?


Exemplo 3.12: Tem-se, a seguir, o grfico exibido pela Globo News, em janeiro de 2014,
apresentando a srie histrica relativa inflao no Brasil.

Percebe-se o erro na ltima coluna e tambm uma escala que pode ser enganadora, pois
pode-se ter a impresso que a inflao do ano de 2010 quase o triplo da inflao de 2009.
Fonte: http://www.viomundo.com.br/humor/grafico-da-globo-inflaciona-a-inflacao.html
O grfico correto :

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

19

6,50%
5,92%

5,84%

5,91%

2012

2013

4,31%

2009

2010

2011

CARTOGRAMA
a representao sobre uma carta geogrfica.
Esse grfico empregado quando o objetivo o de figurar os dados estatsticos diretamente
relacionados com reas geogrficas ou polticas.
PICTOGRAMA
O pictograma constitui um dos processos grficos que melhor fala ao pblico, pela sua forma
ao mesmo tempo atraente e sugestiva. A representao grfica consta de figuras.
Exemplo 3.13: Pictograma

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

20

CAPTULO 4
ANLISE DE CONJUNTOS DE DADOS NO AGRUPADOS
INTRODUO
A anlise de dados frequentemente segue linhas diferentes, conforme se trate de um grande ou
de um pequeno conjunto de dados. Quando h uma pequena quantidade de dados, utilizam-se os
mtodos que seguem neste captulo. Para maior quantidade de dados, so mais prticos mtodos que
exigem primeiro o agrupamento dos dados. Essas tcnicas sero consideradas posteriormente.
Frequentemente, um conjunto de nmeros pode reduzir-se a uma ou a algumas medidas
numricas que resumem todo o conjunto. Tais medidas so de mais fcil manejo e compreenso do
que os dados originais.
O objetivo aqui apresentar os mtodos mais teis para resumir dados. Embora no exista um
padro que se possa considerar o melhor, h tcnicas que se prestam melhor que outras a
determinadas situaes.
MEDIDAS DE TENDNCIA CENTRAL
H situaes em que no estamos interessados nos padres de um grupo, mas em
caracteriz-lo como um todo. Podemos ter questes como: Qual o salrio mdio do trabalhador
brasileiro? Qual o tipo sanguneo mais comum? Qual a nota que divide os alunos de uma turma em um
grupo superior e o outro inferior? Para responder a essas questes necessitamos de um grupo nico,
que represente todos os valores obtidos pelo grupo. Este nmero possibilita a caracterizao do grupo
como um conjunto e tende a se condensar no centro da srie; desse fato deriva o termo "medida de
tendncia central". A utilizao de medidas de posio no substitui o uso de tabelas e de grficos.
Veremos, ento, trs medidas de tendncia central: a mdia, a mediana e a moda. Elas
constituem maneiras diversas de determinar um nico nmero representativo de uma srie, e,
conforme veremos, raramente coincidem.
1) MDIAS
A mdia de um conjunto de nmeros um valor que, levando em conta a totalidade dos
elementos do conjunto, pode substituir a todos sem alterar determinada caracterstica desse conjunto.
Por exemplo, se a caracterstica do conjunto a soma dos seus elementos, tem-se a mais
simples de todas as mdias: a mdia aritmtica.
Existem vrios tipos de mdias, sendo a mais utilizada a aritmtica; portanto, sempre que
mencionarmos simplesmente mdia, estaremos nos referindo aritmtica.
MDIA ARITMTICA ( ou x )
A mdia (aritmtica) , de modo geral, a mais importante de todas as mensuraes numricas
descritivas. Consiste em adicionar os elementos e dividir a soma pelo nmero de elementos
adicionados. A mdia representada, por conveno, por x ( l-se x barra) quando estamos lidando
com uma amostra ou quando o conjunto de dados for uma populao .
Em notao de somatrio, a mdia aritmtica representada da seguinte forma:

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

21

x
ou mais simples como:

x
i 1

ou

ou

i 1

xi

onde:

xi

n
N

a mdia aritmtica amostral


a mdia aritmtica populacional
so os valores da varivel
(letra Sigma) o somatrio dos valores da varivel
o nmero de medidas efetuadas na amostra
o nmero de medidas efetuadas na populao
Quando desejamos saber a mdia dos dados determinamos a mdia aritmtica simples.

Exemplo 4.1: Sabendo-se que o nmero de peas produzidas por sete mquinas diferentes, num
certo dia, foi 10, 17, 13, 15, 16, 18 e 12, temos, para produo mdia desse dia:

10 17 13 15 16 18 12 101

14,4
7
7

Logo:

x = 14,4 peas
A mdia aritmtica de uma amostra pode no pertencer ao conjunto original de valores, nem
precisa ter significado real.

Mdia aritmtica ponderada ( x )


A frmula anterior para calcular a mdia aritmtica supe que cada observao tenha a mesma
importncia. Embora este seja o caso mais geral, h excees.
A mdia aritmtica ponderada aquela resultante de um conjunto de valores, no qual alguns
valores tm importncia (ou quantidade de ocorrncias) maior que a dos outros.
Exemplo 4.2: O IBGE vai rever o clculo do ndice de inflao (INPC) para que retrate com mais
fidelidade o custo de vida... O setor de vesturio, com peso de 10% na formao do ndice, deve ficar
com uma ponderao entre 5% e 6% .
Exemplo 4.3: Se o exame final, em um curso, tem peso 3 e as provas realizadas no semestre tm
peso 1, e um aluno tem notas 85 no exame, 70 e 90 nas provas, sua mdia ( aritmtica ponderada )
ser:

3x85 1x70 1x90 255 70 90 415

83
11 3
5
5

Podemos, ento, escrever:

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

22

x .w
w

onde wi so os pesos da observao de ordem i .


Exemplo 4.4: Os salrios mdios mensais dos professores de ensino fundamental em trs cidades
so R$ 1.450,00, R$ 1.620,00 e R$ 1.190. Havendo 720, 660 e 520 professores de ensino elementar
nessas cidades, respectivamente, o salrio mdio ser entre as trs :

Exemplo 4.5: Uma pesquisa amostral efetuada junto a estudantes de uma faculdade acusa os
seguintes dados sobre o conceito obtido na disciplina de Estatstica.

Conceito
0
1
2
3
4
Total

Nmero de estudantes
4
28
41
29
12

Baseados na tabela, podemos afirmar que o conceito mdio :

MDIA GEOMTRICA
A mdia geomtrica de uma amostra um nmero que, levando em conta o total dos
elementos dessa amostra, pode representar a todos, sem alterar o produto desses elementos. Assim
sendo, a mdia geomtrica de uma amostra de tamanho n igual raiz de ordem n do produto dos n
valores.
Desse modo, a mdia geomtrica calcula por:

x G n x1 .x2 . ... .xn

ou

x G n xi

Ao contrrio da mdia aritmtica, a mdia geomtrica no muito influenciada pelos valores


extremos de uma sequncia numrica. Ainda, a mdia geomtrica definida apenas para nmeros
positivos.
A mdia geomtrica usada para mdias proporcionais de crescimento quando uma medida
subsequente depende de medidas prvias.

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

23

Se, por exemplo, uma populao de 2 milhes de habitantes em 1960 aumentou para 8
milhes em 1980, quadruplicou em 20 anos; qual teria sido a cifra da populao em 1970? No teria
sido cinco milhes, que a mdia aritmtica de 2 e 8 milhes, pois o aumento mais rpido nos anos
posteriores do que nos anteriores. A cifra real determinada calculando-se a mdia geomtrica, sendo
multiplicados todos os valores da srie e em seguida extrada a raiz de ordem n desses valores, de
acordo com seguinte :
Para o nosso exemplo teramos
xG 2 2x8 4

ou seja, 4 milhes de pessoas em 1970.

Comparemos as duas situaes a seguir:


1 ) As importaes brasileiras durante o ano de 1998 foram as seguintes, em bilhes de dlares:
janeiro, 4.577; fevereiro, 3.799; maro, 5.038; abril, 4.799; maio, 4.913; junho, 4.844; julho, 5.329;
agosto, 4.634; setembro, 5.338; outubro, 5.039; novembro, 4.709 e dezembro, 4.538. Determine a
mdia das importaes brasileiras em 1998.
2 ) O crescimento do Brasil foi de 2,8% em 1996, 3,7% em 1997 e 0,5% em 1998. Determine a taxa
mdia de crescimento do Brasil nesses trs anos.
Na primeira situao, bastaria calcular a mdia aritmtica simples dos valores dos 12 meses.
Isso resultaria U$ 4.794,75 bilhes.
Na segunda situao devemos calcular a mdia geomtrica desses trs valores:

x G 3 2,8 x 3,7 x 0,5 1,7302%

Mdia geomtrica ponderada

x G i x1 1 x2 2 ... xn
p

pn

MDIA HARMNICA
J vimos que a mdia aritmtica no adequada para todas as sries de dados. No pode ser
empregada, por exemplo, para mdias de crescimento (usamos a mdia geomtrica) ou propores de
velocidade. Digamos que um motorista dirija seu carro de uma cidade A para uma cidade B a uma
velocidade mdia de 60 quilmetros por hora. Na volta, ou seja, a viagem da cidade B para a cidade A
ele perfaz com uma velocidade mdia de 30 quilmetros por hora. Qual a velocidade mdia global? A
resposta no 45 quilmetros por hora.
Vamos supor que a distncia de A at B seja de 60 km (embora possa ser considerada qualquer
distncia). Ento:

60 km
2 horas
30 km / h

o tempo para deslocar-se de B at A

o tempo de A para B

se o tempo total foi 3 horas e a distncia total, 120 km, temos que a velocidade mdia global 40
km/h

60 km
1 hora
60 km / h

A mdia acima harmnica entre 30 e 60. Calculamos assim

Adriana Speggiorin e Andr Espindola

xH

2
1
1

30 60

40

Probabilidade e Estatstica

24

A frmula a seguinte:

xH

n
1

Exemplo 4.6: Um investidor compra R$ 18.000 em aes de uma companhia a R$ 45,00 a ao. Num
segundo momento, compra R$ 18.000 a R$ 36,00 a ao e, por fim, numa terceira aplicao, compra
R$ 18.000 a R$ 30,00 a ao. Assim, descubra o preo mdio por ao pago pelo investidor.

Mdia harmnica ponderada

xH

P
i

p1 p2
p

... n
x1 x2
xn

ou x H

p
p
x

i
i

2) MEDIANA (Md)
Analisemos a situao a seguir:
As idades de seis alunos que participaram de uma excurso com finalidade geolgica so 18,
19, 20, 17, 19, 18 anos e a idade do professor que foi com eles 50 anos. Ao determinarmos a idade
mdia das sete pessoas obteremos x = 23 anos, mas uma afirmao de que a idade mdia do grupo
23 anos pode ser facilmente mal interpretada. Poderamos inferir incorretamente que todas as
pessoas que participaram da excurso estivessem na casa dos 20 anos.
Para evitar a possibilidade de sermos induzidos em erro por uma mdia afetada por um valor
muito pequeno ou muito grande, por vezes prefervel caracterizarmos o centro de um conjunto de
dados por outra medida que no a mdia: por exemplo, a mediana, que vamos estudar a seguir.
A mediana aquele valor que ocupa a posio central da listagem, estando a amostra com
seus valores ordenados e com todos os valores repetidos tambm includos, individualmente, na
lista. A mediana da amostra divide o conjunto total em duas partes iguais, com metade (50%) dos
valores acima da mediana da amostra e metade (50%) abaixo dela. A mediana da amostra pode no
pertencer ao conjunto original de valores.
Exemplo 4.7: Dada uma srie de valores, como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9, de acordo
com a definio de mediana, o primeiro passo a ser dado o de ordenao (crescente ou
decrescente) dos valores:
2 - 5 - 6 - 9 - 10 - 13 - 15 - 16 - 18
Em seguida tomamos aquele valor central que apresenta o mesmo nmero de elementos
direita e esquerda. Em nosso exemplo esse valor o 10.

Logo, Md = 10

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

25

Exemplo 4.8: Se a lista de valores tiver nmero par de termos, a mediana ser, por definio,
qualquer nmero compreendido entre os dois valores centrais da srie. Convencionaremos utilizar o
ponto mdio. Dada a lista:
2, 6, 7, 10, 12, 13, 18, 21
tem , para mediana, a mdia aritmtica entre 10 e 12.
Logo:
Md =

10 12 22

11
2
2

Md = 11

Ento, se os dados da lista esto ordenados e n o nmero de elementos dessa lista, o valor
mediano ser:

n 1
, se n for mpar
2

o termo de ordem

a mdia aritmtica dos termos de ordem

n
n
e
1 se n for par
2
2

OBSERVAES
1) A mdia e a mediana no tm, necessariamente, o mesmo valor.
2) A mediana no, necessariamente, coincide com um elemento da srie.
Exemplo 4.9: Em 15 dias, um laboratrio realiza 40, 52, 55, 38, 40, 48, 56, 56, 60, 37, 58, 63, 46, 50
e 61 testes qumicos. Qual a mediana para o contexto do problema?

Caractersticas da mediana
1) No depende de todos os valores da srie, podendo se manter inaltervel com a modificao de
alguns deles.
2) No influenciada pelos valores extremos da distribuio; por isso particularmente indicada
quando existem dados discrepantes.
3) Pode ser calculada quando os valores mais altos e mais baixos de uma srie no podem ser
exatamente definidos.
3) MODA( Mo)
A denominao moda torna-se coerente na medida em que (so) o(s) evento(s) que mais se
destaca(m), isto , que ocorre(m) com maior frequncia no fenmeno estudado. Examinemos alguns
exemplos do nosso cotidiano:

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

26

Exemplo 4.10: Quando queremos informaes sobre o tipo de sangue mais comum, estamos
interessados na moda. Se um comerciante pretende abrir uma loja de calados e quer saber quais os
nmeros de sapatos femininos que deve encomendar em maior quantidade, a medida de tendncia
que ele necessita para um bom planejamento administrativo a moda. Numa eleio, o candidato que
tem o maior nmero de votos representa a moda. Evidentemente, o comerciante pode constatar que
no h um nico nmero de sapato que predomine, mas que os mais comuns so 35, 36 e 37. Ter,
assim, uma distribuio multimodal, com trs modas: 35, 36 e 37.
Cabe ressaltar que, apesar de ser a frequncia que se destaca, a moda no representa
necessariamente a maioria no total de resultados.
Uma sequncia de nmeros pode no ter valor modal ( ou moda) ou apresentar vrios tipos de
repeties, recebendo ento vrias denominaes:
a)
b)
c)
d)

amodal, quando no tem distino entre todas as frequncias que aparecem;


unimodal , quando h apenas uma moda;
bimodal, quando h duas modas;
multimodal, quando h trs ou mais modas.

Exemplo 4.11: Encontre a moda das amostras abaixo:


a) 2, 7, 5, 4, 3, 1
b) 1, 3, 9, 2, 9, 5
c) 7,1 ; 8,4 ; 7,1 ; 7,1 ; 9,5 ; 8,4 ; 9,4 ; 8,4

Observao
Comparada com a mdia e com a mediana, a moda a menos til das medidas para
problemas estatsticos, porque no se presta anlise matemtica, ao contrrio do que ocorre com as
outras duas medidas. A utilidade da moda se acentua quando um ou dois valores, ou um grupo de
valores, ocorrem com muito maior freqncia que outros.

EXERCCIOS
1) Inspecionam-se quinze rdios antes da remessa. Os nmeros de defeitos por unidade so: 1, 0, 3,
4, 2, 1, 0, 3, 1, 2, 0, 1, 1, 0, 1. Determine o nmero mdio, mediano e modal de defeitos.
2) Qual o nmero que devemos juntar a 5; 7; 8 e 2 de modo que sua mdia seja 6 ?
3) A mdia aritmtica simples de um conjunto de 10 nmeros 35. Se o nmero 12 for retirado do
conjunto, qual ser a mdia aritmtica dos nmeros restantes?
4) A nota de Estatstica de uma turma seria calculada com a mdia aritmtica de 4 testes. Dessa
maneira, Luciana obteria nota 7. O professor, no entanto, resolver anular um dos testes no qual ela
havia tirado 8. Qual vai ser a nota de Luciana?
5) Se o salrio mdio anual pago aos trs profissionais de uma empresa R$ 156.000,00, algum
deles pode receber um salrio anual superior a R$ 500.000,00?
6) Em um posto de controle rodovirio, doze motoristas multados por excesso de velocidade estavam
dirigindo a 8 - 11 - 14 - 6 - 8 - 10 - 20 - 11 - 13 - 18 - 9 15 quilmetros por hora acima do limite
regulamentar de velocidade.
Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

27

a) Em mdia, em quantos quilmetros por hora esses motoristas estavam excedendo o limite?
b) O motorista que excedeu o limite em menos de 15 quilmetros por hora foi multado em R$
60,00 e os outros foram multados em R$ 88,00. Determine a mdia das multas que esses
motoristas tiveram de pagar.
7) Durante um perodo de uma hora uma sorveteria recebeu 20 fregueses, e os valores das compras
em reais foram:
1,25 2,50 1,25 5,50 3,25 3,75 2,75 6,25 4,00 2,50
1,25 1,25 3,75 6,00 4,50 3,25 1,25 4,50 2,50 1,50
a) Calcule o valor mdio das compras.
b) Se cada compra abaixo de R$5,00 faz jus a um bnus de 50 centavos, e cada compra de
R$5,00 ou mais faz jus a um bnus de 1 real, ache o valor mdio desses 20 bnus.
8) O nmero de carros vendidos por cada um dos 10 vendedores de uma revenda autorizada de
automveis durante certo ms, 10,10,4,7,2,12,10,12,15 e 14. Determinar:
a) a venda mdia;
b) a venda mediana;
c) a moda para esta distribuio.
9) O nmero de acidentes ocorridos durante um dado ms em 13 departamentos de manufaturas de
uma indstria foi: 2, 0, 0, 3, 3, 12, 1, 0, 8, 1, 0, 5 e 1. Calcular:
a) a mdia;
b) a mediana;
c) a moda para o nmero de acidentes por departamento.
10) Suponha que os preos de varejos de alguns itens selecionados tenham variado conforme a tabela
a seguir. Determinar a mudana percentual mdia nos preos de varejo.
Item
Leite
Carne
Vesturio
Gasolina

Porcentagem
de aumentos
10%
-6%
-8%
20%

Despesa mdia mensal


(antes do aumento)
100,00
150,00
150,00
250,00

11) A mdia pode ser zero? Pode ser negativa? Explique.


12) A mediana pode ser zero? Negativa? Explique.
13) As observaes a seguir so relativas resistncia por cisalhamento (em MPa) de uma junta
soldada de uma determinada forma:
22,2

40,4

16,4

73,7

36,6

109,9

30,0

4,4

33,1

66,7

81,5

a) Qual o valor da mdia amostral?


b) Qual o valor da mediana amostral? Por que esse valor to diferente da mdia?
c) Calcule a mdia aparada, excluindo a menor e a maior observao.
RESPOSTAS:
1) x = 1,33, Md = 1, Mo = 1
2) 8
3) 37,56
Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

28

4) 6,7
5) No
6) a) 11,92

b) 67

7) a) 3,14

b) 0,58

8) a) x = 9,6 b) Md = 10

c) Mo = 10

9) a) x = 2,77 b) Md = 1

c) Mo = 0

10) 6%
11) Sim. Sim.
12) Sim. Sim.
13) a) 46,8

b) 36,6

c) 44,5

SEPARATRIZES
A mediana apenas um dentre os muitos quantis que dividem os dados em duas ou mais
partes to aproximadamente iguais quanto possvel. Entre eles, destacam-se os quartis, os decis e os
percentis, que dividem os dados em 4, 10 e 100 partes, respectivamente.
QUARTIS
Vamos nos ocupar principalmente da anlise preliminar de conjuntos relativamente pequenos
de dados. o problema de dividir esses dados em quatro partes aproximadamente iguais, onde
dizemos aproximadamente iguais porque no h maneira de dividir em quatro partes iguais um
conjunto com n = 27 ou n = 33, por exemplo. As medidas estatsticas criadas com esta finalidade so
tradicionalmente conhecidas como quartis, Q1, Q2 e Q3. Sem dvida, Q2 simplesmente a mediana.
Por outro lado, h vasto campo para arbitrariedades na definio do quartil inferior Q1 e do quartil
superior Q3.

PERCENTIS
o problema de dividir esses dados em cem partes aproximadamente iguais, onde dizemos
aproximadamente iguais porque no h maneira de dividir em cem partes iguais um conjunto com
n=328, por exemplo. As medidas estatsticas criadas com esta finalidade so tradicionalmente
conhecidas como percentis, P1, P2 , ... P81, ... , P98 e P99.

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

29

MEDIDAS DE DISPERSO

DISPERSO OU VARIABILIDADE
Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por
meio de procedimentos matemticos, em poucos valores representativos - mdia aritmtica , mediana,
moda. Tais valores podem servir de comparao para dar a posio de qualquer elemento do
conjunto. Porm, no o bastante dar uma das medidas de posio para caracterizar perfeitamente
um conjunto de valores.
Exemplo 4.12: Suponhamos que se deseja comparar o desempenho de dois funcionrios, com base
no nmero de cadeiras sem defeitos produzidas durante uma semana:
Empregado A: 80, 81, 79, 80, 80 x 80 cadeiras
Empregado B: 70, 90, 80, 72, 93 x 81 cadeiras
Baseados nestes nicos resultados obtidos, diramos que a produo de B melhor do que de
A, j que B produz, em mdia, um maior nmero de cadeiras diariamente. No entanto se formos um
pouco cuidadosos, percebemos que a produo de A varia de 79 a 81 cadeiras, ao passo que a de B
varia de 70 a 93 cadeiras, o que indica que o desempenho de A bem mais homogneo do que de B.
evidente que um alto grau de homogeneidade costuma ser considerado como uma qualidade
desejvel nesta situao.
Consideremos agora a seguinte situao:
Exemplo 4.13: Temos duas turmas A e B . Observe a tabela onde mostrado o desempenho dos
alunos. Calcule a mdia de cada turma.

Turma A
1
0
10
9
2
8
5
= 35

Turma B
4
6
5
3
4
7
6
= 35

Esses dois conjuntos possuem a mesma mdia. Pode-se dizer que estes conjuntos so iguais?
No, porque embora ambos tenham a mesma mdia eles diferem na sua homogeneidade.
Neste exemplo, o conjunto A mais heterogneo ou mais disperso que o conjunto B. Portanto, no
bastam que conheamos apenas a mdia de um conjunto, precisamos tambm, conhecer a disperso
do conjunto.
Da surge as medidas de variabilidade ou medidas de disperso. Estas medidas medem a
disperso do conjunto, avaliando a heterogeneidade ou a homogeneidade do mesmo.

A disperso mede quo prximos uns dos outros esto os valores de um grupo.

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

30

AMPLITUDE
A amplitude (ou intervalo total) de um conjunto de dados igual diferena entre o maior e o
menor valor.
Exemplo 4.14: Em um hospital, onde se mede a pulsao de cada paciente trs vezes por dia, o
paciente A acusou as taxas de 72, 76 e 74, e o paciente B acusou 72, 91 e 59. A taxa mdia de ambos
a mesma, 74; observe, entretanto, a diferena na variabilidade. Enquanto a pulsao de A estvel,
a de B apresenta grande flutuao.
A vantagem de usar a amplitude como medida de disperso reside no fato de o intervalo ser
relativamente fcil de calcular, mesmo para um grande conjunto de nmeros. Entretanto, a maior
limitao da amplitude o fato dela levar em conta somente os dois valores extremos de um conjunto,
nada informando quanto aos outros valores.

VARINCIA
A varincia a medida de disperso que mede a mdia dos quadrados dos desvios dos
valores, de um conjunto numrico em relao a sua mdia.

Clculo da Varincia:

amostral

populacional

Onde:
xi = valor da varivel
x mdia amostral
xi x = desvio em relao mdia
= mdia populacional
No clculo de varincia divide-se a soma obtida por n-1 quando se trata de um conjunto de
nmeros que representam uma amostra. Se um conjunto de nmeros constitui uma populao, ou se a
finalidade de somar os dados apenas descrev-los, e no fazer inferncias sobre uma populao,
ento deve-se usar N em lugar de (n-1) no denominador.
Exemplo 4.15: Calcular a varincia da produo dos dois funcionrios.

xi x

Funcionrio
A
80
81
79
80
80
=

( x i x )2

Adriana Speggiorin e Andr Espindola

xi x

Funcionrio
B
70
90
80
72
93
=

( x i x )2

=
Probabilidade e Estatstica

31

Exemplo 4.16: Calcule a varincia da tabela a seguir.

xi x

Turma A

( x i x )2

xi x

Turma B

1
0
10
9
2
8
5

( x i x )2

4
6
5
3
4
7
6
=

A varincia expressa na unidade de medida do conjunto numrico. Como ela um valor ao


quadrado, torna-se difcil a interpretao prtica, motivo pelo qual surge outra medida de disperso o
desvio padro.

DESVIO PADRO
O desvio padro simplesmente a raiz quadrada positiva da varincia.

s s2

2
ou

(x

x) 2

n 1

(x

)2

Exemplo 4.17: Calcular o desvio padro das tabelas anteriores.

O desvio padro uma das medidas mais comumente usadas para distribuies, e
desempenha papel relevante em toda a estatstica. Cabe notar que a unidade do desvio padro a
mesma da mdia. Por exemplo, se a mdia em reais, o desvio padro tambm se exprime em reais.
A varincia, por sua vez, se exprime em quadrados de unidades ( p. ex., reais2).
Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

32

Frmula alternativa para o clculo de varincia e desvio padro:

x
x n

s2

x
x n

n 1

n 1

(Baseado no exemplo 4.16)


Turma A
1
0
10
9
2
8
5
=

x2

Turma B
4
6
5
3
4
7
6
=

x2

COEFICIENTE DE VARIAO
Examinemos o seguinte exemplo, em que so comparados os pesos de dois grupos de
indivduos (crianas e adultos), apresentados na tabela abaixo:

Crianas ( kg )
4
2
6

Adultos ( kg )
66
64
62

Verificamos que o peso mdio para as crianas de 4 kg, enquanto para os adultos de 64 kg.
A disperso dos dados em torno da mdia a mesma, pois ambos tm desvio padro s = 2 kg.
Entretanto a variao de 2 kg no grupo de crianas, cujo peso mdio de 4 kg, mais importante do
que a mesma variao no grupo de adultos, cujo peso mdio 64 kg. Neste tipo de situao, mais
interessante o emprego de uma medida de disperso relativa adimensional e geralmente expressa em
porcentagens: o coeficiente de variao.
O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia de um
conjunto.

CV

Adriana Speggiorin e Andr Espindola

s
x 100
x

ou

CV

x 100

Probabilidade e Estatstica

33

Exemplo 4.18: Determinar os coeficientes de variao da tabela anterior.

AMPLITUDE INTERQUARTLICA
definida como a amplitude do intervalo entre o primeiro e o terceiro quartis, ou seja:
Q = Q3 - Q1
A amplitude interquartlica uma medida de variabilidade bastante robusta, que pouco
afetada pela presena de dados atpicos, onde 50% dos dados esto entre Q1 e Q3.

EXERCCIOS
1) O desvio padro pode ser zero? Explique.
2) Calcule a mdia e o desvio padro de uma amostra das vendas dirias, em reais;
8 100; 9 000; 4 580; 5 600; 7 680; 4 800 e 10 640
3) Em um exame final de Matemtica, o grau mdio de um grupo de 150 alunos foi 7,8 e o desvio
padro, 0,80. Em Estatstica, entretanto, o grau mdio final foi 7,3 e o desvio padro, 0,76. Em que
disciplina foi maior a disperso?
4) Uma distribuio apresenta as seguintes estatsticas: s = 1,5 e CV = 2,9%. Determine a mdia da
distribuio.
5) Sabendo que um conjunto de dados apresenta para mdia aritmtica e para desvio padro,
respectivamente, 18,3 e 1,47, calcule o coeficiente de variao.

6) Calcular a varincia e o desvio padro abaixo correspondente ao peso de um grupo de alunos


(amostra).
Aluno
A
B
C
D
E
F
G
H
I
J
K
L
Total

Peso (kg)
53,2
42,7
48,8
55,0
31,5
44,2
45,6
49,1
54,0
56,2
38,8
37,4

Adriana Speggiorin e Andr Espindola

Probabilidade e Estatstica

34

7) Medidas as estaturas de 1.017 indivduos, obtivemos x = 162,2 cm e s = 8,01 cm. O peso mdio
desses mesmos indivduos 52kg, com um desvio padro de 2,3kg. Esses indivduos apresentam
maior variabilidade em estatura ou em peso?
8) Um grupo de 85 moas tem estatura mdia de 160,6 cm, com um desvio padro igual a 5,97cm.
Outro grupo de 125 moas tem uma estatura mdia de 161,9 cm, sendo o desvio padro igual a
6,01cm. Qual o coeficiente de variao de cada um dos grupos? Qual o grupo mais homogneo?
9) Um grupo de cem estudantes tem uma estatura mdia de 163,8 cm, com um coeficiente de
variao de 3,3%. Qual o desvio padro desse grupo?
10) Quinze amostras de ar de certa regio foram obtidas e para cada uma delas foi determinada a
concentrao de monxido de carbono. Os resultados (em ppm) foram:

9,3
9,0

10,7
13,2

8,5
11,0

9,6
8,8

12,2
13,7

15,6
12,1

9,2
9,8

10,5

Determinar a concentrao mdia de monxido de carbono, a concentrao mediana e o desvio


padro relativos s 15 amostras.
RESPOSTAS
1) Sim.

2) x = 7200

s = 2284

3) CV em Matemtica = 10,3 e CV em Estatstica = 10,4%


4) 51,7
2

6) s = 60,6

5) 8%
s = 7,8

(para mdia = 46,4)

7) CV em estatura = 4,9%

CV em peso = 4,4%

8) CV primeiro grupo = 3,72%

CV segundo grupo = 3,71%

9) 5,4

10) x =10,88 Md=10,5

Adriana Speggiorin e Andr Espindola

s = 2,08

Probabilidade e Estatstica

35

Vous aimerez peut-être aussi