Vous êtes sur la page 1sur 77

1

Universidade Federal de Gois


Instituto de Matemtica e Estatstica

Probabilidade e Estatstica
2 Semestre de 2008
Estatstica Descritiva
1


INTRODUO

O cidado comum pensa que a estatstica se resume apenas a apresentar
tabelas de nmeros em colunas esportivas e ou econmicas de jornais e revistas,
ilustradas com grficos, pilhas de moedas, etc. ou quando muito associam a
estatstica previso de resultados eleitorais. Mas estatstico de hoje no se limita a
compilar tabelas de dados e os ilustrar graficamente. Pois partir de 1925, com os
trabalhos de Fisher, a estatstica iniciou-se como mtodo cientfico, ento, o
trabalho do estatstico passou a ser o de ajudara planejar experimentos, interpretar
e analisar os dados experimentais e apresentar os resultados de maneira a facilitar a
tomada de decises razoveis. Deste modo, podemos ento definir estatstica como
sendo a cincia que se preocupa com a coleta, organizao, apresentao, anlise e
interpretao de dados. Didaticamente podemos dividir a estatstica em duas
partes: a estatstica descritiva e a inferncia estatstica. A estatstica descritiva se
refere maneira de apresentar um conjunto de dados em tabelas e grficos, e ao
modo de resumir as informaes contidas nestes dados a algumas medidas. J a
inferncia estatstica baseia-se na teoria das probabilidades para estabelecer
concluses sobre todo um grupo (chamado populao), quando se observou apenas
uma parte (amostra) desta populao. necessrio ter em mente que a estatstica
uma ferramenta para o pesquisador, nas respostas dos por qus" de seus
problemas. E que para ela ser bem usada necessrio conhecer os seus
fundamentos e princpios, e acima de tudo que o pesquisador desenvolva um
esprito crtico e jamais deixe de pensar. Pois "em cincia fcil mentir usando a
estatstica, o difcil falar a verdade sem usar a estatstica".


1. CONCEITOS BSICOS

1.1 O QUE A ESTATSTICA?

Podemos dizer, de uma forma bem simplificada, que:

ESTATSTICA um conjunto de mtodos e processos quantitativos que serve
para estudar e medir os fenmenos coletivos.

1
Agradecimento especial profa. Sandra Regina Peres da Silva por ter cedido o original para adaptao
2

Tentando ser um pouco mais rigoroso, podemos dizer que:
ESTATSTICA a cincia que estuda as tcnicas necessrias para coletar,
organizar, apresentar, analisar e interpretar os dados, a fim de extrair informaes a
respeito de uma populao.

POPULAO o conjunto de todos os elementos (pessoas ou objetos) que
interessam ao estudo de um fenmeno coletivo segundo alguma caracterstica.

AMOSTRA qualquer subconjunto no vazio de uma populao.

PARMETRO uma caracterstica numrica estabelecida para toda uma
populao.

ESTIMADOR uma caracterstica numrica estabelecida para uma amostra.

Exemplo:
Fenmeno coletivo: eleio para governador do Estado de Gois.
Populao: conjunto de todos os eleitores do estado.
Parmetro: proporo de votos de um certo candidato X.
Amostra: grupo de 1.000 eleitores selecionados em todo o estado.
Estimador: proporo de votos do candidato X, obtida na amostra.

Dentre os modelos estatsticos podemos destacar os seguintes:

CENSO um levantamento estatstico (pesquisa) que abrange todos os elementos
de uma populao.

AMOSTRAGEM o processo de obter as amostras, com a finalidade de fazer
generalizaes sobre a populao sem precisar examinar cada um de seus
elementos.

Principais propriedades do Censo:
Confiabilidade 100%
Custo elevado
Lento
Nem sempre vivel

Principais propriedades da Amostragem:
Confiabilidade menor que 100%
Mais barata que o Censo
Mais rpida que o Censo
sempre vivel

3
















1.2 PARTES DA ESTATSTICA

Estatstica Descritiva a parte da Estatstica que trabalha com a organizao e a
apresentao dos dados.

Estatstica Indutiva ou Inferncia Estatstica a parte da Estatstica que
trabalha com anlise e interpretao dos dados, com o objetivo de obter e
generalizar concluses para a populao a partir de uma amostra.

Inicialmente vamos nos dedicar ao estudo da Estatstica Descritiva.
Posteriormente, abordaremos alguns aspectos da Inferncia Estatstica.

1.3 ATRIBUIES DA ESTATSTICA DESCRITIVA

Obteno ou coleta de dados normalmente feita atravs de um questionrio ou
de observao direta
Organizao dos dados consiste na ordenao e crtica dos dados
Apresentao dos dados atravs de tabelas e grficos
Obteno de algumas informaes como mdias, propores, disperses,
ndices que facilitam a descrio dos fenmenos observados.

Passamos a descrever os conceitos envolvidos em um estudo da Estatstica
Descritiva.

DADO ESTATSTICO toda informao devidamente coletada e registrada.
Todo dado se refere a uma varivel.




POPULAO

AMOSTRA
informaes
(concluses / tomada de decises)
Anlise e interpretao dos dados
(usando tcnicas estatsticas)
Coleta
4
VARIVEL uma caracterstica dos elementos de uma populao ou de uma
amostra, que pode assumir diferentes valores, sejam numricos ou no, e que
interessa ao estudo.

1.3.1 CLASSIFICAO DAS VARIVEIS











Varivel Qualitativa: tipo de varivel que no pode ser medida numericamente.
Exemplos: cor dos cabelos, marca de refrigerantes, cor dos olhos, etc.

As variveis qualitativas se classificam em dois tipos:
- Varivel Qualitativa Ordinal: quando seus elementos tm relao de ordem.
Exemplos: colocao primeiro lugar, segundo lugar, etc.
conceito timo, bom, regular, pssimo.

- Varivel Qualitativa Nominal: quando seus elementos so identificados por um
nome.
Exemplos: cor dos olhos, marcas de carro, etc.

Varivel Quantitativa: tipo de varivel que pode ser medida numericamente.
Exemplos: peso, altura, nmero de faltas, nmero de gols, etc.

J as variveis quantitativas tm as seguintes classificaes:
- Varivel Quantitativa Discreta: tipo de varivel que s pode assumir valores
pertencentes a um conjunto enumervel. Normalmente seus valores esto
associados a caracterstica de contagem.
Exemplos: nmero de carros vendidos, nmero de filhos, etc.


- Varivel Quantitativa Contnua: tipo de varivel que pode assumir qualquer
valor num intervalo de valores. Normalmente seus valores esto associados a
caracterstica de medidas.
Exemplos: altura das pessoas, peso dos recm-nascidos, etc.

Varivel
Qualitativa
Quantitativa
Ordinal

Nominal
Discreta

Contnua
5
Obs.: a varivel idade, apesar de ser representada, geralmente, por nmeros
inteiros, uma varivel contnua, pois est relacionada com o tempo, que uma
varivel contnua.

1.3.2 ORGANIZAO DE DADOS EM TABELAS

Objetivo: apresentar resumidamente, de maneira clara e precisa, um conjunto de
dados estatsticos.

So elementos das tabelas:

Ttulo texto conciso, indicador do contedo de uma tabela. Localizado no topo
da tabela, responde s perguntas: O qu? Quando? Onde?

Corpo conjunto de linhas e colunas que contm informaes sobre a varivel em
estudo. Cada cruzamento de uma linha com uma coluna constitui uma casa ou
clula.

Cabealho parte superior da tabela que especifica o contedo das colunas.

Coluna Indicadora parte da tabela que especifica o tipo de informao que cada
linha contm.

Fonte identificador do responsvel (pessoa fsica ou jurdica) pelo fornecimento
dos dados. No se indica a fonte no caso em que a tabela apresentada pelo
prprio pesquisador, ou pelo prprio grupo de pesquisadores, ou pela prpria
instituio que obteve os dados. inscrita na primeira linha do rodap (parte
inferior da tabela) e deve ser precedida da palavra Fonte:.
Notas so informaes de natureza geral que servem para esclarecer o contedo
das tabelas ou para explicar o mtodo utilizado no levantamento dos dados. As
notas so colocadas logo aps a fonte.

Chamadas so informaes de natureza especfica que servem para explicar ou
conceituar determinados dados. As chamadas so inscritas no rodap aps a Fonte
e as Notas.

As chamadas devem obedecer s seguintes regras:

a) A chamada deve ser indicada por algarismo arbico, ou por asterisco, entre
parnteses. A chamada deve ser escrita esquerda da casa, quando feita no
corpo da tabela, e direita da coluna indicadora, quando feita nessa coluna.
b) Se houver mais de uma chamada na mesma tabela, elas devem ser numeradas
sucessivamente, de cima para baixo e da esquerda para a direita.
6
c) As chamadas so colocadas no rodap da tabela, em ordem numrica e
separadas por pontos.
d) Quando a tabela ocupa vrias pginas, as chamadas devem ser apresentadas na
pgina em que aparecem.

Exemplo de tabela:

PRODUO BRASILEIRA DE CAF Ttulo
1991-1995
Coluna ANOS PRODUO (1.000 t) Cabealho
Indicadora 1991 2.535
1992 2.666
Casa ou clula
1993 2.122
1994 3.750
1995 2.007
Rodap FONTE: IBGE Corpo


1.3.3 NORMAS PARA APRESENTAO DE TABELAS

a) as tabelas devem ser delimitadas, no alto e em baixo, por traos horizontais;

b) as tabelas no devem ser delimitadas, direita e esquerda, por traos verticais;

c) o cabealho deve ser delimitado por traos horizontais;

d) podem ser feitos traos verticais no interior da tabela, separando as colunas;

e) as tabelas devem ter significado prprio, isto , devem ser entendidas mesmo
quando no se l o texto em que esto apresentadas;

f) as tabelas devem ser numeradas com algarismos arbicos;

g) a tabela deve ser colocada no texto em posio tal que no exija, para a leitura,
rotao da pgina em sentido horrio;

h) quando dois ou mais tipos de informao tiverem sido agrupados em um s
conjunto, esse conjunto entra na tabela sob a denominao outros;

i) as tabelas podem apresentar dados obtidos atravs de perguntas ou de
entrevistas. Nesses casos, se parte das pessoas no respondeu a determinada
pergunta, essa informao deve ser apresentada na tabela sob a especificao
sem declarao;

j) nenhuma clula da tabela deve ficar em branco. Toda clula deve apresentar um
nmero ou um sinal, conforme a conveno:
... dado numrico no disponvel
7
- dado numrico igual a zero no resultante de arredondamento.
0 quando o valor muito pequeno para ser expresso pela unidade
utilizada
x dado omitido, a fim de evitar a individualizao da informao

k) as tabelas muito longas precisam ser apresentadas em duas ou mais pginas.
Nesses casos, o cabealho deve ser repetido em todas as pginas, mas o ttulo
escrito apenas na primeira. Nas demais pginas escreve-se, em lugar do ttulo,
continua e na ltima escreve-se concluso. S deve ser feito o trao
inferior, que delimita a tabela, na ltima pgina;

l) as tabelas com muitas linhas e poucas colunas ficam melhor apresentadas
quando as colunas so organizadas em duas ou mais partes, escritas lado a lado.
Essas partes so separadas por dois traos verticais. Nesses casos, o cabealho
deve indicar o contedo das colunas em todas as partes;

m) as tabelas com muitas colunas precisam ocupar duas pginas que se
confrontam. Para facilitar a leitura, todas as linhas devem receber um nmero
de ordem. O nmero de ordem deve ser escrito na primeira coluna da pgina
esquerda e na ltima coluna da pgina direita;

n) o total geralmente apresentado na ltima linha, entre dois traos horizontais,
embora tambm possa ser apresentado na primeira linha.


1.4 SRIES ESTATSTICAS

Uma srie estatstica toda tabela que apresenta a distribuio de um conjunto de
dados estatsticos em funo do tempo, do local ou do fenmeno.


Tipos Bsicos de Sries:
Temporal, Cronolgica ou Histrica
Geogrfica, Territorial ou de Localizao
Categrica ou Especfica

Srie Temporal: usada para apresentar dados observados em determinado local,
discriminados ao longo do tempo.

8
Exemplo:

Produo Brasileira de Motos
1996-1998
Ano Produo (unidades)
1996 288.073
1997 426.547
1998 476.655
Fonte: Revista ISTO n
o
1546



Apresentao do tempo:

Toda srie temporal consecutiva deve ser apresentada, em uma tabela, por seus
perodos inicial e final ligados por um hfen (-).
Exemplos:
1991 1995 apresenta dados numricos para os anos de 1991, 1992, 1993,
1994, 1995;
Out 1991 Mar 1992 apresenta dados numricos para os meses de outubro,
novembro e dezembro de 1991 e janeiro, fevereiro e maro de 1992.

Toda srie temporal no consecutiva deve ser apresentada, em uma tabela, por
seus perodos inicial e final ligados por barra (/).
Ex: 1991/1995 apresenta dados para os anos entre 1991 e 1995, deixando de
apresentar dados numricos para algum (ns) dos anos desta srie.

Srie Geogrfica: usada para apresentar dados de diferentes regies geogrficas,
em determinado tempo.

Exemplo:

Vacinao contra a Poliomielite
1993
Regies Quantidade
Norte 211.209
Nordeste 631.040
Sudeste 1.119.708
Sul 418.785
Centro-Oeste 185.823
Fonte: Ministrio da Sade


9
Srie Categrica: usada para apresentar dados que se distribuem em diferentes
categorias, em determinado tempo e local.
Exemplo:

Avicultura Brasileira
1992
Espcies Nmero
(1.000 cabeas)

Galinhas 204.160
Galos, frangos, frangas e pintos 435.465
Codornas 2.488
Fonte: IBGE

Sries Mistas ou Conjugadas (tabela de dupla entrada): quando so feitas
combinaes de duas ou mais sries.

Exemplo:

Exportao Brasileira
1985/1995
Importadores 1985 1990 1995
Amrica Latina 13,0 13,4 25,6
EUA e Canad 28,2 26,3 22,2
Europa 33,9 35,2 20,7
sia e Oceania 10,9 17,7 15,4
frica e Oriente Mdio 14,0 8,8 5,5
Fontes: MIC e SECEX
Nota: Valores em percentagem


1.5 REPRESENTAO GRFICA DAS SRIES ESTATSTICAS

Os grficos produzem uma viso mais rpida e viva do fenmeno em estudo,
ajudando a visualizar as tendncias e a interpretar os valores representativos deste
fenmeno.

Requisitos Fundamentais na Representao Grfica:

O grfico deve ser simples, claro e deve expressar a verdade sobre o fenmeno
em estudo;
Todo grfico deve ter ttulo e escala, para que possa ser interpretado sem que
haja necessidade de esclarecimentos adicionais no texto;
O ttulo do grfico pode ser escrito acima ou abaixo do grfico. O IBGE
escreve o ttulo acima do grfico;
10
As variveis devem ser claramente identificadas;
A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os
valores iniciais dos dados so muito altos, deve ser feita uma interrupo no
eixo, com indicao clara da posio do zero;
O sistema de eixos cartesianos e as linhas auxiliares devem ter traado mais
leve do que a parte do grfico que se pretende evidenciar;
Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o
grfico feito dentro de um retngulo.


Principais Tipos de Grficos: Diagramas
Cartogramas
Pictogramas

Cartogramas: So representaes atravs de mapas (cartas geogrficas). Este
grfico empregado quando o objetivo o de relacionar os dados estatsticos
diretamente com reas geogrficas ou polticas.

Pictogramas: a representao grfica atravs de figuras. Por se tratar de uma
apresentao atraente, um grfico que desperta muito a ateno do leitor.

Diagramas: So grficos geomtricos construdos, em geral, no sistema
cartesiano.

Principais Diagramas: Grfico em Linha, Grfico em Colunas, Grfico em
Barras, Grfico em Colunas ou em Barras Mltiplas e Grfico em Setores.

Grfico em Linha: Usado para apresentar as sries temporais. Representado num
sistema de coordenadas cartesianas, cada par de valores da srie corresponde a um
ponto. Estes pontos so unidos por segmentos de reta.
Exemplo:

Tabela 1
PRODUO BRASILEIRA DE CAF
1991-1995
ANOS PRODUO (1.000 t)
1991 2.535
1992 2.666
1993 2.122
1994 3.750
1995 2.007
FONTE: IBGE
11
PRODUO BRASILEIRA DE CAF
1991-1995
0
500
1.000
1.500
2.000
2.500
3.000
3.500
4.000
1991 1992 1993 1994 1995
ANOS
P
R
O
D
U

O

(
1
.
0
0
0
t
)


Regras para a elaborao de um grfico em linhas:

Fixe a largura (l) do grfico;
Determine a altura mxima e a altura mnima de acordo com as normas a
seguir:
h
mn
= 60% da largura e h
mx
= 80% da largura
Determine os limites da escala, dividindo o maior valor a representar pela altura
mxima e pela altura mnima;
Determine a escala, escolhendo um valor, de preferncia inteiro, entre os
valores encontrados para limites;
Trace um sistema de coordenadas cartesianas;
Determine, graficamente, todos os pontos da srie;
Ligue esses pontos, dois a dois, por segmentos de reta;
Identifique, claramente, as variveis nos dois eixos;
Acrescente o Ttulo, a Fonte e a Legenda (quando necessria).


Grfico em Colunas: Usado para representar as sries cronolgicas, geogrficas e
categricas. Representado por meio de retngulos de mesma base, dispostos
verticalmente (em colunas).

Exemplo:
12
Tabela 1
PRODUO BRASILEIRA DE CAF
1991-1995
ANOS PRODUO (1.000 t)
1991 2.535
1992 2.666
1993 2.122
1994 3.750
1995 2.007


FONTE: IBGE


PRODUO BRASILEIRA DE CAF
1991-1995
0
500
1.000
1.500
2.000
2.500
3.000
3.500
4.000
1991 1992 1993 1994 1995
ANOS
P
R
O
D
U

O

(
1
.
0
0
0
t
)




Grfico em Barras: Usado para representar as sries geogrficas e categricas.
Representado por meio de retngulos dispostos horizontalmente (em barras).

Exemplo:

13
Tabela 2
EXPORTAES BRASILEIRAS
MARO 1995
ESTADOS VALOR (US$ milhes)
So Paulo 1.344
Minas Gerais 542
Rio Grande do Sul 332
Esprito Santo 285
Paran 250
Santa Catarina 202
FONTE: SECEX


E X P O R T A E S B R A S I L E I R A S
M A R O - 1 9 9 5
0 5 0 0 1 . 0 0 0 1 . 5 0 0
S o P a u l o
M i n a s G e r a i s
R i o G r a n d e d o S u l
E s p r i t o S a n t o
P a r a n
S a n t a C a t a r i n a
V a l o r ( U S $ m i l h e s )



OBSERVAES:

1) O procedimento para a construo de um grfico em colunas (ou barras)
anlogo ao do grfico em linhas, observando que no grfico em barras deve-se
fazer a inverso nos eixos cartesianos (o eixo x corresponde a altura e o eixo y
corresponde a largura).
2) Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferncia
ao grfico em barras (sries geogrficas e especficas).


Grfico em Colunas ou em Barras Mltiplas: Usado para representar as sries
conjugadas.

Exemplo:
14
Tabela 3
BALANA COMERCIAL DO BRASIL
1989 1993
ESPECIFICAES VALOR (US$ 1.000.000)
1989 1990 1991 1992 1993
Exportao (FOB) 34.383 31.414 31.620 35.793 38.783
Importao 18.263 20.661 21.041 20.554 25.711
FONTE: Ministrio da Fazenda



BALANA COMERCIAL DO BRASIL
1989-1993
0
5.000
10.000
15.000
20.000
25.000
30.000
35.000
40.000
45.000
1989 1990 1991 1992 1993
V
a
l
o
r

(
u
s
$

1
.
0
0
0
.
0
0
0
)
Exportao (FOB) Importao




Grfico em Setores: Construdo com base em um crculo, este grfico usado
para comparar propores.

Exemplo:

15
Tabela 4
REBANHO SUINO DO SUDESTE DO BRASIL
1992
ESTADOS QUANTIDADE (mil cabeas)
Minas Gerais 3.363,7
Esprito Santo 430,4
Rio de Janeiro 308,5
So Paulo 2.035,9

Total
6.138,5
FONTE: IBGE


REBANHO SUNO DO SUDESTE DO BRASIL 1992
55%
33%
5%
7%
Minas Gerais Esprito Santo Rio de Janeiro So Paulo



Regras para a elaborao de um grfico em setores:
Trace uma circunferncia. A rea do crculo representa o total, isto , 100%,
devendo ser dividida em tantos setores quantas sejam as partes.
Lembre-se de que uma circunferncia tem 360. Ento, se ao total
correspondem 360, a cada parte corresponder um setor cujo ngulo x dado
por:
TOTAL
PARTE
x
360
=
Marque os valores dos ngulos calculados na circunferncia e trace os raios,
separando os setores.
Para facilitar a distino, faa um tracejado diferente em cada setor.
Coloque ttulo e legenda no grfico.
OBS.: Para clareza dos dados, deve-se usar no mximo sete setores.
16
1.6 DISTRIBUIO DE FREQUNCIAS

Freqentemente, ao coletar dados, o pesquisador se depara com uma grande
massa de valores numricos, que se repetem algumas vezes, dificultando sua
anlise e interpretao. Surge ento a necessidade de organizar esses dados em
uma tabela onde os valores observados se apresentam associados individualmente
ou em classes com os nmeros de suas repeties, isto , com suas respectivas
freqncias. Esta tabela recebe o nome de Distribuio de Freqncias.

De acordo com a disposio dos dados tm-se dois tipos de distribuio:

1.6.1 Distribuio de Freqncias Simples (dados no agrupados ou no
tabulados em classes de valores)

uma tabela onde os valores da varivel analisada aparecem individualmente
correlacionados com os nmeros de suas repeties (freqncias).

Esse tipo de distribuio normalmente usado para representar variveis
discretas.

Exemplo:

Tabela 1

Construtora Aimors Nmero de Acidentes Registrados
Janeiro de 2000
N de Acidentes N de Dias
0 18
1 5
2 2
3 2
4 3
5 1
Total 31
FONTE: Dados Hipotticos


1.6.2 Distribuio de Freqncias por Classes (dados agrupados ou
tabulados em classes de valores)

Quando a varivel analisada apresenta um grande nmero de valores torna-se
mais vantajoso o agrupamento destes em classes de freqncia, evitando assim
grande extenso da tabela e facilitando a visualizao do fenmeno como um todo.

17
A distribuio de freqncias por classes uma tabela onde os valores
observados so agrupados em classes, isto , em intervalos de variaes da varivel
em questo.
Esse tipo de distribuio normalmente usado para representar variveis
contnuas. utilizada tambm para representar variveis discretas em um grande
nmero de valores observados.

Exemplo:
Tabela 2
Salrios dos funcionrios da Loja XY
Salrios (R$) N de funcionrios
1000 1200 2
1200 1400 6
1400 1600 10
1600 1800 5
1800 2000 2
Total 25
FONTE: Dados Hipotticos


A seguir so apresentados alguns conceitos fundamentais para a compreenso
dessas sries.


Dados Brutos

a apresentao dos dados observados na seqncia em que foram coletados, isto
, sem nenhuma ordenao numrica.

Exemplo:
O nmero de peas defeituosas obtidas da produo de uma mquina durante vinte
dias foi:
2 4 2 1 2 3 1 0 5 1 0 1 1 2 0 1 3 0 1 2


Rol

a organizao dos dados brutos em ordem crescente ou decrescente.

Exemplo:
O rol do exemplo anterior :
0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 5


18
Amplitude Total (A
T
)

a diferena entre o maior valor e o menor valor da seqncia dos dados
observados.

A
T
= valor mximo valor mnimo

Exemplo:
A amplitude total do rol apresentado : A
T
= 5 0 = 5


Freqncia Absoluta Simples (ou simplesmente freqncia)

Denotada por F
i
, a freqncia indica o nmero de ocorrncias de cada valor ou o
nmero de valores pertencentes a uma classe.

Na Tabela 1: F
6
= F(5) = 1

Na Tabela 2: F
2
= 6


1.6.3 Regras para a elaborao de uma Distribuio de Freqncias
Simples

a) Escreve-se, ordenadamente, os dados observados na coluna indicadora.
b) Obtm-se as freqncias absolutas simples dos dados (F
i
). Essas freqncias
constituem o corpo da tabela.

Exemplo:

Sejam os dados abaixo representativos de uma pesquisa sobre o nmero de irmos
de 20 alunos da Turma PEST.

Dados Brutos:
1 3 0 5 2 1 1 0 0 1 4 3 1 0 1 2 2 1 3 1

Rol:
0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 3 3 3 4 5

A distribuio de freqncias do rol apresentado :

19
Tabela 3

Nmero de Irmos de 20 alunos da Turma PEST
i Nmero de Irmos (x
i
) Repeties (F
i
)
1 0 4
2 1 8
3 2 3
4 3 3
5 4 1
6 5 1
Total F
i
= 20

1 Coluna (i) nmero de ordem dos valores distintos da varivel nmero de
irmos.
2 Coluna (x
i
) valores distintos da varivel nmero de irmos.
3 Coluna (F
i
) nmero de repeties dos valores distintos da varivel nmero de
irmos.

Nota:
k
i
i 1
F n
=
=

, onde n igual ao nmero de dados observados (n = 20)



Observa-se que neste tipo de tabela no h perda de informao, podendo os dados
originais serem reconstitudos a partir da distribuio elaborada.


1.6.4 Tipos de Freqncias

Para a interpretao dos resultados de uma pesquisa, conforme os tipos de
informaes requeridas utilizam-se diversos tipos de freqncias de dados.

A seguir sero apresentados os tipos de freqncias, derivados da distribuio de
freqncias absolutas, bastante teis na interpretao de dados.



Freqncia Total

a soma de todas as freqncias absolutas simples em uma tabela.

k
i
i 1
F n
=
=



20
A freqncia total de uma distribuio de freqncias igual ao nmero total de
observaes (n).

Exemplo:

Na Tabela 3, temos:

6
i 1 2 3 4 5 6
i 1
F F F F F F F 4 8 3 3 1 1 20
=
= + + + + + = + + + + + =





Freqncia Relativa Simples, ou simplesmente, Freqncia Relativa

Simbolizada por f
i
, a freqncia relativa simples fornece a proporo de cada valor
ou de casos ocorridos em cada classe, em relao ao nmero total de observaes.
Portanto, um nmero relativo. Para calcular a freqncia relativa, basta dividir a
freqncia absoluta da ordem em questo pelo nmero de observaes.

n
F
f
i
i
=

As comparaes expressas atravs de porcentagem so mais usuais. Para obter a
porcentagem de cada valor ou de casos ocorridos em cada classe, multiplica-se o
quociente obtido por 100, ou seja:
i
i
F
f 100
n
=

Nota:
k
i
i 1
f 1
=
=

ou 100%
Exemplo:

Na Tabela 3, temos:

1
1
F 4
f 0, 20 100 20
20 20
= = = = %

2
2
F 8
f 0, 40 100
20 20
= = = =40%

3
3
F 3
f 0,15 100 15
20 20
= = = = %
21
4
4
F 3
f 0,15 100 15
20 20
= = = = %

5
5
F 1
f 0, 05 100 5
20 20
= = = = %

6
6
F 1
f 0, 05 100 5
20 20
= = = = %


Freqncia Absoluta Acumulada

Denotada por Fac
i
, a freqncia absoluta acumulada fornece a informao de
quantos elementos se situam at determinado valor. A freqncia acumulada do i-
simo valor ou i-sima classe (freqncia acumulada de ordem i) obtida
somando-se a freqncia desse valor ou classe com as freqncias anteriores, ou
seja, a soma de todas as freqncias de ordens menores ou igual a da ordem em
questo.

Exemplo:
Fac
3
=
3
i 1 =

F
i
= F
1
+ F
2
+ F
3


Fac
4
=
4
i 1 =

F
i
= F
1
+ F
2
+ F
3
+ F
4


Exemplo:

Na tabela 3, temos:

Fac
1
= F
1
= 4 Fac
4
= F
1
+ F
2
+ F
3
+ F
4
= 15 + 3 = 18

Fac
2
= F
1
+ F
2
= 4 + 8 = 12

Fac
5
= F
1
+ F
2
+ F
3
+ F
4
+ F
5
= 18 + 1 = 19
Fac
3
= F
1
+ F
2
+ F
3
= 12 + 3 = 15 Fac
6
= F
1
+ F
2
+ F
3
+ F
4
+ F
5
+ F
6
= 19 + 1 = 20

Freqncia Acumulada Relativa

Denotada por fac
i
, fornece a proporo de elementos situados at determinado
valor. Consiste na soma da freqncia relativa de cada valor ou classe com as
freqncias relativas dos valores ou classes anteriores, ou seja, a soma das
freqncias simples relativas de ordens menores ou iguais a da ordem em questo.
.
22
Exemplo:
fac
3
=
3
i 1 =

f
i
= f
1
+ f
2
+ f
3


Exemplo:
Na tabela 3, temos:

fac
1
= f
1
= 0,20 = 20%

fac
2
= f
1
+ f
2
= 0,20 + 0,40 = 0,60 = 60%

fac
3
= f
1
+ f
2
+ f
3
= 0,60 + 0,15 = 0,75 = 75%

fac
4
= f
1
+ f
2
+ f
3
+ f
4
= 0,75 + 0,15 = 0,90 = 90%

fac
5
= f
1
+ f
2
+ f
3
+ f
4
+ f
5
= 0,90 + 0,05 = 0,95 = 95%

fac
6
= f
1
+ f
2
+ f
3
+ f
4
+ f
5
+ f
6
= 0,95 + 0,05 = 1 = 100%

A freqncia relativa acumulada de ordem i pode ser tambm calculada atravs do
quociente:
=


Exemplo:

3
15
fac 0, 75 75
20
= = = %

Com relao Tabela 3, utilizando todos os tipos de freqncias definidas
anteriormente, podemos construir a seguinte distribuio de freqncias:


Tabela 4
Nmero de Irmos de 20 alunos da Turma PEST
i x
i
F
i
f
i
f
i
(%) Fac
i
fac
i
fac
i
(%)
1 0 4 0,20 20 4 0,20 20
2 1 8 0,40 40 12 0,40 40
3 2 3 0,15 15 15 0,75 75
4 3 3 0,15 15 15 0,90 90
5 4 1 0,05 5 5 0,95 95
6 5 1 0,05 5 5 1,00 100
Total 20 1,00 100



FONTE: Dados Fictcios
23
Interpretao:

f
3
= 0,15; 15% dos alunos responderam que tm 2 irmos.
F
2
= 8; 8 alunos responderam que tm 1 irmo;
fac
3
= 0,75; 75% dos alunos responderam que tm entre 0 e 2 irmos.
1.6.5 Representao Grfica de uma Distribuio de Freqncias
Simples

A distribuio de Freqncias Simples representada graficamente por um Grfico
em Hastes, um diagrama onde as freqncias so representadas por segmentos de
retas perpendiculares ao eixo das abcissas. Cada segmento determinado pelos
pontos (x
i
,F
i
) e (x
i
,0).


Exemplo: Representao grfica da Tabela 3.














EXERCCIOS

1. Considere a seguinte distribuio de freqncias correspondente aos diferentes
preos de um determinado produto pesquisados em 20 lojas.

Preos do Produto A
i Preo (R$) Nmero de Lojas
1 50 2
2 51 5
3 52 6
4 53 6
5 54 1
Total 20
FONTE: Dados Fictcios

0 1 2 3 4 5 x
i
(numero de irmos)
F
i
1

3

4

8

24
a) Quantas lojas apresentam preos de R$ 52,00?
b) Determine as freqncias relativas simples e as freqncias absolutas
acumuladas.
c) Quantas lojas apresentaram um preo de at R$ 52,00 (inclusive)?
d) Qual a percentagem de lojas com preos de at R$ 53,00 (inclusive)?

2. A distribuio de freqncias a seguir apresenta o nmero de acidentes por dia,
durante 40 dias, em determinado cruzamento.

Nmero de Acidentes no Cruzamento X
i N de Acidentes por dia
(x
i
)
Nmero de Dias
(F
i
)
1 0 30
2 1 5
3 2 3
4 3 1
5 4 1
Total 40
FONTE: Dados Fictcios


a) Determine as freqncias absolutas acumuladas, as freqncias simples
relativas e as freqncias acumuladas relativas.
b) Aps ter determinado as freqncias acima, interprete todos os resultados da 3
linha da distribuio de freqncias.


3. Em uma amostra de 30 milheiros de telhas recebidas pela Construtora ABC
Ltda, constatou-se os seguintes nmeros de unidades defeituosas por milheiro:

5 20 10 5 40 30 20 5 10 15 10 30 40 10 50 10
30 15 20 40 10 20 20 50 10 40 30 20 0 30

a) Agrupar estes dados em uma distribuio de freqncias simples.
b) Represent-la atravs de um grfico conveniente.
c) Calcular todos os tipos de freqncias conhecidos.
d) Qual a percentagem de milheiros com mais de 30 telhas defeituosas?
e) Quantos milheiros tiveram menos de 10 telhas defeituosas?
f) Qual a proporo de milheiros com menos de 20 telhas defeituosas?


25
4. Dada a distribuio de freqncias:

Indstria de Equipamentos Eletrnicos IEE
Nmero de Falhas em Componentes durante o perodo
de garantia
Janeiro de 2000
i N de Falhas
(x
i
)
Nmero de Equipamentos
(F
i
)
1 0 148
2 1 52
3 2 34
4 3 26
5 4 13
6 5 7
Total 280
FONTE: Dados Fictcios


a) Determinar as freqncias relativas percentuais, as freqncias acumuladas e as
freqncias relativas acumuladas percentuais.
b) Atravs das freqncias calculadas, responder qual a porcentagem de:
b.1) equipamentos que no apresentaram falha em seus componentes;
b.2) equipamentos que apresentaram pelo menos uma falha em seus componentes;
b.3) equipamentos trocados, sabendo-se que a indstria se compromete a trocar o
equipamento que apresente 4 ou mais falhas em seus componentes.


5. Considere os seguintes nmeros.

1 3 5 7 9 2 4 6 8 10 15 20 25
0 1 2 3 4 5 6 7 8 9 9 8 7
8 6 5 4 3 2 1 0 10 15 20 25 12
8 11 6 4 2 1 3 5 7 9 11

a) Construa a distribuio de freqncias simples.
b) Represent-la atravs de um grfico conveniente.
c) Calcular todos os tipos de freqncias conhecidos.








26
1.7 Intervalo de Classe ou Classe

Classes so intervalos de variaes da varivel, ou seja, cada um dos grupos de
valores em que se subdivide a amplitude total do conjunto de valores observados
da varivel.

Uma determinada classe pode ser identificada por seus extremos ou pela ordem em
que ela se encontra na tabela (valor do ndice i)

O nmero de classes de uma distribuio de freqncias ser denotado por k.

A notao indica intervalo fechado esquerda. Assim, na Tabela 2, um
funcionrio que apresentou salrio de R$ 1400,00 pertence classe
1400 1600, ou terceira classe (i = 3).

Existem diversas maneiras de expressar as classes:
a) a b compreende todos os valores entre a e b, incluindo a e b
b) a b compreende todos os valores entre a e b, excluindo a
c) a b compreende todos os valores entre a e b, excluindo b
d) a b compreende todos os valores entre a e b, excluindo a e b

Em nosso curso usaremos a forma expressa em c).


1.7.1 Limites de Classe

So os valores extremos de cada classe. O menor valor denomina-se limite inferior
da classe i (l
i
) e o maior, limite superior da classe i (L
i
).

Assim, na quarta classe da Tabela 2 tem-se l
4
= 1600 e L
4
= 1800.


1.7.2 Amplitude do Intervalo de Classe (h)

A amplitude do intervalo de classe o comprimento da classe, sendo definida
como a diferena entre o limite superior e o limite inferior da classe.

h
i
= L
i
l
i

Exemplo:

Na Tabela 2, temos:
h
1
= 1200 1000 = 200
h
2
= 1400 1200 = 200
27
Em geral h
1
= h
2
= h
3
= ... = h
k
= h, e determina-se a amplitude do intervalo
fazendo:

T
A
h
k
=
Exemplo: Dados: A
T
= 64 e k = 7. Temos: h =
64
7
= 9,14 10

Nota: Sugere-se sempre aproximar o valor encontrado para o inteiro superior.

1.7.3 Nmero de Classes (k)

No existe uma regra fixa que fornea o nmero de classes. No entanto, como o
objetivo da distribuio de freqncias facilitar a compreenso dos dados,
importante que a distribuio contenha um nmero adequado de classes. Se este
nmero for escasso, os dados originais ficaro to comprimidos que pouca
informao poder ser extrada da tabela. Se por outro lado forem utilizadas vrias
classes, haver algumas com freqncias nulas ou muito pequenas e o resultado
ser uma distribuio irregular e prejudicial interpretao do fenmeno como um
todo. Na prtica esse nmero no deve ser superior a 20 nem inferior a 5. Se a
quantidade de dados for pequena no se justifica a construo de uma tabela, e se
for grande, mais de 20 classes dificulta a anlise.

Em funo do total de observaes existem vrios mtodos que orientam a escolha
de um nmero de classes conveniente. Seguem-se os dois mais utilizados:

a) Regra da Raiz Quadrada

k = 5 para n 25
k = n para n > 25, onde n o nmero de observaes.

Exemplo:
Para n = 30, o nmero de classes ser 48 , 5 30 = 5.


b) Regra de Sturges
k = 1 + 3,3 log n,

onde: n = nmero de observaes.

Exemplo:

Para n = 30, tem-se: k = 1 + 3,3 log 30 6.

28
Para n = 30 os resultados obtidos pelos dois critrios so bastante prximos. O
mesmo no acontece para valores grandes de n onde a regra de Sturges tem o
inconveniente de prever um nmero relativamente pequeno de classes e o
procedimento da raiz quadrada, um nmero relativamente grande. Neste caso deve
prevalecer o bom senso do analista.


1.7.4 Ponto Mdio da Classe (x
i
)

Considerando que os valores de uma classe esto distribudos uniformemente, o
ponto mdio ou valor mdio de uma classe o valor que melhor a representa para
efeito de clculo de certas medidas.

O ponto mdio de uma classe i definido por:
i i
i
l L
x
2
+
=

Uma outra maneira de obter o ponto mdio adicionar a metade da amplitude ao
limite inferior da classe.

Na Tabela 2, o ponto mdio da classe 1200 1400 :

3
1200 1400
x 1300
2
+
= = , ou
3
200
x 1200 1300
2
= + = .


1.7.5 Regras para a elaborao de uma Distribuio de Freqncias
por Classes

a) Determinar o rol (opcional).

b) Determinar a amplitude total (A
T
) dos dados:

A
T
= valor mximo valor mnimo

c) Determinar o nmero conveniente de classes (k), de acordo com um dos
critrios citados anteriormente.

d) Determinar a amplitude de cada classe (h) dividindo a amplitude total pelo
nmero de classes.
AT
h
k
=

Muitas vezes ao efetuar esta diviso, pode-se chegar a um resultado no muito
conveniente sob o aspecto de montagens das classes. Neste caso sugere-se que o
29
valor encontrado seja aproximado para o maior inteiro, caso contrrio algum dado
excederia o limite superior da ltima classe prevista.

e) Determinar os limites das classes, escolhendo-se, preferencialmente, nmeros
inteiros. O limite inferior da primeira classe e o limite superior da ltima, no
precisam, necessariamente, pertencer ao conjunto.

f) Construir a tabela de freqncias, contando o nmero de ocorrncia de cada
classe.


Exemplo:

Os dados a seguir representam as notas de 50 alunos.

33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97

Vamos agrupar estes elementos em uma distribuio de freqncias por classes

a) Amplitude Total: A
T
= 97 33 = 64

b) Nmero de Classes: k = 50 7 ou k = 1 + 3,3 log 50 = 1 + 3,3 x 1,7 7

c) Amplitude das Classes (h):
T
A 64
h 9,14 10
k 7
= = = (aproximar para o maior
inteiro)

d) Limites das Classes

30 40
40 50
50 60
60 70
70 80
80 90
90 100


e) Distribuio de Freqncias por Classes


Ponto inicial = 30 (o ponto inicial deve ser sempre menor ou igual ao
menor valor observado)
Ponto final = 100 (o ponto final deve ser sempre maior que o
maior valor observado)
30
Notas de 50 alunos
Classes Notas F
i
f
i
f
i
(%) Fac
i
fac
i
fac
i
(%) x
i

1 30 |--- 40 4 0,08 8 4 0,08 8 35
2 40 |--- 50 6 0,12 12 10 0,20 20 45
3 50 |--- 60 8 0,16 16 18 0,36 36 55
4 60 |--- 70 13 0,26 26 31 0,62 62 65
5 70 |--- 80 9 0,18 18 40 0,80 80 75
6 80 |--- 90 7 0,14 14 47 0,94 94 85
7 90 |--- 100 3 0,06 6 50 1,00 100 95
Total
50 1,00 100

FONTE: Dados Hipotticos

Interpretao:

F
3
= 8 8 alunos obtiveram nota igual ou superior a 50 e inferior a 60.
f
4
= 26% 26% dos alunos obtiveram notas entre 60 (inclusive) e 70 (exclusive).
Fac
6
= 47 47 alunos obtiveram notas inferiores a 90.
fac
5
= 80% 80% dos alunos obtiveram notas inferiores a 80.


1.8 Distribuio de Freqncias com Intervalos de Classes Desiguais

Existem casos em que mais adequado agrupar os dados em classes com
larguras desiguais, como, por exemplo, as idades dos atletas de acordo com a
categoria a que pertencem.

Exemplo:

Tabela 5

Categoria de Atletas por Idade
Classes Idades
F
i

1 2 |--- 13 12
2 13 |--- 15 5
3 15 |--- 18 8
4 18 |--- 30 30
5 30 |--- 40 12
6 40 |--- 60 10
7 60 |--- 90 2
Total
79



31
1.9 Grficos de uma Distribuio de Freqncias por Classes

1. Histograma

um tipo de grfico apropriado para representar dados agrupados em classes.
Consiste de colunas justapostas cujas bases representam as classes e as alturas
correspondem s freqncias das classes.


2. Polgono de Freqncias

Trata-se da representao de uma distribuio de freqncias por classes,
atravs de um polgono.

O eixo das abcissas constitui a base do polgono. Os vrtices so os pontos
(x
i
,F
i
) onde x
i
o ponto mdio e F
i
a freqncia da classe.

O fechamento da poligonal com a base feito unindo o primeiro vrtice ao
ponto mdio de uma classe anterior primeira, e o ltimo vrtice ao ponto mdio
de uma classe posterior ltima.

Esse grfico adequado tambm para a representao de freqncias relativas e
percentuais.


3. Polgono de Freqncias Acumuladas ou Ogiva de Galton

Utilizado para representar as freqncias acumuladas. Os vrtices so os pontos
(L
i
, Fac
i
). Pode ser usado tambm para representar as freqncias acumuladas
relativas percentuais. O fechamento feito unindo o primeiro vrtice ao limite
inferior da primeira classe.
Esse grfico ser til para a determinao das medidas separatrizes que sero
tratadas posteriormente.

Exemplo:
Dada a distribuio de freqncias:
Notas dos alunos da turma PEST
Notas Fi
Fac Fi xi
30 |--- 40 4 4 0,08 35
40 |--- 50 6 10 0,12 45
50 |--- 60 8 18 0,16 55
60 |--- 70 13 31 0,26 65
70 |--- 80 9 40 0,18 75
80 |--- 90 7 47 0,14 85
90 |--- 100 3 50 0,06 95
Total 50

1,00

32
Os grficos representativos dessa distribuio so:

HISTOGRAMA E POLGONO DE FREQUNCIAS
















POLGONO DE FREQUNCIAS ACUMULADAS



















EXERCCIOS

1. Os dados a seguir referem-se s notas de 50 alunos:

60 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
71 55 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89
3
4
6
7
8
9
13
F
i
30 40 50 60 70 80 90 100 classe
Polgono de
freqncia
10
4
18
47
31
40
50
Fac
30 40 50 60 70 80 90 100 classe
33
Pede-se:
a) A amplitude total da amostra.
b) O nmero de classes.
c) A amplitude das classes.
d) As classes (valor inicial = 30).
e) As freqncias absolutas das classes.
f) As freqncias relativas.
g) Os pontos mdios das classes.
h) As freqncias acumuladas das classes.
i) O histograma.
j) O polgono de freqncias.
k) O polgono de freqncias acumuladas.


2. A tabela abaixo apresenta os salrios de 90 operrios da Empresa Ao S/A

Salrios dos Funcionrios da Empresa
Ao
Classes Salrios
Mnimos
F
i

1 1 |--- 3 40
2 3 |--- 5 30
3 5 |--- 7 10
4 7 |--- 9 5
5 9 |--- 11 5
Total
90

a) Determine as freqncias simples relativas, as freqncias absolutas
acumuladas e as freqncias relativas acumuladas.
b) Quantos funcionrios ganham menos de 3 salrios mnimos?
c) Quantos ganham mais de salrios mnimos?
d) Qual a percentagem de operrios com salrio entre 5 e 7 salrios mnimos?
e) Qual a percentagem de operrios com salrio inferior a 7 salrios mnimos?
f) Construa o histograma e o polgono de freqncia.


3. Complete a tabela abaixo:

i Classes x
i
F
i
Fac
i
f
i

1 0 |--- 2 1 4 0,04
2 2 |--- 4 8
3 4 |--- 6 5 30 0,18
4 |--- 7 27 0,27
5 8 |--- 10 15 72
6 10 |--- 12 83
7 |--- 13 10 93 0,10
8 14 |--- 16 0,07
Total

34
4. A tabela abaixo apresenta uma distribuio de freqncia das reas de 400
lotes:

i reas (m
2
) N de Lotes
1 300 |--- 400 14
2 400 |--- 500 46
3 500 |--- 600 58
4 600 |--- 700 76
5 700 |--- 800 68
6 800 |--- 900 62
7 900 |--- 1000 48
8 1000 |--- 1100 22
9 1100 |--- 1200 6

Com referncia a essa tabela determine:
a) A amplitude total.
b) O limite superior da 5 classe.
c) A freqncia acumulada da 4 classe.
d) O nmero de lotes cuja rea no atinge 700 m
2
.
e) O nmero de lotes cuja rea superior ou igual a 800 m
2
.
f) A classe do 72 lote.


5. Responda as seguintes questes:
a) O que freqncia simples absoluta de uma classe?
b) O que freqncia simples relativa de uma classe?
c) O que freqncia acumulada absoluta de uma classe?
d) O que freqncia acumulada relativa de uma classe?
e) O que limite inferior de uma classe?
f) O que ponto mdio de uma classe?


6. Os pesos de 40 alunos esto relacionados a seguir:

69 57 72 54 93 68 72 58 64 62
65 76 60 49 74 59 66 83 70 45
60 81 71 67 63 64 53 73 81 50
67 68 53 53 65 58 80 60 63 53

a) Agrupar estes dados em classes de valores (Dado log 40 = 1,6).
b) Determine as freqncias relativas, as freqncias acumuladas e as freqncias
relativas acumuladas.
c) Determine os pontos mdios das classes.
d) Interprete todos os resultados da 3 linha da tabela.
e) Construa o histograma, o polgono de freqncias e o polgono de freqncias
acumuladas da distribuio.
35
7. Os dados abaixo referem-se ao consumo mensal de energia eltrica em kwh
da conta n 001.161157-1 das Centrais Eltricas de Gois, no perodo de 1997 a
1999.

142 178 164 190 146 131 119 131 187 158 168 111
96 118 182 116 188 207 229 180 181 175 205 179
184 227 210 210 213 190 240 215 226 188 190 205

a) Sintetizar esses dados atravs de uma distribuio de freqncias por classes.
b) Calcular todos os tipos de freqncias que voc conhece.
c) Com base nas freqncias calculadas, apresentar os seguintes percentuais:
c.1) de meses com consumo inferior a 150 kwh.
c.2) de meses com consumo superior a 200 kwh.
d) Representar a distribuio elaborada atravs de um histograma e de um
polgono de freqncias.
e) Representar a distribuio de freqncias acumuladas atravs de uma Ogiva.


8. Dada a amostra:

28 33 27 30 31 30 33 30 33 29
27 33 31 27 31 28 27 29 31 24
31 33 30 32 30 33 27 33 31 33
23 29 30 24 28 34 39 30 18 17
18 15 16 17 17 18 19 19 20 29

a) Agrupar os elementos em classes (inicie pelo 15 e use h = 5).
b) Calcule as freqncias absolutas, as freqncias acumuladas e os pontos mdios
das classes.
c) Interprete todos os resultados da 4 linha da tabela.
d) Construa o histograma, o polgono de freqncias e o polgono de freqncias
acumuladas da distribuio.


9. Abaixo temos a distribuio dos aluguis de 65 casas.

Aluguel (centenas de $) 1,5 |-- 3,5 3,5 |-- 5,5 5,5 |-- 7,5 7,5 |-- 9,5 9,5 |-- 11,5

N de casas 12 18 20 10 5

Com referncia a essa tabela determine:
a) A amplitude total.
b) O limite superior da 5 classe.
c) A freqncia acumulada da 4 classe.
d) O nmero de aluguis cujo valor atinge, no mximo, R$ 550,00.
36
e) O nmero de aluguis cujo valor superior ou igual a R$ 750,00.
f) A classe do 50 aluguel.


10. A distribuio de freqncia abaixo representa o consumo por nota de 54 notas
fiscais emitidas durante um dia em uma loja de departamentos.

Consumo por nota (R$) n de notas
0 |------ 50 10
50 |------ 100 28
100 |------ 150 12
150 |------ 200 2
200 |------ 250 1
250 |------ 300 1

a) Interprete todos os resultados da 4 linha da tabela.
b) Construa o histograma e o polgono de freqncias.
37
2. MEDIDAS DE POSIO



As medidas de posio so valores que representam o conjunto de dados
observados ou ento promovem uma partio sobre este conjunto. Entre as
medidas de posio destacam-se as medidas de tendncia central e as separatrizes.


2.1 MEDIDAS DE TENDNCIA CENTRAL

A maneira mais simples de resumirmos as informaes contidas em um
conjunto de dados observados estabelecer um ponto central em torno do qual os
dados se distribuem. Tais medidas orientam quanto posio do conjunto no eixo
dos nmeros reais e possibilitam comparaes de sries de dados entre si pelo
confronto destes nmeros. So chamadas Medidas de Tendncia Central, pois
representam os fenmenos pelos seus valores mdios em torno dos quais tendem a
se concentrar os dados.

2.1.1 MDIA ARITMTICA ( x )


a) Mdia aritmtica para dados no agrupados

Sejam x
1
, x
2
, ..., x
n
, n valores da varivel X. A mdia aritmtica simples, denotada
por x , definida por:
n
i
i 1
x
x
n
=
=

,

onde n o nmero de valores observados da varivel X.


Exemplo:
Determinar a mdia aritmtica simples dos valores: 7,0; 3,0; 5,5; 6,5; 8,0.

5
i
i 1
x
7, 0 3, 0 5,5 6,5 8, 0
x 6, 0
5 5
=
+ + + +
= = =




38

b) Mdia aritmtica para dados agrupados

Neste caso, usamos a mdia aritmtica dos valores x
1
, x
2
, ..., x
k
, ponderada pelas
suas respectivas freqncias absolutas F
1
, F
2
, F
3
, ... , F
k
. Desta forma, temos:
k
i i
i 1
x F
x
n
=
=

,
onde n = F
1
+ F
2
+ ... + F
k
=
k
i
i 1
F
=



Observao: Quando se tratar de uma distribuio de freqncia por classe, x
i

corresponde ao ponto mdio da classe, ou seja,
i i
i
l L
x
2
+
= .

Exemplos:

1. Determinar a mdia aritmtica da distribuio a seguir.

NMERO DE IRMOS DE 20 ALUNOS DA TURMA IDX
i x
i
F
i

1 0 4
2 1 8
3 2 3
4 3 3
5 4 1
6 5 1
TOTAL 20
Fonte: Dados Hipotticos

Soluo:

Para determinar a mdia acrescentaremos a coluna com o clculo de x
i
F
i


NMERO DE IRMOS DE 20 ALUNOS DA TURMA IDX
i x
i
F
i
X
I
F
I

1 0 4 0
2 1 8 8
3 2 3 6
4 3 3 9
5 4 1 4
6 5 1 5
39
TOTAL 20 32
Fonte: Dados Hipotticos

k 6
i i i i
i 1 i 1
x F x F
32
x 1, 6
n 20 20
= =
= = = =




2. Dada a distribuio:

Renda Familiar de 40 Famlias
i Salrios (R$
1.000)
F
i
1 2 |--- 4 5
2 4 |--- 6 10
3 6 |--- 8 14
4 8 |--- 10 8
5 10 |--- 12 3
TOTAL 40
Fonte: Dados Hipotticos

Determinar a renda mdia familiar destas 40 famlias.

Soluo:
Acrescentamos as colunas com os clculos de x
i
e x
i
F
i
,
Renda Familiar de 40 Famlias
i Salrios
(R$ 1.000)
F
i
x
i
x
i
F
i
1 2 |--- 4 5 3 15
2 4 |--- 6 10 5 50
3 6 |--- 8 14 7 98
4 8 |--- 10 8 9 72
5 10 |--- 12 3 11 33
TOTAL 40

268
Fonte: Dados Hipotticos

e utilizamos a frmula:
k 5
i i i i
i 1 i 1
x F x F
268
x 6, 7
n 40 40
= =
= = = =



40
Assim, cada famlia possui, em mdia, uma renda de R$6.700,00.


Observao: Do ponto de vista terico, vrios tipos de mdia podem ser
calculados para uma massa de dados. O uso da mdia aritmtica apresenta
vantagens para clculos posteriores, devendo, entretanto, alm de outros casos, ser
empregada em sries que estejam em progresso aritmtica ou se os valores
extremos no influrem sensivelmente sobre ela. Outra orientao para seu
emprego na comparao com as outras medidas de tendncia central.

Focalizaremos ainda neste estudo as mdias geomtricas e as mdias harmnicas.

2.1.2 MDIA GEOMTRICA (Mg)


a) Mdia geomtrica para dados no agrupados

Sejam x
1
, x
2
, ..., x
n
, n valores da varivel X. A mdia geomtrica, denotada por
Mg, definida por:
n
1 2 3 n
Mg x x x ... x =

Exemplo:

Calcular a mdia geomtrica dos valores: 3, 6, 12, 24 e 48.

5 5
Mg 3 6 12 24 48 248.832 12 = = =


b) Mdia geomtrica para dados agrupados

Sejam x
1
, x
2
, ..., x
k
, valores da varivel X associados s freqncias absolutas F
1
,
F
2
, F
3
, ... , F
k
, respectivamente. A mdia geomtrica, denotada por Mg, definida
por:

3 1 2 k
F F F F
n
1 2 3 k
Mg x x x ... x =

Exemplo:

Calcular a mdia geomtrica da distribuio:

x
i
1 2 3 5
F
i
8 6 5 3
41

8 6 5 3 22
Mg 1 2 3 5 1,9311 = =

Observao: Quando o nmero de observaes for muito grande aconselhvel o
emprego de logaritmo (decimal ou neperiano). Assim,

3 1 2 k
F F F F
n
1 2 3 k
Mg x x x ... x = Mg =
( )
3 1 2 k
1
F F F F
n
1 2 3 k
x x x ... x

log Mg = log
( )
3 1 2 k
1
F F F F
n
1 2 3 k
x x x ... x =
1 1 2 2 k k
F . log x F . log x ... F . log x
n
+ + +


Aplicando este resultado no exemplo acima, temos:

log Mg =
8 . log 1 6 . log 2 5 . log 3 3 . log 5
22
+ + +
=
8 . 0 6 . 0,3010 5 . 0,4771 3 . 0,6990
22
+ + +
= 0,2858
Logo, Mg = antilog 0,2858 = 10
0,2858
= 1,9311

A mdia geomtrica como medida de tendncia central de pouco uso, e seu
emprego restrito, como no caso dos dados de uma srie formarem ou se
aproximarem de uma progresso geomtrica, e em nmeros ndices. Exemplos de
dados com este comportamento so os preos num perodo de inflao e a variao
do montante em juros compostos, apresentando-se em progresso geomtrica de
razo (1 + r), sendo r a taxa unitria.

Como a mdia geomtrica depende do produto, se um dos fatores for igual a
zero ela tambm o ser. Por outro lado, se tiver fatores negativos ela poder ser
negativa ou imaginria (nmero complexo), dependendo para isso, do ndice n ser
mpar ou par.


2.1.3 MDIA HARMNICA (Mh)


a) Mdia harmnica para dados no agrupados


Sejam x
1
, x
2
, ..., x
n
, n valores da varivel X. A mdia harmnica, denotada por Mh,
definida por:
42
1 2 3 n
n
Mh
1 1 1 1
...
x x x x
=
+ + + +



Exemplo: Calcular a mdia harmnica de 2, 5 e 8.
3
Mh 3, 64
1 1 1
2 5 8
= =
+ +



b) Mdia harmnica para dados agrupados

Sejam x
1
, x
2
, ..., x
k
, valores da varivel X associados s freqncias absolutas
F
1
, F
2
, F
3
, ... , F
k
, respectivamente. A mdia harmnica de X, denotada por Mh,
definida por:

k
1 2 3 k
i
1 2 3 k
i 1 i
n n
Mh
F F F F
F
...
x x x x
x
=
= =
+ + + +




A mdia harmnica particularmente recomendada para sries de valores que
so inversamente proporcionais, como para o clculo de velocidade mdia, tempo
mdio de escoamento de estoque, etc.

A mdia harmnica poder ser empregada, por exemplo, no caso dos preos
unitrios de certas mercadorias que so inversamente proporcionais s quantidades
de lotes, se o preo total de cada lote tiver o mesmo custo. O preo mdio unitrio
dever ser igual mdia harmnica dos demais preos.

EXERCCIOS:

1. Determine a mdia aritmtica das seguintes sries:
a) 3, 4, 1, 3, 6, 5 e 6;
b) 60, 80, 90, 100 e 120;
c) 2,5; 3,6; 4,1; 4,3 e 6,2.

2. A mdia mnima para aprovao em uma matria 5. Se um estudante
obteve as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5 e 4,0 nos trabalhos mensais desta
matria, pergunta-se: ele foi ou no aprovado?

3. Calcule para cada uma das distribuies a sua respectiva mdia:
43

a)
x
i
3 4 7 8 12
F
i
2 5 8 4 3

b)
Aluguel
(R$1.000)
1,5 |--- 3,5 3,5 |--- 5,5 5,5 |--- 7,5 7,5 |--- 9,5 9,5 |---
11,5
N DE IMVEIS 12 18 20 10 5

4. Com importncias iguais foram compradas quantidades diferentes de certa
mercadoria cujos preos unitrio foram R$ 20,00, R$ 40,00, R$ 20,50, R$ 21,00
e R$ 21,60. Calcular o preo mdio unitrio de custo destas mercadorias.
(Sugesto: utilize a mdia harmnica) .

5. Calcule a mdia geomtrica para as sries:
a) 1, 2, 4, 7, 16;
b) 81, 26, 10, 3, 1.

6. Utilizando a srie de dados 2, 8, 7 e 15, comprove as seguintes propriedades
da mdia aritmtica:
a) A soma dos desvios em torno da mdia zero, isto ,
i
(x x) 0 =


b) Somando (ou subtraindo) uma mesma quantidade arbitrria a (de) todos os
valores da srie, a mdia ficar aumentada (ou diminuda) desta mesma
quantidade.
c) Multiplicando ou dividindo cada termo de uma srie por uma constante, a
mdia ficar multiplicada ou dividida pela constante.
d) A soma dos quadrados dos desvios medidos em relao mdia um mnimo,
ou seja, sempre menor que a soma dos quadrados dos desvios medidos em
relao a qualquer outro valor, isto ,
i
(x x)

mnimo.

7. Calcule as mdias aritmtica, geomtrica e harmnica para a srie a seguir e
observe pelos clculos qual a relao entre estas mdias.

x
i
F
i
2 1
3 4
4 3
5 2
TOTAL

44
2.1.4 MEDIANA (Md)

A mediana, denotada por Md, o valor que divide o rol em duas partes
contendo, cada uma, a mesma quantidade de elementos. Assim, a mediana o
valor que ocupa a posio central de uma srie de dados.

50% 50%
Md


a) Mediana para dados no agrupados

i) Se n mpar o rol admite apenas um termo central que ocupa a posio
n 1
2
+
.

O valor do elemento que ocupa esta posio a mediana.

Exemplo: Determinar a mediana da srie: 20; 12; 23; 20; 8; 12; 2.

Rol: 2; 8; 12; 12; 20; 20; 23.
n = 7 (n mpar)
O rol admite somente um termo central que ocupa a posio
7 1
2
+
, ou seja, a 4
posio. Portanto Md = x
4
= 12.

Interpretao: 50% dos valores da srie so menores ou iguais a 12 e 50% dos
valores so maiores ou iguais a 12.

ii) Se n par neste caso o rol admite dois termos centrais que ocupam as
posies
n
2
e
n
1
2
+ .

Neste caso a mediana definida como a mdia aritmtica destes dois termos
centrais.

Exemplo: Determinar a mediana da srie: 7; 21; 13; 15; 10; 8; 9; 13.

Rol: 7; 8; 9; 10; 13; 13; 15; 21.
n = 8 (n par)
A srie admite dois termos centrais que ocupam as posies
8
2
e
8
1
2
+ , ou seja, a
4 posio e a 5 posio.
Portanto,
45
4 5
x x 10 13
Md 11,5
2 2
+ +
= = = .

Interpretao: 50% dos valores do rol so menores ou iguais a 11,5 e 50% dos
valores so maiores ou iguais a 11,5.


b) Mediana para dados agrupados sem intervalos de classes

O procedimento para o clculo da mediana para dados agrupados sem
intervalos de classes o mesmo utilizado para dados no agrupados, ou seja:
Se n for mpar, a mediana ser o termo central, isto , o termo de ordem
n 1
2
+
.
Se n for par, a mediana ser a mdia aritmtica entre os elementos centrais, isto
, os elementos de ordem
n
2
e
n
1
2
+ .

Exemplo 1:

Determinar a mediana da distribuio abaixo.

i x
i
F
i
Fac
i
1 2 1 1
2 5 4 5
3 8 10 15
4 10 6 21
5 12 2 23
TOTAL 23



n = 23 (n mpar)

A distribuio admite apenas um termo central que ocupa a posio
23 1
2
+
, ou
seja, a 12 posio.

Atravs das freqncias acumuladas podemos observar que: o 1 elemento o 2; o
2, o 3, o 4 e o 5 elementos so iguais a 5; o 6, o 7, ... , o 15 elementos so
iguais a 8; e assim sucessivamente.

Portanto o 12 elemento o 8.
Logo, Md = x
12
= 8.
46
Exemplo 2: Determinar a mediana da distribuio

i x
i
F
i
Fac
i
1 0 3 3
2 1 5 8
3 2 8 16
4 3 10 26
5 5 6 32
TOTAL 32



n = 32 (n par).
A srie admite dois termos centrais que ocupam as posies
32
2
e
32
1
2
+ , ou seja,
o 16 e o 17 elementos.
Observando as freqncias acumuladas, temos:
O 1, o 2 e o 3 elementos so iguais a 0;
O 4, o 5, o 6, o 7 e o 8 so iguais a 1;
O 9, o 10, ... , o 16 so iguais a 2;
O 17, o 18, ... , o 26 so iguais a 3;
O 27, o 28, ..., o 32 so iguais a 5.

Portanto o 16 termo igual a 2 e o 17 termo igual a 3.
Logo,
16 17
x x 2 3
Md 2,5
2 2
+ +
= = =

c) Mediana para dados agrupados com intervalos de classes

Calcula-se
n
2
, independente de n ser par ou mpar;
Localiza-se, atravs das freqncias acumuladas, a classe mediana, ou seja, a
classe que contm o termo de ordem
n
2
;
Aplica-se a frmula:
ant
Md
Md
n
Fac
2
Md l h
F

= + ,
onde:
l
Md
= limite inferior da classe mediana;
Fac
ant
= freqncia acumulada da classe anterior classe mediana;
h = amplitude da classe mediana;
F
Md
= freqncia absoluta da classe mediana.

47
Exemplo 1

Determinar a mediana da distribuio.

i Altura(cm) F
i
Fac
i
1 150 |--- 154 4 4
2 154 |--- 158 9 13
3 158 |--- 162 11 24 classe mediana
4 162 |--- 166 8 32
5 166 |--- 170 5 37
6 170 |--- 174 3 40
TOTAL 40



Calcula-se
n
2

40
20
2
=
Localiza-se a classe mediana (a classe que contm o termo de ordem
n
2
)
Classe mediana = 3 classe
Aplica-se a frmula:
ant
Md
Md
n
Fac
2
Md l h
F

= +

l
Md
= 158
Fac
ant
= 13
20 13
Md 158 4 160,55
11

= + =
h = 4
F
Md
= 11

Interpretao: 50% das pessoas tm altura inferior a 160,55 cm.

Exemplo 2 Consideremos a distribuio de freqncia por classes das notas dos 50
alunos da turma PEST e vamos calcular a sua mediana.

Notas de 50 alunos da turma PEST
Classes Notas F
i
Fac
i


1 30 |--- 40 4 4

2 40 |--- 50 6 10

3 50 |--- 60 8 18

4 60 |--- 70 13 31
classe mediana
5 70 |--- 80 9 40

6 80 |--- 90 7 47

7 90 |--- 100 3 50

Total
50
----
Fonte: Dados Hipotticos
48
Calcula-se
n
2

50
25
2
=
Localiza-se a classe mediana (a classe que contm o termo de ordem
2
n
)
Classe mediana = 4 classe
Aplica-se a frmula:
ant
Md
Md
n
Fac
2
Md l h
F

= +

l
Md
= 60
Fac
ant
= 18
25 18
Md 60 10 65,38
13

= + =
h = 10
F
Md
= 13

Interpretao: 50% das notas foram inferiores a 65,38.

EXERCCIOS:

1. Determinar a mdia e a mediana das sries:
a) 2; 5; 8; 10; 12; 8; 5; 12
b) 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8

2. Determinar a mdia e a mediana das distribuies:
a)
x
i
2 3 4 5 7
F
i
3 5 8 4 2

b)
x
i
73 75 77 79 81
F
i
2 10 12 5 2

c)

Classes 1 |--
-
3 3 |--
-
5 5 |--
-
7 7 |--
-
9 9 |--
-
11 11 |--
-
13
F
i
3 5 8 6 4 3

d)
Classes 22 |--
-
25 25 |--
-
28 28 |--
-
31 31 |--
-
34
F
i
3 5 8 6


49
2.1.5 MODA (Mo)

A moda o valor mais freqente do conjunto de dados observados.


a) Moda para dados no agrupados

Para determinar a moda, basta identificar o(s) elemento(s) que mais se repete(m).

Exemplo: Determinar a moda dos conjuntos de dados abaixo:

a) 2; 8; 3; 5; 4; 5; 3; 5; 1
O elemento que mais se repete o 5. Portanto: Mo = 5 (seqncia unimodal).

b) 6; 10; 5; 6; 10; 2
Neste conjunto de dados o elemento 6 e o elemento 10 se repetem mais vezes
que os demais. Portanto: Mo
1
= 6 e Mo
2
= 10 (seqncia bimodal).

c) 2; 2; 8; 8; 5; 5; 6; 6
No h nenhum elemento que se destaque por possuir maior freqncia.
Portanto, a srie no possui moda e dita amodal.

Observao: A moda s considerada medida de tendncia central no caso
unimodal. Nos demais casos uma medida estatstica de anlise.


b) Moda para dados agrupados sem intervalos de classes

Neste caso, basta identificar o(s) elemento(s) de maior freqncia.

Exemplo: Determinar a moda das distribuies:
a)

i x
i
F
i
1 0 2
2 2 5
3 3 8
4 4 3
5 5 1
Total

Mo = 3 (Distribuio Unimodal)


50

b)
i x
i
F
i
1 1 2
2 2 5
3 3 4
4 4 5
5 5 1
Total

Mo
1
= 2 e Mo
2
= 4 (Distribuio Bimodal)


c)
i x
i
F
i
1 4 5
2 5 5
3 8 5
4 10 5
Total

No h moda (Distribuio Amodal)


c) Moda para dados agrupados com intervalos de classes

Neste caso, h diversos processos para o clculo da moda.

i) Frmula de Czuber

Identifica-se a classe modal (a que possui maior freqncia);
Aplica-se a frmula:
1
Mo
1 2
Mo l h

= +
+
,

onde:
l
Mo
= limite inferior da classe modal.

1
= diferena entre a freqncia absoluta da classe modal e a freqncia
absoluta da classe anterior classe modal.

2
= diferena entre a freqncia absoluta da classe modal e a freqncia
absoluta da classe posterior classe modal.
h = amplitude da classe modal.

51

Exemplo 1

Determinar a moda da distribuio:

i classes

F
i
1 0 |--- 1 3
2 1 |--- 2 10
3 2 |--- 3 17 Classe Modal
4 3 |--- 4 8
5 4 |--- 5 5
TOTAL 43

Identifica-se a classe modal: 3 classe (maior freqncia = 17)
Aplica-se a frmula:
1
Mo
1 2
Mo l h

= +
+
,
onde:
l
Mo
= 2;

1
= 17 10 = 7;

2
= 17 8 = 9;
h = 3 2 = 1
Logo:
7
Mo 2 1 2, 44
7 9
= + =
+


Exemplo 2 Considere a distribuio abaixo.

Salrios dos Empregados da Empresa PEST
Classes Salrios (classes) F
i
(n funcionrios)
1 800 |- 1800 70
2 1800 |- 2500 140
3 2500 |- 3000 140
4 3000 |- 5000 60
Total 410
Fonte: Dados Hipotticos

Como as amplitudes das classes no so iguais, vamos utilizar as densidades das
classes
i
i
F
h
para identificar a classe modal (aquela com a maior densidade)
52

Salrios dos Empregados da Empresa PEST
Classes Salrios
(classes)
x
i

(pto mdio)
F
i

(n funcionrios)
F
i
/h
i

(densidade)
1 800 |- 1800 1300 70 0,07
2 1800 |- 2500 2150 140 0,20
3 2500 |- 3000 2750 140 0.28
4 3000 |- 5000 4000 60 0,03
Total 410
Fonte: Dados Hipotticos

Identifica-se a classe modal: 3 classe (maior densidade = 0,28)
Aplica-se a frmula:
1
Mo
1 2
Mo l h

= +
+
,
onde:
l
Mo
= 2500;

1
= 0,28 0,20 = 0,08;

2
= 0,28 0,03 = 0,25;
h = 500
Logo:
0, 08
Mo 2500 500 2500 0, 24 500 2621, 21
0, 08 0, 25
= + = + =
+

Assim, R$ 2621,21 o salrio mais freqente entre os 410 funcionrios dessa
empresa.

ii) Frmula de Pearson

Mo 3Md 2x

Na frmula de Pearson a moda aproximadamente igual a diferena entre o
triplo da mediana e o dobro da mdia. Esta frmula d uma boa aproximao
quando a distribuio apresenta razovel simetria em relao mdia.

Observao: Para calcular a moda de uma varivel, precisamos apenas da
distribuio de freqncia. Para a mediana necessitamos minimamente ordenar os
valores atribudos varivel. A mdia s pode ser calculada para variveis
quantitativas. Assim, para as variveis nominais somente podemos trabalhar com a
mediana, alm da moda.
53
EXERCCIOS:

1. Para cada distribuio, determine a mdia, a mediana e a moda:

a)
x
i
72 75 78 80
F
i
8 18 28 38


b)
Classes 7 |--- 10 10 |--- 13 13 |--- 16 16 |--- 19 19 |--- 22
F
i
6 10 15 10 5


3. MEDIDAS SEPARATRIZES

As medidas separatrizes so valores que dividem o conjunto de dados observados
em um determinado nmero de partes, contendo cada uma a mesma quantidade de
elementos.

So elas:

Mediana

considerada tambm uma medida separatriz.

Quartis

So valores que dividem o rol em quatro partes iguais, cada uma com 25% dos
elementos. Ao todo tem-se 3 quartis: Q
1
(1 quartil), Q
2
(2 quartil) e Q
3
(3
quartil).

25% 25% 25% 25%
Q
1
Q
2
=Md Q
3


Observe que:
o Abaixo do 1 quartil tem-se 25% dos elementos;
o Abaixo do 2 quartil tem-se 50% dos elementos;
o Abaixo do 3 quartil tem-se 75% dos elementos;

Decis

So valores que dividem o rol em dez partes iguais, cada uma com 10% dos
elementos. Ao todo tem-se 9 decis: D
1
(1 decil), D
2
(2 decil), ... , D
9
(9 decil).
54

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D
1
D
2
D
3
D
4
D
5
D
6
D
7
D
8
D
9


Observe que:

Abaixo do 1 decil tem-se 10% dos elementos;
Abaixo do 2 decil tem-se 20% dos elementos;
Abaixo do 3 decil tem-se 30% dos elementos; e assim sucessivamente.


Centis ou Percentis

Dividem o rol em cem partes iguais, cada uma com 1% dos elementos. Ao todo
tem-se 99 centis: P
1
(1 centil), P
2
(2 centil), ... , P
99
(99 centil).

1% 1% 1% 1% ... 1% ... 1% ... 1%
P
1
P
2
P
3
P
4
P
50
P
51
P
80
P
81
P
99


Observe que:

Abaixo do 1 centil tem-se 1% dos elementos;
Abaixo do 2 centil tem-se 2% dos elementos;
Abaixo do 3 centil tem-se 3% dos elementos;
Abaixo do 4 centil tem-se 4% dos elementos; e assim sucessivamente.

Clculo das medidas separatrizes:

a) Separatrizes para dados no agrupados

Devemos ordenar os elementos, identificar a medida que queremos obter
(quartil, decil ou centil), localizar a posio da medida desejada e identificar o
elemento que ocupa esta posio, de acordo com o esquema a seguir:

Quartil i:
i n
pos ,i 1, 2,3
4

= =

Decil i:
i n
pos ,i 1, 2,...,9
10

= =

Centil i:
i n
pos ,i 1, 2,...,99
100

= =

55

Observe que:

Se pos for um nmero inteiro, ento a medida procurada corresponde ao
elemento do rol que ocupa esta posio.
Se pos no for um nmero inteiro, ento a medida procurada um elemento
intermedirio entre os elementos que ocupam as posies aproximadas por falta
e por excesso do valor pos. Neste caso, a separatriz corresponde mdia
aritmtica dos valores que ocupam estas posies.

Exemplos:

1. Calcule o primeiro quartil da seqncia: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.

Rol: 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15.

i n 1 12
pos 3
4 4

= = =

Logo, Q
1
= x
3
= 5.



2. Calcule o P
60
da seqncia: 2; 8; 7,5; 6; 10; 12; 2; 9.

Rol: 2; 2; 6; 7,5; 8; 9; 10; 12.

i n 60 8
pos 4,8
100 100

= = =
Como este valor no inteiro, o P
60
um valor situado entre o 4 e o 5 elemento
da seqncia. Logo,
4 5
60
x x 7,5 8
P 7, 75
2 2
+ +
= = =


b) Separatrizes para dados agrupados sem intervalos de classes

Neste caso, como os dados j esto ordenados, utilizamos a freqncia acumulada
da srie para localizar o elemento que ocupa a posio da separatriz desejada,
conforme citado no item anterior.

Exemplo:

Calcular o quarto decil da distribuio:

56
i x
i
F
i
F
aci
1 2 3 3
2 4 5 8
3 5 8 16
4 7 6 22
5 10 2 24
Total 24

i n 4 24
pos 9, 6
10 10

= = =


Como este valor no inteiro, o D
4
um valor situado entre o 9 e o 10 elemento
da distribuio.
Logo,
9 10
4
x x 5 5
D 5
2 2
+ +
= = =


c) Separatrizes para dados agrupados com intervalos de classes

Neste caso, aplica-se a frmula:

ant
pos Fac
Sep l h
F

= + ,
onde:

Sep = medida separatriz a ser determinada (Mediana, Quartil, Decil ou Centil);
l = limite inferior da classe separatriz (a classe que contm a separatriz a ser
determinada);
Fac
ant
= freqncia acumulada da classe anterior classe separatriz;
F = freqncia absoluta simples da classe separatriz;
h = amplitude da classe separatriz;
pos = a posio da separatriz, sendo dada por:
Mediana:
n
pos
2
=

Quartil i:
i n
pos ,i 1, 2,3
4

= =

Decil i:
i n
pos ,i 1, 2,...,9
10

= =

Centil i:
i n
pos ,i 1, 2,...,99
100

= =
57
Exemplo:

Calcular o 1 quartil, o 4 decil e o 70 centil da distribuio.

i Altura (cm)

F
i
Fac
i
1 150 |--- 154 4 4
2 154 |--- 158 9 13 classe que contm o 1 quartil
3 158 |--- 162 11 24 classe que contm o 4 decil
4 162 |--- 166 8 32 classe que contm o 70 centil
5 166 |--- 170 5 37
6 170 |--- 174 3 40
TOTAL 40




Clculo do 1 quartil:

Calcula-se pos =
n
4

40
10
4
=
Localiza-se a classe que contm o 10 termo (2 classe)
Aplica-se a frmula:
1
1
ant
1 Q
Q
pos Fac
Q l h
F

= +

1
Q
l = 154
Fac
ant
= 4
1
10 4
Q 154 4 156, 67
9

= + =
h = 4
1
Q
F = 9

Interpretao: 25% das pessoas tm altura inferior a 156,67 cm.

Clculo do 4 decil:

Calcula-se pos =
4 n
10


4 40
16
10

=
Localiza-se a classe que contm o 16 termo (3 classe)
Aplica-se a frmula:
4
4
ant
4 D
D
pos Fac
D l h
F

= +
4
D
l = 158
Fac
ant
= 13
4
16 13
D 158 4 159, 09
11

= + =
h = 4 e
4
D
F = 11
58
Interpretao: 40% das pessoas tm altura inferior a 159,09 cm.


Clculo do 70 centil:

Calcula-se pos =
70 n
100


70 40
28
100

=
Localiza-se a classe que contm o 28 termo (4 classe)
Aplica-se a frmula:
70
70
ant
70 C
C
pos Fac
C l h
F

= +

70
C
l = 162
Fac
ant
= 24
70
28 24
C 162 4 164
8

= + =
h = 4
70
C
F = 8

Interpretao: 70% das pessoas tm altura inferior a 164 cm.


EXERCCIOS:

1. Para a distribuio:


Classes 4 |--- 6 6 |--- 8 8 |--- 10 10 |--- 12
F
i
4 11 15 5

Calcule Q
1
, D
6
e P
65
. Interprete os resultados obtidos.


2. Para a distribuio abaixo calcule Q
3
, D
2
e P
45
. Interprete os resultados obtidos.

Classes 20 |--- 30 30 |--- 40 40 |--- 50 50 |--- 60 60 |--- 70
F
i
3 8 18 22 24


3. O departamento de recursos humanos de uma empresa, tendo em vista o
aumento de produtividade de seus vendedores, resolveu , premiar com um
aumento de 5% no salrio, a metade e seus vendedores mais eficientes. Para
isto, fez um levantamento de vendas semanais, por vendedor, obtendo a tabela:


59
Vendas (R$) N DE VENDEDORES
0 |---- 10.000 1
10.000 |---- 20.000 12
20.000 |---- 30.000 27
30.000 |---- 40.000 31
40.000 |---- 50.000 10
Total

A partir de qual volume de vendas o vendedor ser premiado?


4. Se, no problema anterior, o gerente resolver premiar somente os 25% dos
vendedores mais eficientes, a partir de qual volume de vendas o vendedor ser
premiado?


5. A distribuio de freqncia abaixo representa o consumo por nota de 54 notas
fiscais emitidas durante um dia em uma loja de departamentos.

Consumo por nota fiscal
(R$)
N DE NOTAS
0 |---- 50 10
50 |---- 100 28
100 |---- 150 12
150 |---- 200 2
200 |---- 250 1
250 |---- 300 1
Total


O gerente desta loja de departamentos decidiu premiar a nvel promocional com
um brinde, 10% dos fregueses que mais consumirem, nos prximos 30 dias. A
partir de qual valor de consumo da nota fiscal os clientes seriam premiados?
60
4. MEDIDAS DE DISPERSO, MEDIDAS DE
ASSIMETRIA E MEDIDAS DE CURTOSE


4.1 MEDIDAS DE DISPERSO

As medidas de disperso so medidas estatsticas utilizadas para avaliar o grau
de variabilidade, ou disperso, dos valores em torno da mdia. Servem para medir
a representatividade da mdia. Essa avaliao necessria, pois quando se trata de
interpretar dados estatsticos, mesmo aqueles j convenientemente simplificados,
como a mdia aritmtica, deve-se ter uma idia retrospectiva de como se
apresentavam esses mesmos dados nas tabelas. Assim, no o bastante dar uma
medida de posio para caracterizar perfeitamente um conjunto de valores,
devemos, tambm, medir a variabilidade do conjunto de valores em relao essa
medida de posio.

Se observarmos as seqncias

X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10
Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13
Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13

concluiremos que todas possuem a mesma mdia 13. No entanto, so seqncias
completamente distintas do ponto de vista da variabilidade de dados.

Na seqncia Z no h variabilidade de dados. A mdia 13 representa bem
qualquer valor da srie.

Na seqncia Y, a mdia 13 representa bem a srie, mas existem elementos da
srie levemente diferenciados da mdia 13.

Na seqncia X existem muitos elementos bastante diferenciados da mdia 13.

Conclumos que a mdia 13 representa otimamente a seqncia Z, representa
bem a seqncia Y, mas no representa bem a seqncia X.

Chamando de disperso, ou variabilidade, a maior ou menor diversificao dos
valores de uma varivel em torno de um valor de tendncia central tomado como
ponto de comparao, podemos dizer que o conjunto Z apresenta disperso ou
variabilidade nula e que o conjunto Y apresenta uma disperso ou variabilidade
menor que o conjunto X.

61
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior
ou menor disperso ou variabilidade entre esses valores e a sua medida de posio,
a Estatstica recorre s medidas de disperso.

Estudaremos as principais medidas de disperso absolutas que so: amplitude
total, desvio mdio, varincia e desvio-padro e a principal medida de disperso
relativa que o coeficiente de variao.
4.1.1 AMPLITUDE TOTAL (A
T
)

A amplitude total a diferena entre o maior valor e o menor valor da seqncia
dos dados observados.
A
T
= valor mximo valor mnimo


a) Amplitude total para dados no agrupados

Basta identificar o maior e o menor valor da seqncia e efetuar a diferena entre
esses valores.

Exemplo: Determine a amplitude total da seqncia: 11, 12, 9, 10, 10, 15.

Soluo: O maior valor desta seqncia 15 e o menor valor 9.
Portanto, A
T
= 15 9 = 6 unidades.


b) Amplitude total para dados agrupados sem intervalos de classes

Como os valores j se encontram ordenados, a amplitude total a diferena entre o
ltimo e o primeiro elemento da srie.

Exemplo: Determine a amplitude total da srie:

NMERO DE IRMOS DE 20 ALUNOS DA TURMA IDX
i X
i
F
i

1 0 4
2 1 8
3 2 3
4 3 3
5 4 2
TOTAL 20
Fonte: Dados Hipotticos

Soluo: O maior valor da srie 4 e o menor valor da srie 0.
62
Portanto, A
T
= 4 0 = 4.


c) Amplitude total para dados agrupados com intervalos de classes

Nesta situao, a amplitude total da srie a diferena entre o limite superior da
ltima classe e o limite inferior da primeira classe.

Exemplo: Dada a distribuio abaixo encontre sua amplitude total:
Renda Familiar de 40 Famlias
i Salrios (R$
1.000)
F
i
1 2 |--- 4 5
2 4 |--- 6 10
3 6 |--- 8 14
4 8 |--- 10 8
5 10 |--- 12 3
TOTAL 40
Fonte: Dados Hipotticos

Soluo: Como o limite superior da ltima classe L
5
= 12 e o limite inferior da
primeira classe l
1
= 2, a amplitude total : AT = 12 2 = 10.

Quando dizemos que a amplitude total dos valores 10, estamos afirmando
alguma coisa do grau de sua concentrao. evidente que, quanto maior a
amplitude total, maior a disperso ou variabilidade dos valores da varivel.

Apesar da facilidade de obteno da amplitude total, esta medida apresenta a
inconvenincia de depender apenas de dois valores da srie. possvel modificar
completamente a disperso ou a concentrao dos elementos em torno da mdia,
sem alterar a amplitude total da srie. uma medida que tem pouca sensibilidade
estatstica.
Observao: Faz-se uso da amplitude total quando se quer determinar a amplitude
da temperatura em um dia ou no ano, no controle de qualidade ou como uma
medida de clculo rpido. Tambm a usamos quando a compreenso popular
mais importante que a exatido e a estabilidade.

4.1.2 DESVIO MDIO (D
M
)

Desde que se deseja medir a disperso dos dados em relao mdia parece
interessante fazermos a anlise dos desvios em torno da mdia: d
i
= (x
i
x).
63

Mas a soma de todos os desvios igual a zero, Isto :
i i
d (x x) 0 = =

.

Utilizando o conceito matemtico de distncia (mdulo de nmero real),
encontramos uma maneira de trabalhar com os desvios sem que a soma d zero e,
por isso, o conceito estatstico de desvio corresponde ao conceito matemtico de
distncia.


a) Desvio Mdio para dados no agrupados

Calculamos inicialmente a mdia da seqncia. Em seguida, identificamos a
distncia de cada elemento da seqncia para sua mdia. Finalmente, calculamos a
mdia destas distncias. Dessa forma define-se desvio mdio como:
i i
M
d x x
D
n n

= =



Veja que os desvios foram considerados em mdulo, evitando-se assim que a soma
fosse nula.

Exemplo: Calcule o desvio mdio para a seqncia: 2, 8, 5, 6.

Soluo: Determinamos inicialmente a mdia da srie

i
x
2 8 5 6
x 5, 25
n 4
+ + +
= = =

.

Em seguida, determinamos as distncias de cada elemento da srie para a mdia da
srie

1
x x 2 5, 25 3, 25 = =
2
x x 8 5, 25 2, 75 = =
3
x x 5 5, 25 0, 25 = =
4
x x 6 5, 25 0, 25 = =

O D
M
a mdia aritmtica simples destes valores:

M
3, 25 2, 75 0, 25 0, 75 7
D 1, 75
4 4
+ + +
= = = .

64
Interpretao: Em mdia, cada elemento da seqncia est afastado do valor 5,25
por 1,75 unidades.


b) Desvio Mdio para dados agrupados sem intervalos de classes

No caso da apresentao de uma varivel discreta, lembramos que a freqncia
absoluta simples de cada elemento representa o nmero de vezes que este valor
figura na srie. Conseqentemente, haver repeties de distncias iguais de cada
elemento distinto da srie para a mdia da srie. Assim, a mdia indicada para
estas distncias uma mdia aritmtica ponderada:
i i i
M
d Fi x x F
D
n n

= =




Exemplo: Determine o desvio mdio (D
M
) para a srie:

i x
i
F
i
1 1 2
2 3 5
3 4 2
4 5 1
TOTAL 10

Soluo: A mdia da srie :
i i
x F
x
n
=

e o D
M
dado por
i i
M
x x F
D
n

.

Por isso, incluiremos as colunas x
i
F
i
e
i i
x x F
na tabela para efetuar os
clculos acima.

x
i
F
i
x
i
F
i
i i
x x F
1 2 2 4
3 5 15 0
4 2 8 2
5 1 5 2
TOTAL 10 30 8

Logo, a mdia
i i
x F
30
x 3
n 10
= = =


e o desvio mdio
65
i i
M
x x F
8
D 0,8
n 10

= = =

.

Interpretao: Em mdia, cada elemento da srie est afastado do valor 3 por 0,8
unidades.


c) Desvio Mdio para dados agrupados com intervalos de classes

Nesta situao, por desconhecer os valores individuais dos elementos componentes
da srie, substituiremos estes valores x
i
, pelos pontos mdios das classes.

Desta forma, o desvio mdio tem por clculo a frmula:

i i
M
x x F
D
n

=

,
onde x
i
o ponto mdio da classe i.

Exemplo: Determine o desvio mdio (D
M
) para a srie:

i classes F
i
1 2 |--- 4 5
2 4 |--- 6 10
3 6 |--- 8 4
4 8 |--- 10 1
TOTAL 20

Soluo: Incluiremos as colunas x
i
,

x
i
F
i
e
i i
x x F
na tabela para efetuarmos
os clculos desejados.

i classes F
i
x
i
x
i
F
i

i i
x x F
1 2 |--- 4 5 3 15 10,5
2 4 |--- 6 10 5 50 1,0
3 6 |--- 8 4 7 28 7,6
4 8 |--- 10 1 9 9 3,9
TOTAL 20

102 23,0

A mdia da srie :
i i
x F
102
x 5,1
n 20
= = =

.

66
O desvio mdio :
i i
M
x x F
23
D 1,15
n 20

= = =

.


Interpretao: Em mdia, cada elemento da srie est afastado de 5,1 por 1,15
unidades.


O desvio mdio depende de cada componente da srie. Se mudarmos o valor de
um nico elemento da srie, mudamos tambm o D
M
. Portanto, o desvio mdio tem
perfeita sensibilidade estatstica. A maior dificuldade desta medida envolver
mdulos, cujas propriedades, em geral no so suficientemente conhecidas pelos
alunos que normalmente desenvolvem estes clculos.



EXERCCIOS:

3. Determinar a amplitude total e o desvio mdio das sries:
a) 2; 5; 8; 10; 12; 8; 5; 12

b) 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8


4. Determinar a amplitude total e o desvio mdio das distribuies:
a)
x
i
2 3 4 5 7
F
i
3 5 8 4 2

b)
x
i
73 75 77 79 81
F
i
2 10 12 5 2

c)
Classes 1 |--- 3 3 |--- 5 5 |--- 7 7 |--- 9 9 |--- 11 11 |--- 13
F
i
3 5 8 6 4 3

d)
Classes 22 |--- 25 25 |--- 28 28 |--- 31 31 |--- 34
F
i
3 5 8 6





67
4.1.3 VARINCIA (S
2
) e DESVIO PADRO (S)


Como vimos, a amplitude total instvel, por se deixar influenciar pelos
valores extremos da srie, que so, na sua maioria, devidos ao acaso. Tambm
observamos que a dificuldade em se operar com o desvio mdio se deve presena
do mdulo, para que as diferenas x
i
x possam ser interpretadas como
distncias.

A varincia e o desvio padro so medidas que fogem a essas falhas, pois
levam em considerao a totalidade dos valores da varivel em estudo, o que faz
delas ndices de variabilidade bastante estveis e, por isso mesmo, os mais
geralmente empregados.

A varincia baseia-se nos desvios em torno da mdia aritmtica, porm, para
conseguir que as diferenas x
i
x se tornem sempre positivas ou nulas vamos
considerar o quadrado destas diferenas, isto (x
i
x )
2
. Se substituirmos, nas
frmulas do desvio mdio a expresso
i
x x por (x
i
x )
2
, obteremos essa nova
medida de disperso chamada varincia.

O desvio padro a raiz quadrada positiva da varincia.

Em particular, para estas medidas levaremos em considerao o fato de a
seqncia de dados representar toda uma populao ou apenas uma amostra de
uma populao. No final desta seo justificaremos esta necessidade.

Quando a seqncia de dados representa uma populao a varincia ser
denotada por
2
e o desvio padro correspondente por . Quando a seqncia de
dados representa uma amostra, a varincia ser denotada por s
2
e o desvio padro
correspondente por s.


a) Varincia e desvio padro para dados no agrupados

Se a seqncia representa uma populao, a varincia calculada pela frmula:

2
i
2
(x x)
n

,

e o desvio padro
2
= .

68
Se a seqncia representa uma amostra, a varincia calculada pela
frmula:

2
i
2
(x x)
s
n 1

,

e o desvio padro
2
s s = .

Exemplo: Calcule a varincia e o desvio padro da seqncia: 4, 5, 8, 5.
a) no caso em que esta seqncia representa uma populao;
b) no caso em que esta seqncia representa uma amostra.

Soluo: A mdia da seqncia :
i
x
22
x 5,5
n 4
= = =


Os quadrados das diferenas (x
i
x)
2
valem:
(x
1
x)
2
= (4 5,5)
2
= 2,25
(x
2
x)
2
= (5 5,5)
2
= 0,25
(x
3
x)
2
= (8 5,5)
2
= 6,25
(x
4
x)
2
= (5 5,5)
2
= 0,25

Somando-se estes valores obtm-se:
2
i
(x x)

= 9.
a) No caso em quem a seqncia representa uma populao substitumos esses
valores na frmula da varincia populacional e obtemos:

2
i
2
(x x)
9
2, 25.
n 4

= = =



Como o desvio padro a raiz quadrada positiva da varincia,
2
2, 25 1,5 = = = .

b) Se a seqncia 4, 5, 8, 5, representar uma amostra, a nica diferena entre a
frmula de
2
e s
2
o denominador. Assim,
2
i
2
(x x)
9
s 3
n 1 3

= = =


e o desvio padro s = 3 = 1,73.


b) Varincia e desvio padro para dados agrupados sem intervalos de classes

69
Como h repeties de elementos na srie, definimos a varincia como sendo
uma mdia aritmtica ponderada dos quadrados dos desvios dos elementos da srie
para a mdia da srie.

Se a varivel discreta representativa de uma populao, ento a varincia
dada por:

2
i i
2
(x x) F
n

=

.
Se a varivel discreta representativa de uma amostra, ento a varincia dada
por:

2
i i
2
(x x) F
s
n 1

=



Como voc pode ter notado, as diferenas entre as frmulas so: para o caso da
varincia populacional
2
, utiliza-se a mdia populacional tendo como
denominador o tamanho da populao. Para o clculo da varincia amostral s
2
,
utiliza-se a mdia amostral, tendo como denominador o tamanho da amostra menos
um.

Frmulas prticas para os clculos das varincias, obtidas por transformaes
nas respectivas frmulas originais so:

( )
2
i i
2 2
i i
x F
1
x F
n n


=



ou
( )
2
i i
2 2
i i
x F
1
s x F
n 1 n


=




Exemplo: Calcule a varincia e o desvio padro da srie abaixo, representativa de
uma populao:

i x
i
F
i
1 2 3
2 3 5
3 4 8
4 5 4
Total 20
70
Soluo: Utilizando a frmula prtica para o clculo da varincia, calculamos x
i
F
i

e x
i
2
Fi.


i x
i
F
i
x
i
F
i
x
i
2
F
i
1 2 3 6 12
2 3 5 15 45
3 4 8 32 128
4 5 4 20 100
Total 20 73 285

Substituindo os valores na frmula da varincia, obtemos:
( )
( )
2
2
i i
2 2
i i
x F
73 1 1
x F 285
n n 20 20



= =





=
= [ ]
1 5329 1
285 285 266, 45
20 20 20

=


=
=
[ ]
1
18,55 0,9275
20
=
e o desvio padro correspondente 0,9275 0,963 = = .

Observe que se a varivel fosse representativa de uma amostra, a varincia seria
indicada por s
2
e calculada por:
( )
[ ]
2
i i
2 2
i i
x F
1 1
s x F 18,55
n 1 n 19


= =

= 0,9763
e o desvio padro seria calculado por s = 0,9763 = 0,988.


c) Varincia e desvio padro para dados agrupados com intervalos de classes

Novamente, por desconhecer os particulares valores x
i
da srie, substituiremos
nas frmulas anteriores estes valores pelos pontos mdios das classes.

Exemplo: Determinar a varincia e o desvio padro da distribuio:

i Classes

F
i
1 0 |--- 4 1
2 4 |--- 8 3
3 8 |--- 12 5
4 12 |--- 16 1
TOTAL 10

71
Soluo: Ampliaremos a tabela com o clculo de x
i
F
i
e de x
i
2
F
i
:

i Classes

F
i
x
i
x
i
F
i
x
i
2
F
i
1 0 |--- 4 1 2 2 4
2 4 |--- 8 3 6 18 108
3 8 |--- 12 5 10 50 500
4 12 |--- 16 1 14 14 196
TOTAL 10

84 808

A varincia :
( )
2
2
i i
2 2
i i
x F
1 1 84
x F 808
n n 10 10



= =





= [ ]
1 7056 1
808 808 705, 6
10 10 10

=


=
[ ]
1
102, 4 10, 24
10
=
e o desvio padro: 10, 24 3, 2 = = .

No caso da distribuio representar uma amostra, a varincia seria:
[ ] [ ]
2
1 1
s 102,4 102, 4 11,38
10 1 19
= = =


e o desvio padro correspondente s = 11,38 3,373 = .

Observe que no clculo da varincia, a unidade de medida da srie fica elevada
ao quadrado. Portanto, a varincia dada sempre no quadrado da unidade de
medida da srie. Em algumas situaes, a unidade de medida da varincia nem faz
sentido. Portanto, o valor da varincia no pode ser comparado diretamente com os
dados da srie, ou seja: varincia no tem interpretao. Exatamente para suprir
esta deficincia da varincia que se define o desvio padro.

Para justificar que o denominador da varincia amostral deve ser n 1 e no n,
usaremos o seguinte argumento: O modelo matemtico que calcula a varincia de
uma amostra no pode ser
2
i
2
(x x)
n

,
pois, caso isto fosse verdadeiro, este modelo deveria determinar a varincia para
qualquer tamanho de amostra, inclusive para uma amostra constituda de um nico
elemento x
1
. Mas para uma amostra constituda de um nico elemento x
1
o valor
mdio da amostra tambm ser x
1
. Calculando a varincia pelo modelo acima,
teremos:
2
i i
2
(x x )
n

= 0.
72
Seramos induzidos a afirmar que a disperso da populao de onde provm a
amostra zero, isto , a populao constituda em sua totalidade por elementos
idnticos. O que , em geral, uma afirmao falsa.
Para corrigir o modelo matemtico, basta colocar no denominador o valor
n 1. O modelo escrito ento por
2
i
2
(x x)
s
n 1

.

Observe que agora o modelo coerente. Mesmo quando a amostra tiver apenas
um elemento x
1
, o clculo de s
2
leva-nos a uma indeterminao do tipo
0
0
. O que
significa que a varincia existe, mas no est determinada. Significa tambm que
as amostras de apenas um elemento no nos fornecem informaes sobre a
varincia da srie.


EXERCCIOS:

1. Para cada distribuio, determine a varincia e o desvio padro:

a)
x
i
72 75 78 80
F
i
8 18 28 38


b)
Classes 7 |--- 10 10 |--- 13 13 |--- 16 16 |--- 19 19 |--- 22
F
i
6 10 15 10 5


c)
Classes 4 |--- 6 6 |--- 8 8 |--- 10 10 |--- 12
F
i
4 11 15 5


d)
Classes 20 |--- 30 30 |--- 40 40 |--- 50 50 |--- 60 60 |--- 70
F
i
3 8 18 22 24





73
4.1.4 COEFICIENTE DE VARIAO (CV)

Trata-se de uma medida relativa de disperso til para a comparao em termos
relativos do grau de concentrao em torno da mdia de sries distintas.

O desvio padro por si s no nos diz muita coisa. Assim, se uma srie X
apresenta x = 10 e ) x ( =2 e uma srie Y apresenta y = 100 e ) y ( = 5, do ponto de
vista da disperso absoluta, a srie Y apresenta maior disperso que a srie X. No
entanto, se levarmos em considerao as mdias das sries, o desvio padro de Y
que 5 em relao a 100 um valor menos significativo que o desvio padro de X
que 2 em relao a 10. Alm disso, o fato de o desvio padro ser expresso na
mesma unidade dos dados limita o seu emprego quando desejamos comparar duas
ou mais sries de valores, relativamente sua disperso ou variabilidade, quando
expressas em unidades diferentes.

Para contornar essas dificuldades e limitaes, podemos caracterizar a
disperso ou variabilidade dos dados em termos relativos a seu valor mdio atravs
do coeficiente de variao:

CV 100
x

= ou
s
CV .100
x
=
que expresso em porcentagens.


Diz-se que a distribuio possui pequena variabilidade (disperso) quando o
coeficiente der at 10%; mdia disperso quando estiver acima de 10% at 20%; e
grande disperso quando superar 20%.

Alguns analistas consideram:
Baixa disperso: CV 15%
Mdia disperso: 15% < CV < 30%
Alta disperso: CV 30%

Exemplo: Numa empresa, o salrio mdio dos homens de R$ 4.000,00, com
desvio padro de R$ 1.500,00, e o das mulheres em mdia de R$ 3.000,00 com
desvio padro de R$1.200,00. Ento:
para os homens CV 100
x

= =
1.500
100 37,5%
4.000
=
para as mulheres CV 100
x

= =
1.200
100 40%
3.000
=

Logo, podemos concluir que os salrios das mulheres apresentam maior
disperso relativa que os dos homens.
74
EXERCCIOS

1. A distribuio abaixo possui desvio padro igual a 3,02. Determine o valor
do coeficiente de variao.

Classes 0 |--- 4 4 |--- 8 8 |--- 12
F
i
2 3 2

2. Um fabricante de caixas de cartolina fabrica trs tipos de caixa. Testa-se a
resistncia de cada caixa, tomando-se uma amostra de 100 caixas e determinando-
se a presso necessria para romper cada caixa. So os seguintes os resultados dos
testes:

Tipos de caixas
A

B
C
Presso mdia de ruptura (bria) 150 200 300
Desvio padro das presses (bria) 40 50 60

a) que tipo de caixa apresenta a menor variao absoluta na presso de ruptura?
b) que tipo de caixa apresenta a maior variao relativa na presso de ruptura?

3. Em um exame final de Matemtica, o grau mdio de um grupo de 150
alunos foi 7,8 e o desvio padro 0,80. Em Estatstica, entretanto, o grau mdio final
foi 7,3 e o desvio padro, 0,76. Em que disciplina foi maior a disperso?
75
4.2 MEDIDAS DE ASSIMETRIA (A
S
)

Para conceituar assimetria, obviamente precisamos conceituar simetria.
Diremos que uma distribuio simtrica quando x = Md = Mo. Se isto de fato
ocorrer, a curva de freqncia tem a seguinte caracterstica grfica:












Denomina-se assimetria o grau de afastamento de uma distribuio da
unidade de simetria. Se uma distribuio no for simtrica, ser classificada como
assimtrica. Existem duas alternativas para uma distribuio assimtrica.


















No caso a) a distribuio classificada de assimtrica positiva.
No caso b) a distribuio classificada de assimtrica negativa.
eixo de simetria
x = Md = Mo
x
i
Mo Md x
a)
x Md Mo
b)
76
Existem vrias frmulas para o clculo do coeficiente de assimetria. Dentre
elas temos o coeficiente de assimetria de Pearson dado por:
S
x Mo
A

=

ou
S
x Mo
A
s

=
Se A
S
= 0 ento a distribuio simtrica.
Se A
S
< 0 ento a distribuio assimtrica negativa.
Se A
S
> 0 ento a distribuio assimtrica positiva.


4.3 MEDIDAS DE CURTOSE (C)

Denominamos curtose o grau de achatamento de uma distribuio em relao a
uma distribuio padro, denominada curva normal (curva correspondente a uma
distribuio terica de probabilidade).

Uma distribuio nem chata, nem delgada, ou seja, normal, chama-se
mesocrtica. Quando a distribuio delgada (mais aguda em sua parte superior),
ela chamada de leptocrtica. E, quando a distribuio apresenta uma curva de
freqncia mais aberta que a normal (ou mais achatada na sua parte superior), ela
chamada platicrtica.













Para medir o grau de curtose utilizaremos o coeficiente percentlico de curtose
dado por:
3 1
90 10
Q Q
C
2(P P )

.


Relativamente curva normal, temos:
Se C = 0,263, diz-se que a curva correspondente distribuio de freqncia
mesocrtica.
x
i
x
i
x
i mesocrtica

leptocrtica

platicrtica

77
Se C > 0,263, diz-se que a curva correspondente distribuio de freqncia
platicrtica.
Se C < 0,263, diz-se que a curva correspondente distribuio de freqncia
leptocrtica.

Exemplo: Sabendo-se que uma distribuio apresenta as seguintes medidas

Q
1
= 24,4 cm, Q
3
= 41,2 cm, P
10
= 20,2 cm e P
90
= 49,5 cm,

temos que

41, 2 24, 4 16,8
C 0, 2866 C 0,287
2(49,5 20, 2) 58, 6

= = = =

.

Como 0,287>0,263, conclumos que a distribuio platicrtica, em relao
normal.


EXERCCIOS
Calcular os coeficientes de assimetria e os coeficientes de curtose das listas de
exerccios anteriores.

Vous aimerez peut-être aussi