Vous êtes sur la page 1sur 69

Estatstica Aplicada

Professora conteudista: Angela Maria Pizzo


Sumrio
Estatstica Aplicada
Unidade I
1 INTRODUO ESTATSTICA .........................................................................................................................1
1.1 Introduo ..................................................................................................................................................1
1.2 Importncia da estatstica ...................................................................................................................2
1.3 Grandes reas da estatstica ...............................................................................................................2
1.4 Fases do mtodo estatstico ................................................................................................................5
1.5 Dados estatsticos ..................................................................................................................................9
1.6 Formas iniciais de tratamento dos dados .................................................................................. 10
1.7 Notao por ndices .............................................................................................................................11
1.7.1 Notao sigma () ..................................................................................................................................11
1.8 Sries estatsticas simples e compostas .................................................................................. 15
1.8.1 Tipos de sries estatsticas .................................................................................................................. 16
1.8.2 Tabelas de dupla entrada ..................................................................................................................... 18
1.9 Apresentao de dados - grcos e tabelas ............................................................................. 20
2 MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA PARA
DADOS SIMPLES .................................................................................................................................................. 24
2.1 A mdia aritmtica simples (,x) ................................................................................................... 25
2.2 A mdia aritmtica ponderada ....................................................................................................... 28
2.3 A mediana ............................................................................................................................................... 29
2.4 A moda ..................................................................................................................................................... 31
3 MEDIDAS DE DISPERSO PARA DADOS SIMPLES .............................................................................. 33
3.1 Amplitude total ..................................................................................................................................... 37
3.2 Desvio mdio absoluto ....................................................................................................................... 37
3.3 Varincia .................................................................................................................................................. 39
3.4 Desvio padro ........................................................................................................................................ 44
4 DISTRIBUIO DE FREQUNCIAS ............................................................................................................. 47
4.1 A construo de uma distribuio de frequncias para dados contnuos .................... 48
4.2 A construo de uma distribuio de frequncias para dados discretos ...................... 55
4.3 Representao grca de dados agrupados ............................................................................. 56
Unidade II
5 AS MEDIDAS DE POSIO E VARIABILIDADE NUMA DISTRIBUIO DE FREQUNCIA ...... 66
5.1 As medidas de posio ....................................................................................................................... 67
5.1.1 A mdia ....................................................................................................................................................... 67
5.1.2 A mediana .................................................................................................................................................. 69
5.1.3 A moda ........................................................................................................................................................ 70
5.2 As medidas de disperso numa distribuio de frequncia .................................................71
5.2.1 O desvio mdio ........................................................................................................................................ 71
5.2.2 Varincia .................................................................................................................................................... 72
5.2.3 Desvio padro ........................................................................................................................................... 74
6 INTRODUO PROBABILIDADE ............................................................................................................. 78
6.1 Teoria dos conjuntos, espao amostral e eventos ................................................................... 78
7 PROBABILIDADE: ORIGEM, MTODOS E PRINCIPAIS TEOREMAS ................................................ 90
7.1 Origens da probabilidade .................................................................................................................. 90
7.1.1 Mtodos objetivos .................................................................................................................................. 91
7.1.2 Mtodo subjetivo .................................................................................................................................... 96
7.2 Principais teoremas de probabilidade .......................................................................................... 97
8 REVISO ............................................................................................................................................................ 102
1
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
1 INTRODUO ESTATSTICA
1.1 Introduo
A palavra estatstica lembra, maioria das pessoas,
recenseamentos. Os censos existem h milhares de anos e
constituem um esforo imenso e caro feito pelos governos
com o objetivo de conhecer seus habitantes, sua condio
socioeconmica, sua cultura, religio, etc. Portanto, associar-se
estatstica a censo perfeitamente correto do ponto de vista
histrico, sendo interessante salientar que as palavras estatstica
e estado tm a mesma origem latina: status.
A estatstica tambm comumente associada s pesquisas de
opinio pblica, aos vrios ndices governamentais, aos grcos
e mdias publicadas diariamente na imprensa. Na realidade,
entretanto, a estatstica engloba muitos outros aspectos, sendo
fundamental na anlise de dados provenientes de quaisquer
processos em que exista variabilidade.
possvel distinguir duas concepes para a palavra
estatstica:
No plural (estatsticas), indica qualquer coleo de dados
numricos, reunidos com a nalidade de fornecer informaes
acerca de uma atividade qualquer. Assim, por exemplo, as
estatsticas demogrcas referem-se aos dados numricos
sobre nascimentos, falecimentos, matrimnios, desquites, etc.
As estatsticas econmicas consistem em dados numricos
relacionados com emprego, produo, vendas e com outras
5
10
15
20
Unidade I
2
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
atividades ligadas aos vrios setores da vida econmica. No
singular (estatstica), indica a atividade humana especializada ou
um corpo de tcnicas, ou ainda uma metodologia desenvolvida
para a coleta, a classicao, a apresentao, a anlise e a
interpretao de dados quantitativos e a utilizao desses dados
para a tomada de decises.
1.2 Importncia da estatstica
O mundo est repleto de problemas. Para resolvermos a
maioria deles, necessitamos de informaes. Mas que tipo de
informaes? Quantas? E aps obt-las, o que fazer com elas?
A estatstica lida com essas informaes, associando os dados
ao problema, descobrindo como e o que coletar e obtendo
concluses a partir de todas essas informaes de tal forma que
possam ser entendidas por outras pessoas.
Portanto, os mtodos estatsticos auxiliam o cientista social,
o economista, o engenheiro, o agrnomo e muitos outros
prossionais a realizarem o seu trabalho com mais ecincia.
Vejamos alguns exemplos:
Os estatsticos do governo conduzem censos de populao,
moradia, produtos industriais, agricultura e outros. So feitas
compilaes sobre vendas, produo, inventrio, folha de
pagamento e outros dados das indstrias e empresas. Essas
estatsticas informam ao administrador como a sua empresa
est crescendo, seu crescimento em relao a outras empresas
e como planejar aes futuras. A anlise dos dados muito
importante para se fazer um planejamento adequado.
1.3 Grandes reas da estatstica
Para ns de apresentao, usual dividir-se a estatstica em
trs grandes reas, embora no se trate de ramos isolados:
amostragem, que o mecanismo de coleta de dados;
estatstica descritiva, que se ocupa da organizao,
apresentao e sintetizao de dados;
Estatstica um conjunto de
tcnicas e mtodos que nos auxiliam
no processo de tomada de deciso na
presena de incerteza.
5
10
15
20
25
30
3
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
estatstica inferencial, que constitui o conjunto de mtodos
para a tomada de decises, nas situaes em que existem
incerteza e variao.
Amostragem
o processo de escolha da amostra. a parte inicial de
qualquer estudo estatstico. Consiste na escolha criteriosa dos
elementos a serem submetidos ao estudo.
Exemplo 1. Pesquisas sobre tendncias de votao. Em
pocas de eleio, comum a realizao de pesquisas com o
objetivo de se conhecerem as tendncias do eleitorado. Para
que os resultados sejam, de fato, representativos, toma-se
o cuidado de se entrevistar um conjunto de pessoas com
caractersticas socioeconmicas, culturais, religiosas, etc. to
prximas quanto possvel da populao qual os resultados
da pesquisa sero estendidos. A escolha da amostra, a
redao do questionrio, a entrevista, a codificao dos
dados, a apurao dos resultados so as etapas deste tipo de
pesquisa.
Populao e amostra
O estudo de qualquer fenmeno, seja ele natural, social,
econmico ou biolgico, exige a coleta e a anlise de dados
estatsticos. A coleta de dados , pois, a fase inicial de qualquer
pesquisa.
Populao a coleo de todas as observaes potenciais
sobre determinado fenmeno. O conjunto de dados efetivamente
observados, ou extrados, constitui uma amostra da populao.
sobre os dados da amostra que se desenvolvem os estudos,
visando a fazer inferncias sobre a populao.
Exemplo 2. Avaliao de um programa de ensino. Toma-se
certo nmero de pares de turmas: a um conjunto de turmas
5
10
15
20
25
30
4
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
ensina-se um assunto por um novo mtodo, e ao outro, pelo
mtodo clssico. Aplica-se uma prova a ambos os grupos. As
notas observadas nesses conjuntos de turmas constituem
a nossa amostra. Se os resultados do novo mtodo forem
melhores, iremos aplic-lo a todas as turmas, isto , populao.
A partir da amostra, estabelecemos o que conveniente
para a populao, ou seja, fazemos uma inferncia sobre a
populao.
Exemplo 3. Renda mdia per capita em diversas regies
do pas. Toma-se um conjunto de indivduos em cada regio,
escolhidos ao acaso, e sobre esse grupo fazem-se os estudos.
Os indivduos assim escolhidos constituem a amostra, e os
resultados nela observados sero estendidos populao.
Estatstica descritiva
a parte mais conhecida. Quem v o noticirio, na televiso
ou nos jornais, sabe o quo frequente o uso de mdias, ndices
e grcos nas notcias.
Exemplo 4. INPC (ndice Nacional de Preos ao Consumidor).
Sua construo envolve a sintetizao, em um nico nmero,
dos aumentos dos produtos de uma cesta bsica.
Exemplo 5. Anurio Estatstico Brasileiro. O IBGE publica
a cada ano este anurio, apresentando, em vrias tabelas,
os mais diversos dados sobre o Brasil: educao, sade,
transporte, economia, cultura, etc. Embora simples, fceis de
serem entendidas, as tabelas so o produto de um processo
demorado e extremamente dispendioso de coleta e apurao
de dados.
Exemplo 6. Anurio Estatstico da Embratur. A Embratur
publica este anurio apresentando, em vrias tabelas e grcos,
os mais diversos dados sobre turismo interno e dados sobre
entrada de turistas estrangeiros no Brasil.
5
10
15
20
25
30
5
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Estatstica inferencial (ou indutiva)
A tomada de decises sobre a populao, com base em
estudos feitos sobre os dados da amostra, constitui o problema
central da inferncia estatstica.
Exemplo 7. Anlise nanceira. Os analistas nanceiros
estudam dados sobre a situao da economia, visando a explicar
tendncias dos nveis de produo e de consumo, projetando-os
para o futuro.
Exemplo 8. Ocorrncia de terremotos. Os gelogos esto
continuamente coletando dados sobre a ocorrncia de
terremotos. Gostariam de inferir quando e onde ocorrero
tremores, e qual a sua intensidade. Trata-se, sem dvida, de uma
questo complexa, que exige longa experincia geolgica, alm
de cuidadosa aplicao de mtodos estatsticos.
Probabilidade
O processo de generalizao, que caracterstico
do mtodo indutivo, est associado a uma margem de
incerteza. A existncia da incerteza deve-se ao fato de
que a concluso que se pretende obter para o conjunto
de todos os indivduos analisados quanto a determinadas
caractersticas comuns baseia-se em uma parcela do total
das observaes. A medida da incerteza tratada mediante
tcnicas e mtodos que se fundamentam na Teoria da
Probabilidade. Essa teoria procura quantificar a incerteza
existente em determinada situao.
1.4 Fases do mtodo estatstico
Quando se pretende empreender um estudo estatstico
completo, existem diversas fases do trabalho que devem
ser desenvolvidas para se chegar aos resultados finais do
estudo.
Fica claro, assim, que as trs reas
da estatstica no so separadas ou
distintas, mas tendem a se entrelaar. A
descrio e o resumo dos dados tende
a ser a primeira fase da anlise dos
mesmos; j a teoria e os fundamentos
da amostragem se baseiam na teoria
da probabilidade, que nos leva a
uma inferncia ou a uma tomada de
decises baseada nas informaes
apresentadas.
5
10
15
20
25
30
6
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
As fases principais so as seguintes:
denio do problema;
planejamento;
coleta de dados;
apurao dos dados;
apresentao dos dados;
anlise e interpretao dos dados.
Descrevendo mais atentatamente cada fase:
Denio do problema
A primeira fase do trabalho consiste em uma denio
ou formulao correta do problema a ser estudado. Alm de
considerar detidamente o problema objeto do estudo, o analista
dever examinar outros levantamentos realizados no mesmo
campo e anlogos, uma vez que parte da informao de que se
necessita pode, muitas vezes, ser encontrada nesses ltimos.
Planejamento
O passo seguinte, aps a denio do problema, compreende
a fase do planejamento, que consiste em se determinar o
procedimento necessrio para resolver o problema e, em especial,
como levantar informaes sobre o assunto objeto do estudo.
preciso planejar o trabalho a ser realizado, tendo em vista o
objetivo que se pretende atingir. nesta fase que ser escolhido
o tipo de levantamento a ser utilizado. Sob esse aspecto, pode
haver dois tipos de levantamento:
levantamento censitrio quando a contagem for
completa, abrangendo todo o universo;
levantamento por amostragem, quando a contagem for
parcial.
Observe quais so as fases principais
do mtodo estatstico compem
a organizao de um projeto, sua
execuo e apresentao nal.
5
10
15
20
25
7
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Outros elementos importantes que devem ser tratados nessa
mesma fase so:
cronograma das atividades atravs do qual so xados os
prazos para as vrias fases;
custos envolvidos;
exame das informaes disponveis;
delineamento da amostra, etc.
Coleta dos dados
O terceiro passo essencialmente operacional,
compreendendo a coleta das informaes propriamente ditas.
Nesta fase do mtodo estatstico, conveniente estabelecer
uma distino entre duas espcies de dados:
dados primrios quando so publicados ou comunicados
pela prpria pessoa ou organizao que os haja escolhido.
dados secundrios quando so publicados ou comunicados
por outra organizao.
Um conjunto de dados , pois, primrio ou secundrio em
relao a algum. As tabelas do censo demogrco so fontes
primrias. Quando determinado jornal publica estatsticas
extradas de vrias fontes e relacionadas com diversos setores
industriais, os dados so secundrios para quem desejar utilizar-
se deles em alguma pesquisa que esteja desenvolvendo.
A coleta de dados pode ser realizada de duas maneiras:
coleta direta quando obtida diretamente da fonte,
como no caso da empresa que realiza uma pesquisa
para saber a preferncia dos consumidores pela sua
marca;
5
10
15
20
25
8
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
coleta indireta quando inferida a partir dos elementos
conseguidos pela coleta direta, ou atravs do conhecimento
de outros fenmenos que, de algum modo, estejam
relacionados com o fenmeno em questo.
Apurao dos dados
Antes de comear a analisar os dados, conveniente que
lhes seja dado algum tratamento prvio, a m de torn-los mais
expressivos. A quarta etapa do processo , ento, a da apurao
ou sumarizao, que consiste em resumir os dados atravs de
sua contagem e agrupamento.
Apresentao dos dados
H duas formas de apresentao ou exposio dos dados
observados, que no se excluem mutualmente:
apresentao tabular uma apresentao numrica dos
dados. Consiste em dispor os dados em linhas e colunas
distribudas de modo ordenado, segundo algumas regras
prticas adotadas pelos diversos sistemas estatsticos. As
tabelas tm a vantagem de conseguir expor, sinteticamente
e em um s local, os resultados sobre determinado assunto,
de modo a se obter uma viso global mais rpida daquilo
que se pretende analisar;
apresentao grca constitui uma apresentao
geomtrica dos dados numricos. Embora apresentao
tabular seja de extrema importncia, no sentido de facilitar
a anlise numrica de dados, no permite ao analista obter
uma viso to rpida, fcil e clara do fenmeno e sua
variao como conseguida atravs de um grco.
Anlise e interpretao dos dados
Nesta ltima etapa, o interesse maior reside em tirar
concluses que auxiliem o pesquisador a resolver seu problema.
Observe em jornais e revistas que,
normalmente, as informaes grcas
tm uma assimilao mais rpida por
parte dos leitores.
5
10
15
20
25
30
9
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
A anlise dos estatsticos est ligada essencialmente ao clculo
de medidas, cuja nalidade principal descrever o fenmeno.
Assim, o conjunto de dados a ser analisado pode ser expresso por
nmeros-resumos, as estatsticas, que evidenciam caractersticas
particulares desse conjunto. O signicado exato de cada um dos
valores obtidos atravs do clculo das vrias medidas estatsticas
disponveis deve ser bem interpretado. possvel mesmo, nesta
fase, arriscar algumas generalizaes, as quais envolvero, como
mencionado anteriormente, algum grau de incerteza, porque
no se pode estar seguro de que o que foi constatado para
aquele conjunto de dados (a amostra) se vericar igualmente
para a populao.
1.5 Dados estatsticos
Quando se trabalha com a observao, a mensurao,
a anlise e a interpretao de nmeros, esses nmeros nos
conduzem a ndices inacionrios, ndices de desemprego,
probabilidade de determinado candidato ganhar as eleies, etc.
Tais nmeros, portanto, sero chamados de dados estatsticos.
Esses dados precisaro ser organizados e sumarizados para sua
correta interpretao.
Dado bruto signica que os dados no esto numericamente
organizados e processados. O processamento e a organizao
dos dados que os transformam em informao, enfatizando
seus aspectos mais importantes. A informao, portanto,
resultado de um tratamento dos dados.
Para organizar e processar os dados estatsticos, podemos
utilizar resumos visuais e numricos, atravs de grcos, mapas,
tabelas e modelos numricos.
A mensurao ou a observao de itens como ndices de
preos, renda mensal per capita de um Estado, etc., do origem
aos dados estatsticos. Como esses itens originam valores que
tendem a apresentar um certo grau de variabilidade quando so
medidos sucessivas vezes, chamamos ento de variveis.
importante identicar os quatro
tipos de variveis: variveis contnuas,
variveis discretas, variveis nominais e
variveis por posto.
5
10
15
20
25
30
10
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
I. Variveis contnuas: so as variveis que podem assumir
qualquer valor num intervalo contnuo (dado contnuo).
Exemplos: altura, peso, velocidade, etc.
II. Variveis discretas: em geral originam-se da contagem
de itens e s podem assumir valores inteiros. Exemplos: nmero
de alunos em sala de aula, nmero de professores que trabalham
na escola, etc.
III. Variveis nominais: so aquelas que existem com o
objetivo de denir categorias, e as observaes, mensuraes e
anlises so feitas levando-se em conta essas mesmas categorias.
Exemplos de categorias seriam: a separao por sexo, idade,
nvel de escolaridade, etc.
IV. Variveis por posto: quando existe o desejo de dispor
os elementos observados segundo uma ordem de preferncia
ou desempenho, atribuem-se valores relativos para indicar esta
ordem. Exemplo: primeiro, segundo, terceiro.
As variveis discretas e contnuas so ditas variveis
quantitativas porque envolvem dados numricos. J as
variveis nominais e por posto precisam ser transformadas em
valores numricos para serem objeto da anlise estatstica, e
so ditas variveis qualitativas.
1.6 Formas iniciais de tratamento dos dados
Em geral, quando nos propomos a buscar, construir
informaes a partir de dados, deparamo-nos, inicialmente, com
um conjunto de dados brutos que pouco nos dizem. preciso
organiz-los minimamente para que eles comecem a fazer
algum sentido, viabilizando sua anlise.
Uma primeira forma de organizao dos dados o chamado
rol. Obtemos o rol quando organizamos os dados brutos em
ordem crescente ou decrescente de grandeza. A amplitude do
variveis discretas e contnuas =
variveis quantitativas;
variveis nominais e por posto =
variveis qualitativas.
5
10
15
20
25
11
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
rol obtida pela diferena entre o maior e o menor nmero do
rol. Utiliza-se o rol quando o conjunto de dados for pequeno, ou
seja, for inferior a 30 observaes.
Por outro lado, quando se trata de um conjunto grande
de dados, que seja superior a 30 observaes, utilizamos a
distribuio de frequncias, que consiste em organizar os
dados brutos em classes, a m de identicar o nmero de itens
pertencentes a cada classe, denominado frequncia de classe.
Os dados so assim organizados em intervalos de classes. Este
assunto ser estudado no mdulo II.
1.7 Notao por ndices
A notao por ndices bastante utilizada na estatstica,
sendo assim importante esclarecer seu signicado. O smbolo x
i
(onde se l x ndice i) ir representar qualquer um dos n valores
assumidos pela varivel x, x
1
,x
2
,x
3
,x
4
,...,x
n
. n denominado ndice
e poder assumir qualquer dos nmeros entre 1, 2, 3, 4, ..., n.
1.7.1 Notao sigma ()
A maioria dos processos estatsticos vai exigir o clculo da
soma de um conjunto de nmeros. A letra maiscula grega
sigma () utilizada para representar essas somas.
Assim, se uma determinada varivel y tiver os valores 3, 5, 7,
9 e 11, o y ser:
y = 3+5+7+9+11
y = 35
Por outro lado, se o consumo semanal de arroz de x, durante
um ms, foram 2kg,4kg, 3kg, 5kg, o total consumido por x no
ms teria sido:
x = 2+4+3+5
x = 14; x teria consumido 14kg de arroz durante o ms
referido.
rol inferior a 30 observaes;
distribuio de frequncias superior a
30 observaes.
5
10
15
20
25
12
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
A notao sigma possui algumas propriedades que
precisamos desenvolver, para facilitar os contedos que
estudaremos nesta disciplina.
a)
x x x
i
i
n
= =

=1
; isso signica que devemos somar
as n observaes de x, comeando com a primeira.
Por exemplo, num conjunto de dados em que x
i
={2,4,6,8,10,12},
onde n=6, temos:
x x
x
i
i
n
i
i
i
= =

= = + + + + +
=
1 1
6
2 4 6 8 10 12
42
Por outro lado, possvel utilizar essa notao quando
se pretende analisar a soma de apenas uma parte dos dados
disponibilizados, podendo-se, portanto, abreviar a soma de um
conjunto de dados. Desta forma, podemos ter:
I)
x x x x
i
i
1 2 3
1
3
+ + =
=

II) x x x x x
i
i
8 9 10 11
8
11
+ + + =
=

b) Se cada valor da varivel x multiplicado ou dividido por


uma constante, temos que isso ser igual ao valor da constante
multiplicado ou dividido pela somatria de x.
c x c x . . =

Assim,
4 4 4 4 4
4 4
1 2 3 4
1
4
1 2 3 4
1
4
x x x x x
x x x x x
i
i
i
i
= + + +
= + + + =
=
=

( )
5
10
15
20
13
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Por exemplo:
se x
i
={2,4,6,8,10,12}; onde n=6 e cada valor de x multiplicado
pela constante c=2, temos:
cx c x
cx c x
i
i
i
i
=
= = + + + + + =
=


= = 1
6
1
6
2 2 2 4 2 6 2 8 210 212 ( ) ( ) ( ) ( ) ( ) ( )
22 2 4 6 8 10 12
2 2 2 42 84
1
6
1
6
( )
( )
+ + + + +
= = =
= =

x x
i i
i i
c) O somatrio de uma constante c ser igual ao produto
da constante pelo nmero de vezes (n) que ela se repete. Assim,
temos:
c nc
i
i i
n
=
=

Por exemplo, se numa determinada observao o conjunto


de dados de x
i
={7,7,7,7,7,7}, onde n=6, temos que x
i
uma
constante c que se repete. Ento temos:
x c
x c nc
i i
i i
i i
=
= = = + + + + + = =
= =

1
6
1
6
7 7 7 7 7 7 6 7 42 ( )
d) O somatrio de uma soma ou de uma diferena de duas
variveis ser igual soma ou diferena dos somatrios
individuais das duas variveis. Assim, temos:
( )
( )
x y x y
x y x y
i i i i
i
n
i
n
i
n
i i i i
i
n
i
n
i
n
+ = +
=
= = =
= = =


1 1 1
1 1 1
5
10
15
20
14
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Por exemplo:
i X Y (X-Y)
1 8 5 3
2 3 2 1
3 4 0 4
4 5 4 1
- - - -
20 11 9
( ) x y
x y
=
= =


9
20 11 9
e) O somatrio de um conjunto de dados x
i

ao quadrado nos
obriga a elevar cada elemento de x
i
ao quadrado para efetuar a
soma. Assim, temos:
x x x x x
i
i
n
n
2
1
1
2
2
2
3
2 2
=

= + + + + ...
Por exemplo, se numa dada observao o conjunto de dados
de x
i
={2,4,6,8,10}, onde n=5, temos:
x
i
i
2
1
5
=

=2 +4 +6 +8 +10 =4+16+36+64+100=220
2 2 2 2 2
f) O somatrio ao quadrado de um conjunto de dados ser
obtido tomando-se a soma dos valores de x
i
e elevando-se ao
quadrado. Assim, temos:
( ) ( ... ) x x x x x
i
i
n
n
=

= + + + +
1
2
1 2 3
2
Por exemplo, se temos um mesmo conjunto x
i
={2,4,6,8,10},
onde n=5, tal qual no exemplo do item e, teremos um resultado
distinto. Vejamos, neste caso:
( ) ( ) ( ) x
i
i=

= + + + + = =
1
5
2 2 2
2 4 6 8 10 30 900
Esta notao se encontra em
livros de matemtica. Busque outros
exemplos.
5
10
15
15
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
1.8 Sries estatsticas simples e compostas
Uma srie estatstica dene-se como toda e qualquer
coleo de dados estatsticos referidos a uma mesma ordem
de classicao: quantitativa. No sentido mais amplo, srie
uma sucesso de nmeros referidos a qualquer varivel. Se os
nmeros expressarem dados estatsticos, a srie ser chamada
de srie estatstica.
Em sentido mais estreito, pode-se dizer que uma srie
estatstica uma sucesso de dados estatsticos referidos a
caracteres qualitativos, ao passo que uma sucesso de dados
estatsticos referidos a caracteres quantitativos congurar uma
serrao. Em outros termos, a palavra srie usada normalmente
para designar um conjunto de dados dispostos de acordo com
um carter varivel, residindo a qualidade serial na disposio
desses valores, e no em uma disposio temporal ou espacial de
indivduos. As tabelas servem para apresentar sries estatsticas;
os trs caracteres presentes na tabela que as apresenta so:
a poca (fator temporal ou cronolgico) a que se refere
o fenmeno analisado;
o local (fator espacial ou geogrco) onde o fenmeno
acontece;
o fenmeno (espcie do fato ou fator especicativo) que
descrito.
As sries so divididas em dois grupos:
sries homgradas: aquelas em que a varivel descrita
apresenta variao discreta ou descontnua. So sries
homgradas a srie temporal, a srie geogrca e a srie
especca.
sries hetergradas: aquelas nas quais o fenmeno
ou o fato apresenta gradaes ou subdivises. Embora
5
10
15
20
25
16
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
xo, o fenmeno varia em intensidade. A distribuio de
frequncias uma srie hetergrada.
1.8.1 Tipos de sries estatsticas
As sries estatsticas diferenciam-se de acordo com a
variao de um dos trs elementos: poca, local e fenmeno.
Srie temporal
Tambm chamada de srie cronolgica, srie histrica, srie
evolutiva ou marcha, identica-se pelo carter varivel do fator
cronolgico. Assim, deve-se ter:
elemento varivel: poca
elementos xos: local e fenmeno
Exemplo:
Tabela 1.1
Operadora WKX Venda de bilhetes areos Mercado
Interno - 1995
Meses Vendas ( em milhares de reais)
Janeiro 2300
Fevereiro 1800
Maro 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510
Fonte: Departamento de Anlise de Mercado
5
10

17
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Srie geogrca
Tambm chamada de srie territorial, srie espacial ou
srie de localizao, identica-se pelo carter varivel do fator
geogrco. Assim, deve-se ter:
elementos varivel: local;
elementos xos: poca e fenmeno.
Exemplo:
Tabela 1.2
Operadora WKX - Vendas por Unidade da Federao 2008
Unidades da Federao Vendas (em milhares de reais)
Minas Gerais 4000
Paran 2230
Rio Grande do Sul 6470
Rio de Janeiro 8300
So Paulo 10090
Outros 420
TOTAL BRASIL 31510
Fonte : Departamento de Anlise de Mercado
Srie especca
Tambm chamada de srie categrica, srie por categoria,
identica-se pelo carter varivel de fator especicativo. Assim,
deve-se ter:
elemento varivel: fenmeno;
elementos xos: local e poca.
Exemplos:
Tabela 1.3
Operadora WKX - Venda de bilhetes areos por Linha 2008
Linha do produto Vendas (em milhares de reais)
Linha A 6450
Linha B 9310
Linha C 15750
TODAS AS LINHAS 31510
Fonte : Departamento de Anlise de Mercado
5
10
15
18
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Tabela 1.4
Nmero de empregados das vrias classes de salrios no estado
de So Paulo 2008
Classes de salrios (R$) Nmero de empregados
At 80 41.326
De 80 a 119 123.236
De 120 a 159 428.904
De 160 a 199 324.437
De 200 a 399 787.304
De 400 a 599 266.002
De 600 a 799 102.375
De 800 a 999 56.170
1000 e mais 103.788
TOTAL 2.233.542
Fonte: Servio de Estatstica da Previdncia e Trabalho (dados alterados para
melhor compreenso)
1.8.2 Tabelas de dupla entrada
As tabelas apresentadas anteriormente so tabelas estatsticas
simples, em que apenas uma srie est representada. comum,
todavia, haver necessidade de apresentar, em uma nica tabela,
mais do que uma srie. Quando as sries aparecem conjugadas,
tem-se uma tabela de dupla entrada.
Exemplos:
A) Srie especco-temporal.
B) Srie geogrco-temporal.
Tabela 1.5
Populao economicamente ativa por setor de atividades Brasil
Setor
Populao (1000 hab.)
1940 1950 1960
Primrio 8.968 10.255 12.163
Secundrio 1.414 2.347 2.962
Tercirio 3.620 4.516 7.525
Fonte : IPEA
5
10
19
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Tabela 1.6
Populao indgena brasileira
Unidade de produo
Produo
1937 1938 1939
Acre 5.007 4.765 4.727
Amazonas 6.858 5.998 5.631
Par 4.945 4.223 4.500
Mato Grosso 1.327 1.285 1.235
Outros estados 333 539 337
Fonte : Anurio Estatstico do Brasil IBGE (dados alterados para melhor
compreenso)
Observao:
Nem sempre uma tabela representa uma srie estatstica.
Por vezes, os dados reunidos no revelam uniformidade, sendo
meramente um aglomerado de informaes gerais sobre
determinado assunto, as quais, embora teis, no apresentam a
consistncia necessria para se congurar uma srie estatstica.
Exemplo:
Tabela 1.7
Situao dos espetculos cinematogrcos no Brasil 1967
Especicao Dados numricos
Nmero de cinemas 2.488
Lotao dos cinemas 1.722.348
Sesses por dia 3.933
Filmes de longa metragem 131.330.488
Meia entrada 89.581.234
Fonte : Anurio Estatstico do Brasil IBGE
5
10
20
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
1.9 Apresentao de dados - grcos e tabelas
A representao grfica das sries estatsticas tem por
finalidade representar os resultados obtidos, permitindo
chegar-se a concluses sobre a evoluo do fenmeno ou
sobre como se relacionam os valores da srie. A escolha do
grfico mais apropriado ficar a critrio do analista. Contudo,
os elementos simplicidade, clareza e veracidade devem ser
considerados quando da elaborao de um grfico.
Diretrizes para a construo de um grco:
o ttulo do grco deve ser o mais claro e completo possvel.
Sendo necessrio, acrescentem-se subttulos;
a orientao geral dos grcos deve ser da esquerda para
a direita;
as quantidades devem ser representadas por grandezas
lineares;
sempre que possvel, a escala vertical h de ser escolhida
de modo a aparecer a linha 0 (zero);
s devem ser inclusas no desenho as coordenadas
indispensveis para guiar a vista na leitura. Um tracejado
muito cerrado diculta o exame do grco;
a escala horizontal deve ser lida da esquerda para a direita,
e a vertical, de baixo para cima;
os ttulos e marcaes do grco dispor-se-o de maneira
que sejam facilmente legveis, partindo da margem
horizontal inferior ou da margem esquerda.
5
10
15
20
21
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Leitura e interpretao de um grco:
declarar qual o fenmeno ou fenmenos representados, a
regio considerada, o perodo de tempo, a fonte dos dados,
etc.;
examinar o tipo de grco escolhido, vericar se o mais
adequado, criticar a sua execuo, no conjunto e nos
detalhes;
analisar cada fenmeno separadamente, fazendo notar
os pontos mais em evidncia, o mximo e o mnimo, as
mudanas mais bruscas;
investigar se h uma tendncia geral crescente ou
decrescente ou, ento, se o fato exposto estacionrio;
procurar descobrir a existncia de possveis ciclos peridicos,
qual o perodo aproximado, etc.
Eis os tipos mais comuns de grcos:
Grco em linhas
500
400
300
200
100
0
1 2 3 4 5 6 7
Sequncia 1
Sequncia 2
Grco em colunas
100
80
60
40
20
0
1940 1950 1960 1970
Populao
Populao
5
10
15
22
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Grco em barras
semelhante ao grco em colunas, porm, os retngulos
so dispostos horizontalmente.
1970
1960
1950
1940
0 20 40 60 80 100
Populao
do Brasil
Populao do Brasil
Grco em setores
Anos Receita (em R$ 1.000.000,00)
1975 90
1976 120
1977 150
Total 360
Fonte: Departamento da Fazenda, Municpio X.
a representao grca de uma srie estatstica, em
crculo, por meio de setores . utilizado principalmente quando
se pretende comparar cada valor da srie com o total.
Total __________360
Parte___________ x
Para 1975: 360 - 360
90 - x
x = 90
Para 1976: 360 - 360
120 - x
x = 120
5
10
15
23
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Para 1977: 360 - 360
150 - x
x = 150
1975
1976
1977
Receita do Municpio X
Grco polar
a representao de uma srie por meio de um polgono.
Movimento mensal de compras de uma agncia em 1972
Meses Valores (R$1.000,00)
Janeiro 12
Fevereiro 13
Maro 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
20
15
10
5
0
Jan
Dez
Nov
Out
Set
Ago
Jul
Jun
Mai
Abr
Mar
Fev
Sequncia 1
Resumindo:
a estatstica utiliza mtodos
matemticos para solucionar
problemas reais de tomada de
deciso quando h incerteza;
em situaes nas quais poderamos
contar unicamente com a sorte,
temos um instrumento que nos
possibilita aumentar as chances de
tomar a melhor deciso;
utiliza ferramentas matemticas
denidas. Mesmo lidando com
um grande nmero de dados, essas
ferramentas resumem a anlise em
tabelas ou grcos;
na prtica, a estatstica pode ser
empregada como base conceitual
e fundamental em vrias outras
cincias, inclusive em anlises
gerenciais.
5
24
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
2 MEDIDAS DE TENDNCIA CENTRAL: MDIA,
MODA E MEDIANA PARA DADOS SIMPLES
Na realizao de qualquer estudo, quase nunca possvel
examinar todos os elementos da populao de interesse. Temos
usualmente de trabalhar com uma amostra da populao.
A inferncia estatstica nos d elementos para generalizar,
de maneira segura, as concluses obtidas da amostra para a
populao.
errneo pensar que, caso tivssemos acesso a todos os
elementos da populao, seramos mais precisos. Os erros
de coleta e manuseio de um grande nmero de dados so
maiores do que as imprecises a que estamos sujeitos quando
generalizamos, via inferncia, as concluses de uma amostra
bem selecionada.
Em se tratando de amostra, a preocupao central que ela
seja representativa.
Assim que decidimos obter informaes atravs de um
levantamento amostral, temos imediatamente dois problemas:
denir cuidadosamente a populao de interesse;
selecionar a caracterstica que iremos pesquisar.
Portanto, temos situaes prossionais em que nos bastam
poucos dados ou estatsticas de dados simples. Por outro
lado, h tambm situaes nas quais um nmero maior de
elementos deve ser investigado e tratado como distribuies
de frequncia.
Quando estamos diante de um conjunto de dados, seja ele
pequeno ou grande, em geral, buscamos medidas que possam
ser usadas para indicar um valor que tende a representar melhor
aquele determinado conjunto de nmeros. E as medidas mais
5
10
15
20
25
25
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
usadas neste sentido so as chamadas medidas de tendncia
eventual ou central, que so a mdia, mediana e moda.
Sabe-se que estes valores sero medidos de forma distinta
conforme um grande conjunto de dados ou um pequeno
conjunto de dados. Tambm o clculo desses valores ir ser
afetado caso as variveis sejam discretas ou contnuas.
Distribuio por frequncia a tabela em que se resumem
grandes quantidades de dados, determinando o nmero de
vezes que cada dado ocorre (frequncia) e a porcentagem com
que aparece (frequncia relativa).
ATENO: neste mdulo, trataremos do clculo destas
estatsticas para os chamados dados simples ou conjuntos
de dados com menos que 30 elementos.
2.1 A mdia aritmtica simples (,x)
A mdia aritmtica um dos valores mais representativos de
um conjunto de dados. Obtm-se o valor da mdia aritmtica
dividindo-se o somatrio dos valores do conjunto de dados pelo
nmero de valores total deste conjunto.
Assim, temos que:
mdia =
x
n
i
i
n
=

1
Para a populao, calcula-se a mdia aritmtica utilizando-se
os seguintes parmetros:
=
=

Xi
N
i i
N
, onde

Mdia aritmtica da populao (parmetro)
N Total de observaes da populao (total da
populao)
X
i
Cada varivel populacional
Em estatstica a mdia o valor
mdio de uma distribuio ou de
um conjunto de dados, determinado
segundo uma regra estabelecida a priori
e que se utiliza para representar todos
os valores da distribuio. Existem
diversas formas de se calcular a mdia
de um conjunto de nmeros. Por
exemplo, algumas delas so: aritmtica,
geomtrica e harmnica.
5
10
15
20
26
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Para a amostra, calcula-se o valor mdio utilizando-se os
seguintes parmetros:
x
x
n
i
i
n
=
=

1 , onde

x Mdia aritmtica da amostra (estimativa)
n Nmero de dados da amostra
x
i
Cada varivel da amostra
Vamos agora tomar um exemplo de mdia aritmtica.
Supondo um conjunto de dados x
i
= {2,4,6,8,10,12}, onde N=6,
temos:
= =
+ + + + +
=
=

X
N
i
i
N
1
2 4 6 8 10 12
6
7
Para simplicar o nosso estudo, padronizaremos a notao
para o clculo da mdia, e passaremos a utilizar sempre a
notao utilizada para o clculo da mdia aritmtica simples
em conjuntos de dados amostrais, como no exemplo abaixo:
Uma amostra das notas das provas de matemtica dos
estudantes da stima srie de uma grande escola de So Paulo:
x
i
, onde x
i
= {87,42,64,58,90,90,85,63,47,74,100,94} e n=12,
temos:
x
x
n
i
i
n
=
=

1
=
87+42+64+58+90+90+85+63+47+74+100+94
12
=74,5
A nota mdia na prova de matemtica dos estudantes da
stima srie desta escola de So Paulo, por amostragem, 74,5.
So propriedades da mdia aritmtica:
a) Em um conjunto de dados, sempre possvel o clculo
da mdia, independentemente de quais os elementos
que compem esse conjunto de dados.
Embora tenhamos destacado uma
diferena na notao utilizada para o
clculo da mdia aritmtica em uma
amostra e numa populao, a expresso
para o clculo da mdia a mesma,
tanto no clculo da mdia de uma
populao quanto de uma amostra.
So as propriedades que a mdia
aritmtica simples possui que a fazem a
medida de tendncia central mais usada
e mais importante de todas.
5
10
15
20
27
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
b) Em um determinado conjunto de dados, o valor da
mdia ser nico e corresponder a uma constante.
c) Todos os valores de um determinado conjunto de
dados iro afetar a mdia. Se um valor se modica, a
mdia aritmtica tambm ir modicar-se.
d) Somando-se ou subtraindo-se uma determinada
constante c a cada elemento de um determinado
conjunto de dados x
i
= x
1
,x
2
,x
3
,...,x
n
, a mdia aritmtica
car aumentada ou diminuda desta constante c. Se,
por outro lado, multiplicarmos cada elemento deste
conjunto de dados por uma constante c, a nova mdia
ser tambm multiplicada por esta constante c; se
dividirmos cada elemento do conjunto de dados por
esta mesma constante c, a mdia ser dividida por c.
Assim, se temos um conjunto x
i
= x
1
,x
2
,x
3
,...,x
n
, a mdia ser:
x
x
n
i
n
1
1
1
=
=

, logo
x
c x
n
x
x
n
nc
n
x x c
i
i
n
i
i
n
2
1
2
1
2 1
=
+
= + = +
= =

( )
e) A soma algbrica dos desvios dos nmeros de um
conjunto de dados em torno da mdia zero. Isto
pode ser representado da seguinte forma:
x x
i
=

0
Por exemplo, se temos um conjunto de dados x
i
= 2,4,6,8,10,
onde n=5, temos que :
x
x
i
i
= =
+ + + +
=
=

1
5
5
2 4 6 8 10
5
6
5
10
15
20
28
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Se aplicarmos a frmula acima, temos:
x x x
x
i i
i
=

-6=(2-6)+(4-6)+(6-6)+(8-6)+(10-6)
-x=-4-2+0+2+4
xx
i
-x=0

2.2 A mdia aritmtica ponderada


Num conjunto de dados em que cada elemento ou cada
observao possua a mesma importncia, o clculo da
mdia aritmtica simples mostrar bem a populao ou a
amostra estudada. Mas se queremos atribuir pesos distintos
ou importncias distintas aos elementos de um conjunto
de dados, a estatstica a ser adotada a mdia aritmtica
ponderada, em que a cada valor x
i
dever ser atribudo um
determinado peso w
i
. A expresso estatstica para o clculo
da mdia ponderada :
x
wx
w
p
i i
i
n
i
i
n
=
=
=

1
1
Supondo que um estudante tenha que efetuar uma srie de
4 exames para obter sua mdia nal para passar de ano. Cada
exame possui um peso diferente na composio desta mdia,
conforme a tabela abaixo:

Exame Nota Peso
1 68 0,30
2 89 0,20
3 45 0,40
4 100 0,10
1,00
A mdia aritmtica a mais utilizada
no nosso dia-a-dia. obtida dividindo-
se a soma das observaes pelo
nmero delas.
5
10
15
29
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
x
wx
w
p
i i
i
n
i
i
n
=
=
=

1
1

,logo
x
p
=
+ + +
+ + +
( , ) ( , ) ( , ) , ( )
, , , ,
0 30 68 0 20 89 0 40 45 0 10 100
0 30 0 20 0 40 0 10
xx
p
= + + + = 20 4 17 8 18 10 66 2 , , ,
A nota mdia ser ento 66,2, resultado diferente do que
seria obtido se utilizssemos a mdia aritmtica simples.
Exemplicando mdia aritmtica e ponderada:
um aluno tirou as notas 5, 7, 9 e 10 em quatro provas. A
sua mdia ser (5 + 7 + 9 + 10) / 4 = 7,75;
um aluno fez um teste (peso 1) e uma prova (peso 2),
tirando 10 no teste e 4 na prova. A sua mdia (ponderada)
ser (10 + 2 x 4) / 3 = 6. Se o teste e a prova tivessem
mesmo peso (e no importa qual o valor do peso, importa
apenas a relao entre os pesos), a mdia seria 7.
2.3 A mediana
Uma outra medida importante de um conjunto de dados
a mediana.
A mediana divide um determinado conjunto de dados,
que dever estar ordenado, em dois grupos iguais, em que
metade ter valores menores que a mediana e metade ter
valores maiores que a mediana.
Antes de calcular a mediana, preciso organizar os valores em
um rol em ordem crescente, para ento contar at a metade dos
Num conjunto de dados em que cada
elemento ou cada observao possua
importncia diferente, utilizamos a
mdia aritmtica ponderada.
5
10
15
30
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
valores para encontrar a mediana. Em geral, aps organizarmos
os dados em um rol, podemos calcular a posio da mediana
com a frmula abaixo:
posmed
n
=
+ ( ) 1
2
,
onde n o nmero de dados observados.
Por exemplo, para um conjunto de dados x
i
= {6,9,3,5,2,9,
5,5,8,7,1,7,2}, onde n=13, temos primeiro que organizar estes
dados em um rol, depois encontrar a posio da mediana e
ento saber qual ser a mediana. Vejamos:
rolx
i
= {1,2,2,3,5,5,5,6,7,7,8,9,9}
posio mediana =
( ) n+
=
+
=
1
2
13 1
2
7
mediana = 5
Para um conjunto de dados x
i
={6,4,8,3,2,9,7,1}, onde n=8,
temos, ento:
rolx
i
= {1,2,3,4,6,7,8,9}
posio mediana =
( )
,
n+
=
+
=
1
2
8 1
2
4 5
A mediana ser o valor que est a meio caminho dos dois
valores mdios; neste caso, entre 4 e 6. Como fazer? Deve-se
tirar a mdia entre os dois valores do meio para obter o valor da
mediana. Assim, temos:
mediana =
+
=
4 6
2
5
A mediana outra medida de posio
denida como o nmero que se encontra
no centro de uma srie de nmeros,
estando estes dispostos segundo uma
ordem. Em outras palavras, a mediana de
um conjunto de valores, ordenados,
o valor situado de tal forma no conjunto
que o separa em dois subconjuntos de
mesmo nmero de elementos.
Obs.: - se o nmero de elementos for
mpar, ento a mediana ser exatamente o
valor do meio;
- se o nmero de elementos for
par, ento a mediana ser exatamente a
mdia dos dois valores do meio.
Para determinar a mediana:
organize o conjunto de dados em
um rol;
para um conjunto de dados cujo n
= mpar, a mediana ser o valor do
meio;
para um conjunto de dados cujo n
= par, a mediana ser a mdia dos
dois valores do meio.
5
10
15
20
31
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Quando usamos a mediana?
Empregamos a mediana quando:
desejamos obter o ponto que divide a distribuio em
partes iguais;
h valores extremos que afetam de uma maneira acentuada
a mdia;
a varivel em estudo salrio.
2.4 A moda
Muitas vezes, em um conjunto de dados, existem valores
que se repetem com uma frequncia maior. A moda
justamente este valor ou estes valores que mais se
repetem em um conjunto de dados. possvel haver
estatsticas que no possuam moda ou que possuam mais de
uma moda.
No exemplo que demos acima, para um conjunto de dados
x
i
={1,2,3,4,6,7,8,9}, no existe moda e diz-se que o conjunto ou
distribuio amodal.
A moda uma estatstica muito mais descritiva, e sua
importncia cresce na medida em que um valor ou grupo
de valores se repete mais que outros; neste sentido, a moda
indicaria o valor tpico daquele conjunto de dados com maior
ocorrncia.
Por exemplo, o conjunto de dados x
i
={2,2,7,9,9,9,10,10,11,12,18}
tem moda igual a 9, porque o nmero 9 aquele com maior
frequncia, repetindo-se trs vezes.
Repetindo: denominamos moda, de um conjunto de dados,
o valor (ou valores) que ocorre com maior frequncia.
Ento, em teoria da probabilidade
e em estatstica, a mediana
uma medida de tendncia central, um
nmero que caracteriza as observaes
de uma determinada varivel de tal
forma que este nmero (a mediana) de
um grupo de dados ordenados separa a
metade inferior da amostra, populao
ou probabilidade de distribuio, da
metade superior. Mais concretamente,
1/2 da populao ter valores inferiores
ou iguais mediana e 1/2 da populao
ter valores superiores ou iguais
mediana.
Em casos de populaes (n) mpares,
a mediana ser o elemento central
(n+1)/2. Para os casos de populaes
(n) pares, a mediana ser o resultado
da mdia simples dos elementos n/2 e
(n/2)+1.
Para a seguinte populao: 1, 3, 5, 7,
9 a mediana 5 (igual mdia); no
entanto, para a populao 1, 2, 4, 10,
13, a mediana 4 (enquanto a mdia
6). Para populaes pares: 1, 2, 4, 7, 9,
10 a mediana (4+7)/2, que 5,5.
5
10
15
20
25
32
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Por exemplo: o salrio modal dos empregados de uma
indstria o salrio mais comum, isto , o salrio recebido pelo
maior nmero de empregados dessa indstria.
Exemplo:
Sabendo-se que a produo leiteira diria da vaca A, durante
uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, encontre
a mdia, a moda e a mediana para a produo diria de leite
desta vaca.
Mdia:
x
x
n
i
i
n
= =
+ + + + + +
= =
=

1
10 14 13 15 16 18 12
7
98
7
14
Logo, x = 14 litros de leite em mdia por dia, que representa
uma produo de 98 litros de leite em mdia por semana.
Obs.: a mdia pode ser um nmero diferente de todos os
valores da amostra que ela representa.
Moda: como no existe um valor que aparece com maior
frequncia que os outros, no h valor de moda para este
exemplo.
Mediana: ordenando os dados, temos:
10 12 13 14 15 16 18
Desta forma, o valor mediano o valor central dos dados,
ou seja, 14 litros de leite por dia.
Em estatstica descritiva, a
moda o valor que detm o maior
nmero de observaes, ou seja, o valor
ou valores mais frequentes. A moda no
necessariamente nica, ao contrrio da
mdia ou da mediana. especialmente
til quando os valores ou observaes
no so numricos, uma vez que a
mdia e a mediana podem no ser bem-
denidas.
A moda de {ma, ma, banana,
laranja, laranja, laranja, pssego}
laranja.
A srie {1, 3, 5, 5, 6, 6} apresenta
duas modas (bimodal): 5 e 6.
A srie {1, 3, 2, 5, 8, 7, 9} no apresenta
moda.
5
10
15
20
33
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
3 MEDIDAS DE DISPERSO PARA DADOS
SIMPLES
Vimos que a moda, a mediana e a mdia podiam ser usadas
para resumir, num nico nmero, aquilo que mdio ou
tpico de um conjunto de dados. Mas a informao contida
fornecida pelas medidas de posio necessita, em geral, ser
complementada pelas medidas de disperso. Estas servem para
indicar o quanto os dados se apresentam dispersos em torno
da regio central. Caracterizam, portanto, o grau de variao
existente no conjunto de valores. As medidas de disperso que
nos interessam so:
a amplitude total;
o desvio padro;
a varincia;
o coeciente de variao.
Observe que: quanto maior as medidas de disperso, mais
heterogneos so os dados, e ao contrrio, quanto menor essas
medidas, mais homogneo o conjunto.
Para ilustrar a necessidade de conhecermos as medidas de
disperso de um conjunto de dados, iremos introduzir alguns
exemplos.
Exemplo 1:
Sabe-se que em Honolulu (Hava) e Houston (Texas) a
temperatura mdia diria quase a mesma, em torno de
aproximadamente 23,9C. Pergunta-se: ser que, por isso,
podemos admitir que a temperatura basicamente a mesma
em ambas as localidades? Ou no ser possvel que enquanto
uma cidade melhor para natao a outra o seja para atividades
externas?
5
10
15
20
25
34
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Sabemos que a temperatura em Honolulu varia muito
pouco ao longo do ano, oscilando, em geral, entre 21,1C
e 26,7C. Por outro lado, a temperatura em Houston
pode diferir sazonalmente (nas estaes do ano), isto ,
apresentar-se baixa em janeiro (cerca de 4,4C) e alta em
julho e agosto (bem perto de 37,8C). Desnecessrio dizer
que as praias em Houston no esto abarrotadas de gente
o ano todo!
Exemplo 2:
Suponham que, numa particular cidade, tanto ladres
quanto professores secundrios tenham uma renda mdia
mensal de R$ 900,00. Ser que essa informao indica
que as duas distribuies de renda so necessariamente
semelhantes? Muito ao contrrio, poder-se-ia descobrir que
elas diferem, e muito, num outro aspecto importante, que
o fato de as rendas dos professores concentrarem-se ao redor
de R$ 900,00 (serem constantes, homogneas), enquanto
que as dos ladres espalham-se mais (so descontnuas,
heterogneas), o que reete, portanto, maiores oportunidades
para prises, desemprego, pobreza e, em alguns casos, fortunas
excepcionais.
Tais fatos demonstram que necessitamos, alm de uma
medida de tendncia central, de um ndice que indique o grau
de disperso dos dados em torno da mdia. Este ndice uma
medida indicativa do que costumamos chamar de variabilidade
(ou disperso).
Voltando ao exemplo 1, poderamos dizer que a
distribuio de temperatura em Houston (Texas) tem
maior variabilidade do que a distribuio de temperaturas
em Honolulu (Hava). Da mesma forma, podemos dizer
que a distribuio de rendas entre professores apresenta
menos variabilidade do que a distribuio de rendas entre
ladres.
5
10
15
20
25
30
35
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Exemplo 3:
Considere os seguintes conjuntos de valores das variveis X,
Y e Z:
X: 70, 70, 70, 70, 70.
Y: 68, 69, 70, 71, 72.
Z: 5, 15, 50, 120, 160.
Calculando a mdia aritmtica de cada um desses conjuntos,
obtemos:
X = 70
Y = 70
Z = 70
Vemos, ento, que os trs conjuntos apresentam a mesma
mdia aritmtica: 70; entretanto, fcil notar que o conjunto
X mais homogneo que os conjuntos Y e Z. Para quanticar o
quo heterogneos os dados so, precisamos encontrar algumas
medidas de posio.
Assim, quando se deseja entender, analisar e descrever de
forma adequada um determinado conjunto de dados, faz-
se necessrio dispor no apenas de informaes relativas s
medidas de posio, vistas no mdulo anterior. preciso que
se disponha de informaes relativas variabilidade (disperso)
daqueles nmeros que compem o referido conjunto de dados.
Essas medidas de variabilidade ou disperso indicam se os dados
observados esto prximos ou separados uns dos outros.
Diferente das medidas de posio, as medidas de disperso
no so autoexplicativas; sua aplicabilidade depende da
comparao de populaes ou amostras do mesmo tamanho e
mesmas caractersticas para que se obtenha alguma informao
importante a partir daquela determinada variabilidade.
Medidas de disperso no so
autoexplicativas, dependem de suas
aplicaes em tratamentos comparativos
de dados.
5
10
15
20
25
36
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
As principais medidas de disperso so a amplitude total
(ou intervalo), o desvio mdio, a varincia e o desvio padro. A
mdia serve de referncia para todas essas medidas, exceto para o
intervalo (ou amplitude total). proporo que essas medidas se
elevam, isto representa um aumento da disperso. Isso signica
que se a medida for igual a zero, no existe disperso.
As medidas de variabilidade que tm a mdia aritmtica
como ponto de referncia so importantes porque nos
permitem avaliar o grau de disperso das observaes em
relao a esta mesma mdia, isto , permitem-nos avaliar
o quo distante os dados de um determinado grupo de
observaes esto da mdia calculada, dando-nos uma
noo mais precisa da situao de determinada populao ou
amostra e condies de tirarmos concluses e informaes
importantes daqueles dados disponveis.
Exemplo 4:
Um estudante de Economia resolve fazer uma pesquisa
sobre os salrios mdios dos funcionrios de determinado setor
industrial em So Paulo. Nesta pesquisa, o estudante conseguiu
os seguintes dados em termos de salrios mnimos mensais:
x
i
={1.0;1.5;2.0;2.0;2.0;2.5;3.0;3.0;80.0;85.0}
Ao calcular o salrio mdio deste setor, ele chegou ao valor
mdio de 18,2 salrios mnimos por ms. Ora, mas este dado, sem
o clculo de sua disperso em relao mdia aritmtica, pouco
nos diz sobre a realidade desta populao e acabamos por ter uma
viso distorcida do padro de vida da maior parte dos funcionrios
do setor analisado pelo estudante. As medidas de variabilidade
ou disperso nos permitem perceber essa distoro.
Temos, como principais medidas de disperso, intervalo,
desvio mdio, varincia e desvio padro.
As medidas mais comuns de
variabilidade para dados quantitativos
so a varincia; a sua raiz quadrada,
o desvio padro; a amplitude total,
a distncia interquantlica e o desvio
absoluto so mais alguns exemplos de
medidas de disperso.
5
10
15
20
25
30
37
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
3.1 Amplitude total
O intervalo, ou amplitude total, de um determinado
conjunto de dados obtido pela diferena entre o maior e
o menor valor neste conjunto de nmeros. Indica, portanto,
a distncia entre a maior e a menor observao de um conjunto
de dados. Assim, temos:
Amplitude
total
= Valor
mximo
Valor
mnimo
Por exemplo, em um conjunto de dados x
i
={2,3,3,5,5,5,8,10,1
2}, onde n=9, a amplitude total ser:
A
total
= V
mximo
- V
mnimo
A
total
= 12-2 = 10
Em alguns casos, o intervalo ou amplitude total pode
ser expresso simplesmente pela indicao do menor e
do maior nmero do conjunto de dados. No caso do
exemplo anterior, a amplitude total poderia ser expressa
simplesmente pela identificao do menor e do maior
nmero, indicada como sendo de 2 a 12 ou 2-12.

A grande vantagem da amplitude total que ela
apresenta uma certa facilidade de ser calculada, mesmo
quando o conjunto de dados observados relativamente
grande. No entanto, como a amplitude total apenas leva
em conta os dois extremos do conjunto de nmeros, em
alguns casos, ela pode ser uma medida enganosa quanto
indicao da disperso de um conjunto de nmeros, tendo,
portanto, uma utilidade limitada.
3.2 Desvio mdio absoluto
O desvio mdio absoluto inaugura o estudo das medidas de
variabilidade que tm a mdia como ponto de referncia.
O intervalo de um determinado
conjunto de dados obtido pela
diferena entre o maior e o menor valor
neste conjunto de nmeros.
5
10
15
20
25
38
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
O chamado desvio nada mais que a diferena
entre cada valor de um determinado conjunto de
dados e a mdia deste mesmo conjunto de nmeros (x
i
- x). O valor absoluto de um nmero ser ele prprio, sem
o sinal que lhe associado, e indicado por meio de duas
linhas verticais que o enquadram. Assim, |-67|=67;|9|=9.
preciso calcular primeiro a mdia aritmtica dos dados
disponveis, que, em geral, apresentam-se como dados
amostrais.

O desvio mdio absoluto ser calculado pela mdia dos
desvios dos valores a contar da mdia, ignorando o sinal (+ ou
-) do desvio, ou seja, convertendo os valores dos desvios em
valores absolutos, considerando-os todos desvios positivos.
Assim, temos:
D
mdio
D
x x
n
mdio
i
i
n
=

1
,
onde n o nmero de observaes.
Vamos agora tomar um exemplo de desvio mdio. Para
um conjunto de dados amostrais x
i
=2,4,6,8,10,12, onde n=6,
determine o desvio mdio. Temos ento:
D
mdio
=
x x
n
i

Precisamos primeiro calcular a mdia, para ento passarmos


ao clculo do desvio mdio. Relembrando a frmula do clculo
da mdia aritmtica, temos:
x
x
n
x x
i
= =
+ + + + +
= =

2 4 6 8 10 12
6
7 7
5
10
15
20
39
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Agora podemos calcular os desvios para cada valor do
conjunto de dados. Assim, temos:

x
i
- x
D
mdio
=
D
mdio
=
D
mdio
=
=

x x
n
i
=
-5 + -3 + -1+1+ 3 + 5
6
=
5+3+1+1+3+5
6
=3
3
2-7 -5
4-7 -3
6-7 -1
8-7 1
10-7 3
12-7 5
0
O valor encontrado acima representa a diferena mdia de
cada observao e a mdia da distribuio. Mas tambm neste
caso s seria possvel obter mais informaes a partir do desvio
mdio comparando com outras populaes ou amostras de
mesmas caractersticas.
Por exemplo, se um outro conjunto de dados, com
as mesmas caractersticas e tamanho, apresentasse um
desvio mdio absoluto igual a 2,4, ou seja, menor que
o desvio mdio absoluto calculado no exemplo acima,
poderamos dizer que este segundo conjunto de valores
mais homogneo do que o nosso exemplo, j que a
diferena de cada um dos seus elementos em relao
mdia aritmtica menor. Teramos, assim, uma disperso
menor.
3.3 Varincia
Tanto para o clculo do desvio mdio como para o clculo
da varincia precisaremos utilizar o desvio de cada elemento de
um conjunto de dados em relao mdia aritmtica (x
i
- x).
No entanto, ao invs de trabalharmos com os valores absolutos
(em mdulo), agora os desvios so elevados ao quadrado antes
da soma. Para o caso de dados amostrais, ao invs de dividirmos
por n, dividimos por n-1 (que o total da amostra menos uma
unidade).
O desvio a diferena entre cada
valor de um determinado conjunto de
dados e a mdia deste mesmo conjunto
de nmeros.
5
10
15
20
40
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
A varincia ir nos dizer o grau de disperso de um
determinado grupo de dados com relao mdia aritmtica
desses nmeros.
Assim, a varincia populacional poder ser calculada da
seguinte forma:


2
2
=

( ) x
N
i
, onde
A varincia amostral poder ser calculada pela frmula que
se segue:
s
x x
n
i 2
2
1
=

( )
, onde
Por exemplo, seja um determinado conjunto de dados
x
i
= {1,3,5,7,9,11,13}, onde n=7. Calcule a varincia deste
conjunto de dados, supondo:
a) que este conjunto de dados representa toda uma
populao;
b) que este conjunto de dados representa uma amostra.
a) Para calcular a varincia deste conjunto de dados,
considerando que ele representa toda uma populao, devemos
utilizar a seguinte frmula:


2
2
=

( ) x
N
i
, onde devemos considerar n=N.
Ao invs de trabalharmos com os
valores em mdulo, agora os desvios
so elevados ao quadrado antes da
soma. Para o caso de dados amostrais,
ao invs de dividirmos por n, dividimos
por n-1.
5
10
15
41
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Devemos passar ao clculo da mdia deste conjunto de
dados, para ento proceder ao clculo da varincia. Sendo assim,
temos:

=
=

x
N
i
=
1+3+5+7+9+11+13
7
=7
7


(mdia populacional)
Partindo da mdia, podemos agora calcular os desvios, e ento
partir para o clculo da varincia populacional, j que supomos
que o conjunto de dados representava toda a populao. Assim,
temos:

x
i
- (x
i
- )
2
7 7-1=6 6
2
7 7-3=4 4
2
7 7-5=2 2
2
7 7-7=0 0
7 7-9=-2 (-2)
2
7 7-11=-4 (-4)
2
7 7-13=-6 (-6)
2
0 112

2
2
2
2
=

=
=

( ) x
N
i
6 +4 +2 +(-2) +(-4) +(-6)
7
36+16+4+4+16+
2 2 2 2 2 2
336
7
=16

2
16 =
Assim, a varincia populacional desse conjunto de dados
seria igual a 16.
b) Se, por outro lado, temos o mesmo conjunto de dados
e supondo que ele represente apenas dados amostrais,
devemos calcular a varincia amostral de outra forma.
Devemos partir do clculo da mdia, para ento calcularmos
a varincia.
5
10
15
42
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Como vimos no mdulo 2, a expresso para o clculo da
mdia aritmtica em uma amostra a mesma do clculo da
mdia para uma populao, mas utilizaremos para as amostras
uma outra notao. Vejamos:
x
x
n
x
i
= =

7

(mdia amostral)
Normalmente, a mdia amostral aproxima-se da mdia
populacional quanto maior o tamanho da amostra, mas no se
iguala a ela.
Passemos ento ao clculo da varincia amostral. Utilizaremos
os mesmos passos do clculo da varincia populacional.
Desta forma:
s
x x
n
i 2
2
1
=

( )

x
x
i
- x (x
i
- x)
2
7 7-1=6 6
2
7 7-3=4 4
2
7 7-5=2 2
2
7 7-7=0 0
7 7-9=-2 (-2)
2
7 7-11=-4 (-4)
2
7 7-13=-6 (-6)
2
0 112
s =
s =
6 +4 +2 +(-2) +(-4) +(-6)
7-1
s =
36+16+4+4
2
2
2 2 2 2 2 2
2
( ) x x
n
i

2
1
++16+36
7-1
=
112
6
s =18,666...
2
A varincia amostral deste conjunto de dados igual a
18,666...
5
10
43
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Como a mdia aritmtica, a varincia possui algumas
propriedades importantes que devemos colocar em
destaque e que facilitam o clculo de alguns problemas mais
complexos.
a) Somando-se ou subtraindo-se uma constante a cada
elemento de um conjunto de dados, o valor da varincia
no se altera.
Por exemplo, um conjunto de dados x
i
={2,4,6,8}, onde n=4,
e a mdia igual a 5. A varincia deste conjunto ser dada como
segue:

2 2
2
= =
=

(x -m)
N
(2-5) +(4-5) +(6-5) +(8-5)
4
(-3) +(-1)
i
2
2 2 2 2
2 2
++1+3
4
=
9+1+1+9
4
=
20
4
=5
2
Se somarmos uma constante c=4 a cada um dos elementos
do conjunto de dados, temos um novo conjunto de dados
y
i
={6,8,10,12}, em que a mdia ser igual a 9. A varincia ser
ento:

2
2 2
2
2
=

=

( ) y
N
i
2
2 2 2 2
2
=
(6-9) +(8-9) +(10-9) +(12-9)
4
(-3) +(-1)) +(1)+(3)
4
=
9+1+1+9
4
=
20
4
=5
2 2
Sendo assim, demonstramos que
2
2
2
= , ou seja, ao
somarmos uma constante a cada elemento de um conjunto de
dados, a varincia permanece a mesma.
b) Ao multiplicarmos uma constante c a cada elemento
de um conjunto de dados, temos uma nova varincia ao
multiplicarmos a varincia do conjunto de dados original
por c
2
.
5
10
15
20
25
44
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Assim, a nova varincia ser representada da seguinte
forma:

2
2 2
1
2
= c .
c) Ao dividirmos cada elemento de um conjunto de
dados por uma constante arbitrria c, obtm-se a nova
varincia dividindo-se a antiga varincia por c
2
.
Assim, podemos apresentar a nova varincia da seguinte
forma:


2
2 1
2
2
=
c
d) A varincia de uma constante igual a zero.
Existe uma frmula alternativa e reduzida para o clculo da
varincia populacional, deduzida da frmula original, que :

2
2
2
=

x
N
i
Para a varincia amostral tambm existe uma frmula
alternativa bastante utilizada e que no exige o clculo da
mdia, que decorre da frmula acima:
s
x x n
n
x
i i 2
2 2
1
=


( )
3.4 Desvio padro
Obtm-se o desvio padro extraindo-se a raiz
quadrada da varincia. Assim como a varincia e o desvio
mdio, o desvio padro tambm representa uma medida
de variabilidade absoluta e indica o desvio de cada um dos
Relembrando as propriedades de
varincia:
- ao somarmos uma constante a cada
elemento de um conjunto de dados,
a varincia permanece a mesma;
- ao multiplicarmos uma constante c
a cada elemento de um conjunto de
dados, temos uma nova varincia
ao multiplicarmos a varincia do
conjunto de dados original por c
2
;
- ao dividirmos cada elemento de
um conjunto de dados por uma
constante arbitrria c, obtm-se a
nova varincia dividindo-se a antiga
varincia por c
2
;
- varincia de uma constante igual
a zero.
5
10
15
20
45
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
nmeros x
i
de um dado conjunto de observaes em relao
mdia . tambm chamado por alguns autores de desvio da
raiz mdia quadrtica.
Matematicamente, o desvio padro poder ser representado
da seguinte forma:
Desvio padro populacional:

( ) x
N
i
2
Desvio padro amostral:
s
x x
n
i
=

( )
2
1
Por exemplo, um conjunto de dados amostrais x
i
= {2,4,6},
onde n=3 e a mdia igual a 4. Vamos ento calcular o desvio
padro para a amostra:
s
x x
n
s
i
=

=
+ +

=
=
+ +
= = =

( )
( ) ( ) ( )
( )
2
2 2 2
2 2
1
2 4 4 4 6 4
3 1
2 0 2
2
8
2
4 2
Este conjunto de dados ir apresentar um desvio padro
igual a 2.
As propriedades da varincia tambm so aplicveis ao
desvio padro. Mas existem duas propriedades que sero
distintas no caso do desvio padro devido a sua caracterstica
de raiz quadrada mdia positiva da varincia.
Assim, ao multiplicarmos cada elemento de um conjunto de
dados por uma constante c, o novo desvio padro ser igual ao
antigo multiplicado pela constante. Temos ento:

2 1
= c.
5
10
15
20
46
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Por outro lado, se dividirmos cada elemento de um conjunto
de dados por uma constante c, o novo desvio padro ser igual
ao anterior dividido pela constante c. Assim, temos ento:


2
1
=
c
As demais propriedades da varincia sero as mesmas para
o desvio padro.
Exemplo: Sabendo-se que a produo leiteira diria da vaca
A, durante uma semana, foi de: 10, 14, 13, 15, 16, 18 e 12 litros,
pede-se calcular a amplitude, o desvio padro (S), a varincia
(S
2
) e o coeciente de variao (cv).
Soluo
Amplitude:
R= 18 10 = 8 litros de leite,
ou seja, a maior variao do nmero de litros de leite
produzidos por dia pela vaquinha A de 8 litros.
Obs.: sabemos que a mdia para estes dados x =14 litros
de leite por dia.
Desvio padro:
s=
(x -x)
n-1
=
(x -x) +(x -x) +...+(x -x)
n-1
=
=
(10-14)
i
2
i=1
n
1
2
2
2
n
2
2

++(14-14) +(13-14) +(15-14) +(16-14) +(12-14) +


7-1
=
=
(-4) +
2 2 2 2 2
2
((0) +(-1) +(1) +(2) +(4) +(-2)
6
=
16+0+1+1+4+16+4
6
=
42
6
=
= 7
2 2 2 2 2 2
2,65 litros de leite por semana.
As propriedades da varincia se
aplicam ao desvio padro, exceto:
quando multiplicarmos cada
elemento de um conjunto de
dados por uma constante c, o novo
desvio padro ser igual ao antigo
multiplicado pela constante;
quando dividirmos cada elemento
de um conjunto de dados por uma
constante c, o novo desvio padro
ser igual ao anterior dividido pela
constante c.
Em Probabilidade e Estatstica,
o desvio padro a medida mais
comum da disperso estatstica. O
desvio padro dene-se como a raiz
quadrada da varincia. denido
desta forma de maneira a dar-nos uma
medida da disperso que:
1. seja um nmero no-negativo;
2. use as mesmas unidades de medida
que os nossos dados.
Faz-se uma distino entre o desvio
padro (sigma) do total de uma
populao ou de uma varivel aleatria,
e o desvio padro s de um subconjunto
em amostra.
O termo desvio padro foi introduzido
na estatstica por Karl Pearson, no
seu livro de 1894: Sobre a disseco
de curvas de frequncia assimtricas.
5
10
15
20
47
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Varincia:
S2 = (S)
2
=(2,65)
2
7(litros de leite)
2
Coeciente de variao:
cv
S
x
= = =
2 65
14
0 1893
,
, ou seja, existe uma variabilidade
de 18,93% dos dados em relao a mdia.
4 DISTRIBUIO DE FREQUNCIAS
Ao longo de nosso estudo, observamos que para extrair
dos dados estatsticos de que dispomos a correta anlise e
interpretao, o primeiro passo dever ser a correta organizao
e sumarizao destes dados; caso contrrio, estes nmeros no
faro qualquer sentido.
Alm disso, dependendo do tamanho do nosso conjunto de
dados, podemos organiz-los em um rol de dados simples, ou
seja, por ordem de grandeza (crescente ou decrescente), ou em rol
(novamente ordenando o conjunto de dados) e, posteriormente,
tabelando sua distribuio de frequncias.
A distribuio de frequncias o modo de tratamento de
dados utilizado quando grande a quantidade de dados brutos,
e passamos a agrupar os dados estatsticos em subconjuntos
com caractersticas semelhantes as classes ou categorias.
A distribuio de frequncia a organizao de dados em
classes ou intervalos, para determinar o nmero de observaes
ou a percentagem de observaes de cada classe, chamada de
frequncia de classes.
Para apresentar esses dados, podemos utilizar grcos e
tabelas, bem como utilizar as medidas de posio e variabilidade
para interpret-los, mas no sem organiz-los previamente em
5
10
15
20
48
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
uma distribuio, sem a qual caria impossvel o clculo de
algumas das medidas necessrias, como mdia, varincia, etc.
Tabela 4.1
Idade de 100 estudantes formandos do curso de Gesto de
uma Universidade AB em dez/2006
Idade Nmero de estudantes
20 a 22 8
22 a 24 10
24 a 26 12
26 a 28 20
28 a 30 17
30 a 32 15
32 a 34 9
34 a 36 5
36 a 38 3
38 a 40 1
Total = 100
A tabela acima uma distribuio de frequncias das
idades dos estudantes que esto se formando no curso
de Gesto de uma determinada Universidade fictcia AB.
A primeira classe corresponderia ao grupo de estudantes
formandos em Gesto no ano de 2006 e que possuem entre
20 e 22 anos, e indicada pelo smbolo 20 |- 22. A frequncia
desta classe corresponde a 8 porque existem 8 estudantes
cuja idade faz parte desta classe.
4.1 A construo de uma distribuio de
frequncias para dados contnuos
Para se construir uma determinada distribuio de
frequncias, preciso, em primeiro lugar, definir o tipo de
varivel em questo, para depois definir os passos que devem
ser seguidos para a construo desta distribuio. Vamos
supor que o conjunto de dados abaixo seja referente s idades de
5
10
15
49
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
uma amostra de 100 alunos formandos em Gesto de uma
Universidade AB:
Tabela 4.2
Dados das idades dos estudantes formandos de
Gesto da Universidade AB
20 20,4 20,5 21 21 22 22 22 22,1 22,2
22,3 22,5 22,6 22,7 22,8 22,9 23 24 24,1 24,2
24,3 24,4 24,5 25 25 25,3 25,5 25,7 26 26
26,2 26,3 26,4 26,5 26,6 26,7 26,8 26,9 27 27
27,1 27,2 27,3 27,4 28 28 28 28 28 28
28,2 28,3 28,5 29 29 29 29 29,1 29,1 29,2
29,3 29,4 29,5 29,5 30 30 30 31 31 31
31 31,1 31,2 31,3 31,4 31,5 31,6 31,6 32 32
32 32 32,3 33 33 33 34 34 34 34
34 34,5 35 35 36 36 37 37,5 38 40
Como podemos observar, os dados j esto dispostos em
ordem crescente de grandeza, em um rol, muito embora se trate
de um conjunto de nmeros superior a 30 observaes. Esta
amostra diz respeito s idades dos alunos de uma determinada
Universidade ctcia AB que esto se formando no curso
de Gesto. Estamos considerando, portanto, uma varivel
contnua.
Como vimos, tratar um conjunto de dados sob a forma de uma
distribuio de frequncias signica organiz-los em intervalos
de classes. Precisamos, ento, denir o nmero de classes, o
tamanho destas classes, para, ento, enquadrar os dados nas
classes pela simples contagem desses dados amostrais.
A primeira coisa que devemos fazer ao nos depararmos com
um conjunto de dados como este apresentado na tabela 4.2
procurar calcular a amplitude total (ou intervalo). Neste caso,
ser muito mais fcil, j que os nmeros j esto dispostos em
um rol. Conforme vimos no mdulo 3, a amplitude total ou
intervalo poder ser calculada da seguinte forma:
A
total
= V
mximo
- V
mnimo
A
total
= 40-20 = 20
Uma varivel contnua aquela
que pode assumir qualquer valor num
intervalo contnuo.
5
10
15
20
25
50
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
No caso do nosso exemplo, a amplitude total ser igual a 20.
O valor da amplitude total ser importante porque, juntamente
com o nmero de classes, denir a chamada amplitude de
classes.
Mas como ento estabelecer o nmero de classes? A
teoria estatstica tem se desenvolvido ao longo dos anos e
chegou ao consenso de que aconselhvel estabelecer o
nmero de classes entre um mnimo de 5 e um mximo de
20. Uma distribuio de frequncias que possua mais de
20 classes torna a apresentao dos dados muito confusa
e de mais difcil avaliao. Se estabelecemos um nmero
de classes inferior a 5, podemos correr o risco de ocultar
informaes importantes sobre os dados disponveis.
Quando se quer determinar o nmero de classes em funo
do conjunto de dados disponveis, basta tirarmos a raiz quadrada
de n, onde n corresponderia ao total de observaes (seja da
populao ou da amostra). Sendo assim, temos:
Nmero
classes
= n
No caso do exemplo apresentado acima, temos um total
de observaes n=100; portanto, o nmero de classes ser
igual a 10:
N
classes
= n
N
classes
=
100 10 =
Uma vez estabelecido o nmero de classes, preciso
pensar qual ser o tamanho de cada classe, ou, dito de outra
forma, faz-se necessrio determinar a amplitude de classe
desta distribuio de frequncias. Para isso, calculamos a
amplitude total desta distribuio, a qual corresponde a
uma medida absoluta de variabilidade.
A amplitude de classes ser
calculada, ento, tomando-se o valor
da amplitude total e dividindo-se pelo
nmero de classes.
5
10
15
20
25
51
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Assim, temos:
Seguindo o exemplo que estamos trabalhando (j zemos
o clculo da amplitude total e do nmero de classes), podemos
passar para o clculo da amplitude de classes do exemplo. Temos,
ento:
A amplitude das classes da distribuio de frequncias que
estamos procurando construir em nosso exemplo ser igual a
dois. Isso representa o intervalo ou tamanho de cada classe,
em que iremos dispor os nossos dados. importante ressaltar
que uma distribuio de frequncia no obrigatoriamente
apresenta uma nica amplitude de classes, posto que mantenha
a composio estrutural da distribuio.
Temos agora o nmero de classes, a amplitude de classes,
podemos ento calcular o intervalo de classes. O intervalo de
classes composto por um limite inferior (nmero menor) e por
um limite superior (nmero maior). Os limites inferior e superior
podem ou no estar inclusos no intervalo de classes, existindo uma
simbologia prpria dentro da estatstica para se expressar isso.
Vejamos exemplos possveis a partir da tabela 4.1 acima:
a) 20 || 22: diz-se que um intervalo fechado, pois tanto o
20 quanto o 22 participam do intervalo;
b) 22 | 24: diz-se que um intervalo aberto, j que o limite
inferior, 22, no participa do intervalo, ao passo que o
limite superior participa do intervalo;
5
10
15
20
52
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
c) 20 | 22: caso o exemplo se apresentasse assim, teramos
um intervalo de classe aberto, j que o limite inferior
participa do intervalo, mas o limite superior no participa
do intervalo;
d) 20 22: aqui teramos um intervalo de classe aberto, em
que nem o limite inferior nem o limite superior participam
do intervalo.
Aps o clculo do nmero de classes e da amplitude de
classes, devemos denir os limites inferior e superior de cada
classe, comeando com o menor valor, ou, no caso de dados
fracionais, com um inteiro logo abaixo do menor valor. No nosso
exemplo, podemos calcular as classes da seguinte forma:
Para a primeira classe:
Limite inferior: 20.
Limite superior: 20 + amplitude de classe = 20 + 2 = 22.
Para a segunda classe:
Limite inferior: limite superior da classe anterior = 22.
Limite superior: limite inferior da segunda classe + amplitude
de classes = 22 + 2 = 24.
E assim sucessivamente at a classe de nmero 10, no
nosso exemplo, que ter como limite inferior 38 e como limite
superior 40. importante frisar que determinado valor no
pode pertencer a mais de uma classe, mas, por outro lado, para
cada valor deve haver uma classe, no permitindo a existncia
de lacunas na xao destas mesmas classes.
Uma vez denido o nmero de classes e a amplitude total,
a partir delas pudemos estabelecer a amplitude de classes,
e pudemos tambm denir os limites superior e inferior de
cada classe; resta agora confrontar as nossas classes com as
observaes de que dispomos na tabela 4.2.
5
10
15
20
25
30
53
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Mediante contagem, devemos construir nossa distribuio
de frequncia, xando cada observao numa classe
determinada. Quando indicamos o nmero de observaes
existentes em um dado intervalo, temos a chamada frequncia
absoluta simples (
i
).
importante destacar que nenhuma classe poder
apresentar frequncia absoluta igual a zero. Assim, uma primeira
construo que podemos fazer nos leva tabela 4.1, s que
agora colocaremos a notao estatstica trabalhada at agora.
Ento, temos:
Tabela 4.3
Distribuio de frequncia das idades
Classes Frequncia absoluta simples
20 | 22 8
22 | 24 10
24 | 26 12
26 | 28 20
28 | 30 17
30 | 32 15
32 | 34 9
34 | 36 5
36 | 38 3
38 | 40 1
100
importante ressaltar que na construo da distribuio
de frequncias acima, uma vez que determinado valor
tenha sido incluso em determinado intervalo de classes, no
dever ser incluso em um outro. Da a razo por que temos
intervalos em que o limite inferior no est incluso, pois ele
corresponde ao mesmo valor do limite superior da classe
anterior; portanto, o referido valor, provavelmente, j deve
ter sido alocado numa classe anterior. Por exemplo, na tabela
A frequncia absoluta o nmero
de vezes que o dado aparece naquele
determinado conjunto de nmeros.
5
10
15
20
54
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
4.2, temos a observao do dado 22, que se repete trs
vezes, e que ser incluso no primeiro intervalo de classes.
Mas este valor no dever ser incluso novamente no segundo
intervalo de classes.
A seguir, devemos calcular as frequncias absolutas
simples acumuladas (
i
, A).
Por exemplo, na terceira classe, teramos 30 alunos com
idade entre 20 e 26 anos se formando em Gesto. Vejamos como
caria a nova tabela, incluindo a nova notao da frequncia
acumulada:
Tabela 4.4
Classes
Frequncia absoluta
simples (
i
)
Frequncia absoluta simples
acumulada (
i
, A)
20 | 22 8 8
22 | 24 10 18
24 | 26 12 30
26 | 28 20 50
28 | 30 17 67
30 | 32 15 82
32 | 34 9 91
34 | 36 5 96
36 | 38 3 99
38 | 40 1 100
100
Um outro dado importante que podemos extrair da
construo de uma distribuio de frequncias a frequncia
relativa simples (
i
, R).
A soma das frequncias relativas de todas as classes ser igual
a 1, se expressa em forma fracionria, ou a 100% se expressa em
Frequncia absoluta simples
acumulada indica o nmero de
observaes acumuladas at o limite
superior de uma classe.
Frequncia relativa simples nos
mostra a participao relativa do nmero
de observaes em uma dada classe e
dever ser calculada da seguinte forma:
f R
f
f
i
i
i
, =

, geralmente expresso
em percentual.
5
10
15
55
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
percentual. No caso da distribuio de frequncias que estamos
construindo, temos agora a seguinte tabela:
Tabela 4.5
Classes

i
, A
i
, R
20 | 22 8 8 0,08
22 | 24 10 18 0,10
24 | 26 12 30 0,12
26 | 28 20 50 0,20
28 | 30 17 67 0,17
30 | 32 15 82 0,15
32 | 34 9 91 0,09
34 | 36 5 96 0,05
36 | 38 3 99 0,03
38 | 40 1 100 0,01
100 1
4.2 A construo de uma distribuio de
frequncias para dados discretos
Numa distribuio de frequncia de dados contnuos,
os valores individuais sofrem uma perda de identidade uma
vez agrupados em classes, o que gera a perda de uma certa
quantidade de informaes. Isso car claro ao calcularmos
a mdia aritmtica em uma distribuio de frequncia e
compararmos o resultado ao obtido mediante o clculo dos
dados individualmente, at mesmo no exemplo que demos neste
mdulo. Os resultados no sero os mesmos, considerando essa
perda de informao.
Dependendo do tipo de dados e dos objetivos do observador,
este fenmeno pode ou no ocorrer numa distribuio de frequncia
com dados discretos. Quando no h perda de informao, possvel
que os dados originais sejam reconstitudos a partir da tabela de
distribuio de frequncia com dados discretos. No caso de dados
contnuos, isso no possvel.
5
10
15
56
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Essencialmente, no existem diferenas substanciais entre
uma distribuio de frequncia com dados contnuos e uma
com dados discretos. Os clculos das frequncias acumuladas e
relativas so feitos da mesma forma, bem como os clculos das
medidas de posio e variabilidade.
4.3 Representao grca de dados
agrupados
Como j mencionado no mdulo 1, a confeco de grcos
permite melhor visualizao dos dados, mostrando mais
claramente as diferenas existentes. Os grcos mais comuns so
o grco de setor, de coluna ou de barra e o grco de curva. O
tipo de grco a ser utilizado depende do que se deseja enfatizar.
Assim, o grco de coluna ou de barra mostra diferenas entre
os valores absolutos, e o grco de curva utilizado quando se
deseja mostrar variaes ao longo do tempo; o grco de setor,
tambm conhecido como grco de pizza, utilizado quando
se deseja ressaltar diferenas entre propores. Esses grcos
podem ser facilmente feitos em planilhas eletrnicas, como, por
exemplo, o Excel.
No caso de dados agrupados, ou de distribuies de
frequncia, a representao grca utilizada o histograma
ou, ainda, o polgono de frequncia.
Reforando os conceitos:
a) histograma: a representao grca de uma distribuio
de frequncia por meio de retngulos justapostos em
que a base colocada no eixo horizontal corresponde aos
intervalos de classe e a altura proporcional frequncia
das classes;
b) polgono de frequncias: a representao grca
de uma distribuio de frequncia por meio de um
polgono. Cada vrtice do polgono tem como abscissa o
ponto mdio de classe e como ordenada proporcional
frequncia dessa classe.
Distribuio de frequncias uma
tcnica para apresentar uma coleo
de objetos classicados de modo a
mostrar o nmero existente em cada
classe. Mais ainda do que a tcnica
de apresentar cotaes, importante
considerar a possibilidade de apresentar
distribuies especiais, tal como no
caso da distribuio de frequncias
de probabilidades e de frequncias de
amostragens.
5
10
15
20
25
30
57
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Exemplo: salrios de funcionrios de uma determinada
empresa:
Intervalos Salrios Freq. Freq. acum.
15750 |-- 29000 29000 238 238
29000 |-- 42250 42250 144 382
42250 |-- 55500 55500 35 417
55500 |-- 68750 68750 29 446
68750 |-- 82000 82000 16 462
82000 |-- 95250 95250 6 468
95250 |-- 108500 108500 4 472
108500 |-- 121750 121750 1 473
121750 |-- 135000 135000 0 473
a) Histograma:
250
200
150
100
50
0
1
5
7
5
0

|


2
9
0
0
0
2
9
0
0
0

|


4
2
2
5
0
4
2
2
5
0

|


5
5
5
0
0
5
5
5
0
0

|


6
8
7
5
0
6
8
7
5
0

|


8
2
0
0
0
8
2
0
0
0

|


9
5
2
5
0
9
5
2
5
0

|


1
0
8
5
0
0
1
2
1
7
5
0

|


1
3
5
0
0
0
1
0
8
5
0
0

|


1
2
1
7
5
0
b) Polgono de frequncia:
15750
|
29000
250
200
150
100
50
0
29000
|
42250
42250
|
55500
55500
|
68750
68750
|
82000
82000
|
95250
95250
|
108500
108500
|
121750
121750
|
135000
58
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Vamos ressaltar novamente:
Estatstica descritiva o nome dado ao conjunto de
tcnicas analticas utilizado para resumir o conjunto de todos
os dados coletados numa dada investigao a relativamente
poucos nmeros e grcos. Ela envolve basicamente:
distribuio de frequncia: o conjunto das
frequncias relativas observadas para um dado
fenmeno estudado, sendo a sua representao grca
o histograma (diagrama em que o eixo horizontal
representa faixas de valores da varivel aleatria e o
eixo vertical representa a frequncia relativa). Por uma
consequncia da Lei dos Grandes Nmeros, quanto
maior o tamanho da amostra, mais a distribuio de
frequncia tende para a distribuio de probabilidade.
50
40
30
20
10
0
F
r
e
q
u

n
c
i
a
r
e
l
a
t
i
v
a

(
%
)
Faixa da varivel aleatria
A B C D E
Histograma
medidas da tendncia central: so indicadores que
permitem que se tenha uma primeira ideia, um resumo
de como se distribuem os dados de um experimento,
informando o valor (ou faixa de valores) da varivel
aleatria que ocorre mais tipicamente. Ao todo, so os
seguintes trs parmetros:
- mdia: a soma de todos os resultados dividida pelo
nmero total de casos, podendo ser considerada como
um resumo da distribuio como um todo;
- moda: o evento ou categoria de eventos que ocorreu
com maior frequncia, indicando o valor ou categoria
mais provvel;
59
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
- mediana: o valor da varivel aleatria a partir do
qual metade dos casos se encontra acima dele e
metade se encontra abaixo.
50
40
30
20
10
0
F
r
e
q
u

n
c
i
a
r
e
l
a
t
i
v
a

(
%
)
Faixa da varivel aleatria
A B C D E
Histograma
Tendncia
central
medidas de disperso: so medidas da variao de um
conjunto de dados em torno da mdia, ou seja, da maior
ou menor variabilidade dos resultados obtidos. Elas
permitem se identicar at que ponto os resultados se
concentram ou no ao redor da tendncia central de um
conjunto de observaes. Incluem a amplitude, o desvio
mdio, a varincia, o desvio padro, o erro padro e o
coeciente de variao, cada um expressando diferentes
formas de se quanticar a tendncia que os resultados
de um experimento aleatrio tm de se concentrarem
ou no em determinados valores (quanto maior a
disperso, menor a concentrao, e vice-versa).
50
40
30
20
10
0
F
r
e
q
u

n
c
i
a
r
e
l
a
t
i
v
a

(
%
)
Faixa da varivel aleatria
A B C D E
Histograma
Disperso
A ideia bsica a de se estabelecer uma descrio
dos dados relativos a cada uma das variveis, dados esses
levantados atravs de uma amostra.
60
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Desenvolvamos alguns exemplos, para tornar as denies e
suas aplicaes tcnicas mais claras:
Exemplo 1: em uma pesquisa feita para detectar o nmero de
lhos de empregados de uma multinacional, foram encontrados
os seguintes valores:
1 4 2 5 3 2 0 3 2 1
5 4 2 5 0 3 2 4 2 3
2 3 2 1 4 2 1 3 4 2
Responda as questes abaixo, para x=2 e x=4.
Soluo
Rol (dados em ordem crescente):
0 0 1 1 1 1 2 2 2 2
2 2 2 2 2 2 3 3 3 3
3 3 4 4 4 4 4 5 5 5
Tabela de distribuio de frequncias:
X F f
r
f % F F F% F%
0 2 0,067 6,7 2 30 6,7 100
1 4 0,133 13,3 6 28 20 93,3
2 10 0,333 33,3 16 24 53,3 80
3 6 0,2 20 22 14 73,3 46,7
4 5 0,167 16,7 27 8 90 26,7
5 3 0,1 10 30 3 100 10
Total 30 1 100 - - - -
Algumas consideraes ou concluses:
a) Quantos empregados tm x lhos? A resposta dada
atravs de f (frequncia absoluta simples).
b) Quantos empregados tm menos de x lhos? A resposta
dada atravs de F (frequncia absoluta acumulada
abaixo de).
5
10
15
20
61
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
c) Quantos empregados tm mais de x lhos? A resposta
dada atravs de F (frequncia absoluta acumulada acima
de).
d) Quantos empregados tm x lhos ou menos? A resposta
dada atravs de F (frequncia absoluta acumulada
abaixo de).
e) Quantos empregados tm x lhos ou mais? A resposta
dada atravs de F (frequncia absoluta acumulada
acima de).
Exemplo 2: um determinado hospital est interessado
em analisar a quantidade de creatinina (em miligramas por
100 mililitros) encontrada na urina (de 24 horas) de seus
pacientes internados com problemas renais. Os dados so os
seguintes:
1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02
Soluo
Rol (dados em ordem crescente):
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68
1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86
1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34
5
10
15
20
25
30
62
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
Amplitude total (d uma ideia do campo de variao dos
dados):
A = LS - LI = (2,34) - (1,08) = 1,26.
Analisando-se a quantidade de creatinina encontrada na
urina dos 84 pacientes, vericou-se que ocorreu a variao de
1,26 no seu campo (de 1,08 a 2,34).
Estabelecer o nmero de classes (c):
c = 1 + (3,3333.....).log(n) = 1 + (3,3333....).log(84) = 7,414
c = 7.
Estabelecer o intervalo de classe (i):
i = A / c = (1,26) / 7 = 0,18
Construo da tabela:
Classes f
i
P
m
f
r
f % f% f% F F
1,08 |- 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 |- 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 |- 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 |- 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 |- 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 |- 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 |- 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
Observaes:
(1) O melhor valor para representar cada classe o ponto
mdio (P
m
), o qual se obtm pela frmula:
P
m
= L
i
+ (i / 2), ou ainda, P
m
= (L
i
+ L
s
) / 2.
(2) f
i
: nmero de elementos de cada classe;
... f
r
: mede o quanto cada valor signica e relao a unidade;
.. f%: mede o quanto cada valor signica com relao a 100.
5
10
15
63
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
(3) 1,08 |- 1,26, intervalo fechado esquerda (pertencem
classe valores iguais ao extremo inferior) e aberto
direita (no pertencem classe valores iguais ao extremo
superior).
(4) No necessariamente o ltimo nmero ser o limite
superior da ltima classe, mas obrigatoriamente as classes
devem conter todos os elementos.
Algumas consideraes ou concluses:
a) Quantos pacientes tm quantidade de creatinina no
intervalo de x? A resposta dada atravs de f (frequncia
absoluta simples). Ex.: Quantos pacientes tm quantidade de
creatinina no intervalo [1,44; 1,62)? R.: 32 pacientes.
b) Quantos pacientes tm quantidade de creatinina inferior
ao intervalo x? A resposta dada atravs de F (frequncia
absoluta acumulada abaixo de). Ex.: Quantos pacientes tm
quantidade de creatinina inferior ao intervalo [1,80; 1,98)? R.:
68 pacientes.
c) Quantos pacientes tm quantidade de creatinina superior
ao intervalo x? A resposta dada atravs de F (frequncia
absoluta acumulada acima de). Ex.: Quantos pacientes tm
quantidade de creatinina superior ao intervalo [1,80; 1,98)? R.:
5 pacientes.
Ateno: para dados agrupados ou distribuio de
frequncias.
Elementos principais:
a) classe cada um dos intervalos em que os dados so
agrupados;
5
10
15
20
25
64
Unidade I
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
b) limites de classes - so os valores extremos de cada classe.
l
i
= limite inferior de uma classe;
L
i
= limite superior de uma classe;
c) amplitude a diferena entre o maior valor e o menor
valor de certo conjunto de dados. Pode ser referida ao total de
dados ou a uma das classes em particular:
amplitude total (A
t
) calculada pela seguinte expresso:
A
t
= Max. (rol) Min.(rol).
amplitude das classes (h) a relao entre a amplitude
total e o nmero de classes, conforme mostra a expresso
a seguir:
, onde n o nmero de intervalos
de classe;
d) ponto mdio de classe (x
i
) - calculado pela seguinte
expresso:
x
L l
i
i i
=
+
2
;
e) frequncia absoluta (f
i
) - frequncia absoluta de uma
classe de ordem i o nmero de dados que pertencem a essa
classe;
f) frequncia relativa (fr
i
) - frequncia relativa de uma
classe de ordem i o quociente da frequncia absoluta dessa
classe (f
i
) pelo total, ou seja,


r
Total
i
i
=
Obs.: a soma de todas as frequncias absolutas igual ao
total;
5
10
15
20
25
65
ESTATSTICA APLICADA
D
i
a
g
r
a
m
a

o
:

F
a
b
i
o

-

1
9
/
1
1
/
0
8

-
|
|
-

1
a

C
o
r
r
e

o
:

F
a
b
i
o

/

R
e
v
:

A
n
a

0
3
/
1
2
/
0
8
g) frequncia acumulada (F
i
) - frequncia acumulada de
uma classe de ordem i a soma das frequncias at a classe de
ordem i;
h) frequncia relativa acumulada (Fr
i
) - frequncia relativa
acumulada de uma classe de ordem i a soma das frequncias
relativas at a classe de ordem i.

Vous aimerez peut-être aussi