Vous êtes sur la page 1sur 9

B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A

Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

2. ESTATSTICA DESCRITIVA (Parte 1)

2.1. INTRODUO
A anlise estatstica visa aumentar o conhecimento do pesquisador sobre uma populao a partir de uma
amostra. Assim, a Estatstica um conjunto de mtodos adequados para a coleta, a explorao, descrio e para
a interpretao de conjuntos de dados numricos.
Estes mtodos de anlise permitem:
- a explorao dos dados com o intuito de identificar padres de interesse,
- a representao dos dados caracterizados por estes padres.
A anlise exploratria de dados teve seu incio com J.W. TUKEY, cujos trabalhos foram publicados em
TUKEY (1977) e TUKEY & MOSTELLER (1977).
Os mtodos da EDA ( Exploratory Data Analysis ) permitem um tratamento bastante informal dos dados e
levam rapidamente ao conhecimento de estruturas existentes no conjunto de dados.
Embora as tcnicas da EDA sejam simples, geralmente so mtodos robustos (vlidos para uma grande
gama de situaes e modelos ) e resistentes (insensveis aos erros grosseiros ou dados estranhos).

2.2. DISTRIBUIO DE FREQUNCIAS


s observaes de determinado conjunto chamamos "dados", sejam estes provenientes de censos
populacionais ou amostras. Assim que os dados so coletados (dados brutos) conveniente proceder rotinas de
organizao que permitam visualizar ou facilitem o clculo de indicadores de suas propriedades. Aos dados
organizados chamamos de rol.
Como a Estatstica visa o estudo da distribuio de variveis aleatrias, um dos tipos de resumo mais
convenientes para descries estatsticas so as "tabelas de distribuio de frequncias", que so tabelas que
relacionam cada medida possvel em uma observao frequncia com que ocorreu nos dados.
Se as variveis medidas so naturalmente separveis em classes de ocorrncia, a construo destas
tabelas fica extremamente facilitada. Este o caso de variveis qualitativas:
Um problema diferente o de construir tabelas de distribuio de frequncias se no h classes naturais
de ocorrncia, como em variveis quantitativas.
Como exemplo, construiremos uma tabela de distribuio de frequncia para os seguintes dados
referentes ao salrio semanal, em dlares, de 100 trabalhadores (dados extrados de Hoel, 1986), relacionados a
seguir:

39 45 45 46 47 47 48 49 49 50 50 50 51 51 52 52 53 54 55 57
40 45 46 46 47 47 48 49 49 50 50 50 51 51 52 52 53 54 55 60
43 45 46 46 47 48 48 49 50 50 50 50 51 51 52 52 53 54 56 60
44 45 46 46 47 48 49 49 50 50 50 51 51 51 52 52 53 54 56 61
44 45 46 47 47 48 49 49 50 50 50 51 51 51 52 53 53 55 57 61

Note que os salrios foram arredondados para inteiros para facilitar os clculos, mas poderiam variar
quase continuamente de centavo em centavo.
Um roteiro para a construo de uma tabela de distribuio de frequncias (utilizado por Scott, 1979),
consiste nos seguintes passos:

10 de 18
B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A
Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

1- Determinar o nmero de classes (k): em geral, at 100 dados usa-se tomar o inteiro mais prximo da
raiz do nmero de dados (n). Para mais que 100 observaes, usa-se o inteiro mais prximo de 5*log (n):
n 100 k = n e n > 100 k = 5logn
Como no exemplo n = 100, o nmero de classes k = 10.

2- Determinar a amplitude de cada classe (c): toma-se a amplitude total dos dados (representada por A,
calculada pela diferena entre o maior e o menor valor dos dados e divide-se tal valor pelo nmero de classes
menos 1:
c= A
k-1
No exemplo: A = 61 39 = 22; c = 22 / 9 2,44

3- Determinar o limite inferior da primeira classe LI1 e os demais limites de classe:


Li = menor valor da srie - c
2
No exemplo:
LI1 = 39 - 2,44 / 2 = 37,78;
LS1 = LI2 = LI1 +c = 37,78 + 2,44 = 40,22;
LS2 = LI3 = LI2 +c e assim sucessivamente, at ultrapassar o maior valor observado.
4- Determinar a frequncia de dados observados em cada classe (por meio da contagem simples dos
dados que caem entre os limites da classe) e construir a tabela.

Tabela 2.2.1. Distribuio de frequncia dos salrios semanais de 100 trabalhadores (varivel quantitativa
contnua). Roteiro para amostras.
Classe de Salrio Semanal Ponto Mdio da Classe Frequncia Observada Frequncia Acumulada
37,78 40,22 39,00 2 2

40,22 42,66 41,44 0 2


42,66 45,10 43,88 9 11
45,10 47,54 46,32 16 27
47,54 49,98 48,76 15 42
49,98 52,42 51,20 37 79
52,42 54,86 53,64 10 89
54,86 57,30 56,08 7 96
57,30 59,74 58,52 0 0
59,74 62,18 60,96 4 100
Total 100

Tomaremos os dados e esta tabela para acompanhar os exemplos a seguir. Note que os pontos mdios
de classe so as mdias aritmticas dos limites de classe.
Para o clculo de medidas a partir de tabelas de distribuio de frequncias so em geral feitas algumas
aproximaes. A principal aproximao a chamada Hiptese Tabular Bsica que consiste em supor que todos os
dados de uma classe so representados pelo ponto mdio desta classe. Como veremos, este fato trar
consequncias como simplificar os clculos apesar da perda de preciso envolvida.

11 de 18
B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A
Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

2.3. MEDIDAS DE POSIO


Medidas de posio ou de tendncia central indicam valores como o salrio esperado ao se entrevistar um
trabalhador, o salrio mais frequente na empresa ou qual o valor salarial central, abaixo do qual (ou acima do qual)
esto situados metade de todos os salrios.

2.3.1. VALOR ESPERADO ( Mdia x )


Esta a medida mais utilizada e intuitiva de tendncia central. Supomos que todos j calcularam mdias
aritmticas (soma de todos os valores dividida pelo nmero de valores) e mdias ponderadas. No caso de dados
quantitativos contnuos brutos, a media ponderada deve proceder de uma tabela de distribuio de frequncias, e
a ponderao se d pela frequncia de ocorrncia de cada ponto mdio de classe.
Calculando a mdia salarial do exemplo anterior (os 100 dados brutos), encontramos o seguinte valor:

x = xi = 49 + 47 + 51 + ... + 45 + 50 = 5000 = 50
n 100 100

Para a tabela de distribuio de frequncias, a mdia dada por:

x = fi xi = 2x39,5 + 0x41,44 + ... + 4x60,96 = 5012,64 = 50,13


fi 2 + 0 + ... + 2 100

2.3.2. VALOR CENTRAL (Mediana md)


Esta medida pode ser facilmente estabelecida caso as observaes estejam dispostas em ordem
crescente ou decrescente. Se o nmero de dados for mpar, corresponder ao valor da observao da posio (n /
2 + 1) sima. Se o nmero de dados for par, corresponder mdia das observaes (n / 2) sima e (n / 2 + 1)
sima. No exemplo dos salrios (n = 100), temos:

md = (observao ordenada de nmero 50 + observao ordenada de nmero 51) / 2 = (50 + 50) / 2 = 50

O clculo a partir de uma tabela de distribuio de frequncias dado pela seguinte expresso:

md = LI50 + (50*n)/100 - FAA * c50


f50

ou seja, o limite inferior da classe mediana somado a uma frao (entre parnteses) da amplitude da classe
mediana (em geral constri-se tabelas com c constante). Esta frao dada pela relao entre a diferena da
posio central para a inicial da classe mediana (FAA a frequncia acumulada anterior classe mediana) e a
frequncia da prpria classe mediana, ou seja, pela proporo das observaes da classe que devem ser
anteriores mediana.
No exemplo dos salrios, a classe mediana a que contm a posio 50, seu limite inferior 49,98; a
amplitude de classe 2,44; a frequncia acumulada anterior mediana 42 e a frequncia da classe mediana
37. Assim, a mediana calculada por:

md = 49,98 + 50*100/100 - 42 * 2,44 = 50,51


37

12 de 18
B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A
Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

2.3.3. VALOR MAIS FREQUNTE (Moda mo)


Esta medida pode ser determinada pela contagem de observaes recorrentes em dados discretos. Para
dados contnuos, somente pode-se obter a moda em tabelas de distribuio de freqncias. Como no exemplo os
salrios esto discretizados (arredondados para inteiros) calcularemos a moda pelos dois processos
Dados Brutos: o salrio modal 50 (ocorre 16 vezes).
Na tabela, utilizaremos um mtodo anlogo ao proposto para a mediana, em que procura-se inicialmente
determinar a classe modal e depois soma-se uma frao correspondente diferena de frequncias entre as
classes modal e as adjacentes (mtodo geomtrico de Czuber):

mo = LImo + 1 * cmo
1 + 2

em que 1 e 2 so as diferenas entre a frequncia da classe modal e as das classe anterior e posterior,
respectivamente.
No exemplo dos salrios a classe modal a mesma classe mediana,

1 = 37 15 = 22
2 = 37 10 = 27
mo = 49,98 + 22 * 2,44 51,08
22 + 27

2.3.4. OUTRAS MDIAS


Algumas vezes interessante calcular mdias de forma diferente para dados com caractersticas
especiais. Bastante empregadas so as mdias geomtricas para observaes positivas referentes a
crescimentos exponenciais (como taxas de avano de doenas, nmero de habitantes de regies em colonizao,
crescimento de produtividade e lucro em alguns negcios, etc.). A mdia geomtrica a raiz n-sima do produto
das n observaes.

Ex.: O conjunto de dados {2, 6,15, 59} tem mdia geomtrica G = 2 * 6 *15 * 59 10,15

Para fenmenos que dependem fortemente do menor dos dados, em geral utiliza-se mdias harmnicas
calculadas como o inverso da mdia dos inversos. Um exemplo o clculo do tamanho efetivo de populaes
naturais submetidas a processos de devastao ecolgica.

Ex.: O nmero de hipoptamos de uma regio ao longo de quatro geraes foi de { 2000, 20, 250,1500 }, a
mdia harmnica deste nmero dada por

H = 1 72,51
1 1 + 1 + 1 + 1 .
4 2000 20 250 1500

Pode-se notar que, enquanto a mdia geomtrica favorece os maiores nmeros, a mdia harmnica
favorece os nmeros menores.

13 de 18
B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A
Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

2.3.5. COMPARAO ENTRE MDIA, MEDIANA E MODA

Tabela 2.3.5.1 Comparao entre Mdia, Mediana e Moda

Definio Vantagens Limitaes

Mdia x = xifi 1. reflete cada valor 1. influenciada por


n 2. possui propriedades valores extremos
matemticas atraentes

Mediana metade dos valores so 1. menos sensvel a valores 1. difcil de determinar


maiores, metade menores extremos do que a mdia para grande quantidade
de dados

Moda valor mais frequente 1. valor tpico: maior 1. no se presta a anlise


quantidade de valores matemtica
concentrados neste ponto 2. pode no ser moda
para certos conjuntos
de dados

2.4. MEDIDAS DE DISPERSO


Uma breve reflexo sobre as medidas de tendncia central permite-nos concluir que elas no so
suficientes para caracterizar totalmente uma sequncia numrica.
Se observarmos as sequncias:
X:10, 1,18, 20,35,3,7,15,11,10.
Y:12,13, 13,14,12,14,12,14,13, 13.
Z:13, 13,13,13,13,13,13,13, 13,13.
concluiremos que todas possuem a mesma mdia 13.
No entanto, so sequncias completamente distintas do ponto de vista da variabilidade de dados.
Na sequncia Z no h variabilidade de dados. A mdia 13 representa bem qualquer valor da srie.
Na sequncia Y a mdia 13 representa bem a srie, mas existem elementos da srie levemente
diferenciados da mdia 13. Na sequncia X existem muitos elementos bastante diferenciados da mdia 13.
Conclumos que a mdia 13 representa otimamente a sequncia Z, representa bem a sequncia Y, mas
no representa bem a sequncia X.
O nosso objetivo construir medidas que avaliem a representatividade da mdia. Para isto usaremos as
medidas de disperso.
Observe que na sequncia Z os dados esto totalmente concentrados sobre a mdia 13. No h disperso
de dados. Na sequncia Y h forte concentrao dos dados sobre a mdia 13, mas h fraca disperso de dados.
J na srie X h fraca concentrao de dados em torno da mdia 13 e forte disperso de dados em relao
mdia 13.

14 de 18
B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A
Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

2.4.1. MEDIDAS DE DISPERSO ABSOLUTA


As principais medidas de disperso absolutas so: amplitude total, desvio mdio simples, varincia e
desvio padro.

2.4.1.1. AMPLITUDE TOTAL


a diferena entre o maior e o menor valor da sequncia.
Para o exemplo dos dados referentes ao salrio semanal, basta identificar o maior e o menor valor da
sequncia e efetuar a diferena entre estes valores: A = 61 39 = 22
Para a tabela de distribuio de frequncias, consideraremos como maior valor da srie o ponto mdio da
ltima classe e como menor valor da srie o ponto mdio da primeira classe. A amplitude total a diferena entre
estes valores: A = 60,96 39 = 21,96

2.4.1.2. DESVIO MDIO SIMPLES


O conceito estatstico de desvio corresponde ao conceito matemtico de distncia.
A disperso dos dados em relao mdia de uma sequncia pode ser avaliada atravs dos desvios de
cada elemento da sequncia em relao mdia da sequncia.
O desvio mdio simples que indicaremos por DMS definido como sendo uma mdia aritmtica dos
desvios de cada elemento da srie para a mdia da srie.
Calculamos inicialmente a mdia da sequncia. Em seguida identificamos a distncia de cada elemento da
sequncia para sua mdia. Finalmente, calculamos a mdia destas distncias.
Se a sequncia for representada por X: x1, x2, ..., xn ento o DMS admite como frmula de clculo:

DMS = I xi - x I
n

Para o exemplo dos dados referentes ao salrio semanal, basta determinar as distncias de cada
elemento da srie para a mdia da srie:
39 - 50 = |-11| = 11 47 - 50 = |-3| = 3 49 - 50 = |-1|= 1 51 - 50 = |1| = 1 53 - 50 = |3| = 3
40 - 50 = |-10| = 10 47 - 50 = |-3| = 3 49 - 50 = |-1|= 1 51 - 50 = |1| = 1 53 - 50 = |3| = 3
43 - 50 = |-7| = 7 47 - 50 = |-3| = 3 50 - 50 = |0| = 0 51 - 50 = |1| = 1 53 - 50 = |3| = 3
44 - 50 = |-6| = 6 47 - 50 = |-3| = 3 50 - 50 = |0| = 0 51 - 50 = |1| = 1 53 - 50 = |3| = 3
44 - 50 = |-6| = 6 47 - 50 = |-3| = 3 50 - 50 = |0| = 0 51 - 50 = |1| = 1 53 - 50 = |3| = 3
45 - 50 = |-5| = 5 47 - 50 = |-3| = 3 50 - 50 = |0| = 0 51 - 50 = |1| = 1 54 - 50 = |4| = 4
45 - 50 = |-5| = 5 47 - 50 = |-3| = 3 50 - 50 = |0| = 0 51 - 50 = |1| = 1 54 - 50 = |4| = 4
45 - 50 = |-5| = 5 48 - 50 = |-2| = 2 50 - 50 = |0| = 0 51 - 50 = |1| = 1 54 - 50 = |4| = 4
45 - 50 = |-5| = 5 48 - 50 = |-2| = 2 50 - 50 = |0| = 0 51 - 50 = |1| = 1 54 - 50 = |4| = 4
45 - 50 = |-5| = 5 48 - 50 = |-2| = 2 50 - 50 = |0| = 0 51 - 50 = |1| = 1 55 - 50 = |5| = 5
45 - 50 = |-5| = 5 48 - 50 = |-2| = 2 50 - 50 = |0| = 0 52 - 50 = |2| = 2 55 - 50 = |5| = 5
46 - 50 = |-4| = 4 48 - 50 = |-2| = 2 50 - 50 = |0| = 0 52 - 50 = |2| = 2 55 - 50 = |5| = 5
46 - 50 = |-4| = 4 48 - 50 = |-2| = 2 50 - 50 = |0| = 0 52 - 50 = |2| = 2 56 - 50 = |6| = 6
46 - 50 = |-4| = 4 49 - 50 = |-1| = 1 50 - 50 = |0| = 0 52 - 50 = |2| = 2 56 - 50 = |6| = 6
46 - 50 = |-4| = 4 49 - 50 = |-1| = 1 50 - 50 = |0| = 0 52 - 50 = |2| = 2 57 - 50 = |7| = 7
46 - 50 = |-4| = 4 49 - 50 = |-1| = 1 50 - 50 = |0| = 0 52 - 50 = |2| = 2 57 - 50 = |7| = 7
46 - 50 = |-4| = 4 49 - 50 = |-1| = 1 50 - 50 = |0| = 0 52 - 50 = |2| = 2 60 - 50 = |10| = 10
46 - 50 = |-4| = 4 49 - 50 = |-1| = 1 50 - 50 = |0| = 0 52 - 50 = |2| = 2 60 - 50 = |10| = 10
46 - 50 = |-4| = 4 49 - 50 = |-1| = 1 51 - 50 = |1| = 1 52 - 50 = |2| = 2 61 - 50 = |11| = 11
47 - 50 = |-3| = 3 49 - 50 = |-1| = 1 51 - 50 = |1| = 1 53 - 50 = |3| = 3 61 - 50 = |11| = 11

15 de 18
B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A
Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

O DMS a mdia aritmtica simples destes valores: DMS = 11 + 10 + ......... + 11 + 11 = 294 = 2,94
100 100

Interpretao: Em mdia, cada elemento da sequncia est afastado do valor 50 por 2,94 unidades.

No caso da tabela de distribuio de frequncias, lembramos que a frequncia simples de cada elemento
representa o nmero de vezes que este valor figura na srie. Consequentemente haver repeties de distncias
iguais de cada elemento distinto da srie para a mdia da srie. Assim, a mdia indicada para estas distncias
uma mdia aritmtica ponderada.

A frmula para o clculo do DMS : DMS = I xi - x I fi


fi

Usaremos a disposio da tabela, acrescentando novas colunas para a resoluo dos clculos.

A mdia da srie : x = 50,13

Classe de Salrio Ponto Mdio Frequncia


Semanal da Classe (xi ) Observada (fi ) xi - x I xi - x I I xi - x I *fi

37,78 40,22 39 2 -11,13 11,13 22,26


40,22 42,66 41,44 0 -8,69 8,69 0
42,66 45,10 43,88 9 -6,25 6,25 56,25
45,10 47,54 46,32 16 -3,81 3,81 60,96
47,54 49,98 48,76 15 -1,37 1,37 20,55
49,98 52,42 51,2 37 1,07 1,07 39,59
52,42 54,86 53,64 10 3,51 3,51 35,1
54,86 57,30 56,08 7 5,95 5,95 41,65
57,30 59,74 58,52 0 8,39 8,39 0
59,74 62,18 60,96 4 10,83 10,83 43,32
Total 100 319,68

O DMS dado por: I xi - x I fi = 319,68 = 3,20


fi 100

Interpretao: Em mdia, cada elemento da sequncia est afastado do valor 50 por 3,20 unidades.

COMENTRIO: O desvio mdio simples depende de cada componente da srie. Se mudarmos o valor de um
nico elemento da srie, mudamos tambm o DMS. Portanto, o desvio mdio simples tem perfeita sensibilidade
estatstica. A maior dificuldade desta medida envolver mdulos, cujas propriedades, em geral no so
suficientemente conhecidas pelos profissionais que normalmente desenvolvem estes clculos.

2.4.1.3. VARINCIA E DESVIO PADRO


Observamos no item anterior que a dificuldade em se operar com o DMS se deve presena do mdulo,
para que as diferenas xi - x possam ser interpretadas como distncias.
Outra forma de se conseguir que as diferenas xi - x se tornem sempre positivas ou nulas considerar o
quadrado destas diferenas, isto : ( xi x )2.
Se substituirmos, nas frmulas do DMS a expresso I xi x I por ( xi - x )2, obteremos nova medida de
disperso chamada varincia.

16 de 18
B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A
Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

Portanto, varincia uma mdia aritmtica calculada a partir dos quadrados dos desvios obtidos entre os
elementos da srie e a sua mdia.
Quando a sequncia de dados representa uma populao a varincia denotada por 2(x) e o desvio
padro correspondente por (x).
Quando a sequncia de dados representa uma amostra, a varincia denotada por s2(x) e o desvio
padro correspondente por s(x).
2 = ( xi x )2fi s2 = ( xi x )2fi
N n-1

O desvio padro a raiz quadrada positiva da varincia.

= 2 s = s2

A mdia da srie : x = 50,13

Classe de Salrio Ponto Mdio Frequncia


Semanal da Classe (xi ) Observada (fi ) xi - x ( xi - x )2 ( xi - x )2 *fi

37,78 40,22 39 2 -11,13 123,8769 247,7538


40,22 42,67 41,44 0 -8,69 75,5161 0
42,67 45,11 43,88 9 -6,25 39,0625 351,5625
45,11 47,56 46,32 16 -3,81 14,5161 232,2576
47,56 50,00 48,76 15 -1,37 1,8769 28,1535
50,00 52,44 51,2 37 1,07 1,1449 42,3613
52,44 54,88 53,64 10 3,51 12,3201 123,201
54,88 57,33 56,08 7 5,95 35,4025 247,8175
57,33 59,78 58,52 0 8,39 70,3921 0
59,78 62,22 60,96 4 10,83 117,2889 469,1556
Total 100 1742,263

Se a sequncia representa uma populao, a varincia :


2 = ( xi x )2fi = 1742,263 = 17,42
N 100

Se a sequncia representa uma populao, a varincia :


s2 = ( xi x )2fi = 1742,263 = 17,60
n-1 99

O desvio padro a raiz quadrada positiva da varincia:


= 2 = 17,42 = 4,17
s = s2 = 17,60= 4,20

COMENTRIOS:
1. No clculo da varincia, quando elevamos ao quadrado a diferena ( xi x ), a unidade de medida da
srie fica tambm elevada ao quadrado.
Portanto, a varincia dada sempre no quadrado da unidade de medida da srie.

17 de 18
B AC H AR E L AD O E L I C E N C I AT U R A E M Q U M I C A
Notas de Aulas do Curso de Estatstica - Prof MSc. Damaris Fernandes

Se os dados so expressos em metros, a varincia expressa em metros quadrados.


Em algumas situaes, a unidade de medida da varincia nem faz sentido. o caso, por exemplo, em que
os dados so expressos em litros. A varincia ser expressa em litros quadrados.
Portanto, o valor da varincia no pode ser comparado diretamente com os dados da srie, ou seja:
varincia no tem interpretao.
2. Exatamente para suprir esta deficincia da varincia que se define o desvio padro.
Como o desvio padro a raiz quadrada da varincia, o desvio padro ter sempre a mesma unidade de
medida da srie e portanto admite interpretao.

2.4.1.4. MEDIDAS DE DISPERSO RELATIVA


Se uma srie X apresenta x = 10 e (x) = 2 e uma srie Y apresenta y = 100 e (y) = 5, do ponto de vista
da disperso absoluta, a srie Y apresenta maior disperso que a srie X
No entanto, se levarmos em considerao as mdias das sries, o desvio padro de Y que 5 em relao
a 100 um valor menos significativo que o desvio padro de X que 2 em relao a 10.
Isto nos leva a definir as medidas de disperso relativas: coeficiente de variao e varincia relativa.
O coeficiente de variao de uma srie X indicado por CV(x) definido por:

CV =
x
A varincia relativa de uma srie X indicada por V(x) e definida por:

V = 2
( x )2
Note que o coeficiente de variao, como uma diviso de elementos de mesma unidade, um nmero
adimensional, portanto, pode ser expresso em percentual.
Este fato justifica a utilizao do denominador ( x )2 na definio de V(x).

Deste modo, se calcularmos o coeficiente de variao das sries X e Y citada no incio obteremos:

CV(x) = 2 = 0,2 ou 20% CV (y) = 5 = 0,05 ou 5%


10 100

Como a medida de disperso relativa leva em considerao a medida de disperso absoluta e a mdia da
srie, uma medida mais completa que a medida de disperso absoluta.
Comparando os valores destes dois coeficientes conclumos que:
- a srie Y apresenta maior disperso absoluta.
- a srie X apresenta maior disperso relativa.
Portanto, a srie X apresenta maior disperso.

Para o exemplo dos dados referentes ao salrio semanal, considerando que a sequncia representa:

- uma populao: CV = 4,17 *100 = 8,32% e V = (4,17)2 *100 = 0,69%


50,13 50,132

- uma amostra: CV = 4,20 *100 = 8,38% e V = (4,20)2 *100 = 0,70%


50,13 50,132

18 de 18

Vous aimerez peut-être aussi