Vous êtes sur la page 1sur 32

Elaborado por Gerson Bacury

INTRODUO AO CAPTULO

Poderamos dividir em dois, esse captulo, porm pelo forte imbricamento

entre os contedos optamos pela juno. Ele encerra a Estatstica Descritiva e serve como introduo Estatstica Inferencial, pois no estudo desse item, est incluindo, em quase todos os tpicos, as Medidas de Disperso atravs da utilizao principalmente do Desvio Padro. Iniciaremos, ao estudo das Medidas de Posio Central, nesse momento analisaremos os seguintes temas: Mdia, Moda, Mediana e as Separatrizes. No segundo momento, trabalharemos as Medidas de Disperso, onde nosso foco ser o Desvio Padro nas medidas de disperso absoluta e o Coeficiente de Variao nas medidas de disperso relativa. Vale pena ressaltar que todos os exemplos resolvidos tambm so comentados da maneira mais simples e detalhada possvel, para uma melhor compreenso por parte do aluno. De um modo geral daremos um tratamento especial s situaes de clculo tanto nas Medidas de Posio Central e tambm Medidas de Disperso, quando no estudo das Distribuies de Freqncia para Dados Agrupados, pois aqui h a exigncia de equaes, tornando mais trabalhoso o aprendizado desse assunto. Lembre-se, s trabalhoso mais no difcil!

53

Elaborado por Gerson Bacury


MEDIDAS DE POSIO CENTRAL Quando se faz um estudo descritivo de dados estatsticos, como a anlise de uma Srie Estatstica conveniente o clculo de alguns valores (medidas) para melhor entend-las, uma desses valores so as Medidas de posio Central. Segundo Vieira (2003, p.43):

Para resumir a quantidade de informao contida em um conjunto de dados, os estatsticos definem medidas que descrevem, atravs de um s nmero, caractersticas de dados. Algumas dessas medidas descrevem a tendncia central, isto , a tendncia que os dados tm de se agrupar em torno de certos valores.

De modo geral, as Medidas de Posio Central caracterizam-se pelo fato de seus resultados tenderem, em geral, a agrupar-se em torno dos valores centrais em uma D.F. Por exemplo, quando um educador revela que a mdia da turma foi 8,5 na disciplina de Estatstica, na verdade ele est mostrando que tal valor representa no somente a nota de um aluno, mas tambm a caracterstica de todos os alunos que realizaram sua avaliao. Com base nesse resultado podemos, entre outras coisas, por meio de um parmetro (mdia de aprovao) estabelecido pela Instituio de Ensino, se essa turma est abaixo, acima ou na mdia de aprovao. Dentre as Medidas de Posio Central, podemos destacar: Mdia, Moda, Mediana e as Separatrizes.

54

Elaborado por Gerson Bacury


Mdia ( x ):

Analisaremos aqui, trs situaes: a) CONJUNTO DE VALORES: Quando a mdia calculada a partir dos dados brutos ou de um rol. Somam-se todas as variveis e divide-se por sua quantidade. Nesse caso tem-se a mdia chamada aritmtica simples:

x=

xi n

x MDIA xi VARIVEIS
n QUANTIDADE DE VARIVEIS
Ex.: Calcule a mdia para o tempo (em horas) de diversas cirurgias realizadas em certo hospital, sabendo que os dados coletados foram: 3, 5, 8, 12, 7, 12, 15, 18, 20.

x=

3 + 5 + 8 + ... + 20 100 = = 11,1h 9 9

Logo a mdia de durao para as cirurgias realizadas igual a 11,1horas.

55

Elaborado por Gerson Bacury


b) PARA UMA D.F DE DADOS NO AGRUPADOS: Devemos considerar as freqncias absolutas, por isso, faremos o clculo dos dados utilizando a mdia ponderada. Logo a mdia ser dada pela razo entre o somatrio do produto das variveis e as respectivas freqncias absolutas ( xi.Fi) e o tamanho da amostra (N), conforme a expresso abaixo:

x=

x xi

x i .Fi N

MDIA

VARIVEL

Fi FREQUNCIA ABSOLUTA N TAMANHO DA AMOSTRA (soma de todas as freqncias absolutas)


Ex.: Calcule a mdia de idade para pacientes internados em certo Hospital, por patologias relacionadas rea da Ortopedia, segundo a D.F abaixo:
Idades (anos) Qntd de Pacientes

xi
16 17 19 20 22 23 24 25

Fi
3 3 2 4 2 3 3 5 25

xi . Fi
48 51 38 80 44 69 72 125 527

x=

527 = 21,1 anos 25

xi.Fi

Vale ressaltar que em algumas situaes principalmente quando o resultado for divulgado a pessoas leigas o valor calculado13 no retrata a realidade com coerncia, apesar da varivel idade, ser quantitativa contnua, devemos fazer, nesse caso, uma restrio e considerar o valor estimado14, logo usando o bom senso conclumos que a idade mdia dos pacientes internados igual a aproximadamente 21anos.

13 14

Oriundo de clculos numricos. O que depende da estima ou apreo em que se tem um objeto.

56

Elaborado por Gerson Bacury


c) PARA UMA D.F DE DADOS AGRUPADOS: Aqui, utilizaremos os pontos mdios como representante das classes, no clculo da mdia. Tambm ser empregada a mdia ponderada como geradora do resultado, ento o mesmo dever ser obtido pela razo entre o somatrio do produto do ponto mdio das classes e as respectivas freqncias absolutas (Xi.Fi) pelo tamanho da amostra (N), conforme a expresso abaixo:

x=

X i .Fi N

MDIA

Xi PONTO MDIO Fi FREQUNCIA ABSOLUTA N TAMANHO DA AMOSTRA


Ex.: Calcule a mdia para o ndice de VO2 em ml(kg.min) em mulheres com idades variando de 20 a 29 anos, segundo a D.F abaixo:
ndice de VO2 Qntd Mulheres Mdia de VO2

Classes

Fi 5 8 7 9 13 6 2 50 N

Xi 19,5 26,5 33,5 40,5 47,5 54,4 61,5 -

Xi . Fi 97,5 212 234,5 364,5 617,5 326,4 123 1975,4

16 23 30 37 44 51 58

23 30 37 44 51 58 65

x=

1975 ,4 = 39,5 ml (kg. min ) 50

Xi.Fi

Aqui no h consideraes acerca do resultado logo, conclumos que a


mdia para o ndice de VO2 em mulheres, igual a 39,5 ml(kg.min).

57

Elaborado por Gerson Bacury


Moda (Mo): Suponha que certa vez voc vai fazer compras, em dado momento observou nas pessoas a sua volta que vrias delas usam o mesmo tipo de tnis e, por um acaso voc tambm est com esse modelo. Logo podemos concluir, entre outras coisas, que voc est na moda! No caso da Estatstica seguimos essa lgica. Para Larson & Faber (2004, p.49):
A moda de um conjunto de dados aquela entrada que ocorre com maior freqncia. Se nenhuma entrada repetida, o conjunto de dados no possui moda. Se duas entradas ocorrem com a mesma freqncia elevada, cada entrada uma moda e os dados so chamados de bimodais.

Em algumas situaes a moda utilizada para a mensurao da mdia e mediana, assim nos assegura Kirsten & Rabahy (2006, p.46) ao comentar sobre a mesma: [...] pode ser utilizada quando se deseja ter a noo aproximada da mdia aritmtica: quanto maior o nmero de observaes que apresenta valor idntico, maior a possibilidade da mdia aritmtica estar prxima a esse valor. Daremos nfase a duas situaes, na anlise da moda: as Distribuies de Freqncia para dados no agrupados e dados agrupados.

a) PARA UMA D.F DE DADOS NO AGRUPADOS: Nesse caso, s basta saber que a Moda dada pela varivel que possui maior freqncia absoluta.
Ex1: Mo = 5 (unimodal) Xi Fi 3 4 5 6 7

3 5 10 9 4

Ex2: possui 2 modas Mo = 4 e Mo = 7 (bimodal)

Xi Fi

3 4 1 8

5 4

6 7 8 9 3 8 5 6

Xi Ex3: no possui moda (amodal) Fi

3 4 2 2

5 2

6 7 2 2

58

Elaborado por Gerson Bacury

COMENTRIO: As seqncias que possuem mais de duas modas so chamadas de polimodais.

b) PARA UMA D.F DE DADOS AGRUPADOS: Aqui, impossvel identificar o valor exato da Moda, a olho nu, como no caso anterior, pois a varivel est disposta em uma classe a Moda pode assumir qualquer um dos infinitos valores em uma classe logo necessrio o uso de um modelo matemtico para encontrar o resultado, mas primeiro preciso determinar a classe modal (classe que possui maior freqncia absoluta), para assim resolvermos o problema. Existem alguns modelos matemticos para o clculo da moda, autores como Kirsten & Rabahy (2006), Costa Neto (2002) e outros, sugerem a frmula de Czuber. Faremos uma adaptao na equao claro sem alterar sua estrutura para tornar mais fcil a interpretao dos valores que iro compor a equao na efetuao dos clculos:

Mo = l +
l
1 2

1 .h 1 + 2

LIMITE INFERIOR DA CLASSE MODAL

DIFERENA

ENTRE A FREQUNCIA ABSOLUTA DA CLASSE MODAL E A

IMEDIATAMENTE ANTERIOR.

DIFERENA

ENTRE A FREQUNCIA ABSOLUTA DA CLASSE MODAL E A

IMEDIATAMENTE POSTERIOR.

AMPLITUDE DA CLASSE.

59

Elaborado por Gerson Bacury


Ex.: Calcule o valor do ndice de VO2 em ml(kg.min) para a maioria das mulheres com idades variando de 20 a 29 anos, segundo a D.F abaixo:
ndice de VO2 Qntd Mulheres

Classes

Fi 5 8 7 9 13 6 2 50

16 23 30 37 44 51 58

23 30 37 44 51 58 65

MTODO DE RESOLUO

Devemos encontrar a Classe Modal (possui maior freqncia absoluta) e, em seguida, efetuar o clculo para o valor da Moda.
Qntd Mulheres

ndice de VO2

Classes

Fi 5 8 7 9 13 6 2 50

16 23
Classe Modal

23 30 37 44 51 58 65

Mo = 44 +

(13 9 ) . 7 = 49,6 ml(kg. min ) [(13 9 ) + (13 6 )]

30 37 44 51 58

Maior Freqncia Absoluta

Portanto, conclumos que a maioria das mulheres com idades variando de 20 a 29 anos, possui o ndice de VO2 igual a 49,6 ml(kg.min).

60

Elaborado por Gerson Bacury


MEDIANA (Md): Podemos dizer que a mediana quando comparada s grandezas anteriores a Medida de Posio Central mais central que existe. Quando os dados so dispostos em ordem crescente, a mediana a varivel que divide uma srie em duas partes iguais, isto , o limite para os primeiros 50% dos elementos srie. Para Callegari-Jacques (2003), uma caracterstica importante apresentada pela Mediana, o fato de seu valor no ser afetado pelos extremos da srie. Graficamente a Mediana pode ser visualizada da seguinte maneira:
0% 50% Md 100%

A seguir, apresentaremos trs situaes na anlise da Mediana, so elas:

a) CONJUNTO DE VALORES: Quando a mediana calculada a partir dos dados brutos ou de um rol, devemos verificar a quantidade de elementos (n) da mesma:

n + 1 Se n for mpar: o rol admite apenas o termo que ocupa a posio 2 Ex.: Calcular a mediana do conjunto X: 3, 5, 8, 12, 7, 12, 15, 18, 20.

MTODO DE RESOLUO

i) Organizaremos os dados em um Rol: 3, 5, 7, 8, 12, 12, 15, 18, 20. ii) Calcularemos o termo segundo a equao mencionada anteriormente:

9 +1 =5 2
Verificamos que o resultado da mediana ocupa a 5 posio, isto , a mediana vale 12. Observe, se o ltimo valor da mediana fosse 345, isso no afetaria o resultado encontrado.

61

Elaborado por Gerson Bacury


Se n for par: para Callegari-Jacques (2003) quando o conjunto de valores contiver um nmero par de elementos, a mediana ser obtida pela mdia aritmtica entre os dois valores centrais. Ex.: Calcular a mediana do conjunto X: 3, 5, 8, 16 7, 12, 15, 18, 20, 18.

MTODO DE RESOLUO

i) Organizaremos os dados em um Rol: 3, 5, 7, 8, 12, 16, 15, 18, 18, 20. ii) Calcularemos o valor da mediana segundo a mdia aritmtica entre 12 e 16 ento temos que:

12 + 16 = 14 2
Portanto nossa Mediana igual a14.

b) PARA DADOS NO AGRUPADOS: Como neste caso as variveis j esto devidamente organizadas, a anlise feita com base no tamanho da amostra (N) e a ajuda das freqncias acumuladas (fac), segundo dois casos: 1 caso (N mpar): Para Silva (1999a), mediana o termo que ocupa a posio N + 1 .
2

Ressaltamos que a varivel correspondente ao valor da Mediana s ser encontrada por meio da ajuda das fac.

Ex.: Calcule a idade para 50% dos pacientes internados em certo Hospital, por patologias relacionadas rea da Ortopedia, segundo a D.F abaixo:
Idades (anos) Qntd de Pacientes

xi
16 17 19 20 22 23 24 25

Fi
3 3 2 4 2 3 3 5 25

62

Elaborado por Gerson Bacury


MTODO DE RESOLUO

Idades (anos)

Qntd de Pacientes

xi
16 17 19 20 22 23 24 25

Fi
3 3 2 4 2 3 3 5 25

fac
3 6 8 12 14 17 20 25 -

25 + 1 = 12,5 2
Primeiro devemos calcular as devidas freqncias acumuladas, aps, devemos efetuar a expresso numrica acima e obter a ordem do termo correspondente a mediana, em seguida, procuraremos esse resultado na coluna da fac. De uma maneira prtica, aps o clculo do termo, devemos procur-lo na coluna das freqncias acumuladas, quando o valor no se encontra (nesse caso 12,5), devemos considerar o valor imediatamente maior ao calculado (nesse caso 14). Portanto a varivel equivalente 22.

Logo, a idade de 50% dos pacientes igual a 22 anos.

2 caso (N par): Silva (1999a), mediana admite dois valores centrais que ocupam as posies
N N e +1 2 2

, nesse caso a Mediana varivel correspondente

mdia extrada entre os termos que ocupam estas posies centrais.

Ex.: Calcule o peso para 50% das crianas avaliadas em um teste para um diagnstico de obesidade, segundo a D.F abaixo:
Paso (Kg) Qntd de Crianas

xi
25 32 43 46 50 52 58

Fi
3 3 5 1 2 3 4 21

63

Elaborado por Gerson Bacury


MTODO DE RESOLUO
Paso (Kg) Q de Crianas
ntd

xi
25 32 43 46 50 52 58

Fi
3 3 5 1 2 3 4 21

fac
3 6 11 12 14 17 21 -

21 = 10,5 2

21 + 1= 11,5 2

Primeiro devemos calcular as devidas freqncias acumuladas, aps, efetuar as expresses numricas acima e obter a ordem dos termos correspondentes, em seguida, procuraremos esses resultados na coluna da fac, como no caso anterior. Assim encontramos as variveis 43 e 46. Agora, s calcular a mdia aritmtica entre esses dois resultados e encontrar o valor da mediana, ou seja:

Md =

43 + 46 = 44,5 Kg 2

Logo, o peso para 50% das crianas avaliadas de 44,5 kg.

c) PARA UMA D.F DE DADOS AGRUPADOS: Assim como na Moda, nesse caso, exige um modelo de clculo para obtermos a mediana. Quanto a metodologia de clculo procederemos da mesma maneira, ou seja, primeiro precisamos determinar a classe em que se encontra a Mediana (classe Mediana). Essa classe determinada pelo que denominamos como identificador da classe Mediana (
N 2

) com o auxlio das fac.

O modelo matemtico que lembramos! receber uma adaptao, mas sem alterar sua essncia utilizado para o calculo da mediana o seguinte:

N fant 2 .h Md = l + Fi

l fant Fi

LIMITE INFERIOR DA CLASSE MEDIANA

FREQUNCIA ACUMULADA DA CLASSE ANTERIOR CLASSE MEDIANA.


FREQUNCIA ABSOLUTA DA CLASSE MEDIANA.

64

Elaborado por Gerson Bacury

h N
N 2

AMPLITUDE DA CLASSE MEDIANA. TAMANHO DA AMOSTRA. IDENTIFICADOR DA CLASSE MEDIANA

Ex.: Calcule o valor do ndice de VO2 em ml(kg.min) para 50% das mulheres com idades variando de 20 a 29 anos, segundo a D.F abaixo:
ndice de VO2 Qntd Mulheres

Classes

Fi 5 8 7 9 13 6 2 50

16 23 30 37 44 51 58

23 30 37 44 51 58 65

MTODO DE RESOLUO

1 passo: Identificar a classe Mediana: inicialmente criamos uma coluna numrica

para a freqncia acumulada, em seguida calcularemos o identificador da classe mediana para determinar a mesma, veja:
ndice de VO2 Q
ntd

Mulheres

Classes

Fi
5 8 fant 7 9 13 6 2 50

16 23 30
Classe Mediana

23 30 37 44 51 58 65

fac 5
13 20 29 42 46 50 65

50 = 25 2
De posse do resultado originado pelo o clculo do identificador, devemos procurar a classe mediana na coluna da fac. Utilizando a maneira prtica, o nmero imediatamente superior ao calculado (25) o nmero 29, logo a classe Mediana a quarta classe, de cima para baixo.

37 44 51 58

Elaborado por Gerson Bacury


2 passo: Calcular o valor da Mediana via equao:

Md = 37 +

(25 20 ) . 7 = 40,9 ml (kg. min )


9

Portanto, conclumos que 50% das mulheres com idades variando de 20 a 29 anos, possui o ndice de VO2 igual a 40,9 ml(kg.min). SEPARATRIZES

So valores que dividem uma srie de dados ordenados em quatro, cinco, dez e cem partes iguais. Essas medidas tm ligao com a mediana, pois a mesma, tambm considerada uma separatriz. Segundo Silva (1999a, p. 89):
[...] a mediana que divide a seqncia ordenada em dois grupos, cada um deles contendo 50% dos valores da seqncia, tambm uma medida separatriz. Alm da mediana, as outras medidas separatrizes que destacaremos so: quartis, quintis, decis e percentis.

Daremos aqui nfase aos quartis e percentis e tambm sua analise considerando somente as Distribuies de Freqncia para dados agrupados.

QUARTIS (QK): dividem uma srie de valores em quatro partes iguais.


0% 25% Q1 50% Q2 75% Q3 100%

Os quartis so calculados a partir de uma adequao na equao da mediana, assim como, seu procedimento de clculo. Ressaltamos que o Segundo Quartil igual Mediana, pois o mesmo se encontra tambm no centro da seqncia de valores. A equao geral para o Quartil dada por:

K .N fant 4 .h QK = l + Fi

66

Elaborado por Gerson Bacury

QK l fant
QUARTIL K

QUARTIL, K representa a ordem do quartil (K= 1, 2 OU 3) LIMITE INFERIOR DA CLASSE QUE CONTM O QUARTIL K FREQUNCIA ACUMULADA DA CLASSE ANTERIOR CLASSE QUE CONTM O

Fi h N

FREQUNCIA ABSOLUTA DA CLASSE QUE CONTM O QUARTIL K AMPLITUDE DA CLASSE QUE CONTM O QUARTIL K TAMANHO DA AMOSTRA. IDENTIFICADOR DA CLASSE QUE CONTM O QUARTIL K

k .N 4

Ex.: Com base na D.F abaixo, calcule o valor do ndice de VO2 em ml(kg.min) limite, para as mulheres com idades variando de 20 a 29 anos, segundo categorias: a) Categoria A, formada por 25% das mulheres; b) Categoria B, formada por 50% das mulheres; c) Categoria C, formada por 75% das mulheres;
ndice de VO2 Qntd Mulheres

Classes

Fi 5 8 7 9 13 6 2 50

16 23 30 37 44 51 58

23 30 37 44 51 58 65

67

Elaborado por Gerson Bacury


MTODO DE RESOLUO

Item a: Ao calcularmos o limite de VO2 mx. para esse percentual (25%)

devemos ressaltar que a separatriz utilizada ser o Primeiro Quartil (Q1):


1 passo: Devemos personalizar a equao para o Primeiro Quartil, logo:

= l

N 4 +

Fi

f ant .h

2 passo: Identificar a classe do Q1: inicialmente criamos uma coluna numrica

para a freqncia acumulada, em seguida calcularemos o identificador da classe do Q1 para determinar a mesma, veja:
ndice de VO2 Qntd Mulheres

Classes

Fi 5 8 7 9 13 6 2 50

16
Classe Q1

23 30 37 44 51 58 65

fac 5 13 20 29 42 46 50 -

fant

50 = 12,5 4
De posse do resultado originado pelo o clculo do identificador, devemos procurar a classe do Q1 na coluna da fac. Utilizando a maneira prtica, o nmero imediatamente superior ao calculado (12,5) o nmero 13, logo a classe do Q1 a segunda classe, de cima para baixo.

23 30 37 44 51 58

3 passo: Calcular o valor do Q1 via equao:

Q 1 = 23 +

(12,5 5 ) . 7 = 30,9 ml (kg. min )


8

Portanto, conclumos que a categoria A (25% das mulheres) possui um limite para o ndice de VO2 igual a 30,9 ml(kg.min).

68

Elaborado por Gerson Bacury


Item b: Ao calcularmos o limite de VO2 mx. para esse percentual (50%)

devemos ressaltar que a separatriz utilizada ser o Segundo Quartil (Q2) que j foi dito, igual a Mediana. Como esse exemplo o mesmo utilizado no clculo da Mediana, ento temos que: Md=Q2= 40,9 ml(kg.min), Portanto, conclumos que a categoria B (50% das mulheres) possui um limite para o ndice de VO2 igual a 40,9 ml(kg.min).
Item c: Ao calcularmos o limite de VO2 mx. para esse percentual (75%)

devemos ressaltar que a separatriz utilizada ser o Terceiro Quartil (Q3), onde devemos seguir o mesmo procedimento utilizado no item a, isto :
1 passo: Devemos personalizar a equao para o Terceiro Quartil, logo:

= l

3 .N 4 +

Fi

f ant .h

2 passo: Identificar a classe do Q3: inicialmente criamos uma coluna numrica

para a freqncia acumulada, em seguida calcularemos o identificador da classe do Q3 para determinar a mesma, veja:
ndice de VO2 Q
ntd

Mulheres

Classes

Fi 5 8 7 9 13 6 2 50

16 23 30 37
Classe Q3

23 30 37 44 51 58 65

fac 5 13 20 29 42 46 50 -

3 . 50 = 37,5 4
De posse do resultado originado pelo o clculo do identificador, devemos procurar a classe do Q3 na coluna da fac. Utilizando a maneira prtica, o nmero imediatamente superior ao calculado (37,5) o nmero 42, logo a classe do Q3 a quinta classe, de cima para baixo.

fant

44 51 58

3 passo: Calcular o valor do Q3 via equao:

Q 3 = 44 +

(37,5 29 ) . 7 = 48,6 ml (kg. min )


13

69

Elaborado por Gerson Bacury


Portanto, conclumos que a categoria C (75% das mulheres) possui um limite para o ndice de VO2 igual a 48,6 ml(kg.min). PERCENTIS (PK): dividem uma srie de valores em cem partes iguais.
0% 1% 2% ... P1 P2 ... ...98% 99% 100% ...P98 P99

Os percentis so calculados a partir de uma adequao na equao da mediana, assim como, seu procedimento de clculo. Ressaltamos que o Segundo Quartil e a Mediana tem o mesmo valor do Qinquagsimo Percentil (P50), pois o mesmo se encontra tambm no centro da seqncia de valores. A equao geral para o Percentil :

K .N f ant 100 .h PK = l + Fi

PK l

PERCENTIL, K representa a ordem do percentil (K= 1,..., 99) LIMITE INFERIOR DA CLASSE QUE CONTM O PERCENTIL K

fant FREQUNCIA ACUMULADA DA CLASSE ANTERIOR CLASSE QUE CONTM O PERCENTIL K Fi h N



FREQUNCIA ABSOLUTA DA CLASSE QUE CONTM O PERCENTIL K AMPLITUDE DA CLASSE QUE CONTM O PERCENTIL K TAMANHO DA AMOSTRA.

k .N IDENTIFICADOR DA CLASSE QUE CONTM O PERCENTIL K 100

70

Elaborado por Gerson Bacury


Ex.: Com base na D.F abaixo, calcule o valor do ndice de VO2 em ml(kg.min) limite, para 10 % das mulheres com idades variando de 20 a 29 anos:
ndice de VO2 Qntd Mulheres

Classes

Fi 5 8 7 9 13 6 2 50

16 23 30 37 44 51 58

23 30 37 44 51 58 65

MTODO DE RESOLUO

Ao calcularmos o limite de VO2 mx. para esse percentual (10%) devemos ressaltar que a separatriz utilizada ser o Dcimo Percentil (P10):
1 passo: Devemos personalizar a equao para o Primeiro percentil, logo:

P 10

10 . N f ant 100 .h =l + Fi

2 passo: Identificar a classe do P10: inicialmente criamos uma coluna numrica

para a freqncia acumulada, em seguida calcularemos o identificador da classe do P10 para determinar a mesma, veja:
ndice de VO2 Qntd Mulheres

Classes
Classe P10

Fi 5 8 7 9 13 6 2 50

16 23 30 37 44 51 58

23 30 37 44 51 58 65

fac 5 13 20 29 42 46 50 71

10 .50 =5 100
De posse do resultado originado pelo o clculo do identificador, devemos procurar a classe do P10 na coluna da fac. Utilizando a maneira prtica, verificamos que a classe do P10 a primeira. Nesse caso no h freqncia acumulada anterior, isto , fant = 0.

Elaborado por Gerson Bacury


3 passo: Calcular o valor do Q1 via equao:

P10 = 16 +

(5 0 ) . 7 = 23 ml (kg. min )
5

Portanto, conclumos que 10% das mulheres, possuem um limite para o ndice de VO2 igual a 23 ml(kg.min). MEDIDAS DE DISPERSO OU VARIABILIDADE

As medidas de Posio Central no so suficientes para avaliar um resultado no que tange a variabilidade15, preciso um complemento para que se tenha noo exata de quanto os dados esto ou no afastados em relao a um ponto de referncia (nesse caso, a mdia). Para Costa Neto (2002, p.24): A informao fornecida pelas medidas de posio necessita em geral ser complementada pelas medidas de disperso. Estas servem para indicar o quanto os dados se apresentam em torno da regio central. Portanto as Medidas de Disperso completam com maior mincia as informaes fornecidas pelas Medidas de Posio Central, isto , avaliam a representatividade da mdia em um conjunto de dados. As Medidas de Disperso classificam-se em duas: medidas de disperso
absolutas (Amplitude Total, Desvio Mdio, Varincia e Desvio Padro) e medida de disperso relativa (Coeficiente de Variao).

NOO INTUITIVA DA DISPERSO

Para iniciarmos esse tpico, devemos lembrar que em suma, a palavra disperso est ligada ao grau de afastamento, ou seja, quanto mais afastado da mdia, mais disperso haver. Por outro lado, precisamos associar uma palavra antnima ao grau de proximidade a homogeneidade. Quanto mais prximo da mdia, mais homogeneidade haver. Considere, por exemplo, os trs tipos de variveis abaixo:
15

Caracterstica de apresentar diversos valores distintos em uma seqncia numrica.

72

Elaborado por Gerson Bacury


W: 70, 70, 70, 70, 70 S: 68, 69, 70, 71, 72 T: 5, 15, 50, 120, 160

Ambos possuem mdia igual a 70. Vamos fazer primeiramente uma analise, levando em considerao a homogeneidade, em seguida, faremos uma concluso acerca da disperso. Anlises: a) O conjunto W mais homogneo que S e T, pois seus elementos so iguais a mdia; b) O conjunto S mais homogneo que T, pois seus elementos esto mais prximos da mdia em relao aos de T; c) O conjunto T o menos homogneo dentre todos, pois seus elementos esto muito distantes da mdia; Concluses: a) O conjunto W possui disperso nula; b) O conjunto S menos disperso que T; c) O conjunto T o mais disperso todos. Logo, ficou claro como funcionam as anlises de homogeneidade e disperso dos elementos em relao mdia. Tambm podemos verificar que a pesar desses conjuntos terem a mesma mdia, possuem caractersticas bem distintas segundo sua variabilidade. claro que na vida real, no analisamos dessa maneira os dados estatsticos, dispomos de ferramentas de diversos nveis, desde o mais simples at o mais rebuscado, utilizado em trabalhos cientficos.

73

Elaborado por Gerson Bacury


MEDIDAS DA DISPERSO ABSOLUTAS

AMPLITUDE TOTAL (AT) a Medida de Disperso mais simples de todas. Analisa em seu clculo, apenas os valores extremos da seqncia numrica. Vejamos duas situaes: a) PARA UMA D.F DE DADOS NO AGRUPADOS: a diferena entre o maior e o menor valor, observado na D.F ou conjunto de valores (dispostos em Rol). Matematicamente, podemos escrever a Amplitude total como:

At= xmx - xmn


Ex: Calcular a Amplitude Total para os conjuntos de valores W, S e T (citados no incio) e verifique as concluses apresentadas acerca da disperso:

AW= 70 70 = 0, disperso nula; AS= 72 68 = 4, menos disperso que T; AT= 160 5 = 155, mais disperso dentre todos.
b) PARA UMA D.F DE DADOS AGRUPADOS: a diferena entre o ponto mdio da primeira classe pelo ponto mdio da ltima classe na D.F:

At= Xmx - Xmn


Ex.:Calcular a Amplitude Total para a D.F abaixo:
Comprimidos Ingeridos (no ms) Qntd Pacientes

Classes
13 16 19 22 25 28 16 19 22 25 28 31

Fi
8 15 7 3 12 5 50

74

Elaborado por Gerson Bacury


MTODO DE RESOLUO

Primeiramente devemos calcular os Pontos Mdios da primeira a ltima classe, respectivamente, em seguida, efetuar o clculo e obter o resultado para a Amplitude Total, segundo a equao apresentada. Logo temos que:

Comprimidos Ingeridos (no ms)

Qntd Pacientes

Classes
13 16 19 22 25 28 16 19 22 25 28 31

Fi
8 15 7 3 12 5 50

Xi
14,5 29,5 -

At= 29,5 14,6 = 15 comprimidos

Como a amplitude total s analisa os valores extremos da srie no considerando os valores intermedirios, ela no vista como um parmetro para efeito de exatido, nos resultados. Para Vieira (2003, p.62): A amplitude no mede bem a disperso por uma razo bem simples: para calcul-la, usam-se apenas os valores extremos. importante que todos os dados sejam usados nos clculos da medida de disperso.

75

Elaborado por Gerson Bacury


Um exemplo bem bsico para observarmos estas consideraes. Imagine que foram levantadas as notas (em vrios 6 avaliaes), na disciplina de Estatstica, para dois alunos A e B, onde:
Aluno A
Avaliaes Xi Notas Obtidas Fi 1 2 3 4 5 6 Avaliaes Xi Notas Obtidas Fi 1

Aluno B
2 3 4 5 6

7,0 7,5 7,8 7,5 7,2 8,0

3,0 6,0 9,5 5,0 4,0

6,5

ALUNO A
10 9,5 9 8,5 8 7,5 7 6,5 6 5,5 5 4,5 4 3,5 3 2,5 2

ALUNO B
8,0 7,2
10 9,5 9 8,5 8 7,5 7 6,5 6 5,5 5 4,5 4 3,5 3 2,5 2

9,5

7,0

7,5

7,8

7,5

NOTAS

NOTAS

6,0 5,0 4,0 3,0

6,5

AVALIAES

AVALIAES

Note que a Amplitude Total para os dois alunos a mesma At = 6 1= 5, porm note que nos grficos, as notas para o aluno A so bastante regulares (bem prximas uma das outras), enquanto as notas do aluno B so mais diversificadas (bem distintas entre si), isto , as notas tm maior variabilidade para o aluno B do que para o aluno A, embora a Amplitude Total no tenha captado esse importante fato.

DESVIO MDIO (Dm) Desvio corresponde ao conceito matemtico de distncia. Segundo Cardoso (2007, p.136): Os desvios so afastamentos nos dados. O ponto de referncia para efetuar-se o clculo dos desvios ou afastamentos nos dados a mdia aritmtica dos desvios.

76

Elaborado por Gerson Bacury


Neste caso, a disperso em uma srie de valores pode ser analisada atravs dos desvios de cada elemento da seqncia, em relao a sua mdia. Algumas dificuldades que vo desde sua operao matemtica rebuscada at problemas em sua anlise so colocadas para o clculo do Desvio mdio. Silva (1999a) esclarece que a maior dificuldade desta medida em envolver mdulos, cujas propriedades, em geral no so suficientemente conhecidas. J Vieira (2003) comenta em sua obra que essa medida de disperso tem problemas para sua anlise e prefere no discutir sobre. Logo, em face de todas as consideraes acima, rumaremos ao objetivo maior das Medidas de Disperso Absolutas o Desvio Padro porm, antes, devemos entender o conceito e aplicao da Varincia. VARINCIA (S2)

dada pela mdia aritmtica dos quadrados dos desvios. Notaes: quando a seqncia de dados representarem uma populao ento a varincia ser representada por

e, quando representar uma amostra

ser indicada por S2, vale ressaltar , que a denominao da letra S na simbologia da Varincia assim como do Desvio Padro, que veremos a seguir, oriunda da palavra Space (na lngua inglesa significa espao, distncia, etc.). Aqui trabalharemos apenas com a varincia amostral. Aqui analisaremos trs situaes: a) CONJUNTO DE VALORES: Quando a varincia calculada a partir dos dados brutos ou de um rol, devemos verificar a quantidade de elementos (n) da mesma. Usaremos a seguinte expresso:
S2 =

( x )
n 1 n

Ex.: Calcular a Varincia para o tempo (em meses) na preparao, de atletas para uma competio, onde os valores so: 4, 6, 4, 6, 5, 5.

77

Elaborado por Gerson Bacury


MTODO DE RESOLUO

Primeiramente devemos criar uma tabela com os itens n, x e x2 para facilitar os clculos matemticos, ento:
n x
4 6 6 4 6 5 5

16 36 16 36 25 25 154

S2 =

154

(30 ) 2
= 0,8 meses 2

6 6 1

30

x2

Logo esses atletas possuem uma varincia para o tempo de preparao acerca de uma competio igual a 0,8 meses2.

d) PARA UMA D.F DE DADOS NO AGRUPADOS: Nesse caso, leva-se em considerao a mdia e o tamanho da amostra D.F:

S2 =

(x

x . Fi N 1
2 i

Ex.: Calcular a Varincia para as idades (em anos) de crianas com problemas de desnutrio segundo a D.F abaixo:
Idade de crianas Qntd de crianas

xi
3 4 5 6 7

Fi
2 5 7 4 4 22

78

Elaborado por Gerson Bacury


MTODO DE RESOLUO

1 passo: Devemos calcular a Mdia:


Idade de crianas Qntd de crianas

xi
3 4 5 6 7

Fi
2 5 7 4 4 22

xi . Fi
6 20 35 24 28 113

x=

113 = 5,1 anos 22

N xi.Fi 2 passo: De posse do resultado da Mdia construiremos, respectivamente as

colunas (xi x )2 e (xi x )2. Fi, para assim ento procedermos ao clculo para a Varincia:
Idade de crianas Qntd de crianas

xi
3 4 5 6 7

Fi
2 5 7 4 4 22

xi . Fi
6 20 35 24 28 113

(xi x )2
4,4 1,2 0 0,8 3,6 -

(xi x )2. Fi
8,8 6 0 3,2 14,4 32,4

S2 =

32,4 = 1,5 anos 2 22 1

[(xi x )2. Fi]

Logo a varincia para as idades igual a 1,5 anos2.

79

Elaborado por Gerson Bacury


e) PARA UMA D.F DE DADOS AGRUPADOS: Devemos levar em considerao a mdia, o tamanho da amostra e o ponto mdio das classes na D.F:

S2

(X =

2 i

.Fi

) (x)

Ex.:Calcular a Varincia para a quantidade de comprimidos (referente a vitamina C) ingerida por atletas do Atletismo segundo a D.F abaixo:
Comprimidos ntd Ingeridos (no ms) Q Atletas

Classes
13 16 19 22 25 28 16 19 22 25 28 31

Fi
8 15 7 3 12 5 50

MTODO DE RESOLUO

1 passo: Devemos calcular a Mdia:


Comprimidos ntd Ingeridos (no ms) Q Atletas

Classes
13 16 19 22 25 28 16 19 22 25 28 31

Fi
8 15 7 3 12 5 50

Xi
14,5 17,5 20,5 23,5 26,5 29,5 -

Xi . Fi
116 262,5 143,5 70,5 318 147,5 1058

x=

1058 = 21,2 comprimido s 50

Xi. Fi

80

Elaborado por Gerson Bacury


2 passo: De posse do resultado da Mdia construiremos a coluna X2. Fi, para

assim ento procedermos ao clculo para a Varincia.


Comprimidos ntd Ingeridos (no ms) Q Atletas

Classes
13 16 19 22 25 28 16 19 22 25 28 31

Fi
8 15 7 3 12 5 50

Xi
14,5 17,5 20,5 23,5 26,5 29,5 -

Xi . Fi
116 262,5 143,5 70,5 318 147,5 1058

X2 . Fi
1682 4593,8 2941,8 1656,8 8427 4351,3 23652,7

S2 =

23652,7 2 (212) = 23,6 comprimidos 2 , 50

Xi. Fi X2. Fi

Logo a varincia para a quantidade de comprimidos ingeridos igual a 23,6 comprimidos2.

COMENTRIO: Aps o clculo da varincia nota-se que a unidade da varivel em questo est elevada ao quadrado, portanto, em algumas situaes, a anlise dos dados no tem sentido. Assim comenta Vieira (2003, p.65-66): Como medida de disperso, a varincia tem a desvantagem de apresentar unidade de medida igual
ao quadrado da unidade de medidas de dados. [...] Isso acontece porque a

varincia obtida a partir da soma de quadrados dos desvios. Logo, se a unidade de medida dos dados expressa em comprimidos exemplo acima a varincia expressa em comprimidos quadrados. Para corrigir essa deficincia utiliza-se o emprego do Desvio Padro.

DESVIO PADRO (S)

81

Elaborado por Gerson Bacury

Matematicamente definido como a raiz quadrada da varincia. Segundo Callegari-Jacques (2003, p.36):
Uma dificuldade com a varincia, como medida descritiva da disperso, o fato de no poder ser apresentada com a mesma unidade com que a varivel foi medida [...]. A soluo extrair a raiz quadrada positiva da varincia, j que, com isso, se volta unidade original da varivel. Essa nova medida de variabilidade denominada desvio padro.

Notaes: quando a seqncia de dados representarem uma populao ento o desvio padro ser representada por

e, quando representar uma

amostra ser indicado por S. Aqui trabalharemos apenas com o desvio padro amostral. Logo temos que:

S = S2
Ex.: Para os exemplos mostrados anteriormente (tempo de preparao de atletas, idade de crianas com desnutrio e comprimidos ingeridos por atletas) no estudo da varincia, calcule os respectivos desvios padro.

MTODO DE RESOLUO

1 caso: tempo de preparao de atletas:

S2 = 0,8 meses2 S = 0,8 meses 2 = 0,9 meses


2 caso: idade de crianas com desnutrio:

S2 = 1,5 anos2 S = 1,5 anos 2 = 1,2 anos


3 caso: comprimidos ingeridos por atletas:

S2 = 25,8 comprimidos2 S = 23,6 comprimido 2 = 4,9 comprimido s s

MEDIDAS DA DISPERSO RELATIVAS

82

Elaborado por Gerson Bacury

COEFICIENTE DE VARIAO (Cv) uma medida de disperso relativa (expresso em percentual) que analisa o grau de concentrao em torno da mdia para sries distintas. Para CallegariJacques (2003), quando analisamos duas amostras para a mesma varivel, podemos comparar os desvios padro verificando onde ocorreu maior variao, porm, a situao muda quando se trata de variveis distintas, neste caso, devemos utilizar uma medida de disperso independente da unidade de mensurao da varivel, chamada coeficiente de variao. definido como a razo entre o desvio padro e a mdia, calculado atravs da expresso:

Cv =

S .100 x

O Coeficiente de Variao se configura como uma medida de disperso mais completa quando comparado s mediadas de disperso absoluta. Assim comenta Silva (1999a, p.121-122):
Como a medida de disperso relativa leva em considerao a medida de disperso absoluta e a mdia da srie, uma medida mais completa que a medida de disperso absoluta. Portanto, a medida de disperso relativa prevalece sobre a medida de disperso absoluta. Podemos afirmar que a srie que tem a maior disperso relativa, tem de modo geral a maior disperso.

Vamos analisar essa situao por meio do estudo de caso abaixo. Ex.: Em uma academia, o salrio dos estagirios de Educao Fsica do sexo masculino em mdia de R$ 400,00 com desvio padro de R$ 150,00 enquanto que as estagirias ganham em mdia R$ 300,00 com desvio padro de R$ 120,00. Determine quem possui o salrio mais homogneo (menos disperso).

MTODO DE RESOLUO 83

Elaborado por Gerson Bacury

1 passo: Devemos calcular os coeficientes de variao para os salrios de

ambos os sexos:

Cv masculino = Cv fe min ino =

150 .100 = 37,5 % 400

120 .100 = 40 % 300

Logo o salrio das estagirias apresenta maior variabilidade, ou seja, os estagirios possuem os salrios mais homogneos. Observe que o desvio padro (medida de disperso absoluta) para o salrio dos estagirios maior que no salrio das estagirias, mas nem por isso, deixou de possuir menor disperso. Quando analisamos uma srie de valores, de maneira individual, podemos utilizar um parmetro para medir a disperso por meio do Coeficiente de Variao Analisando individualmente uma srie, podemos classific-la com mdia, baixa ou alta disperso segundo os parmetros abaixo:
Se Cv 10% BaixaDisperso Se 10% < Cv 20% Mdia Disperso Se Cv > 20% Alta Disperso

84