Vous êtes sur la page 1sur 31

Medidas de Posio Moda(mo): o valor (ou atributo) que ocorre com maior freqncia.

Moda Ex: 4,5,4,6,5,8,4,4 Mo = 4


Variavel qualitativa

Mdia
x =

x1 +x2 +x3 +... +xn


n

1 = i= n

Ex:2,5,3,7,8 Mdia = [(2+5+3+7+8)/5]=5


2

A mediana o valor da varivel que ocupa a posio central de um conjunto de n dados ordenados. Posio da mediana: (n+1)/2 Ex: 2,5,3,7,8 Dados ordenados: 2,3,5,7,8 => (5+1)/2=3 => Md = 5

Mediana

Ex: 3,5,2,1,8,6 Dados ordenados:1,2,3,5,6,8 (6+1)/2=3,5 => Md=(3+5)/2=4 =>


3

Percentis
O percentil de ordem px100 (0<p<1), em um conjunto de dados de tamanho n, o valor da varivel que ocupa a posio px(n+1) do conjunto de dados ordenados. O percentil de ordem p (ou p-quantil) deixa px100% das observaes abaixo dele na amostra ordenada. Casos Particulares:
Percentil 50 = mediana, segundo quartil(md,Q2,q(0,5))

Percentil 25= primeiro quartil (Q1), q(0,25) Percentil 75= terceiro quartil (Q3) , q(0,75)

Exemplos
Ex(1): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 =>n=10
Posio Md:0,5(n+1)=0,5x11=>Md=(3+3,1)/2=3,05 Posio de Q1:0,25(11)=2,75=> Q1=(2+2,1)/2=2,05 Posio de Q3:0,75(11)=8,25=>Q3=(3,7+6,1)/2=4,9

Ex(2):0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 =>n=11 Md=5,3 Q1=1,7 Q3=12,9

Exemplo 2: Considere as notas de um teste de 3 grupos de alunos: Grupo 1: 3, 4, 5, 6, 7; Grupo 2: 1, 3, 5, 7,9; e Grupo 3: 5,5,5,5,5.

G1 G2

0 0

10 10

G3

0
5

10

Temos : x 1 = x 3 = x 3 = 5

Md 1 = Md 3 = Md 3 = 5
6

Medidas de Disperso
Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados Amplitude (A): A=mx-min Para os grupos anteriores, temos: Grupo 1, A=4 Grupo 2, A=8 Grupo 3, A=0
7

Intervalo-Interquartil (d)
a diferena entre o terceiro quartil e o primeiro quartil, ou seja, d= Q3-Q1

Ex(1): 15,5,3,8,10,2,7,11,12 Q1=4,5 e Q3=11,25 d =Q3-Q1=4,9-2,05=2,85


Max,Min,Q1,Q3,Q2: importantes para se ter uma boa ideia da forma dos dados (simetrica ou assimetrica) e construir box-plots
8

Varincia
S
2

( x1 x ) + ( x 2 x ) + ...+ ( x n x ) =
2 2

n1

( xi x ) 2
i =1

n1

Desvio padro S

Desvio Padro : S = Varincia

Clculo da varincia para o grupo 1:

G1:3, 4, 5, 6, 7: Vimos que:


(3 5) 2 + (4 5) 2 + (5 5) 2 + (6 5) 2 + (7 5) 2 1 0 S2 = = = 2,5 5 1 4

x =5

Desvio padro
2

S = 2,5 = 1,58

G1 : S = 2,5 G 2 : S = 10 G3 : S = 0
2 2

S = 1,58 S = 3,16 S =0
10

Coeficiente de Variao (CV)


uma medida de disperso relativa; Elimina o efeito da magnitude dos dados; Exprime a variabilidade em relao a mdia til Comparar duas ou mais variveis

S CV = 100 % X

11

Exemplo 4: Altura e peso de alunos


Mdia Altura Peso 1,143m 50Kg Desvio padro 0,063m 6kg Coeficiente de variao 5,5% 12%

Concluso: Com relao as mdias, os alunos so, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto a altura

12

ORGANIZAO E REPRESENTAO DOS DADOS


Uma das formas de organizar e resumir a informao contida em dados observados por meio de tabela de freqncias e grficos.

Tabela de freqncia: relaciona categorias (ou classes) de valores,

juntamente com contagem (ou freqncias) do nmero de valores que se enquadram em cada categoria ou classe. 1. Variveis qualitativas: Podemos construir tabela de freqncia que os quantificam por categoria de classificao e sua representao grfica mediante grfico de barras, grfico setorial ou em forma de pizza.

13

Exemplo 1: Considere ao varivel grau de Instruo dos dados da tabela 1.(Varivel qualitativa) Grau de instruo 1o Grau 2o Grau Superior total

Tabela de freqncia
Contagem

fi
12 18 6 n=36

f ri
0,3333 0,5000 0,1667 1,0000

f ri %
33,3% 50 % 16.7% 100%

fi
f ri

:Frequncia da categoria i (nmero de indivduos que pertencem categoria i f = i : Frequncia relativa da categoria i n

f ri % = f ri *100% : Frequncia relativa percentual da categoria i


14

Representao grfica de variveis qualitativas


Grfico de Barras Diagrama circular, de sectores ou em forma de pizza
D ga ad b ra p r av r e i r m e ar s aa ai v l a ga d i sr o r u e n t u
6, 0 00 % 5, 0 00 % 4, 0 00 % 3, 3 33 % 3, 0 00 % 2, 0 00 % 1, 0 00 % 00 % ,0 1 Gu o r a 2 Gu o r a Sp r r u eio 1, 0 67 % 5, 0 00 %

15

Diagrama circular para a variavel grau de instruo

1 G (33 ) o rau .3%

D ia g r a m a c ir c u la r p a r a a v a r i v e l g r a in s t r u o
S u p e r io r 17%

1 o G ra u 33%

2oG (50 ) rau .0%

S e r (1 .7% up rio 6 )

2 o G ra u 50%

16

2. Organizao e representao de variveis quantitativas 2.1 Quantitativas discretos: Organizam-se mediante tabelas de frequncias e a representao grfica mediante grfico de barras Exemplo: Considere a varivel nmero de filhos dos dados da tabela 1. Tabela 2.1:Distribuio de freqncias de funcionrios da empresa, segundo o nmero de filhos
i 1 2 3 4 5 Nmero de filhos (Xi ) 0 1 2 3 5 total Nmero de funcionrios (fi ) 4 5 7 3 1 20 % de funcionrios (fri) 20% 25% 35% 15% 5% 100%
17

Observao 1: A partir da tabela 2.1 podemos recuperar as 20 observao da tabela 1.1, ou seja, aqui no temos perda de informao dos dados originais. Representao grfica : Diagrama de Barras

35

35%

Mo=2

% de funcionrios

25 20%

25%

15% 15 5% 5 0 1 2 3 4 5

Nmero de filhos
18

Determinao das medidas de posio e medidas de disperso para variveis quantitativas discretas agrupados em tabela de freqncias:

Mdia:

X 1 f1 + X 2 f 2 + + X k f k X= = n

X
i =1

fi

Exemplo: Considere a tabela 2.1 e determine a mdia de filhos dos funcionrios.

X=
Mediana:

0 4 + 1 5 + 2 7 + 3 3 + 5 1 33 = = 1,65 20 20

Dados ordenados: 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 => (20+1)/2=10,5

=> Md = (2+2) /2=2

19

Varincia:

( X 1 X ) 2 f1 + ( X 2 X ) 2 f 2 + + ( X k X ) 2 f k S = = n 1
2

(X
i =1

X )2 fi

Clculo da varincia para os dados da tabela 2.1


2

n 1

4(0 1,65) 2 + 5(1 1,65) 2 + 7(2 1,65) 2 + 3(3 1,65) 2 + (5 1,65) 2 S = 19 16,3125 = = 0,858553 19
Desvio padro:

S = S 2 = 0,858553 = 0,927

20

2.2 Quantitativas continuas: Os seus valores podem ser qualquer nmero real e ainda geralmente existe um grande nmero de valores diferentes. Como proceder a construir uma tabela de frequncia nestes casos?

A alternativa consiste em construir classes ou faixas de valores e contar o nmero de ocorrncias em cada faixa

No caso da variavel salario podemos considerar as seguintes faixas de valores: [4,0; 7,0); [7,0;10,0);...... NOTAO: 4,0|----7,0

21

2.2 Procedimento de construo de tabelas de freqncia para variveis contnuas: 1. Escolha o nmero de intervalos de classe (k) 2. Identifique o menor valor (MIN) e o valor mximo (MAX) dos dados. 3. Calcule a amplitude dos dados (A): A=MAX MIN A 4. Calcule o comprimento de cada intervalo de classe (h): h = k 5. Arredonde o valor de h de forma que seja obtido um nmero conveniente. 6. Obtenha os limites de cada intervalo de classe.
PR E O IM IR IN R A O TE V L : L 1 =M I IN : L 1 = LI 1 + h S : L ite inferior im L ite superior im

22

SGNO E UD IN E V L T RAO : L ite in rio im fe r : L 2 =L 1 I S L ite im s p rio ue r :L S


2

=L I

+h :

k - IM S O L ite im L ite im

IN E V L T R AO :L I
k

in rio fe r s p rio ue r

=L S
k

k 1 k

:L S

=L I

+h

7. Construa uma tabela de freqncias, constituda pelas seguintes colunas: Nmero de ordem de cada intervalo (i) Limites de cada intervalo. Os intervalos so fechados esquerda e aberta direita: NOTAO:|----

23

Ponto mdio (ou marca de classe) de cada intervalo de classe:

LS i + LI i = 2

Contagem dos dados pertencentes a cada intervalo. Freqncias absolutas de cada intervalo de classe. Freqncias relativas de cada intervalo de classe. Freqncias acumuladas absolutas de cada intervalo de classe.

Fi = f 1 + f 2 + + f i =

f
j= 1

Freqncias acumuladas relativa de cada intervalo de classe.

Fri = f r1 + f r2 + + f ri =

j =1

Fi f r j ; ou Fri = n
24

Exemplo: Considere a varivel salrio da empresa comercializadora de produtos de informtica. Procedimento: 1. Considere k=5. 2. MIN=4; MAX=23,30. 3. A=MAX-MIN=23,30-4=19,30 4. h=19,3/5=3,86 5. h 3,9 6. Clculo dos limites de cada intervalo:
P IM IR R E O L 1 =4 I L 1 =4 +3,9 =7,9 S SGN O E U D L I L S
2 2

IN E V L TR AO

IN E V L TR AO

=7,9 =7,9 +3,9 =1 ,8 1

Os demais limites dos procedimento anterior.

intervalos

foram

gerados

seguindo

o
25

Ponto mdio:X 1 =

( 4 + 7,9) = 5,95;
2

X2 =

( 7,9 + 11,8) = 9,85.....


2

De forma similar obtm-se os outros pontos mdios. Tabela 2.2: Distribuio de freqncias da varivel salrio.
i Intervalos de classe 4,0 | -- 7,9 7,9 |-- 11,8 11,8 |-- 15,7 15,7 |-- 19,6 19,6 |-- 23,5 Total Ponto mdio (X i)
5,95 9,85 13,75 17,65 21,55

Freqncia Freqncia Absoluta (f i) Relativa ( f ri ) 10 12 7 6 1 36


0,277778 0,333333 0,194444 0,166667 0,027778 1,000000

Freqncia Acumulada Absoluta (F i) 10 22 29 35 36

Freqncia Acumulada Relativa ( Fri )


0,277778 0,611111 0,805556 0,972222 1

1 2 3 4 5

26

Representao grfica: Histograma de freqncias relativas (em %) para a varivel salrio

33,33% 30 27,78%

% de funcionrios

20

19.44% 16,67%

10 2,7% 0 4.0 7.9 11.8 15.7 19.6 23.5

Salrio

27

Histograma de freqncia acumulada relativa (em %) Aprox. 61% dos empregados possuim salrio inferior a 12 salarios mnimos
Frequncia acum ulada percentual (%)
100 80,56% 61,11% 50 27,78% 97,22% 100%

0 4.0 7.9 11.8 15.7 19.6 23.5

Aprox. 19% dos empregados possuim salrio superior a 16 salrios mnimos

Salario

28

Grfico de Ramo e Folhas: Varivel salrio


4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 30 00 56 25 73 26 66 86 39 44 59 12 46 74 95 13 35 77 80 53 76 06 59 00 79 23 60 85 69 71 99 22 61 26 75 40

Valores

concentrados entre 4 e 19

Leve assimetria na direo dos valores grandes( assimtrica direita) Destaque do valor 23.30

29

Medidas de posio e medidas de disperso para variveis contnuas agrupadas em tabela de freqncias. Mdia:
X =
X1

f 1 + X f 2 + X f k = n

X
i= 1

fi

Exemplo: Considere a tabela 2.2


X = 5,95 10 + 9,85 12 +13 ,75 7 +17 ,65 6 + 21,55 1 36 401,4 = = 11,15 35

Se calculamos a mdia para dados no agrupados apresentadas anteriormente resulta:


X = X 1 + X 2 + + X 36 4 + 4,36 + + 23 ,30 = =11,122 36 36

Este resultado difere do valor obtido anteriormente. Porque?


30

Varincia:

S2 =

f (X
k i i =1

n 1

Exemplo: Considere a tabela 2.2. Vimos que


i 1 2 3 4 5 Intervalos de classe 4,0 |-- 7,9 7,9 |-- 11,8 11,8 |-- 15,7 15,7 |-- 19,6 19,6 |-- 23,5 Total Xi
5,95 9,85 13,75 17,65 21,55

X = 11,15
f i X i X
270,40 20,28 47,32 253,50 108,16 699,66

fi 10 12 7 6 1 36

S2 =

f (X
5 i i =1

36 1

699,66 = 19,99029 35

S = 4,47105 (Desvio Padro)

31

Vous aimerez peut-être aussi