Vous êtes sur la page 1sur 10

Distribuio

Vamos considerar uma populao com apenas 5 pessoas, cujas rendas so:
Pessoas Renda
1 1
2 1
3 2
4 6
5 30

A renda da i-esima pessoa X
i
, com i=1, 2, ..., n., onde n o tamanho da
populao. Para o nosso exemplo: n=5, X
1
= X
2
=1, X
3
= 2, X
4
= 6 e X
5
=
30. Como cada pessoa s tem uma renda a probabilidade associada a cada
pessoa 1/n, no caso 1/5.
A Distribuio de uma varivel discreta consiste no conjunto de valores da
varivel e das suas respectivas probabilidades.
Considere agora uma populao de 200 famlias, onde Xi (i=1, ..., n) o
nmero de filhos dependentes por famlia. A distribuio de freqncia das
famlias segundo nmero de filhos, pode ser vista na tabela abaixo:
Tabela 2: Distribuio das famlias segundo nmero de filhos


N. de filhos
dependentes
(Xi)
Frequncia de
famlias (f)
Frequncia relativa
(ou probabilidade)
(f/n)
0 32 0,16
1 46 0,23
2 50 0,25
3 40 0,20
4 16 0,08
5 8 0,04
6 6 0,03
7 0 0,00
8 2 0,01
Obs: Desenhar um histograma
Nesta mesma populao de 200 famlias, Xi (i=1, ..., n) a altura de cada
chefe de famlia medida em cm. Como a altura uma varivel contnua a
distribuio de freqncia das famlias segundo a idade do chefe, deve ser
construda com base em intervalos:
Tabela 2: Distribuio das famlias segundo altura do chefe da famlia
Limite de
classes (cm)
Mdia
de altura
frequencia
absoluta
frequencia
relativa
151,5 a 156,5 154 2 0.01
156,5 a 161,5 159 6 0.03
161,5 a 166,5 164 24 0.12
166.5 a 171,5 169 40 0.20
171,5 a 176,5 174 46 0.23
176,5 a 181,5 179 44 0.22
181,5 a 186,5 184 28 0.14
186,5 a 191,5 189 8 0.04
191,5 a 196,5 194 2 0.01

Obs: Desenhar um histograma

Medidas de Tendncia Central

Uma medida de tendncia central de um conjunto de dados mostra o valor
em torno do qual se agrupam as observaes. As principais medidas de
tendncia central so: mdia aritmtica (ou simplesmente media), mediana
e moda.
MDIA ARITMTICA:
A mdia aritmtica de n dados (X
1
, X
2
, ..., X
n
) por definio, o valor

=
=
n
i
i
X
n
X
1
1

Se os dados estiverem classificados em uma distribuio de freqncia com
k classes, se X
j
(j=1, 2, ..., k) so os valores centrais das classes e f so as
respectivas freqncias, a mdia aritmtica dada por:

=
=
k
j
j j
f X
n
X
1
1

Exemplos:
Tabela 1: 8
5
30 6 2 1 1
=
+ + + +
= X
Tabela 2: 11 , 2 = X
Tabela 3: 174 = X

MEDIANA
A mediana de um conjunto de dados por definio o valor ao qual
metade dos dados igual ou inferior e a outra metade dos dados igual ou
superior.
Ex: Tabela 1; Xi=[1, 1, 2, 6, 30] => Mediana=2
Ex: Tabela 2; num total de famlias, 100 tem maios do que dois filhos e
100 tem menos do que dois filhos => Mediana=2
Quando os dados esto dispostos em distribuio de freqncia a mediana
calculada de acordo com a formula abaixo:
) (
2
1
1
1
1
h h
h
j
j
h
h
L L f
n
f
L D
|
|
|
.
|

\
|
+ =
+


Onde h a classe mediana, L
h
o limite inferior e L
h+1
o limite superior,
f
h
a freqncia da classe mediana.
Exemplo: Tabela 2; D = 171,5 +1/46* (100-72)* 5 = 174,5
MODA
A moda de um conjunto de dados o valor que ocorre com maior
freqncia, ou seja, o valor mais comum. Um conjunto de observaes
pode: no ter moda, ter uma nica moda (unimodal), duas modas (bimodal)
ou mais de duas modas (multimodal).
Exemplo:
A = [2, 3, 5, 6, 7, 10] => No tem moda
B = [1, 2, 2, 3 e 4] => unimodal: M = 2
C = [1, 1, 2, 3, 4, 4] => bimodal: M1=1 e M2=4
Na tabela 1, M=1 e na tabela 2, M=2
Quando os dados esto dispostos em uma tabela de freqncia a moda pode
ser calculada como abaixo:

) (
2
1
1 1
1
h h
h h h
h h
h
L L
f f f
f f
L M


+ =
+
+


Ex.: Tabela 3:
5 *
44 40 46 * 2
40 46
5 , 171

+ = M

M = 175,2

MDIA PONDERADA
Dado um conjunto de n valores observados (X
1
, X
2
, ..., X
n
) e os respectivos
fatores de ponderao (q
1
, q
2
, ..., q
n
), a mdia ponderada de X :

Exemplo:
Tabela 4: Preos e quantidades vendidas de feijo em 3 diferentes
estabelecimentos.
Mercado Preo (X
i
) Quantidade
vendida (q
i
)
A 10,0 200
B 8,0 700
C 12,0 100

Qual o preo mdio do feijo? 8 , 8
1000
) 100 ( 12 ) 700 ( 8 ) 200 ( 10
=
+ +
= W

MEDIDAS DE DISPERSO

Considere os seguintes conjuntos:
A = [5, 5, 5, 5, 5]
B = [3, 4, 5, 6, 7]
C = [13, 14, 15, 16, 17]
D = [1, 3, 5, 7, 9]
E = [3, 5, 5, 5, 7]
F = [3, 3, 4, 4, 5, 5, 6, 6, 7, 7]
Vejamos:
1. A mdia aritmtica do conjunto C 15 e para todos os demais a
mdia 5.
2. O conjunto A, apresenta disperso nula.
3. Os conjuntos B e C apresentam a mesma disperso, porm diferem
na mdia.
4. A disperso de D maior que a de B (dobro).
5. A disperso de E maior que a de A e menor que a de B.
6. A disperso de F igual a disperso de B.
Amplitude
a diferena entre o maior e o menor nmero observado.
Desvios em relao mdia
Se os valores observados so indicados por X
i
(i = 1, 2, ..., n), o desvio da
i-esima observao em relao a mdia definido como abaixo:
X X e
i i
=

Para os conjuntos em anlise os desvios em relao mdia so:
A = [0, 0, 0, 0, 0]
B = [-2, -1, 0, 1, 2]
C = [-2, -1, 0, 1, 2]
D = [-4, -2, 0, 2, 4]
E = [-2, 0, 0, 0, 2]
F = [-2, -2, -1, -1, 0, 0, 1, 1, 2, 2]
Varincia
A varincia encontrada dividindo-se a soma dos quadrados dos desvios
em relao mdia pelo nmero de observaes da populao:
( )
n
X X
n
e
i

= =
2
2
2
o

No caso de amostras finitas o estimador no enviesado da varincia :
( )
1 1
2
2
2

=

n
X X
n
e
S
i

Desvio Padro
a raiz quadrada da varincia:

2
o

Tabela 4: Valores de vrias medidas de disperso


Conjunto Amplitude
( )
2
X X
i


2
o

o

A 0 0+0+0+0+0=0 0 0
B 4 4+1+0+1+4=10 2
2
C 4 4+1+0+1+4=10 2
2
D 8 16+4+0+4+16=10 8
2 2
E 4 4+0+0+0+4 1,6
2
F 4 4+4+1+1+0+0+1+1+4+4=20 2
2

Igualdade Importante:
( )

=
2
2 2
1
) (
i i i
X
n
X X X

No caso dos dados estarem agrupados em uma distribuio de freqncia,
as medidas de disperso podem ser expressas como:
( )
n
f X X
j j

=
2
2
o
e
( )
1
2
2

=

n
f X X
S
j j

( )

=
2
2 2
1
) (
j j j j j j
f X
n
f X f X X
, n = Ef.


Exerccios utilizando STATA
1. Encontre e compare a Mdia, Mediana, Moda e o Desvio Padro e
amplitude das variveis: sexo, idade, raa, renda e escolaridade.

Comandos:
- sum varivel [w=peso], det
- tab varivel [w=peso]

Mdia Mediana Moda D. Padro Amplitude
Sexo 0,4870 0 0 0,4998 1
Idade 30,7 28 12 20,4 119
Raa 0,5035 1 1 0,5000 1
Renda 753,8 400 350 1428,8 120.000
Escolaridade 6,74 6 1 4,62 15

2. Calcule o logaritmo neperiano da renda (lnrenda) e compare novamente
a Mdia, Mediana, Moda e o Desvio Padro e amplitude das variveis:
sexo, idade, raa, lnrenda e escolaridade.

Comandos:
- gen lnrenda= ln(renda)
- tab lnrenda [w=peso], det

Mdia Mediana Moda D. Padro Amplitude
Sexo 0,4870 0 0 0,4998 1
Idade 30,7 28 12 20,4 119
Raa 0,5035 1 1 0,5000 1
lnrenda 6,22 6,19 5,86 0,99 10,60
Escolaridade 6,74 6 1 4,62 15

3. Faa o grfico com a distribuio das variveis: sexo, raa, escolaridade.

4. Qual o Estado (regio) do Brasil com maior porcentagem de mulheres?

Comandos:
- tab uf(ou reg) sexo [w=peso], row

Estado 33 (Rio de Janeiro) 53,07% de mulheres
Regio 3 (Suldeste) 51,81% de mulheres

5. Dentre os Estados (regies) brasileiros (as) em qual est concentradas
um nmero maior de mulheres?

Estado 35 (So Paulo) 21.203.895 mulheres
Regio 3 (Suldeste) 41.316.122 mulheres

6. Qual o Estado (regio) do Brasil com maior porcentagem de brancos?

Comandos:
- tab uf(ou reg) raca [w=peso], row

Estado 42 (Santa Catarina) 87,46% de brancos
Regio 4 (Sul) 80,26% de brancos

7. Dentre os Estados (regies) brasileiros (as) em qual est concentrado um
nmero maior no branco?

Estado 35 (So Paulo) 12.578.994 no-brancos
Regio 2 (Nordeste) 36.393.964 no-brancos

8. Agrupe a populao por geraes (de 5 em 5 anos) iniciando em 1931 e
calcule:
a. Distribuio das famlias segundo geraes.
b. Idade mdia de cada coorte.
c. Distribuio da renda segundo geraes

Comandos:
- gen dn= ano-idade
- gen coorte=1 if dn>1931 & dn<=1936
- replace coorte= 2 if dn>1936 & dn<=1941
- replace coorte= 3 if dn>1941 & dn<=1946
- replace coorte= 4 if dn>1946 & dn<=1951
- replace coorte= 5 if dn>1951 & dn<=1956
- replace coorte= 6 if dn>1956 & dn<=1961
- replace coorte= 7 if dn>1961 & dn<=1966
- replace coorte= 8 if dn>1966 & dn<=1971
- replace coorte= 9 if dn>1971 & dn<=1976
- replace coorte= 10 if dn>1976 & dn<=1981
- tab coorte [w=peso], sum (idade)
- tab coorte [w=peso]
- tab coorte [w=peso], sum (renda)

Gerao Idade Mdia Frequncia Renda Mdia D.P. da Renda
1: ]1931-1936] 72 3,38 485,51 1212,79
2: ]1936-1941] 67 4,56 646,95 1783,85
3: ]1941-1946] 62 5,75 776,01 1739,85
4: ]1946-1951] 57 7,44 949,47 1919,51
5: ]1951-1956] 52 9,69 1060,21 2351,04
6: ]1956-1961] 47 10,96 1042,68 1788,88
7: ]1961-1966] 42 13,28 982,36 1588,45
8: ]1966-1971] 37 13,88 874, 38 1403,95
9: ]1971-1976] 32 14,56 806,25 1325,58
10: ]1976-1981] 27 16,50 674,83 934,94
d. Distribuio da renda segundo geraes, para cada uma das 5 regies

Comandos:
- tab reg if coorte==1, sum (renda);
- tab reg if coorte==2, sum (renda);
- tab reg if coorte==3, sum (renda);
- tab reg if coorte==4, sum (renda);
- tab reg if coorte==5, sum (renda);
- tab reg if coorte==6, sum (renda);
- tab reg if coorte==7, sum (renda);
- tab reg if coorte==8, sum (renda);
- tab reg if coorte==9, sum (renda);
- tab reg if coorte==10, sum (renda);


Renda
Gerao Norte
(1)
Nordeste
(2)
Suldeste
(3)
Sul
(4)
Centro-Oeste
(5)
1: ]1931-1936] 283 308 634 476 992
2: ]1936-1941] 464 449 793 680 1062
3: ]1941-1946] 598 560 985 860 973
4: ]1946-1951] 759 653 1168 1099 1150
5: ]1951-1956] 844 722 1230 1171 1367
6: ]1956-1961] 895 726 1197 1101 1307
7: ]1961-1966] 782 639 1140 1061 1292
8: ]1966-1971] 763 576 996 995 1148
9: ]1971-1976] 653 533 921 952 1035
10: ]1976-1981] 555 458 785 787 819

Vous aimerez peut-être aussi