Vous êtes sur la page 1sur 48

Estatstica I

Aula 3
Prof.: Patricia Maria Bortolon, D. Sc.

Estatstica: Prof. Andr Carvalhal

Dados quantitativos: medidas numricas

Propriedades
Numricas
Tendncia
Central

Disperso

Formato

Mdia

Amplitude

Mediana

Varincia

Moda

Desvio Padro

Quantis

Assimetria

Coeficiente de Variao

Estatstica: Prof. Luis Araujo

Propriedades Numricas dos Dados

Tendncia Central
(Localizao)

Variao
(Disperso)

Forma

Estatstica: Prof. Luis Araujo

Notao

Medida
Mdia
Desvio Padro

Amostra

Populao

Varincia

Tamanho

Medidas de tendncia central


Mdia Aritmtica
x=

soma dos valores de x


x
=
nmero de observaes
n

Propriedades da mdia:
Centro de gravidade
Mais informativa no caso de distribuies aproximadamente
simtricas
A soma dos desvios em relao a mdia igual a zero

(x x) = 0
i

influenciada por valores extremos.

Medidas de tendncia central


Mdia Amostral

x=

i =1 i

x = estatstica

Mdia Populacional

x
i =1 i

= parmetro

Exemplo 1
Se as lmpadas de uma amostra duram 967, 949, 952, 940 e 922
horas de uso continuado, o que podemos concluir sobre a
durao mdia das 40.000 lmpadas do lote?
Soluo:

967 + 949 + 952 + 940 + 922


x=
= 946 horas
5
Supondo que os dados so de uma amostra que represente a
populao de lmpadas podemos estimar que a durao mdia
das 40.000 lmpadas de = 946 horas
Para dados no-negativos, a mdia no s descreve o meio do
conjunto de dados, mas impe uma limitao ao seu tamanho.
Se multiplicarmos por n ambos os lados da equao x = n x ,
veremos que x = n.x e, portanto, que nenhuma parte, ou
subconjunto dos dados, pode exceder n. x .

Exemplo 2
Se o salrio anual mdio pago a trs jogadores de
basquete nos EUA na temporada 2001-2002 foi de
3.650.000 dlares, pode
(a) algum deles ter recebido 6.000.000 dlares?
(b) dois deles terem recebido, cada um, 6.000.000 dlares?

Soluo:
Como n * x = 3 * 3.650.000 = 10.950.000
(a) se um deles recebeu seis milhes, restariam 10.950.000
6.000.000 = 4.950.000 para os outros dois, de modo que
possvel.
(b) se dois deles receberam, cada um, seis milhes, isso
necessitaria de 2(6.000.000)=12.000.000 dlares. Como isso
necessitaria mais do que o total pago aos trs jogadores, no
teria sido possvel.

Exemplo 3
A editora de um livro precisa de um nmero para a
quantidade de calorias de uma fatia de pizza de
calabresa grande. Solicitando a um laboratrio que
faa o servio com um calormetro, ela recebe os
seguintes nmeros para uma fatia de pizza de seis
fornecedores diferentes: 265, 332, 340, 225, 238 e
346.
(a) calcule a mdia, que a editora ir utilizar em seu livro
(b) suponha que, ao calcular a mdia, a editora cometa o erro de
digitar 832, em vez de 238, em sua calculadora. Qual ser o
tamanho do erro no nmero que ela utilizar em seu livro?

Exemplo 3
Soluo:
(a) a mdia correta

265 + 332 + 340 + 225 + 238 + 346


6
= 291

x=

(b) a mdia errada

265 + 332 + 340 + 225 + 832 + 346


x=
6
= 390
E o erro ser um desastroso 390 291 = 99 calorias

Medidas de Tendncia Central


Mdia Ponderada
til quando as grandezas em jogo no tm a mesma importncia

w1.x1 + w2 .x2 + ... + wn .xn


=
xw =
w1 + w2 + ... + wn
xi so as observaes da amostra
wi so os pesos de cada observao

n
i =1 i i
n
i =1 i

w .x
w

Exemplo 4
Numa turma de psicologia, h 14 calouros, 25 alunos
de segundo e 16 alunos de terceiro ano. Dado que
num exame os calouros obtiveram a mdia 76, os
alunos do segundo ano a mdia 83 e alunos de
terceiro ano a mdia 89, qual a grande mdia pra
toda a classe?
Soluo:

14 76 + 25 83 + 16 89
x=
= 82,96
14 + 25 + 16

Medidas de tendncia central


Mediana (Md)
Em um conjunto de observaes ordenadas de forma crescente o
elemento que ocupa a posio central.
o valor do elemento do meio se n impar, e a mdia dos dois valores
do meio se n par.
No afetado por valores extremos.
Dados de produo:
Ms
Produo: Dados ordenados:
Jan
210
180
Fev
180
180
Mar
205
185
Abr
195
190
Mai
205
195
Jun
220
198 <== Mediana =(198 + 200) / 2 = 199
Jul
185
200 <==
Ago
190
205
Set
200
205
Out
180
205
Nov
205
210
Dez
198
220
soma =
mdia =

2.373
197,75

Medidas de tendncia central


Mediana (Md)
Varivel discreta em tabela de frequncias

xi

fi

Total de elementos = 23

Ento o termo central ocupa a posio


de no. 12

10

10

12

Como localizar o 12o. elemento?


R: construindo a frequncia acumulada

Medidas de tendncia central


Mediana (Md)
Varivel discreta em tabela de frequncias

xi

fi

Fi

Total de elementos = 23

Ento o termo central ocupa a posio


de no. 12

10

15

10

21

12

23

Como localizar o 12o. elemento?


R: construindo a frequncia acumulada

O elemento que ocupa a 12a. posio vale


8, ento, podemos afirmar que a mediana
vale 8!!

Medidas de tendncia central - posio


Quartis
Dividem um conjunto de dados dispostos em ordem crescente
em quatro partes com dimenses iguais.
Mnimo

1o. Q

2o. Quartil
= Mediana

3o. Q

25% dos dados so inferiores ao 1o. Q


50% dos dados so inferiores ao 2o. Q ou mediana
75% dos dados so inferiores ao 3o. Q

Mximo

Medidas de tendncia central - posio


Decis
Dividem um conjunto de dados dispostos em ordem crescente
em dez partes com dimenses iguais.
10% dos dados so inferiores ao 1o. Decil

Percentis
Dividem um conjunto de dados dispostos em ordem crescente
em cem partes com dimenses iguais.
1% dos dados so inferiores ao 1o. Percentil

Medidas de tendncia central


Mdia valores agrupados

xF

x=
i

Amostra:
18
29
37
44
54
Mdia =

20
30
37
45
54

20
30
37
45
56

21
31
37
45
58

22
31
38
46
62

24
32
38
47
65

25
33
38
48
25

34
40
49
26
35

41
50
27
36
43

51
29
36
44
53

38,32
14

Intervalos
das classes
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53
53 - 60
60 - 67
Total
Mdia =

12

Fi
6
10
13
8
6
5
2
50
38,50

xi
21,5
28,8
35,5
42,5
49,5
56,5
63,5

xiFi
129,0
288,0
461,5
340,0
297,0
282,5
127,0
1925,0

10
8
6
4
2
0
21,5

28,8

35,5

42,5

49,5

56,5

63,5

Medidas de tendncia central


Moda (Mo)
o valor mais frequente (a maior barra do histograma)

Intervalos
das classes
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53
53 - 60
60 - 67
Total

Fi
6
10
13
8
6
5
2
50

xi
21,5
28,8
35,5
42,5
49,5
56,5
63,5

xiFi
129,0
288,0
461,5 <== Classe Modal
340,0
297,0
282,5
14
127,0
12
1925,0
10

Mdia =

38,50

8
6
4
2
0
21,5

28,8

35,5

42,5

49,5

56,5

63,5

Medidas de tendncia central


14
12
10

Moda
Mediana (627)
Mdia

8
6
4
2

Std. Dev = 114,73


Mean = 658,6
N = 100

0
500,0
550,0
600,0
650,0
700,0
750,0
800,0
850,0
900,0
525,0
575,0
625,0
675,0
725,0
775,0
825,0
875,0
925,0

Estatstica: Prof. Andr Carvalhal

Dados quantitativos: medidas numricas

Propriedades
Numricas
Tendncia
Central

Disperso

Formato

Mdia

Amplitude

Mediana

Varincia

Moda

Desvio Padro

Quantis

Assimetria

Coeficiente de Variao

Estatstica: Prof. Andr Carvalhal

Dados quantitativos: medidas numricas

Propriedades
Numricas
Disperso
Amplitude
Varincia
Desvio Padro
Coeficiente de Variao

Por que avaliar medidas de disperso?


Exemplo: um mdico observa a variao nos
batimentos cardacos por minuto de dois pacientes.
Veja os resultados:
Paciente A:
Paciente B:

72
72

76
91

74
59

Os dois pacientes tm mdia de batimentos iguais a 74 mas a


variao muito diferente!!

Amplitude
a diferena entre o maior e o menor valor
Mede a disperso total no conjunto de dados
Mas tem um problema....

7 8 9
Balana A

10

11

12

13

7 8 9
Balana C

7 8 9
Balana B

10

11

12

10

11

12

13

No apropriada quando h observaes extremas

13

Varincia e Desvio Padro


A amplitude no descreve como os valores se distribuem em
torno da mdia, no mostra se h valores extremos...
... poderamos ento avaliar os desvios em torno da mdia

x1 x , x2 x , x3 x ,..., xn x
... mas a soma destes desvios sempre igual a zero!!
Como no nos interessa se as diferenas so positivas ou
negativas trabalhamos com os quadrados das diferenas
Uma alternativa, pouco utilizada, usar os desvios absolutos,
calculando o Desvio Mdio Absoluto

1 n
DMA = i =1 xi x
n

Varincia Amostral
a soma das diferenas ao quadrado, em torno da
mdia aritmtica, dividindo-a pelo tamanho da
amostra, menos um:

(x
n

S2 =

i =1

n 1

E a varincia da populao igual a:

(x
N

x2 =

i =1

Desvio Padro Amostral


a raiz quadrada da varincia.
a medida de disperso mais utilizada. Est na
mesma unidade dos dados originais.

(x
n

S=

i =1

n 1

E desvio padro da populao igual a:

(x
N

x =

i =1

Desvio Padro Amostral


Para calcular o desvio padro de uma amostra
devemos:

Calcular a mdia da amostra


Obter a diferena entre cada observao e a mdia
Elevar ao quadrado essas diferenas
Somar os quadrados das diferenas
Dividir o somatrio por (n-1)  voc aqui obteve a varincia
Extrair a raiz quadrada do somatrio obtido

Exemplo 5
Calcule o desvio padro da seguinte amostra:
Amostra
Dados (Xi) :

10

12

n=8

14

15

17

18

18

24

Mdia = x = 16

S=

(10 X ) 2 + (12 X ) 2 + (14 X ) 2 + L + (24 X ) 2


n 1

(10 16) 2 + (12 16) 2 + (14 16) 2 + L + (24 16) 2


8 1

126
7

4.2426

uma medida da
disperso mdia dos
dados em torno de sua
mdia

Desvio Padro Amostral


Organize seus clculos:
x=

xi

(xi x )2

xi x

total

(x
n

x =

i =1

n 1

Desvio Padro Amostrais


Comparando Desvios - Padro

Dados A
11

12

13

14

15

16

17

18

19

20 21

Mdia = 15.5
S = 3.338

20

Mdia = 15.5
S = 0.926

Dados B
11
21

12

13

14

15

16

17

18

19

Dados C
11

12

13

14

Mdia = 15.5
S = 4.570
15

16

17

18

19

20 21

Desvio Padro Amostrais


Comparando Desvios - Padro

Pequeno desvio padro

Grande desvio padro

Frmula alternativa
Frmula alternativa para o Desvio Padro Amostral

S=

xx
n 1

(
x)

onde xx = x
n

2
i =1 i

i =1 i

Vantagem desse clculo: no preciso calcular a


mdia nem os desvios em relao a mdia

Entendendo a Variao nos Dados


Quanto mais espalhados ou dispersos estiverem os
dados, maiores sero a amplitude, a varincia e o
desvio padro
Quanto mais concentrados, ou homogneos, forem
os dados, menores sero a varincia e o desvio
padro
Se as observaes forem todas iguais (de forma que
no exista nenhuma variao nos dados), a
amplitude, a varincia e o desvio padro sero todos
iguais a zero
Nenhuma das medidas de variao pode ser
negativa

Entendendo a Variao nos Dados


Voc apresentado ao desvio padro dos retornos
mensais nos ltimos trs anos de trs fundos de
investimentos
S = 7,71
S = 17,66
S = 23,17
O que voc pode dizer sobre a variao dos
retornos?
Voc pode dizer qual o fundo com maior risco?

Aplicaes do Desvio Padro


So usados nos problemas de inferncia que
veremos adiante
A disperso, e o desvio padro, so pequenos se os
dados esto concentrados em torno da mdia e
grandes se os mesmos so muito dispersos
O teorema de Tchebichev expressa formalmente
essa idia...

Teorema de Tchebichev
Para qualquer conjunto de dados (populao ou
amostra) e qualquer constante k maior do que 1, a
proporo dos dados que devem estar a menos de k
desvios-padro de qualquer um dos dois lados da
mdia pelo menos

1
1 2
k

Exemplo 6

Voc est avaliando a rentabilidade das empresas do setor varejista. A


mdia da rentabilidade sobre os ativos em 2009 foi de 10% com desvio
padro de 3%. Faa estimativas para a distribuio dos dados pelo
Teorema de Tchebychev para k igual a 2 e 3.
Soluo:

para k = 2 :
1 3
= = 75%
2
2
4
10% 2 3% pelo menos 75% das rentabilidades 10% + 2 3%
4% pelo menos 75% das rentabilidades 16%
para k = 3 :
1 8
1 - 2 = = 88,9%
3
9
10% 3 3% pelo menos 88,9% das rentabilidades 10% + 3 3%
1% pelo menos 88,9% das rentabilidades 19%
1-

Teorema de Tchebichev
O problema do Teorema de Tchebichev que ele diz
apenas pelo menos qual proporo dos dados deve
estar entre certos limites. um limite inferior para a
verdadeira proporo, tem poucas aplicaes
prticas.
Para distribuies em forma de sino podemos fazer as
seguintes afirmaes muito mais fortes.
Cerca de 68% dos valores esto a menos de um desvio-padro da
mdia, isto , entre x x e x + x
Cerca de 95% dos valores esto a menos de dois desvios-padro da
mdia, isto , entre x 2 x e x + 2 x
Cerca de 99,7% dos valores esto a menos de trs desvios-padro da
mdia, isto , entre x 3 x e x + 3 x

Frmula de converso para unidades padronizadas


Em um curso de francs um aluno obteve nota 66
em vocabulrio e 80 em gramtica.
1a. Concluso: melhor nota em gramtica que vocabulrio

E se voc agora souber que a mdia e o desvio


padro da turma em vocabulrio foram,
respectivamente, 51 e 12. Em gramtica mdia e
desvio padro das notas da turma foram,
respectivamente, 72 e 16. Como sua resposta se
altera?
Em vocabulrio a nota do aluno est (66-51)/12 = 1,25 desvios
padro acima da mdia e em gramtica (80-72)/16 = 0,50
desvios padro acima da mdia da turma.
Comparado com o resto da turma o aluno est melhor em
vocabulrio do que em gramtica.

Frmula de converso para unidades padronizadas

xx
z=
S

ou

z=

z nos diz quantos desvios-padro um valor est


acima ou abaixo da mdia do conjunto de dados ao
qual pertence.

Exemplo 7
A Sra. Santos pertence a uma faixa etria na qual o
peso mdio de 56kg, com desvio-padro de 6kg, e
seu marido, o Sr. Santos, pertence a uma faixa etria
na qual o peso mdio de 82kg, com desvio-padro
de 9kg. Se a Sra. Santos pesa 66kg e o Sr. Santos
pesa 96kg, qual dos dois, relativamente ao peso
mdio de sua faixa etria, est com maior excesso
de peso?

Exemplo 7
Soluo:
O peso do Sr. Santos est 96 82 = 14kg acima da mdia e o
peso da Sra. Santos est somente 66 56 = 10kg acima da
mdia, mas em unidades padronizadas obtemos (96-82)/9=1,55
para o Sr. Santos e (66-56)/6=1,66 para a Sra. Santos. Assim,
relativamente ao peso mdio de sua faixa etria, a Sra. Santos
est mais acima do peso do que o Sr. Santos.

Coeficiente de Disperso
O desvio padro depende das unidades de medida
O Coeficiente de Disperso uma medida relativa
de variao
Expresso na forma de percentagem e no em
termos das unidades dos dados especficos
Permite comparaes quando as variveis tm
unidades de medida diferentes

S
V = 100% ou V = 100%
x

Coeficiente de Disperso
Exemplo: o gerente de um servio de entregas est
avaliando a compra de uma nova frota de
caminhes. Quando as encomendas so carregadas
nos caminhes, no preparo para entrega, dois
importantes parmetros so considerados: peso (em
kg) e o volume (em m3) para cada item. Suponha que
numa amostra de 200 encomendas, o peso mdio
seja de 26kg com um desvio padro de 3,9kg, e o
volume mdio para cada encomenda seja 8,8m3 com
um desvio padro de 2,2m3. Como podem as
variaes de peso e volume ser comparadas?

Coeficiente de Disperso
Soluo:
para o peso o coeficiente de variao
V=3,9/26x100%=15%;
para o volume V=2,2/8,8x100%=25%.
logo, em relao mdia aritmtica, o volume de
uma encomenda muito mais varivel do que seu
peso.

Formato

Estatstica: Prof. Andr Carvalhal

1.

Descreve como os dados esto distribudos

2.

Medida: assimetria

Assimtrica
esquerda

Simtrica

Assimtrica
direita

MediaMediana
Media
Mediana Moda Media
Media=
= Mediana
Mediana=
= Moda Moda Mediana Media

Negativamente
Assimtrica

Simtrica

Positivamente
Assimtrica

Formato
Coeficiente de Assimetria de Pearson

3(mdia mediana)
SK =
desvio padro
MediaMediana
Media
Mediana Moda Media
Media=
= Mediana
Mediana=
= Moda Moda Mediana Media

Negativamente
Assimtrica

Simtrica

Positivamente
Assimtrica

Vous aimerez peut-être aussi