Vous êtes sur la page 1sur 29

Estatstica Descritiva

(I)

O que Estatstica
Origem relacionada com a coleta e construo de tabelas de dados
para o governo.
A situao evoluiu: a coleta de dados representa somente um dos
aspectos da Estatstica.
No sculo XIX, o desenvolvimento do clculo de probabilidade e
outras metodologias matemticas, tais como a tcnica de Mnimos
Quadrados, foram fundamentais para o desenvolvimento da Estatstica.

No sculo XX a Estatstica desenvolve-se como uma rea especfica


do conhecimento a partir do desenvolvimento da Inferncia Estatstica,
metodologia que faz uso da Teoria das Probabilidades e com ampla
aplicao em cincias experimentais.
A Estatstica hoje consiste em uma metodologia cientfica para
obteno, organizao e anlise de dados oriundos das mais variadas
reas das cincias experimentais, cujo objetivo principal auxiliar a
tomada de decises em situaes de incerteza.
2

Estatstica
Populao
Caractersticas

Tcnicas de amostragem

Amostra
Anlise
descritiva

Concluses
sobre as
caractersticas
da populao

Inferncia
estatstica

Informaes contidas
nos dados

Amostragem
Associada coleta de dados, a tecnologia da amostragem
desenvolveu um conjunto de tcnicas para obteno de amostras
convenientemente obtidas da populao de interesse.
Exemplos de uso:
Pesquisas de mercado
Pesquisas de opinio pblica
Ensaios clnicos
4

Estatstica Descritiva
Etapa inicial da anlise utilizada para descrever, organizar
e resumir os dados coletados.
A disponibilidade de uma grande quantidade de dados e de
mtodos computacionais muito eficientes revigorou esta
rea da Estatstica.

Probabilidade
A teoria das probabilidades auxilia na modelagem de
fenmenos aleatrios, ou seja, aqueles em que est presente
a incerteza.
uma ferramenta fundamental para a inferncia estatstica.

Inferncia Estatstica
Conjunto de tcnicas que permite, a partir de dados
amostrais, tirar concluses sobre a populao de interesse,
controlando erros.
6

Exemplo 1:
Numa pesquisa eleitoral, um instituto de pesquisa tem como
objetivo prever o resultado da eleio, utilizando uma
amostra da populao.

Considere o Candidato A:
Denomine por p a proporo de pessoas (na populao)
que votaro em A na eleio.
Denomine por p^ a proporo de pessoas no
levantamento de opinio que expressam inteno
de voto em A.
Estimao: Podemos usar o valor de ^p para estimar
a proporo p da populao.
8

Em anos de eleies, os institutos de pesquisa de opinio


colhem periodicamente amostras de eleitores para obter as
estimativas de inteno de voto da populao. As estimativas
so fornecidas com um valor e uma margem de erro.

Pesquisa Sensus
Os quadros, apresentados a seguir, referem-se inteno
de voto para presidente do Brasil para o primeiro e
segundo turnos das eleies de 2010.
A resposta foi estimulada e nica.
Pergunta realizada: Se a eleio para presidente fosse
hoje e os candidatos fossem estes, em quem o(a) Sr.(Sra)
votaria?
9

Inteno de voto para presidente do Brasil, 1 Turno 2010

Pesquisa Sensus, em % do total de votos.


2.000 eleitores - Margem de erro de 2,2% com 95% de confiana.
10

Inteno de voto para presidente do Brasil, 2 Turno 2010

Pesquisa Sensus, em % do total de votos.


2.000 eleitores - Margem de erro de 2,2% com 95% de confiana.
11

Estatstica Descritiva
O que fazer com as observaes que
coletamos?

Primeira Etapa:
Resumo dos dados = Estatstica descritiva

12

Varivel:
Qualquer caracterstica associada a uma populao.

Classificao das variveis:


NOMINAL

sexo, cor dos olhos

ORDINAL

classe social, grau de instruo

CONTNUA

peso, altura, salrio, idade

DISCRETA

nmero de filhos, nmero de carros

QUALITATIVA

QUANTITATIVA

13

Variveis Quantitativas
MEDIDAS DE POSIO:
Mnimo, Mximo, Moda, Mdia, Mediana, Percentis

MEDIDAS DE DISPERSO:
Amplitude, Intervalo-Interquartil, Varincia, Desvio
Padro, Coeficiente de Variao.

14

Medidas de Posio
Mximo (max): a maior observao
Mnimo (min): a menor observao
Moda (mo): o valor (ou atributo) que ocorre com
maior frequncia.
Dados: 4, 5, 4, 6, 5, 8, 4
max = 8

min = 4

mo = 4

15

Mdia:
n

x1 x2 x3 ... xn
x

x
i 1

Dados: 2, 5, 3, 7, 8

253 7 8
x
5
5

16

Mediana:
A mediana o valor da varivel que ocupa a posio
central de um conjunto de n dados ordenados.

Posio (ordem) da mediana: n+1


2

17

Exemplos:
Dados: 2, 6, 3, 7, 8

n = 5 (mpar)

Dados ordenados: 2 3 6 7 8 ordem: 5+1 = 3o. Md=6


2
Posio da Mediana

Dados: 4, 8, 2, 1, 9, 6

n = 6 (par)

Dados ordenados: 1 2 4 6 8 9

Md

6+1 = 3,5o.
2

Md = (4 + 6) / 2 = 5
18

Percentil:
O percentil de ordem p 100 (0 < p < 1), em um
conjunto de dados de tamanho n, o valor da varivel
que ocupa a posio p (n + 1) do conjunto de dados
ordenados.

Casos particulares:
percentil 50 = mediana ou segundo quartil (Md)
percentil 25 = primeiro quartil (Q1)
percentil 75 = terceiro quartil (Q3)
percentil 10 = primeiro decil
19

Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7

n=10

Posio de Md: 0,5(n+1)= 0,511= 5,5 Md = (3 + 3,1)/2 = 3,05

Posio de Q1: 0,25 (11) = 2,75 Q1=( 2+2,1)/2=2,05


Posio de Q3: 0,75 (11) = 8,25 Q3=(3,7+6,1)/2=4,9
Md = 3,05

Q1 = 2,05

Q3 = 4,9

Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6

n=11

Md = 5,3

Q1 = 1,7

Q3 = 12,9

Observao: os softwares utilizam frmulas de clculo de


percentis um pouco diferentes e, assim, podem fornecer
valores um pouco diferentes.
20

Exemplo 2: Considere as notas de um teste de 3 grupos de alunos.


Grupo 1: 3,4,5,6,7

Grupo 2: 1, 3, 5, 7, 9

Grupo 3: 5,5,5,5,5

* * * * *
G1
*

G2
*
*
*
*
*

G3
0

Temos: x1 = x2 = x3 = 5

10

e md1= md2= md3 = 5


21

Medidas de Disperso
Finalidade: encontrar um valor que resuma a
variabilidade de um conjunto de dados.

Amplitude (A):

A = mx - min
Para os grupos anteriores, temos:
Grupo 1, A = 4
Grupo 2, A = 8
Grupo 3, A = 0
22

Intervalo-Interquartil:
a diferena entre o terceiro quartil e o primeiro
quartil, ou seja, Q3 - Q1.

Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
Q1 = 2,05

Q3= 4,9

Q3 - Q1 = 4,9 - 2,05 = 2,85

23

Varincia:
n

( x1 x ) ( x2 x ) ... ( xn x )
Varincia s

n 1
2

2
(
x

x
)
i
i 1

n 1

Desvio padro:

Desvio padro s Varincia

24

Clculo para os grupos:


G1: s2 =(3-5)2+ (4-5)2+ (5-5)2+ (6-5)2+ (7-5)2
4
s2 = 10/4= 2,5

s = 1,58

G2: s2 = 10 s = 3,16
G3: s2 = 0 s = 0
25

Frmula alternativa para Varincia:


n

S
2

X
i 1

2
i

nX

(n 1)

Em G1: Xi2 = 9 + 16 + 25 + 36 +49 = 135


S2 = 135 - 5(5)2 = 2,5
4
26

Coeficiente de Variao (CV)


- uma medida de disperso relativa
- elimina o efeito da magnitude dos dados
- exprime a variabilidade em relao mdia

s
CV 100%
x

27

Exemplo 3:
Altura e peso de alunos

Mdia
Altura
Peso

1,50m
50 kg

Desvio
Padro
0,05m
3,5kg

Coef. de
Variao
3,3%
7%

Concluso: Os alunos so, aproximadamente, duas


vezes mais dispersos quanto ao peso do que quanto
altura.
28

Exemplo 4:
Altura (em cm) de uma amostra de recmnascidos e de uma amostra de adolescentes
Mdia
Recm-nascidos
Adolescentes

50
160

Desvio
padro
6
16

Coef. de
variao
12%
10%

Concluso: Em relao s mdias, as alturas dos


adolescentes e dos recm-nascidos apresentam
variabilidade quase iguais.
29