Académique Documents
Professionnel Documents
Culture Documents
Estatística I
Definição
Antonio A. Crespo define Estatística como :
Estatística é uma parte da matemática
aplicada que fornece métodos para a coleta,
a organização, a descrição, a análise e a
interpretação de dados quantitativos e
qualitativos, e a utilização desses dados para
a tomada de decisão.
Análise Exploratória de Dados
Introdução
Análise
Exploratória
Conclusões Informações
sobre as Inferência
contidas nos
características dados
Estatística
da população
Análise Exploratória de Dados
Estatística permite:
• “Invisibilidade” da Estatística
• Armadilha da atividade
Método Estatístico
- Externa : Informante
Amostra : é um subconjunto
finito de uma população
POPULAÇÃO E AMOSTRA
Devido a quantidade excessivamente grande de elementos
que constantemente fazem parte da população,
trabalhamos com uma amostra.
O aspecto comum dentre todas as técnicas existentes é a
aleatoriedade, isto é, a igual chance que cada elemento da
população deve ter de ser escolhido, as principais:
Qualitativas
Ordinais
Variáveis
Discretas
Quantitativas
Contínuas
Variável
Variável Tipo
1 Número de dependentes Quantitativa, discreta
2 Idade Quantitativa, contínua
3 Local de nascimento Qualitativa, nominal
4 Nível educacional Qualitativa, ordinal
5
6
7
8
Variável
DISCRETA - É uma representação tabular de um conjunto de
valores em que colocamos na primeira coluna em ordem crescente
apenas os valores distintos de série e na segunda coluna
colocamos os valores das freqüências simples correspondentes.
Devemos optar por uma variável discreta na representação de uma
série de valores quando o número de elementos distintos da série
for pequeno
xi = número de fi = freqüência
filhos absoluta
0 1
1 5
2 6
3 10
total 22
Variável
CONTÍNUA - É uma representação tabular de um conjunto de
valores em que colocamos na primeira coluna faixa de valores
agrupados em ordem crescente da série e na segunda coluna
coloca os valores das freqüências simples correspondentes.
Devemos optar por uma variável contínua na representação de uma
série de valores quando o número de elementos distintos da série
for grande.
xi = número de fi = freqüência
filhos absoluta
2 /------ 4 4
4 /------ 6 12
6 /------ 8 10
8 /------ 10 4
total 30
Conceitos a serem aplicados
- Amplitude total de uma seqüência = é a diferença entre o Limite
superior e o Limite inferior de uma seqüência. At = Ls – Li
- Intervalo de Classe = é qualquer subdivisão da amplitude total de
uma série estatística. 2 /------ 4
- Limite de Classe = cada intervalo de classe fica caracterizado por
dois números reais. O menor valor chamado de Limite inferior (Li)
da classe e o maior valor chamado de Limite superior (Ls) da
classe. 2 = Li e 4 = Ls
- Amplitude do intervalo de classe = é a diferença entre o Ls e o Li
do intervalo de classe. A = Ls – Li 4-2 = 2 A = 2
- Freqüência simples ou absoluta de uma classe (fi) = é o número
de elementos da seqüência que são maiores ou iguais ao Li desta
classe e menores que o Ls desta classe.
Distribuição de Freqüências
0 1 3,33 1 3,33
1 5 16,67 6 20,00
2 6 20,00 12 40,00
3 10 33,34 22 73,34
4 4 13,33 26 86,67
5 4 13,33 30 100
Total 30 100
Distribuição de Freqüências
xi fi fir% fiac firac%
Total 30 100
Representação Gráfica -
Histograma
0,34
0,35
0,3
0,26
0,25
0,2
Proporção
0,16
0,15
0,12
0,1
0,04 0,04
0,05
0,02 0,02
0
5,5 13,5 21,5 29,5 37,5 45,5 553,5 61,5
rea ~ freqüência ( f ou p )
otas :
100
90
80
70
% acumulada
60
50
40
30
20
10
0
1.5 9.5 17.5 25.5 33.5 41.5 49.5 57.5 65.5
Tributo ( % faturamento )
Representação Gráfica
Polígono de % acumulada
Exemplo :
• Calcule a média dos seguintes grupos de
dados:
1, 2, 3, 4, 5
n e
∑ xi 2, 3, 3, 3, 4
x= i =1
n
Medidas de Tendência Central
Média e Mediana
Sua comparação indica a assimetria da distribuição.
Média Mediana
Medidas de Tendência Central
– Exemplo:
notas de degustadores de vinho:
8, 7, 9, 6, 8, 10, 9, 9, 5, 7.
Moda: 9
Medidas de Tendência Central
Moda
• Vantagens
- indica onde os dados tendem a se concentrar.
- útil para dados qualitativos (Ex. notas de jurados).
- pode haver mais de uma ou não ter sentido (Ex.
pesquisa de lazer).
• Limitações
- não se presta a análise matemática;
- pode não ser moda para certos conjuntos de dados.
Medidas de Tendência Central
Exemplo:
Média = 65,125
Mediana = 65,5
Moda =66
Medidas de Tendência Central
Média Para variáveis discretas
• Se os dados estão apresentados na forma de uma variável
discreta, utilizamos a média ponderada, considerando as
freqüências (fi) como sendo as ponderações dos elementos
(xi) correspondentes.
xi = número de fi = freqüência fi *
filhos absoluta xi
0 1 0
Média =
1 5 5 47 / 22 =
2 6 12
3 10 30 2,14 filhos
total 22 47
Medidas de Tendência Central
xi = número de fi = freqüência
filhos absoluta
0 1
1 5 Moda = 3 filhos
2 6
Moda = 3 10
total 22
Medidas de Tendência Central
n / 2 − fiacant
md = Li + .h
Onde : fi
Li = Limite inferior do intervalo de classe 4
n = Total de fi 30
fiacant = freqüência acumulada anterior ao intervalo de
classe 4
fi = freqüência do intervalo de classe 12
h = amplitude da classe = Ls – Li 6 – 4 = 2
Medidas de Tendência Central
10
mo = 4 + .2
10 + 4
mo = 5,43
Exercícios de aplicação
Medidas de Dispersão
• Desvio Médio
• Variância
• Desvio-Padrão
• Coeficiente de variação
Medidas de Dispersão
∑ xi − x .fi
DM =
n
Medidas de Dispersão
2
S =
∑( xi −x )
2
.fi
n −1
Medidas de Dispersão
s= s 2
Medidas de Dispersão
S
CV = .100
X
Medidas de Dispersão
xi = fi xi * xi - x /xi-x/ * (xi-x)2 *
número fi fi fi
de filhos
0 1 0 -2,14 2,14 4,58
1 5 5 -1,14 5,7 6,50
2 6 12 -0,14 0,84 0,12
3 10 30 0,86 8,6 7,40
total 22 47 17,28 18,6
Média=2,
14=
DM 0,79
S2 = 0,89
S= 0,94
CV = 43,93
%
Para variáveis contínuas xi = PM
Exercícios de aplicação
Probabilidade
•Freqüência e probabilidade
•Eventos
1 1 0,1 ou 10%
2 0 0
3 1 0,1 ou 10%
4 2 0,2 ou 20%
5 3 0,3 ou 30%
6 3 0,3 ou 30%
A medida que a amostra cresce, a freqüência se
estabiliza: temos então a probabilidade
Resultados do lançamento de um dado
n = 50 lançamentos n=∞
Resultado Núm. de ocorrências Freq. Número de ocorrências Freqüência
do dado do resultado (f) Rela(f/n) do resultado (f) (f/n)
n = 10 n = 50 n = infinito
0,3
0,2
0,1
0,0
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
Probabilidade
• Freqüência e probabilidade
• Eventos
– Representações gráficas
– Compostos
– Condicionais
– Dependentes e independentes
• Definição subjetiva de probabilidade
Formas de representação gráfica de eventos
Resultado
Criança 1 Criança 2 Criança 3
final
M M, M, M
M F M, M, F
M M, F, M
M
F
F M, F, F
M M F, M, M
F F F, M, F
M F, F, M
F
F F, F, F
O diagrama de Venn é adequado ao agrupamentos dos
eventos de interesse
Casais com
meninos somente Casais com
meninas somente
Casais com
meninos e meninas
A combinação dos diagramas de árvore e de
Venn permite representações mais complexas
Agrupamento de casais com quatro filhos e pelo menos duas meninas
M M, M, M, M
M
F M, M, M, F
M
M M, M, F, M
F
F M, M, F, F
M M M, F, M, M
M
F M, F, M, F Agrupamento
F dos resultados
M M, F, F, M
F que apresentem
F M, F, F, F ao menos
duas meninas.
M F, M, M, M
M
F F, M, M, F
M
M F, M, F, M
F
F F, M, F, F
F M F, F, M, M
M
F F, F, M, F
F
M F, F, F, M
F F, F, F, F
F
Dependência e independência são termos que
obedecem a regras precisas
3 1 1/6
2 1/6
Lançamento 3 1/6
já realizado 4 1/6
e resultado 5 1/6
conhecido!
6 1/6
meninas
• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Binomial
– Poisson
• Distribuições contínuas de probabilidade
– Normal
Probabilidade
• Distribuição de probabilidade
n x n-x
P( x) = p ( sucesso). p ( fracasso)
x
Onde:
n = numero de amostras
x = número de sucesso
p(s) = percentual de sucesso
p (f) = percentual de fracasso
Exemplo
7 0 7
a- P ( x ) =
0 (0,08).(0,92) =
0,5578
7
1 6
P ( x ) =
1 (0,08).(0,92) =
b-
0,3396
Probabilidade
• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Poisson – É útil para descrever as probabilidades
do número de ocorrências num campo ou intervalo
contínuo (em geral tempo ou espaço).
– A utilização da Poisson, exige certas hipótese
como:
• A probabilidade de uma ocorrência é a mesma
em todo o campo de observação.
• A probabilidade de mais de uma ocorrência num
único ponto é aproximadamente zero.
• O número de ocorrências em qualquer intervalo
é independente do número de ocorrências em
outros intervalos.
Probabilidade
• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Formula de Poisson
eµ
− (µ )x
P ( x) =
x
!
Onde: µ = média
x = número de ocorrências
e =µ
− valor tabelado
Exemplo
0
0,0101( 4,6)
•2 P( x) = =
0 ! 0,0101
Probabilidade
( x − x) ( x −µ)
z= z=
s σ
Onde:
Z= número de desvios padrões a contar da média
X = valor arbitrário
σ = o desvio padrão
µ = a média da distribuição normal
Exemplo
• Regra de Chebyshev:
• Ao menos 3/4 estará dentro de 2 s.
• Ao menos 8/9 estará dentro de 3 s.
• P/ k>1, ao menos (1-1/k2) das medidas cairá dentro de k
desvios-padrão.
• Distribuição Normal
• Aproximadamente 68% das medidas caem dentro de 1 s.
• Aproximadamente 95% das medidas caem dentro de 2 s.
• Aproximadamente 99,7% das medidas caem dentro de 3 s.
• Aplicações de todos os conceitos
estudados em exercícios
práticos........