Vous êtes sur la page 1sur 20

E S T A T Í S T I C A B Á S I C A

Definições básicas
Taxonomia das principais áreas em estatística

POPULAÇÃO
PLANEJAMENTO DE EXPERIMENTOS
Área da estatística
preocupada em montar
experimentos que realizem ESTATÍSTICAS DESCRITIVAS
Área da estatística preocupada
uma amostragem não
em organizer, resumir e
enviesada e significativa da
descrever as informações de
população
uma amostra com objetivo de
quantificar propriedades da
população

ESTATÍSTICA INFERENCIAL
Área da estatística preocupada
fazer afirmações sobre as
propriedades de uma população.
Trata dos estimadores e testes de
hipótese
Estatísicas Descritivas
Classificação dos tipos de medida

CENTRALIDADE DISPERSÃO QUARTIS MOMENTOS CENTRAIS CORRELAÇÃO

Medem a posição Medem o quanto as Utilizados para


Medem posições A correlação mede a
central da observações se caracterizar a densidade
relativas entre os variação relativa entre
distribuição da desviam de uma da distribuição dos
dados da amostra duas variáveis
mostra medida de dados
centralidade
Medidas de centralidade
MÉDIA MEDIANA MODA

É definida como o valor que fica na


É definida como o valor médio da
metade dos valores ordenados da É definida como o valor que ocorre
grandeza de interesse dentro dos
amostra. com mais frequência na amostra.
valores dos indivíduos da amostra.

´ =4 → ∀ 𝑥 ∈{1,3,3 , 𝟒 , 5,7,8}
𝑥  𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑥  𝑚𝑜𝑑𝑎
´ =𝑎𝑟𝑔 max ⁡(𝐹𝑟𝑒𝑞(𝑋 𝑖))

  ∑ 𝑥𝑖
´ =4.5 → ∀ 𝑥 ∈ {1,3,3 , 𝟒 ,𝟓 , 7,8 , 9 }
𝑥  𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑖
𝑥 𝑚´é 𝑑𝑖𝑎 = 𝑗
𝑁
Muito útil em distribuições de valores
É a medida mais simples e utilizada de
Separa a metade maior e a metade não numéricos.
todas, mas possui um problema:
menor da amostra.
resume muito a informação de
Robusta a em uma amostra com
posição.
  𝐵,𝐵,𝐵 ,𝐶 , 𝐴 ,𝐵,𝐶, 𝐵}
outliers
´ =4 → ∀ 𝑥 ∈{1,3,3 , 𝟒 , 5,7,205}
𝑥  𝑚𝑒𝑑𝑖𝑎𝑛𝑎 {𝐴,
Medidas de centralidade
Medidas de centralidade
Medidas de dispersão

AMPLITUDE VARIÂNCIA

É definida como a diferença entre o valor máximo e Medida de dispersão mais comumente utilizada.

o valor mínimo da grandeza de interesse dentro dos Definida como a soma dos desvios quadráticos.
2
valores dos indivíduos da amostra.
  ( 𝑥 − ´𝑥 )
𝑖
𝑉𝐴𝑅 = 𝑥
 𝐴 𝑥 =max ( 𝑥 𝑖 ) − min ( 𝑥 𝑖 ) 𝑁 −1
Medidas de dispersão

Amplitude Variância
uniform(-1,1) 1,85 0,25
uniform(-3,3) 5,63 2,02
normal(0,1) 4,51 0,82
normal(0,1)+out
6,71 1,45
lier
Medidas de dispersão

DESVIO PADRÃO
Desvio
Amplitude Variância
padrão Raiz quadrada da variância. Possui a vantage de ter
uniform(-1,1) 1,85 0,25 0,50 a mesma unidade que as observações
uniform(-3,3) 5,63 2,02 1,42
normal(0,1) 4,51 0,82 0,91 𝑠  𝑥 =√ 𝑉𝐴𝑅 𝑥
normal(0,1)+out
6,71 1,45 1,20
lier
Medidas de dispersão
VS
Medidas de dispersão
Quartis
20 observações na amostra

25% das 25% das 25% das 25% das


observaçõe observaçõe observaçõe observaçõe
mínimo s s s s máximo

Q1 Q2 Q3
= mediana
Quartis
Momentos centrais
Medida de centralidade N-ÉSIMO MOMENTO CENTRAL

´𝑥 
desvio caracteriza
Os momentos centrados ou momentos
 𝜇1 Bias/Viés
centrais podem ser estimados pela
soma dos desvios da amostra elevados
à n-ésima potência.

 𝜇2 Variância
𝑛
  ∑ ( 𝑥𝑖 − ´𝑥 )
𝑖
𝜇𝑛 =
𝑁
 𝜇3 Coeficiente de assimetria
São importantes para caracterizar as
densidades das amostra  𝜇3 Curtose
Momentos centrais
3
  1 𝑥 𝑖 − ´𝑥
𝐶𝑜𝑒𝑓𝐴𝑠𝑠𝑖𝑚= ∑
𝑛 ( )
𝑉𝐴𝑅 𝑥

Assimetria positiva
Assimetria negativa
Momentos centrais
4
  1 𝑥 𝑖 − ´𝑥
𝐶𝑢𝑟𝑡𝑜𝑠𝑒= ∑
𝑛 ( )
𝑉𝐴𝑅 𝑥
−3
Correlação

correlação positiva

Y
Correlação

correlação negativa

Y
Correlação linear
Questões
1. Qual o filme com maior rating médio da amostra? E qual o filme com o menor?

2. Qual a dispersão do filme?

3. A dispersão do filme é positive ou negativa?

4. Caracterize e distribuição da contagem de votos por filme.

5. Qual a correlação entre a quantidade de ratings e o rating médio de um filme?

Vous aimerez peut-être aussi