Vous êtes sur la page 1sur 20

NORMALIDADE

DA DISTRIBUIÇÃO
Existem vários métodos para verificação da condição
de “normalidade” nos dados sob análise:

9 Gráfico de Probabilidade Normal

9 Método dos Momentos

9 Teste “W” - Shapiro-Wilk

9 Teste Kolmogorov-Smirnov

9 Teste de Aderência X2
Teste de Aderência X2

(0 − E )
2

X =2

E
ONDE:

X2 = CHI-QUADRADO
O = VALORES OBSERVADOS
E = VALORES ESPERADOS
Etapas do cálculo de X2

1. Transformar os valores observados (x)


em valores de z

( xi − xm )
Z=
s
Etapas do cálculo de X2

2. Agrupar os dados padronizados em classes


de freqüência, de modo que todas as
classes geradas tenham freqüência de
ocorrência maior que 5

CLASSES FREQUÊNCIA

< -1 6
-1 - 0 20
Etapas do cálculo de X2

3. Calcular a probabilidade de ocorrer o valor z e a


freqüência esperada supondo a distribuição normal

FREQ.OBS FREQ.ESP
CLASSES PROBAB. Z
(O) E
< -1 6 0.16 7.93
-1 a 0 20 0.34 17.07
... ... ... ...
Etapas do cálculo de X2

3. Calcular o valor de X2 da distribuição analisada e o


valor de X2 da Tabela fornecida (valor teórico)

(0 − E ) (6 − 7.93) (20 − 17.07)


2 2 2

X =
2
⇒ + ...
E 7.93 17.07

A CONDIÇÃO DE NORMALIDADE É ACEITA SE O X2


ENCONTRADO FOR MENOR QUE O X2 TABELADO

X2 tabelado = 3,841 (para gl = 1 e alpha = 0,05)


Teste de Shapiro-Wilk W

• O teste de Shapiro-Wilk W tem sido o mais utilizado


para testar a normalidade

• Se o valor calculado de W é estatisticamente


significativo (para p = 0,05) rejeita-se a hipótese que a
distribuição estudada é normal
Ou seja:
Para a Distribuição ser considerada Normal o valor de p
deve ser maior que 0,05
DISTRIBUIÇÃO NORMAL
Histogram: NORMAL 1
Shapiro-Wilk W=,98455, p=,75196
Expected Normal
14

12

10

8
No. of obs.

0
2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0
X <= Category Boundary
DISTRIBUIÇÃO NÃO NORMAL
Histogram: POISSON 1
Shapiro-Wilk W=,87283, p=,00007
Expected Normal
25

20

15
No. of obs.

10

0
0 2 4 6 8 10
X <= Category Boundary
Teste de Kolmogorov-Smirnov
• O teste de Kolmogorov-Smirnov baseia-se na máxima
diferença entre a distribuição acumulada da amostra e
distribuição acumulada esperada.
• Se o valor calculado de D é estatisticamente significativo
(para p = 0,05) rejeita-se a hipótese que a distribuição
estudada é normal
Ou seja:
Para a Distribuição ser considerada Normal o valor de p
deve ser maior que 0,05

Quando a média e o desvio padrão da distribuição


esperada (hipotética) não é conhecido, os valores de
probabilidades de Lilliefors devem ser usados.
DISTRIBUIÇÃO NORMAL
Histogram: NORMAL 1
K-S d=,04543, p> .20; Lilliefors p> .20
Expected Normal
14

12

10

8
No. of obs.

0
2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0
X <= Category Boundary
DISTRIBUIÇÃO NÃO NORMAL
Histogram: POISSON 1
K-S d=,18430, p<,10 ; Lilliefors p<,01
Expected Normal
25

20

15
No. of obs.

10

0
0 2 4 6 8 10
X <= Category Boundary
TRANSFORMAÇÃO DE DADOS:

PADRONIZAÇÃO
&
NORMALIZAÇÃO
PADRONIZAÇÃO

Recurso utilizado quando se deseja comparar


a distribuição de variáveis:

¾ centralização: y’ = y - ymedio

¾ transformação z: (y - ymédio)/s

(para unidades diferentes)


NORMALIZAÇÃO: ajuste a distribuição normal

Recurso utilizado quando a distribuição dos


dados originais apresenta-se:

¾ Não – normal

¾ Heterocedastica (variâncias diferentes entre


amostras de uma mesma população)
Exemplo de Normalização
Logarítmica:

x’ = log (x) ou x’ = ln (x)

no caso de existirem valores zero na distribuição pode se adotar:


x’ = log (x + 1) ou ln (x + 1)

Utilizada principalmente quando ocorre:


¾ Assimetria positiva
¾ Heterocedasticidade
¾ Coeficiente de Variação constante (o desvio padrão
aumenta proporcionalmente ao aumento da média)
Exemplo de Normalização

Raiz Quadrada:

x’ = RAIZ Q (x)
no caso de existirem valores zero na distribuição pode se adotar:
x’ = RAIZ (x + 0.5)

Utilizada principalmente quando:

¾ As variâncias aumentam proporcionalmente ao


aumento da média
Exemplo de Normalização
Arco seno:

p’ = arcsen (raiz p)

Utilizada principalmente quando:

¾ Os dados são expressos em porcentagens ou razões entre 0 e 1.


Ou seja, quando são afetados pelo “fechamento” da somatória
(quando o aumento de uma variável implica necessariamente na
redução de outra)

OBS: no Excel esta transformação é dada em radianos e para retornar a graus é


necessário multiplicar o resultado por (180/pi)

1 radiano = 57,296º
Exemplo de Normalização
Razão Logarítmica (Logratio):

X’ = log (x /Mg)

Mg= média geométrica da distribuição = Soma (log x/n)

Utilizada principalmente quando:

¾ Os dados são expressos em porcentagens ou razões entre


0 e 1.

OBS: no MVSP os valores zero são automaticamente transformados em


valores muito baixos e todos os demais valores reajustados para que a
somatória seja igual a 1

Vous aimerez peut-être aussi