Académique Documents
Professionnel Documents
Culture Documents
médias amostrais
Tratamento Paramétrico
Aula de hoje
Diferenças entre testes
paramétricos e não-paramétricos
Testes paramétricos:
Baseados em parâmetros da amostra (média e
desvio-padrão).
Fazem pressupostos sobre a distribuição dos
dados (distribuição normal)
Testes não-paramétricos:
Baseiam-se em postos (ranks) dos dados.
Pouco influenciados por valores extremos
Não fazem pressupostos sobre a distribuição dos
dados
Transformação
E quando houver uma clara discrepância dos
dados em relação à distribuição Normal?
Duas saídas possíveis:
Transformar os dados (ex. calculando o logaritmo ou
a raiz quadrada) em uma tentativa de obter uma
distribuição aproximadamente Normal;
Desvantagem: a interpretação dos resultados fica mais
complexa.
Hipóteses do teste:
Hipótese nula: média das duas populações são
iguais.
Hipótese alternativa: média das duas populações
são diferentes.
H 0 : 1 2 H 0 : 1 2 0
ou
H1 : 1 2 H1 : 1 2 0
Funcionamento do teste t para
2 amostras independentes
Variâncias iguais:
x1 x2 2
2
t (
s2 1
n 1) s1 ( n2 1) s 2
1 1 n1 n2 2
s
2
n1 n2 s: desvio padrão conjugado
com n1 n2 2 graus de liberdade
Variâncias diferentes:
x1 x2
t
s12 s22
n1 n2
Cálculo do valor de p e
distribuição t de student
O valor de p é a probabilidade de obter uma
dada diferença entre as médias x1 x2
dado que H0 é verdadeira.
Teste t para 2 amostras independentes (e
variâncias iguais)
72
70
peso corporal (kg)
68
66
64
62
60
controle flushing
grupo
Checando as premissas
Normalidade
Variâncias
Descriptive Statistics
Variable: todas
grupo: controle p=0,972
Anderson-Darling Normality Test
A-Squared: 0.139
P-Value: 0.972
Mean 65.7733
StDev 2.4972
Variance 6.23582
Skewness 0.118183
Kurtosis -5.0E-01
N 30
61 63 65 67 69 71
Minimum 61.1000
Neste caso, através da
1st Quartile 63.8250
Median
3rd Quartile
65.6500
67.4250
observação dos histogramas e
Maximum 71.1000
95% Confidence Interval for Mu
95% Confidence Interval for Mu
boxplots, pode-se assumir que os
65 66 67
64.8409 66.7058
95% Confidence Interval for Sigma
dados sigam a distribuição
1.9888 3.3570
95% Confidence Interval for Median
Normal.
95% Confidence Interval for Median 64.8686 66.9543
No entanto, podemos
Descriptive Statistics confirmar utilizando um teste de
Variable: todas
Normalidade (como o teste de
grupo: flushing p=0,894 Anderson-Darling feito pelo
Anderson-Darling Normality Test
A-Squared:
P-Value:
0.187
0.894
Minitab) para confirmar a hipótese
Mean 67.3667 de Normalidade.
StDev 2.2525
Variance
Skewness
5.07362
-9.5E-02 Hipóteses do teste de Normalidade:
Kurtosis -3.9E-01
61 63 65 67 69 71
N 24
H0: Distribuição é Normal
Minimum 62.7000
1st Quartile
Median
66.0250
67.3500 H1: Distribuição não é Normal
3rd Quartile 69.4000
95% Confidence Interval for Mu Maximum 71.8000
95% Confidence Interval for Mu p >> 0,05 → podemos
66.4155 68.3178
66 67 68 95% Confidence Interval for Sigma assumir que os dados
1.7507 3.1597
95% Confidence Interval for Median
sigam a distribuição
95% Confidence Interval for Median 66.1827 68.4079 Normal
Teste F para variâncias
O teste F, também
conhecido como teste
da razão de variâncias, H 0 : 12 22
pode ser utilizado para
testar se dois conjuntos H1 :
2
1
2
2
de dados apresentam a
mesma variância.
A estatística do teste é
s12
F 2 , s12 s22 , onde s12 e s22 são as variância s dos 2 grupos
s2
graus de liberdade do numerador : n1 1
graus de liberdade do denominado r : n2 1
Ainda o Teste F
No caso do nosso exemplo, os resultados
obtidos no Minitab são:
Test for Equal Variances
Level1 controle
Level2 dieta Para um nível de significância
ConfLvl 95,0000 a = 0,05:
F-Test (normal distribution)
Como p>0,05, não há
Test Statistic: 1,229 evidência de desigualdade
P-Value : 0,617
entre as variâncias e a
Levene's Test (any continuous distribution)
hipótese de igualdade das
Test Statistic: 0,238 variâncias permanece válida.
P-Value : 0,628
Voltando ao nosso exemplo...
3) Calcular a estatística (fórmula) do teste t.
Nesse caso: t=2,43
x1 x2
t
2 1 1 ( n 1) s 2
( n 1) s 2
s s2 1 1 2 2
n1 n2 n1 n2 2
com n1 n2 2 graus de liberdade s: desvio padrão conjugado
23 oC
Freqüência absoluta
30
20
10
0
15 20 25 30
Período de pré-muda (dias)
40
Freqüência absoluta
30
25 oC
20
10
Período de pré-muda
0
15 20 25 30
de ninfa de carrapatos
Período de pré-muda (dias)
(Dados hipotéticos)
Exemplo – Teste t para amostras
independentes (variâncias desiguais)
H 0 : 1 2
Variable N Mean Median TrMean StDev SE Mean
t25 100 18,766 18,771 18,742 0,889 0,089
t23 100 24,996 25,036 24,943 2,016 0,202
H1 : 1 2
Variable Minimum Maximum Q1 Q3
t25 16,912 21,241 18,057 19,335
t23 20,376 30,891 23,863 26,253
Descriptive Statistics
Variable: t23 p=0,229
Anderson-Darling Normality Test
A-Squared: 0,480
P-Value: 0,229
Mean 24,9955
StDev 2,0161
Variance 4,06458
Skewness 0,333140
Kurtosis 0,633287
N 100
20 22 24 26 28 30
Minimum 20,3755
1st Quartile 23,8634
Median 25,0360
3rd Quartile 26,2531
95% Confidence Interval for Mu Maximum 30,8911
95% Confidence Interval for Mu
24,5955 25,3956
24,6 24,8 25,0 25,2 25,4 95% Confidence Interval for Sigma
1,7701 2,3420 Confirmando a
95% Confidence Interval for Median
95% Confidence Interval for Median
24,6352 25,3205
Normalidade dos
Descriptive Statistics
dados
Variable: t25
p=0,530
Anderson-Darling Normality Test
A-Squared: 0,319
P-Value: 0,530
Mean 18,7662
StDev 0,8887
Variance 0,789843
Skewness 0,262128
Kurtosis 4,28E-02
N 100
17,25 18,00 18,75 19,50 20,25 21,00
Minimum 16,9122
1st Quartile 18,0572
Median 18,7714
3rd Quartile 19,3347
95% Confidence Interval for Mu Maximum 21,2411
95% Confidence Interval for Mu
18,5898 18,9425
18,55 18,65 18,75 18,85 18,95 19,05 95% Confidence Interval for Sigma
0,7803 1,0324
95% Confidence Interval for Median
95% Confidence Interval for Median
18,5884 19,0322
2) Verificando se as variâncias são iguais (teste F)
Test for Equal Variances
95% Confidence Intervals for Sigmas Factor Levels
t23
t25
t23
t25
20 25 30
30
25
20
t23 t25
Teste t pareado
O teste t pareado é utilizado quando selecionamos duas
amostras com observações dependentes ou pareadas.
auto-pareamento: cada animal selecionado da população é seu
próprio controle;
pareamento natural (filhotes da mesma ninhada, gêmeos);
pareamento de animais idênticos.
H 0 : dieta1 dieta2 ou d 0
H1 : dieta1 dieta2 ou d 0
25
Nível de glicose (mmol/l)
20
15
10
0
LF HF
Tipo de dieta
Boxplot da diferença de nível de glicose nas
duas dietas
10
glicose sérica (mmol/l)
Diferença (LF-HF) de
8
6
4
2
0
-2
Checando a premissa
Teste de normalidade das diferenças:
P = 0,928
Checando a premissa
Alternativamente, e mais simples, teste de
normalidade de cada amostra:
P = 0,390 P = 0,262
d
t
sd / n
d é a média das diferenças
sd é o desvio padrão das diferenças
Paired T for LF - HF
[ _ ]
Ho X
0 1 2 3 4 5 6 7 8 9
Differences