Vous êtes sur la page 1sur 58

Projetos de experimentos

com um fator e vrios nveis

Projetos completamente aleatorizados


Anlise de varincia (ANOVA) com um fator

Fonte Principal: Pedro Alberto Barbetta (INE - UFSC)


www.inf.ufsc.br/~barbetta
barbetta@inf.ufsc.br
Porque ANOVA ?
No Podemos Comparar 2 a 2 ?
Probabilidade de Ocorrer Erro do Tipo I =

A Probabilidade Prob de ocorrer k erros do tipo I em n


comparaes dada por:

( k ) C p (1 p )
n k
=
prob n
k
k

Probabilidade de ocorrer erros do tipo I:

prob(Erro Tipo I)=prob(1)+prob(2)+...+prob(n)

No exemplo:
prob(Erro Tipo I) =
Exemplo 1: Comparao de trs tipos de rede.

Considere o problema de comparar 3 tipos de rede de


computadores, C1, C2 e C3, em termos do tempo mdio
de transmisso de pacotes de dados entre duas
mquinas.

Experimento (projeto completamente aleatorizado


com um fator): 8 replicaes com cada tipo de rede,
aleatorizando a ordem dos 24 ensaios e mantendo fixos
os demais fatores controlveis.
Exemplo 1: Projeto do experimento.
ensaios de 1 a 8: C1
ensaios de 9 a 16: C2
ensaios de 17 a 24: C3

Seqncia nmero Uso da


dos testes do ensaio rede
1 16 C2
2 14 C2
3 24 C3
4 6 C1
... ... ...
24 11 C3
Exemplo 1. Dados do experimento:

Seqncia nmero Tempo de


dos testes do ensaio Rede resposta (y)
1 16 C2 7,8
2 14 C2 8,2
3 24 C3 6,3
4 6 C1 7,2
... ... ... ...
24 11 C2 7,8
Exemplo 1: Perguntas a serem
respondidas pela anlise estatstica.

Existe diferena real (significativa) entre os 3


tipos de rede?

Qual a estimativa do tempo de resposta


para cada tipo de rede?
Dados do experimento
Tipo de rede

Replicao C1 C2 C3
1 7,2 7,8 6,3
2 9,3 8,2 6,0
3 8,7 7,1 5,3
4 8,9 8,6 5,1
5 7,6 8,7 6,2
6 7,2 8,2 5,2
7 8,8 7,1 7,2
8 8,0 7,8 6,8
Soma 65,7 63,5 48,1
Mdia 8,21 7,94 6,01
tratamento
Notao:
(1) (2) (3)
(g = 3 tratamentos)
y11 y21 y31
y12 y22 y32
Dados
... ... ...
Mdia
Estatsticas y1n y2n y3n global:
Mdia:

Estatstica: funo dos elementos da amostra


(so estimadores de certos parmetros de interesse)
Parmetros: valores reais, mas
geralmente desconhecidos
tempo esperado (mdio) de resposta;

i tempo esperado (mdio) de resposta sob


o tratamento i;

i = i - efeito devido ao tratamento i.


Parmetros: valores reais, mas
geralmente desconhecidos
Se Y a varivel aleatria que representa a
observao do tempo de resposta, tem-se
que Y deve ter uma certa densidade de
probabilidade f. O parmetro o valor
esperado desta distribuio: = E{Y}.
Analogamente: 2 = Var{Y}

Yi = observao sob o tratamento i, ento


i = E{Yi} , i2 = Var{Yi} e i = E{Yi - Y}
tratamento
(1) (2) (3)
y11 y21 y31
y12 y22 y32
... ... ...
Mdia
Estatsticas y1n y2n y3n global:
Mdia:

Estimativas de

Parmetros
1 2 3

O efeito i = i - pode ser estimado pela estatstica:


tratamento
(1) (2) (3)
y11 y21 y31
y12 y22 y32
... ... ...
Mdia
y1n y2n y3n global:
Mdia:

i = 1, 2, 3
j = 1, 2, ..., n

mdia erro aleatrio


observao
global efeito do tratamento i

= mdia do fator i
Hipteses
H0: 1 = 2 =...= g = 0 ou 1 = 2 =...= g

H1: i 0 ou i j
para algum i para algum par (i,j)

As observaes
Sob H1: Sob H0:
Sob H0: 1 = 2 =...= g = 0
Sob H1: i 0 para algum i
Suposies da ANOVA

As observaes so independentes e provm


de distribuies normais com a mesma
varincia.

Observa-se que o teste razoavelmente


robusto a estas suposies.
Anlise de varincia (ANOVA) com um fator

Tratamento
Replicao 1 2 ... g
1 y11 y21 ... yg1
2 y12 y22 ... yg2
... ... ... ... ...
n y1n y2n ... ygn
Soma y1. y2. ... yg.
Mdia ...

Soma de quadrados total: Graus de liberdade:

gl = N - 1
onde: N = ng
Anlise de varincia (ANOVA) com um fator

Tratamento
Replicao 1 2 ... g
1 y11 y21 ... yg1
2 y12 y22 ... yg2
... ... ... ... ...
n y1n y2n ... ygn
Soma y1. y2. ... yg.
Mdia ...

Soma de quadrados dos tratamentos: Graus de liberdade:

gl = g - 1
Anlise de varincia (ANOVA) com um fator

Tratamento
Replicao 1 2 ... g
1 y11 y21 ... yg1
2 y12 y22 ... yg2
... ... ... ... ...
n y1n y2n ... ygn
Soma y1. y2. ... yg.
Mdia ...

Soma de quadrados do erro: Graus de liberdade:


gl = N - g
Anlise de varincia (ANOVA) com um fator
Frmulas equivalente
s anteriores

Estatstica do teste (possveis valores da razo f):


Graficamente
Graficamente
Teste F
Se H0: 1 = 2 =...= g = 0 for verdadeira, a estatstica F
tem distribuio F com (g - 1) graus de liberdade no
numerador e (N - g) graus de liberdade no denominador.
Densidade de probabilidade F
0,75
densidade de probabilidade

0,50

valor p
0,25

0,00
0 1 2 3 4

possveis valores da estatstica F, sob H 0

f
Regra de deciso
= nvel de significncia
(probab. tolervel de se rejeitar Ho quando esta for verdadeira)
Usual: = 0,05 = 5%

p rejeita H0 (prova-se
estatisticamente H1)

p>
aceita H0 (os dados no
mostram evidncia para
afirmar H1)
Exemplo 1: Comparao de trs tipos de rede.

Considere o problema de comparar 3 tipos de rede de


computadores, C1, C2 e C3, em termos do tempo mdio
de transmisso de pacotes de dados entre duas
mquinas.

Experimento (projeto completamente aleatorizado


com um fator): 8 replicaes com cada tipo de rede,
aleatorizando a ordem dos 24 ensaios e mantendo fixos
os demais fatores controlveis.
Dados do experimento
Tipo de rede

Replicao C1 C2 C3
1 7,2 7,8 6,3
2 9,3 8,2 6,0
3 8,7 7,1 5,3
4 8,9 8,6 5,1
5 7,6 8,7 6,2
6 7,2 8,2 5,2
7 8,8 7,1 7,2
8 8,0 7,8 6,8
Soma 65,7 63,5 48,1
Mdia 8,21 7,94 6,01
Exemplo 1
Anlise de varincia (ANOVA)

Fonte da variao SQ gl QM f
Entre grupos 22,99 2 11,50 21,07
Dentro dos grupos 11,46 21 0,55

Total 34,45 23

f = 21,07 valor p < 0,01

O teste F rejeita H0, ou seja, existe alguma


diferena significativa entre os tratamentos
Verificao das suposies: anlise dos resduos
Resduos:

(i = 1, 2, ..., g; j = 1, 2, ..., n)

Tempo de resposta Resduos


Replicao C1 C2 C3 C1 C2 C3
1 7,2 7,8 6,3 -1,01 -0,14 0,29
2 9,3 8,2 6 1,09 0,26 -0,01
3 8,7 7,1 5,3 0,49 -0,84 -0,71
4 8,9 8,6 5,1 0,69 0,66 -0,91
5 7,6 8,7 6,2 -0,61 0,76 0,19
6 7,2 8,2 5,2 -1,01 0,26 -0,81
7 8,8 7,1 7,2 0,59 -0,84 1,19
8 8 7,8 6,8 -0,21 -0,14 0,79
Mdia 8,21 7,94 6,01 0,00 0,00 0,00
Verificao das suposies:
anlise dos resduos
Resduos x fator
1,5

1,0

0,5
Resduos

0,0

-0,5

-1,0

-1,5
C1 C2 C3
Rede
Verificao das suposies:
anlise dos resduos
Grfico de probabilidade normal
3

0,99
2
Valor esperado pela normal

0,95

1
0,75

0 0,55
0,35

-1 0,15

0,05
-2
0,01

-3
-1 0 1
Resduos
Verificao das suposies: Normalidade

Kolmogorov-Smirnov
Jarque-Beta
DAgostino-Pearson
Shapiro-Wilk
Lilliefors
Anderson-Darling
Cramer-von Mises
Verificao das suposies: Normalidade
Kolmogorov-Smirnov
Estatstica do Teste

1
D=
mx g mx +
2n

gmx : maior valor calculado de g;


n : tamanho da amostra ou nmero de parcelas.

=g F ( zi ) F0,5

F0,5 =
( i 0, 5 )
n

F(zi): funo de distribuio normal acumulada;


i: nmero da amostra;
Normalidade
Kolmogorov-Smirnov
Tabela 2.2. Valores Crticos da Distribuio Dn
Verificao das suposies:
Kolmogorov-Smirnov
Para n>40
Verificao das suposies: Normalidade
Shapiro-Wilk
Estatstica do Teste
1 Ordenar em ordem crescente as n observaes da amostra
2 Calcular:

3 Calcular:

Se N mpar, despreza-se a observao mediana


Normalidade
Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
Normalidade
Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
Normalidade
Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
Normalidade
Shapiro-Wilk
Normalidade
Shapiro-Wilk
4 Calcular a estatstica de teste:.
Valores Crticos da Distribuio W da Estatstica Shapiro-Wi
Normalidade
DAgostino-Pearson
Normalidade
DAgostino-Pearson
Normalidade
DAgostino-Pearson
Teste de Homocedasticidade
Teste de Hartley
2
Smax
Estatstica do Teste: Fmax = 2
Smin

onde Smax e Smin so, respectivamente, os valores


mximo e mnimo de desvio padro
estimados para as n amostras.

Rejeitar H0 se Fmax > F(,a,N-1)


Teste de Homocedasticidade
Teste de Cochran
S2max
Estatstica do Teste: C= a
2
Si
i =1

Rejeitar H0 se C > C(,a,N-1), com:

1
C(, a, n) =
1 + ( a 1) F ( (1 ) / a, (a 1) *a, n )
Teste de Homocedasticidade
Teste de Bartlett
( n i 1)Si2
( n i 1) ln
( n i 1)
( )
( n i 1) ln Si2
Estatstica do Teste: c =
2
1 1 1
1+
3 ( a 1) n i 1 ( n i 1)

Rejeitar H0 se c2 > a21

onde o ndice de significncia do teste, a o nmero de


amostras sendo testadas e ni o nmero de observaes
da i-sima amostra.
Teste de Homocedasticidade
Teste de Levene

Estatstica do Teste:

Rejeitar H0 se

onde o ndice de significncia do teste, k o nmero de


amostras sendo testadas e ni o nmero de observaes
da i-sima amostra.
Estimao das mdias

Mdias amostrais sob cada tratamento:

Tempo de resposta

C1 C2 C3
Mdia 8,21 7,94 6,01
Estimao das mdias
QM erro
IC(i , ) = yi. t
n
ANOVA:
Fonte da variao SQ gl QM f
Entre grupos 22,99 2 11,50 21,07
Dentro dos grupos 11,46 21 0,55

Total 34,45 23

0,55
IC(1 , 95 ) = 8,21 2,08 = 8,21 0,55
8
Estimao das mdias
9,5

9,0

8,5
Tempo de transmisso

8,0

7,5

7,0

6,5

6,0

5,5

5,0
C1 C2 C3
Rede

Estimativas, atravs de intervalos de 95% de confiana,


para o tempo esperado de transmisso, em trs tipos de rede.
Teste de Tukey (teste para comparao
mltipla)
Utilizado quando se deseja comparar todos os pares de mdias de r
populaes, adotando-se um nico nvel de confiana.

H0 : i j =0
H1: i j 0 i j

O teste consiste em calcular um valor (Dcrt), acima do qual, a diferena


entre duas mdias amostrais (em absoluto) significativamente
diferente de zero.

qr , nT r 1 1
= QME +
ni n j
Dcrt
2

onde qr , nT r representa o valor tabelado (vindo de uma distribuio da


amplitude studentizada studentized range) associado ao nvel de
significncia adotado.
Distribuio da Amplitude
Studentizada
P ( qr , g > qtab ) =
0, 05

g
Teste de Scheff (teste para
comparao mltipla)
Neste teste a hiptese nula H0: i = j rejeitada se:

onde, F(1 ) o quantil de probabilidade (1-) da distribuio :


Teste de contraste (teste para
comparao mltipla)
Um contraste C uma combinao linear dos totais yi, que permite a
comparao das mdias dos tratamentos.

a a
C = ci y i ci = 0
i =1
i =1

SSC
F= F,1,n a
MSE
Exerccio

Vous aimerez peut-être aussi