Vous êtes sur la page 1sur 12

Análise da Variância

ANOVA

Conceito
• Considere populações independentes com
distribuição normal, nas quais precisamos
demonstrar a significância das diferenças entre
três ou mais médias amostrais, ou, na hipótese
nula, que todas as médias amostrais são iguais.
• Podemos aplicar este teste também para duas
populações.
• A comparação é feita por uma análise de
variância acompanhada de um teste F que
supõe que:

1
– as observações são independentes;
– as variâncias populacionais devem ser iguais
nos g grupos;
– a distribuição das observações em cada
grupo deve ser normal.

• Assim temos as hipóteses:

Experimento de um Fator
• As medições ou observações são obtidas
para g grupos (tratamentos)
independentes de amostras, onde n é o
numero de repetições ou replicações.
• Considerando tamanhos de amostras
iguais, n, podemos colocar as somas e as
médias em uma tabela.

2
Experimento de um Fator

A média da amostra global, denotada por X é a soma de todas as


observações divididas pelo número total de observações:

g g n g n g n

∑Xj
j =1
∑∑ xij / n
j =1 i −1
∑∑ xij
j =1 i −1
∑∑ x
j =1 i −1
ij

X= = = =
g g ng N
Para cada elemento xij podemos calcular a sua distancia à média global da forma:
xij − X

tomamos o quadrado da distância:


2

(x − X )
ij

somando os quadrados de todas as observações temos assim a variação total de


todas as observações:
n g 2
SQTot = ∑∑ xij − X
i =1 j =1
( )

3
Vamos chamar de soma de quadrados dos tratamentos, SQTrat, a
variação entre tratamentos:
g n 2 g 2
SQTrat = ∑∑ X j − X
j =1 i =1
( ) = n∑ X j − X
j =1
( )
que calcula ou mede as diferenças da média do tratamento com relação à
média global, associada exclusivamente a um efeito dos grupos.

E a soma de quadrados dos erros dada por:

n g 2
SQerro = ∑∑ xij − X j
i =1 j =1
( ) g
= ∑ j =1 ( n j − 1) S 2j

que calcula ou mede as variações dentro de cada grupo ou tratamento, que não é
mais do que a soma dos quadrados dos resíduos devidos exclusivamente ao erro
aleatório.

Quando uma soma de quadrados é dividia pelo número de seus graus de


liberdade, o resultado é chamado de variância quadrática média, assim a variância
quadrática média entre tratamentos é:
SQTrat
QM Trat =
g −1
e a variância quadrática média dos erros, isto é dentro de cada tratamento, é:

SQErro SQErro
QM Erro = =
ng − g N − g

4
Finalmente, definimos a estatística F como:

QM Trat
F=
QM Erro
que segue uma distribuição F com g -1 graus de liberdade no numerador e N - g
graus de liberdade no denominador.

•Se a hipótese nula H0 não é verdadeira (isto é, as médias dos


tratamentos não são iguais), podemos esperar que QMTrat seja maior pois
depende das médias, ao passo que QMErro não.
•Assim, se esta estatística é significativamente grande, podemos concluir
que existe uma diferença significativa entre as médias dos tratamentos e
portanto, rejeitamos H0, caso contrário podemos aceitar H0.
•Desta forma, com um nível de significância dado, obtemos o valor Fα com
g -1 graus de liberdade no numerador e N -g graus de liberdade no
denominador, o ponto crítico.

A região crítica define-se por F > Fα.

Região de aceitação Região de rejeição

5
As somas de quadrados podem ser resumidas em uma tabela conhecida como
tabela ANOVA:

g
∑ j =1
(n j − 1) S 2j

2
= ∑ ( n − 1) S
g
j =1 j j

OBS: Quando os tamanhos das amostras são diferentes, N = n1+n2+...+nj

Exemplo 1: A National Computer Products, INC. (NCP) produz impressoras e


máquinas de fax em suas fábricas localizadas em Atlanta, Dallas e Seattle. Para
medir quanto os empregados dessas fábricas sabem sobre gerenciamento da
qualidade total, uma amostra aleatória de seis empregados de cada fábrica foi
selecionada e seus integrantes foram submetidos a um exame de seus
conhecimentos sobre qualidade. As notas de exame obtidas estão na tabela abaixo.
Os gerentes querem usar esses dados para testar a hipótese de que a média das
notas de exame é a mesma para todas as 3 fábricas.
Observação Fábrica 1 Fábrica 2 Fábrica 3
Atlanta Dallas Seattle
1 85 71 59
2 75 75 64
3 82 73 62
4 76 74 69
5 71 69 75
6 85 82 67
Solução:
H0 : µ1 = µ2 = µ3
H1 : Nem todas as médias populacionais são iguais

6
g

∑X
j =1
j
79 + 74 + 66
X= = = 73
g 3

Entre os Tratamentos

7
Dentro dos Tratamentos

Teste F calculado

8
Tabela ANOVA:

516 3-1=2 258 9

430 6x3-3=15 28,67

946 6x3-1=17

Como F>Fα, rejeita-se H0.Ou seja, com 5% de significância,


nem todas as médias nos exames são iguais.

9
Excel

10
Exemplo 2
• Um determinado departamento governamental
está preocupado com os aumentos dos custos
verificados no decurso de projetos de
investigação e desenvolvimento encomendados
aos institutos A, B, C e D. Assim, decidiu
analisar os custos associados a diferentes
projetos,calculando para cada um deles a razão
entre o custo final incorrido e o custo
inicialmente previsto.
• Os resultados apresentam-se na tabela
seguinte:

• A questão que se coloca é a de saber se os


quatro institutos têm um comportamento distinto
em relação ao agravamento de custos.
• Considere α=0,05

11
• Como o F calculado é maior que o tabelado (Fα=3,16)
leva-nos à rejeição da hipótese da igualdade das médias
(ao nível de significância 0.05), concluindo-se que os
institutos têm comportamentos distintos no que diz
respeito ao agravamento dos custos.

12