Vous êtes sur la page 1sur 9

Anlise de Varincia Wagner Oliveira de Araujo

Technical Report - RT-MSTMA_001-09 - Relatrio Tcnico April - 2009 - Abril

The contents of this document are the sole responsibility of the authors. O contedo do presente documento de nica responsabilidade dos autores.

Mestrado Sociedade, Tenologia e Meio Ambiente Centro Universitrio de Anpolis www.unievangelica.edu.br

Anlise de Varincia
Wagner Oliveira de Araujo
waoa@bol.com.br

Clarimar Jose Coelho


clarimarc@gmail.com

Resumo. Este meta-artigo descreve uma sntese da Anlise Univariada de Varincia, tcnica estatstica para determinar, com base em uma medida dependente, se vrias amostras so oriundas de populaes com mdias iguais.

1 Introduo
a) A anlise da varincia uma tcnica que pode ser usada para determinar se as mdias de duas ou mais populaes so iguais. ANalysis Of Variance (ANOVA); b) Permite determinar se as mdias de 2 ou mais populaes so iguais. c) Populao: o grupo (universo) do qual se extrai a amostra d) Amostra: parcela do grupo examinada e) Suposies: - As amostras devem ser aleatrias e independentes - As amostras devem ser extradas de populaes normais - As populaes devem ter varincias iguais, isto :
2 2 2 2 1 = 3 = 2 = . . . = k

(1)

Observaes: Mdia y=

yi
i=1 n

Varincia = s2 = Covarincia = Sxy =


1 n1

(yi y)2
i=1

n i=1 (xi yi

nx y) n1

Mestrando em Sociedade, Tecnologia e Meio Ambiente Responsvel pelo texto do artigo. Orientador, Centro Universitrio de Anpolis UniEVAGLICA

Tabela 1: Dados de Quilometragem Tipos de Gasolina Observao 1 2 3 4 1 15,1 14,9 15,4 15,6 2 15,0 15,2 15,2 15,5 3 14,9 14,9 16,1 15,8 4 15,7 14,8 15,3 15,3 5 15,4 14,9 15,2 15,7 6 15,1 15,3 15,2 15,7 Mdias Amostrais 15,2 15,0 15,4 15,6 Varincias Amostrais 0,088 0,040 0,124 0,032 Tabela 2: Extrai-se uma amostra de cada populao e, para cada uma delas, calcula-se a mdia e a varincia. Populao 1 Populao 2 Populao 3 Populao k Parmetros desconhecidos 1 2 3 k 1 2 3 k Estatstica Amostral x1 x2 x3 xk s2 s2 s2 s2 1 2 3 k Duas hipteses possveis: H0 : as mdias das populaes so todas iguais (nula); H1 : as mdias das populaes no so iguais (alternativa). Se a hiptese nula for verdadeira: diferenas devidas variaes aleatrias nas amostras Caso contrrio as diferenas so muito grandes para serem causadas apenas devido a aleatoriedade Fundamentos lgicos: Se H0 verdadeira: conceitualmente idntico a uma situao em que todas as amostras tenham sido tiradas de uma nica populao Se H0 "falsa": as amostras vm de populaes com mdias diferentes (mas normais e com varincias iguais) Varincia populacional a mdia das varincias amostrais. Varincia "dentro":
2 k Sw = 1 2 3K 4 2 s1 = varincia da amostra 1 s2 = varincia da amostra 2 2 . . . s2 +s2 +s2 +s2 +...+s2

s2 = varincia da amostra k k K = nmero de amostras

Veja Tabela 1 pgina 2 2 Sw = 0,088 + 0,040 + 0,124 + 0,032 4

Estimativa "dentro"da varincia no afetada pela veracidade de H0 => no pode ser usada sozinha para julgar se as mdias populacionais so iguais; Estimativa "entre"da varincia sensvel s diferenas das mdias populacionais. Desvio padro da distribuio amostral : x =
x n

x => desvio padro da populao n = tamanho da amostra No conhecemos o desvio padro da distribuio amostral, neste caso, usa-se o desvio padro da distribuio da qual se extraiu a amostra; A determinao da varincia das mdias amostrais possibilita estimar a varincia da distribuio da qual se extraiu a amostra.
2 Sx =
2 Sb n

Estimativa "entre"da varincia (Sb ): Veja Tabela 1 pgina 2 Calcular a mdia das mdias amostrais: x=
2 Calcular Sx 2 Sx =
k 2 j=1 (xj x)

k j=1

xj =

15,2 + 15,0 + 15,4 + 15,6 4

= 15, 3

k1

(15,215,3)2 +(15,015,3)2 +(15,415,3)2 +(15,615,3)2 41

= 0, 067

Sendo n o nmero de amostras (observaes) teremos:


2 Sb = ns2 = 6(0, 067) = 0, 402 x

Comparando com a varincia "dentro":


2 Sw = 0, 071 2 2 Sb > S w

0, 402 > 0, 071 Temos ento 2 estimativas da varincia populacional.


2 Se H0 verdadeira Sb Sw = 2 2 2 Se H0 falsa Sb > Sw

Figura 1: Teste de hiptese No nosso exemplo sabemos que Sb maior, mas no sabemos se signicativamente maior (a variao casual devida a amostragem pode ser responsvel por isso). Calculemos ento a razo F : Razo F =
2 Sb 2 Sw

O valor obtido com a estatstica comparado com uma tabela de valores F As formas da distribuio F variam de acordo com os graus de liberdade do numerador e denominador. Ver Figura 2

Figura 2: Grau de liberdade do numerador e denominador Os graus de liberdade so calculados como: Numerador: nmero de amostras menos 1 (k 1) Denominador: nmero de amostras x (tamanho da amostra -1) {k[n 1]} Exemplo:
(k1) {k[n1]}

41 4(61)

3 20

Utilizao da tabela F Representam a linha divisria entre o aleatrio e o no aleatrio; Compara-se a razo F calculada com o valor tabelado Se o valor calculado for maior que o tabelado rejeitasse a hiptese nula. Ver Figura 3

Figura 3: Rejeitando a hiptese nula

Figura 4: Maior que o tabulado Lembrando . . . F =


2 Sb 2 Sw

0,402 0,071

= 5, 661 5, 70

Este valor maior que o tabulado => rejeita-se H0 . Ver Figura 4 Atualmente os programas estatsticos fornecem diretamente o valor p

Tabela 3: Fontes Fonte de variao Soma de quadrados G.L. Varincia Razo F 2 k Sx 2 2 entre mdias n j=1 (xj x) k1 = Sb F = S2 w 2 dentro de amostras k(n 1) = Sw Total kn 1 k = nmero de amostras n = nmero de observaes em cada amostra nk = nmero total de observaes Nota: i se refere s linhas, e j s colunas

1.1 Utilizando Matlab


Utilizaremos o software Matlab 6.5 para gerar os resultados de nosso exemplo.

Tabela 4: Exemplo de tabela amostral Amostra Observaes 1 2 3 ... n1 x1 x1 x1 . . . x1 n2 x2 x2 x2 . . . x2 n3 x3 x3 x3 . . . x3 . . . . . . . . n4 . . . . n5 n6 Mdias Amostrais xn x1 xn x2 xn x3 ... ... xn xk

Exemplo 1 Cdigo Entrada e Sada MatLab


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

%Valores de Entrada X=[15.1,14.9,15.4,15.6; 15.0,15.2,15.2,15.5; 14.9,14.9,16.1,15.8; 15.7,14.8,15.3,15.3; 15.4,14.9,15.2,15.7; 15.1,15.3,15.2,15.7] p = anova1(X)

%Valores de Sada X = 15.1000 15.0000 14.9000 15.7000 15.4000 15.1000 14.9000 15.2000 14.9000 14.8000 14.9000 15.3000 15.4000 15.2000 16.1000 15.3000 15.2000 15.2000 15.6000 15.5000 15.8000 15.3000 15.7000 15.7000

p = 0.0058 >>

Resultado produzido no MatLab:

16

15.8

15.6 Values

15.4

15.2

15

14.8 1 2 Column Number 3 4

(a) Execuo de resultados

(b) Plotagem do grco

Figura 5: Resultado da execuo juntamente com o grco

Referncias
FREUND, J. E.; SIMON, G. A. Estatstica Aplicada: economia, administrao e contabilidade. 9.ed. Porto Alegre: Bookman, 1997. HAIR, J. F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C. Multivariate Data Analsys. 5.ed. New Jersey-USA: Prentice-Hall, 1998. MANLY, B. J. F. Mtodos Estatsticos Multivariados: uma introduo. 3.ed. Porto Alegre: Bookman, 2005. RENCHER, A. C. Methods of Multivariate Analysis. 2.ed. Nova York: John Wiley & Sons, Inc, 2002. STEVENSON, W. J. Estatstica: aplicada administrao. 1.ed. So Paulo: HARBRA, 2001.