Vous êtes sur la page 1sur 37

Regresso Linear

anlise dos pressupostos

Examinando os resduos

Anlise de Resduos

A anlise dos resduos revela:

se a presuno de normalidade da distribuio dos resduos se confirma;


pode revelar se a varincia dos resduos realmente constante, ou seja, se a disperso dos dados em torno da reta de regresso uniforme; se h ou no uma varivel no identificada que deve ser includa no modelo; se a ordem em que os dados foram coletados ( p. ex., tempo da observao) tem algum efeito sobre os dados, ou se a ordem deve ser incorporada como uma varivel no modelo. se a presuno de que os resduos no so correlacionados est satisfeita.

Premissas dos Testes Estatsticos

Premissas em relao aos resduos:

So aleatrios com distribuio normal ? So independentes entre si ? Tm Valor Esperado = 0 ? Possuem Varincia Constante ? Modelo linear nos parmetros

Premissas em relao aos dados:

Premissas dos Testes Estatsticos

Os intervalos de confiana e os testes estatsticos s sero vlidos se essas premissas forem verdadeiras para os dados que esto sendo analisados Portanto, necessrio verificar se essas premissas esto presentes antes de analisar a regresso

Checando as premissas pelas ferramentas do Excel

Usar os grficos:

Plotagem dos Resduos


Se os dados atendem s premissas, o grfico deve mostrar uma faixa horizontal centrada em torno do 0, sem mostrar uma tendncia positiva ou negativa

Plotagem de Probabilidade Normal


Se o grfico aproximadamente linear, podemos assumir que os resduos tm distribuio normal

Testando a adequao do modelo


Resduos

Se o grfico dos resduos mostra uma tendncia sistemtica positiva ou negativa significa que uma outra funo (no linear) deve ser escolhida.

Testando a Existncia de Variveis Esquecidas


Resduos

Os resduos no esto aleatoriamente distribudos em torno de zero Se o grfico dos resduos demonstra um padro quando plotado contra determinada varivel, esta varivel deve ser includa no modelo ao lado do X

Checando Igualdade da Varincia dos Resduos


A varincia dos resduos indicada pela largura da disperso dos resduos, quando o valor de x aumenta Se essa largura aumenta ou diminui quando o valor de x aumenta, a varincia no constante

Este problema denominado heterocedasticidade Quando existe heterocedasticidade o mtodo dos mnimos quadrados no pode ser usado para estimar a regresso, devendo ser usado um mtodo mais complexo chamado mnimos quadrados geral.

Checando Heterocedasticidade
Resduos Resduos

Resduos parecem aleatrios, sem padro


10

A varincia residual est crescendo

Examinando autocorrelao
m
0

11

Examinando autocorrelao
m
0

x
12

Examinando autocorrelao

13

Checando as premissas por Testes dos Pressupostos

Testes bsicos para validao do modelo de regresso simples


Normalidade dos resduos Homocedasticidade Ausncia de autocorrelao dos resduos Linearidade dos parmetros

14

Normalidade dos resduos


Os resduos devem apresentar distribuio normal
Identificao da Normalidade: Compara-se a distribuio dos resduos com a curva normal Testes: Kolmogorov-Smirnov (no paramtrico) Jarque-Bera (paramtrico assinttico)

15

Normalidade dos resduos


Teste Kolmogorov-Smirnov H0: distribuio normal H1: distribuio no normal
Testa a proximidade ou a diferena entre freqncia observada e esperada. Geralmente, K-S menor que 0,3 indica que a distribuio est apropriada.

Estatstica K-S usa a distribuio D. D Dcrtico aceita a Hiptese Nula

i D max. z i n
16

Normalidade dos resduos


Teste de Jarque-Bera H0: distribuio normal H1: distribuio no normal
JB JBcrtico aceita a Hiptese Nula

Estatstica JB qui-quadrado (( )2com 2 gl)

onde: A = assimetria 17 C = curtose

JB = n . [ A2/6 + (C-3)2/24]

Normalidade dos resduos


Se a distribuio no for normal? Estimativas no sero eficientes; maior erro padro Possveis causas: Omisso de variveis explicativas importantes Formulao matemtica incorreta (forma funcional) Soluo: Incluir novas variveis Formular corretamente a relao funcional
18

Homocedasticidade

19

Homocedasticidade
Os resduos devem apresentar a mesma varincia para cada observao de X Avalia-se o contedo informacional dos resduos Identificao da homocedasticidade Analisa-se a evoluo da disperso dos resduos em torno da sua mdia, medida que X aumenta Examina-se a distribuio dos resduos para cada observao de X Testes: Pesarn-Pesarn; BPG; RESET de Ramsey; White; etc.
20

Homocedasticidade
Teste de Pesarn-Pesarn:

m2 = f (Yc2)
Regride-se o quadrado dos resduos (m2) como funo do quadrado dos valores estimados (Yc2) Avalia-se o coeficiente de Yc2 H0: resduos homocedsticos H1: resduos heterocedsticos

21

Homocedasticidade
Se a distribuio no for homocedstica? Estimativas no sero eficientes; maior erro padro Possveis causas: Diferenas entre os dados da amostra a. modelo da aprendizagem b. discricionariedade no uso da renda c. diferenas em dados em corte (cross-section) d. erro de especificao

22

Homocedasticidade

Soluo: Mudar a forma funcional atravs de transformaes das variveis Estimar a regresso via mnimos quadrados ponderados

23

Ausncia de autocorrelao
O modelo pressupe que: correlao entre os resduos zero o efeito de uma observao nulo sobre a outra no h causalidade entre os resduos e a varivel X, e, por conseqncia, a varivel Y Identificao da autocorrelao Analisa-se a disperso dos resduos em torno da sua mdia Teste de Durbin-Watson
24

Ausncia de autocorrelao
Teste de Durbin-Watson
H0: No existe correlao serial dos resduos H1: Existe correlao serial dos resduos Estatstica DW = S(mx - mx-1)2 / S mx2

25

Ausncia de autocorrelao
Anlise da Estatstica DW

Autocorrelao positiva

Regio no conclusiva

Ausncia de Autocorrelao

Regio no conclusiva

Autocorrelao negativa

dL

dU

4-dU

4-dL

26

Ausncia de autocorrelao
Se os resduos forem correlacionados? Estimativas no eficientes; maior erro padro Possveis causas: Em sries temporais inrcia vis de especificao falta de variveis forma funcional incorreta defasagem nos efeitos das vriveis manuseio dos dados (interpolao / extrapolao)
27

Ausncia de autocorrelao

Soluo:
Formular corretamente a relao funcional
Tornar a srie estacionria

28

Regresso Linear Mltipla


Extenso do modelo de regresso linear Valem as hipteses de Distribuio Normal dos Resduos Homocedasticidade Ausncia de autocorrelao Linearidade nos parmetros Adicionalmente Ausncia de multicolinearidade

29

Multicolinearidade

Ocorre com duas ou mais variveis independentes do modelo explicando o mesmo fenmeno Variveis contm informaes similares
Exemplo

Explicar preo de uma casa com regresso que tenha como variveis explicativas a rea da casa e o nmero de cmodos

30

Multicolinearidade
o Duas ou mais variveis independentes altamente correlacionadas o Dificuldade na separao dos efeitos de cada uma das variveis o A multicolinearidade tende a distorcer os coeficientes (b) estimados

31

Multicolinearidade
Conseqncias Erros padro maiores Menor eficincia Estimativas mais imprecisas Estimadores sensveis a pequenas variaes dos dados Dificuldade na separao dos efeitos de cada uma das variveis
32

Multicolinearidade

Identificao atravs dos Testes seguintes FARRAR & GLAUBER VIF (VARIANCE INFLATION FACTOR) TOLERANCE

33

Multicolinearidade
Identificao Teste de Farrar & Glauber

c2 crtico com g.l. = k . (k-1) / 2 c2 = -[n - 1 - 1/6 . (2.k+5)] . Ln(det 1 r12 ........r1k r21 1 ........r2k rk1
onde: n = nmero de observaes k = nmero de variveis Ln = logaritmo neperiano det = determinante rij = coeficiente de correlao parcial
34

rk2 ........ 1

Multicolinearidade
Teste de aceitao Teste de Farrar & Glauber

H0: Ausncia de Multicolinearidade H1: Existe Multicolinearidade

c2 teste > c2 crtico Rejeita a hiptese nula de ausncia de


multicolinearidade (H correlao entre as variveis)

35

Multicolinearidade
Identificao VIFk = 1 / ( 1 - rk2) Regra de bolso para o VIF at 1 - sem multicolinearidade de 1 at 10 - multicolinearidade aceitvel acima de 10 - multicolinearidade problemtica
onde: rk = coeficiente de correlao da varivel K com as demais variveis

VIF

36

Multicolinearidade
Identificao Tolerancek = ( 1 - rk2) Regra de bolso para o ndice Tolerance at 1 - sem multicolinearidade de 1 at 0,10 - multicolinearidade aceitvel abaixo de 0,10 - multicolinearidade problemtica
onde: rk = coeficiente de correlao da varivel K com as demais variveis

37

Vous aimerez peut-être aussi