Vous êtes sur la page 1sur 183

SECRETARIA DO PLANEJAMENTO, MOBILIDADE E DESENVOLVIMENTO REGIONAL ISBN 978-85-7173-141-7

FUNDAO DE ECONOMIA E ESTATSTICA Siegfried Emanuel Heuser

Econometria Aplicada no EViews


Igor Morais, Filipe Stona e Gustavo Schuck

Porto Alegre, outubro de 2016


SECRETARIA DO PLANEJAMENTO, MOBILIDADE E DESENVOLVIMENTO REGIONAL
FUNDAO DE ECONOMIA E ESTATSTICA Siegfried Emanuel Heuser
CONSELHO DE PLANEJAMENTO: Andr F. Nunes de Nunes, Angelino Gomes Soares Neto, Andr Luis Vieira Campos, Leandro Valiati, Ricardo Franzi, Carlos
Augusto Schlabitz
CONSELHO CURADOR: Mayara Penna Dias, Olavo Cesar Dias Monteiro e Irma Carina Brum Macolmes
DIRETORIA
DIRETOR TCNICO: MARTINHO ROBERTO LAZZARI
DIRETOR ADMINISTRATIVO: NRA ANGELA GUNDLACH KRAEMER
CENTROS
ESTUDOS ECONMICOS E SOCIAIS: Vanclei Zanin
PESQUISA DE EMPREGO E DESEMPREGO: Rafael Bassegio Caumo
INDICADORES ECONMICOS E SOCIAIS: Juarez Meneghetti
INFORMTICA: Valter Helmuth Goldberg Junior
INFORMAO E COMUNICAO: Susana Kerschner
RECURSOS: Grazziela Brandini de Castro

M827e Morais, Igor A. Clemente de.


Econometria Aplicada no EViews / Igor Morais, Filipe Stona
M827e e Gustavo Schuck. - Porto Alegre : FEE, 2016.
182 p. : il.

ISBN 978-85-7173-141-7

1. Econometria. 2. Estatstica. 3. EViews (programa de


M827e computador). I. Stona, Filipe. II. Schuck, Gustavo. III. Fundao de
M827e Economia e Estatstica Siegfried Emanuel Heuser. IV. Ttulo.

CDU 330.43

Bibliotecrio responsvel: Joo Vtor Ditter Wallauer CRB 10/2016

2016 Igor Morais


Publicado pela Fundao de Economia e Estatstica Siegfried Emanuel Heuser
permitido reproduzir, compartilhar e derivar trabalhos desta obra, desde que citada a fonte, sendo proibido o uso para fins comerciais, a
menos que haja permisso, por escrito, do detentor dos direitos autorais.

As opinies emitidas neste livro so de exclusiva responsabilidade dos autores, no exprimindo, necessariamente, um posicionamento oficial da FEE ou da Secretaria do
Planejamento, Mobilidade e Desenvolvimento Regional.
Capa: Laura Wottrich.

Como referenciar este trabalho:


MORAIS, I. A. C. de; STONA, F.; SCHUCK, G. Econometria Aplicada no EViews. Porto Alegre: FEE, 2016.

FUNDAO DE ECONOMIA E ESTATSTICA Siegfried Emanuel Heuser (FEE)


Rua Duque de Caxias, 1691, Porto Alegre, RS CEP 90010-283
Fone: (51) 3216-9132 Fax: (51) 3216-9134 E-mail: biblioteca@fee.tche.br Site: www.fee.rs.gov.br
Sumrio

I Parte Um

1 EViews
R
...................................................... 9
1.1 Programando no Eviews 10
1.1.1 Exemplo de Programao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Como abrir dados no EViews
R
12
1.3 Do Excel para o EViews
R
13
1.4 Criando um Workfile 15
1.5 Abrindo os dados do FRED 16

2 Grficos no EViews
R
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1 Dados Categricos 28
2.2 Exemplos de programas.prg 29

3 Funes de Distribuio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1 A Curva Normal 33
3.2 A curva t-student 40
3.3 A Curva Qui-Quadrado 42
3.4 Curva F 49
3.5 Distribuio de Poisson 51
3.6 Exerccios 52
3.7 Sites teis 54
4 Estatsticas, testes de hiptese e ANOVA . . . . . . . . . . . . . . . . . . . . . . . 55
4.1 Histograma e Estatsticas 56
4.2 Estatsticas por classificao (Statistics by Classification) 59
4.3 Testes de Hiptese 60
4.4 Teste de Igualdade por Classificao 61
4.5 Teste de Distribuio Emprica (KolmogorovSmirnov) 62
4.6 Teste de Igualdade (Test of Equality) 64
4.7 Grficos Analticos Fazendo a distribuio dos dados 64
4.8 Teste de Razo de Varincia 65
4.9 Exerccios 72

5 Sries de tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.1 Ajuste Sazonal 75
5.1.1 Mtodo das Mdias Mveis (Moving Average Methods) . . . . . . . . . . . . . . . . 77
5.1.2 TRAMO/SEATS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.1.3 Mtodo Census X-12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.1.4 Mtodo Census X-13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.1.5 Alisamento Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.2 ETS-ERROR-trend-seasonal 93
5.3 Ciclo 98
5.3.1 Filtro Hodrick-Prescott . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3.2 Filtros de Frequncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.3.3 O Filtro Corbae-Ouliaris . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.4 Autocorrelao (Correlograma) 105
5.5 Anlise Espectral 108
5.6 Exerccios 111
5.7 Bibliografia 112

6 Regresso Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115


6.1 Diagnstico Dos Coeficientes 124
6.1.1 Scaled Coefficients . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.1.2 Intervalo de Confiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.1.3 Teste de Wald . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.1.4 Confidence Ellipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.1.5 Variance Inflation Factors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.1.6 Decomposio da Varincia do Coeficiente . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.1.7 Variveis Omitidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.1.8 Variveis Redundantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.1.9 Teste Factor Breakpoint . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
6.2 Diagnstico Dos Resduos 137
6.2.1 Teste de Normalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
6.2.2 O teste de Independncia (BDS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.2.3 Correlograma Q-stat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.2.4 Correlograma dos Resduos ao Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
6.2.5 Teste de Autocorrelao LM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
6.2.6 Testes de Heteroscedasticidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
6.3 Diagnstico De Estabilidade 147
6.3.1 Teste de Chow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
6.3.2 Teste de Quandt-Andrews . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
6.3.3 Teste de Previso de Chow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
6.3.4 Teste de Ramsey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6.3.5 Estimativas Recursivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6.3.6 Leverage Plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
6.3.7 Estatsticas de Influncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
6.4 Previso - Forecast 158
6.5 ANEXO ESTATSTICO 164
6.5.1 MNIMOS QUADRADOS ORDINRIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
6.6 Bibliografia 166

7 Regresso Mltipla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167


7.1 O modelo com duas variveis independentes 168
7.2 Previso - Forecast 175
7.3 Mtodo STEPLS 176
7.3.1 Os mtodos de Seleo STEPLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
7.4 Bibliografia 180

Referncias Bibliogrficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180


1 EViews
R
............................. 9
1.1 Programando no Eviews
1.2 Como abrir dados no EViews
R

I

R
1.3 Do Excel para o EViews
1.4
1.5
Criando um Workfile
Abrindo os dados do FREDParte Um
2 Grficos no EViews
R
. . . . . . . . . . . . . . . . 19
2.1 Dados Categricos
2.2 Exemplos de programas.prg

3 Funes de Distribuio . . . . . . . . . . . . . 31
3.1 A Curva Normal
3.2 A curva t-student
3.3 A Curva Qui-Quadrado
3.4 Curva F
3.5 Distribuio de Poisson
3.6 Exerccios
3.7 Sites teis

4 Estatsticas, testes de hiptese e ANOVA


55
4.1 Histograma e Estatsticas
4.2 Estatsticas por classificao (Statistics by Classifica-
tion)
4.3 Testes de Hiptese
4.4 Teste de Igualdade por Classificao
4.5 Teste de Distribuio Emprica (Kolmogo-
rovSmirnov)
4.6 Teste de Igualdade (Test of Equality)
4.7 Grficos Analticos Fazendo a distribuio dos
dados
4.8 Teste de Razo de Varincia
4.9 Exerccios

5 Sries de tempo . . . . . . . . . . . . . . . . . . . . . 75
5.1 Ajuste Sazonal
5.2 ETS-ERROR-trend-seasonal
5.3 Ciclo
5.4 Autocorrelao (Correlograma)
5.5 Anlise Espectral
5.6 Exerccios
5.7 Bibliografia

6 Regresso Simples . . . . . . . . . . . . . . . . . . 115


6.1 Diagnstico Dos Coeficientes
6.2 Diagnstico Dos Resduos
6.3 Diagnstico De Estabilidade
6.4 Previso - Forecast
6.5 ANEXO ESTATSTICO
6.6 Bibliografia

7 Regresso Mltipla . . . . . . . . . . . . . . . . . 167


7.1 O modelo com duas variveis independentes
7.2 Previso - Forecast
7.3 Mtodo STEPLS
7.4 Bibliografia

Referncias Bibliogrficas . . . . . . . . . . . 180


1. EViews
R

Do ponto de vista operacional o EViews R


muito mais do que um simples pacote estatstico com
uma boa interface. Esse software permite ao usurio manter seus modelos atualizados em tempo
real, conectando o mesmo a dados na internet. Permite programar rotinas diversas com vrios
modelos e, a despeito das falhas de testes estatsticos de fronteira, o usurio pode ainda se conectar
com outros softwares como o R e o Matlab. O EViews R
pode ser utilizado para anlises estatsticas
e economtricas de trs diferentes maneiras: interface grfica, comandos individuais e arquivo de
programa. A interface grfica nos remete a tudo que o usurio visualiza e interage atravs do uso
do mouse, barra de menus e as janelas, como workfile, spreadsheet e grficos.

(b) Janela de comando (c) Programa


(a) Interface grfica

Figura 1.1: Acessando o EViews


R

Outra forma de acessarmos as funes do software por instrues de comando. O EViews R

nos possibilita duas maneiras, a primeira pela janela de comando em branco logo abaixo da barra
de menus. Nesta podemos executar instrues de somente uma linha, como por exemplo, wfcreate
u 1000 e pressionar enter, pronto: criamos um workfile com 1000 observaes. Torna-se til e
veloz quando se est trabalhando com a interface grfica e quer executar comandos simples. A
ltima maneira por um arquivo de programa no formato .prg. Atravs dos programas podemos
mandar instrues mais complexas, trabalhar com um conjunto superior de dados, salvar nossas
linhas de programao para aplicaes futuras e conectar oEViews R
a diferentes bancos de dados
10 Captulo 1. EViews
R

ou outros softwares. Nesse captulo faremos uma breve introduo sobre essas trs diferentes
formas de usar o EViews
R
.

1.1 Programando no Eviews


Para criar um programa necessrio abrir uma porta especifica que fica em File/New/Program.
Como workfiles e demais objetos, o EViews R
nos permite trabalhar com apenas um programa
aberto sem nomear por vez, o untitled. Para dar nome ao seu programa e, consequentemente, salvar
na extenso .prg, pressione save ou save as na barra de menu da janela do programa e escolha o
local desejado.

Figura 1.2: Programa sem Ttulo

Uma vez salvo, os programas podem ser abertos atravs da barra de menus em File, Open e,
ento, Programs. Para execut-los basta pressionar Run na barra de menu da janela do programa
aberto. Porm, muito cuidado ao fazer isso, pois se o caminho do programa no coincidir com o
banco de dados ou se as variveis que foram nomeadas no forem iguais, ser retornado erro.

1.1.1 Exemplo de Programao


No EViews R
os programas so executados linha por linha e cada linha entendida como um
comando. Comentrios no executveis podem ser adicionados depois do apstrofo () e tomam a
cor verde na janela de programao.

Programao 1.1.1 As linhas de comando a seguir criam um workfile, uma srie aleatria,
denominada dados e salva o valor da mdia no escalar a.

wfcreate u 100 'Comentrio: workfile no estruturado com 100 observaes


series dados = rnd
scalar a = @mean(dados)
show a

Primeiro criado um workfile no estruturado utilizando o comando wfcreate u. Na segunda


linha, series o comando executado para criar ou alterar uma srie de dados. Aqui nomeamos
a srie criada com o nome dados e pelo comando rnd geramos valores aleatrios. No caso de
1.1 Programando no Eviews 11

alterarmos a linha 2 para series dados = 2 a srie dados ir tomar o valor 2 em cada observao.
Depois de criarmos dados utilizado o comando @mean(x) para calcular sua mdia. Ento,
guardarmos esse valor dentro de um escalar denominado "a". O comando show apresenta
qualquer objeto na tela, nesse caso "a".

Partindo do nosso programa inicial, podemos extrair mais informaes da srie dados. Por
exemplo, para o nmero de observaes, desvio padro, valor mximo e mnimo utilizamos
respectivamente os comandos @obs(x), @stdev(x), @max(x) e @min(x).

wfcreate u 100
series dados = rnd
vector(5) a
a(1) = @obs(dados)
a(2) = @stdev(dados)
a(3) = @mean(dados)
a(4) = @max(dados)
a(5) = @min(dados)
show a

Note que, no lugar do escalar "a" utilizamos um vetor "a", isso nos possibilita guardamos
mais posies de informaes. Esse vetor foi includo para ter 5 linhas.
Na mesma linha de raciocnio, podemos desenvolver um programa que crie um workfile com,
agora, cinco sries aleatrias e guarde o nmero de observaes, desvio padro, valor mdio,
mximo e mnimo.

wfcreate u 100
matrix(5,5) a
for !a = 1 to 5
series dados!a = rnd
a(1,!a) = @obs(dados!a)
a(2,!a) = @stdev(dados!a)
a(3,!a) = @mean(dados!a)
a(4,!a) = @max(dados!a)
a(5,!a) = @min(dados!a)
next
show a

Diferente do programa anterior, utilizamos uma matriz 5x5 "a"ao invs do vetor "a", para
acomodar mais de uma coluna. Note que usamos o comando !a. Esse para permitir que
uma varivel tenha um intervalo numrico. Tambm aplicada a instruo for, que abre o loop
encerrado pelo next. Este lao possibilita criarmos um circuito onde a varivel "!a"tomar
inicialmente o valor 1, proceder as linhas seguintes at o comando next, que aumenta "!a"em 1
e retorna a execuo do programa para a linha do for at que "!a"guarde o valor 5 e quebre o
circuito. Desta forma, sempre que houver um for existir um next correspondente.
Para finalizar nosso programa, podemos adicionar um cabealho nossa matriz "a". O
EViews R
no permite o uso de texto dentro de matrizes e por isso utilizamos table(linha,coluna)
que cria um objeto tabela. Na terceira at a oitava linha adicionamos o cabealho na primeira
coluna da tabela "a". Note que, textos so armazenados sendo colocados dentro de aspas.
12 Captulo 1. EViews
R

wfcreate u 100
table(6,6) a
a(1,1) = "Estatsticas/Srie"
a(2,1) = "Obs"
a(3,1) = "Desvio Padro"
a(4,1) = "Mdia"
a(5,1) = "Mximo"
a(6,1) = "Mnimo"
for !a = 1 to 5
series dados!a = rnd
a(1,1+!a) = "dados"+@str(!a)
a(2,1+!a) = @obs(dados!a)
a(3,1+!a) = @stdev(dados!a)
a(4,1+!a) = @mean(dados!a)
a(5,1+!a) = @max(dados!a)
a(6,1+!a) = @min(dados!a)
next
show a

Outro detalhe a ser observado na linha 11, onde preenchido a primeira linha de " a"com
o nome das sries. Para a tabela aceitar o "dados"seguido dos valores de "!a"(1,2,3,4 e 5) em
forma de texto utilizado o comando @str(nmero) que transforma os valores numricos em
texto.
Note que as variveis de controle iniciadas com exclamao (!) so utilizadas para armazenar
nmeros. J as variveis iniciadas com o smbolo de porcentagem (%) guardam informaes de
texto.

Programao 1.1.2 Uma maneira prtica de manipular um conjunto de sries de tempo


agregando em um grupo. Abaixo agrupamos todas as sries do workfile em um grupo de nome
"g". Na segunda linha, tiramos a srie resid do nosso grupo e ento, na terceira linha, instrumos
o EViews R
a buscar o nome da primeira srie do grupo "g"e guardar esse informao em "%a".

group g *
g.drop resid
%a = g.@seriesname(1)
scalar b = @mean{%a}
show b

Na quarta linha, gravamos a mdia de "%a"dentro do escalar "b"e ento exibimos "b". Note
que adicionamos colchetes em "{%a}", isso faz com que o EViews R
execute o texto dentro da
varivel. No se esquea de salvar.

Ao longo desse livro iremos exemplificar diversas aes que podem ser feitas criando seu
prprio programa. A idia que, ao final do livro, voc tenha desenvolvido as habilidades mnimas
para criar um programa.

1.2 Como abrir dados no EViews


R

H vrias formas de abrir dados no EViews R


e cada uma delas ir depender do tipo de informao
que ser utilizado e dos objetivos de pesquisa. As opes para criar um banco de dados so muitas,
1.3 Do Excel para o EViews
R
13

mas, para os propsitos desse livro, precisaremos apenas aprender como abrir ou criar os chamados
workfile.
Para tanto, iremos dividir essa anlise em duas partes. Primeiro abordando sobre a criao de
um conjunto de dados no Excel que, posteriormente, so lidos noEViews R
. A seguir, criando um
workfile e copiando e colando dados. Qual das duas alternativas escolher fica a seu critrio.

1.3 Do Excel para o EViews


R

Vamos supor que se tenha um conjunto de sries de tempo de periodicidade trimestral, com
incio em 2006Q1 e trmino em 2014Q2. Essas podem ser vistas no arquivo em Excel de nome
dados/exemplo1.
Como primeiro passo, abra o EViews R
.
Note que, por hora, no h nada disponvel,
nem dados, informao sobre a periodicidade e
etc. A seguir, v em File/Open/Foreign Data
as Workfile (ver figura 1.3). E selecione o ar-
quivo em Excel (v at a pasta onde o mesmo
foi salvo). Depois clique em Ok.
A janela de opes que se abre a seguir
Figura 1.3: Importando dados do Excel consiste de trs passos. muito comum que
no se mudem as informaes no primeiro e no
segundo passos. Nesse caso, podemos clicar em avanar nesses dois primeiros passos. Porm, no
terceiro passo, caso no se modifique algumas opes, pode ser que o arquivo final no fique tal
como desejado. Em especial se no especificarmos a periodicidade e as datas.
Sendo assim, no passo trs, selecione Dated - regular frequency, que sempre ser utilizado
quando tivermos uma srie de tempo e, depois, a periodicidade trimestral (Quarterly), conforme a
figura 1.4a. Por vezes, o arquivo do Excel j tem uma srie com os dados. Nesses casos, a opo
Dated - specified by date series identifica automaticamente a frequncia e o incio da srie, basta
informar no campo Date series o nome da srie que tem essa informao (ver figura 1.4b). Por fim,
digite a data inicial como 2006Q1 e clique em Finish.
Pronto, agora temos um workfile de 30 trimestres contendo cinco sries de tempo com os
respectivos nomes que estavam no Excel: J30D, INF, PIB e DES.

Programao 1.3.1 Uma forma de fazer a abertura de um workfile via programao, que d
muita agilidade ao trabalho. Basta aplicarmos o comando wfopen seguido do caminho onde se
encontra o arquivo com as sries.

wfopen c:/exemplo1.xlsx

Um ltimo ponto importante para salientar nesse momento sobre a forma que as datas so
inseridas no EViews R
. Como pode ser visto no exemplo acima, especificamos primeiro o ano,
seguido da letra que compem a periodicidade, no caso de trimestre Q e, no caso de meses M
para ento, colocar o perodo. Como os dados comeam no primeiro trimestre, colocamos 1.
Se os dados tivessem como incio maro de 1996, especificaramos 1996M3. Note que os dados
esto no formato Ingls, onde os decimais so separados por ponto. Caso seu computador estiver
no formato Portugs (Brasil), teremos problema na hora que o EViews R
abrir esses dados do
excel. Ele ir confundir os pontos com as vrgulas. A sugesto reconfigurar o computador para
o Ingls americano. A localizao desta opo pode variar ligeiramente conforme a verso do
Windows. Para o Windows 7, acesse Painel de Controle/Relgio, Idioma e Regio/Regio e
Idioma na aba Formatos selecione o Formato Ingls (Estados Unidos). Ento clique em Aplicar
14 Captulo 1. EViews
R

(a) Estrutura - frequncia regular

(b) Estrutura - frequncia definida por srie

Figura 1.4: Importando Dados

e Ok.
Programao 1.3.2 Sempre que for iniciar um programa pode digitar os comandos abaixo
para que seu banco de dados seja aberto automaticamente.

%path = @runpath
cd %path

Ao rodar os comandos acima, o caminho utilizado para abrir os dados, mostrado na barra de
status no canto inferior da tela, ser alterado para o caminho que foi salvo o programa. Sendo
assim, recomenda-se colocar o arquivo ".prg"na mesma pasta em que se encontra o ".wf1". Desta
forma, se salvarmos o exemplo1.xlsx dentro da mesma pasta do programa podemos importar
os dados por programao.

%path = @runpath
cd %path
wfopen exemplo1.xlsx

Tambm possvel definirmos um caminho diferente do que o programa est salvo. Alterando a
primeira linha de comando.

%path = "c:/nome da pasta/"


cd %path
1.4 Criando um Workfile 15

wfopen exemplo1.xlsx

1.4 Criando um Workfile


Tambm podemos copiar os dados
que esto no Excel e colar os mes-
mos no EViews R
. Nesse caso pre-
cisamos criar, como primeiro passo,
um workfile. Assim, abra um novo
arquivo do EViews R
que no con-
tenha informaes. A seguir, v
em File/New/Workfile (ou Ctrl+N).
Dentre as diversas opes dispon-
veis, selecione Dated - regular fre- Figura 1.5: Criando Workfile
quency, a seguir quarterly e especi-
fique o intervalo dos dados, escrevendo a data inicial e final (figura 1.5). Veja como o formato de
datas. Primeiro o ano, seguido da letra do perodo e depois o numero do perodo.

Programao 1.4.1 Para criar um workfile no estruturado utilizamos o comando wfcreate u


seguido do nmero de observaes desejadas. Para criarmos um workfile mensal utilizamos a
opo m seguida da data inicial e final. Da mesma forma, para frequncia trimestral utilizamos q
e anual a.

wfcreate u 100
wfcreate m 1990m1 2015m12
wfcreate q 1990q1 2015q4
wfcreate a 1990 2015

O arquivo que est sendo criado ainda no possui os dados, apenas criamos o chamado workfile.
Para inserir os dados temos que, primeiro, criar um objeto (figura 1.6a). V em Object/New Object
e selecione a opo Group. Do lado direito escolha um nome para o grupo (evite acentos, espaos
e etc, seja bem simples nessas escolhas). A seguir, depois de clicar em Ok, o EViews R
ir abrir
uma janela que bem semelhante com planilhas do Excel. V no Excel, selecione apenas os dados,
no pegando as datas nem os nomes das sries, copie e cole no EViews R
. A seguir feche o mesmo.

(b) Criando pgina com vnculo

(a) Criando Workfile

Figura 1.6: Novo Objeto


16 Captulo 1. EViews
R

Note que agora temos um workfile e os dados, mas, as sries ficaram com nomes diferentes.
Isso pode ser resolvido clicando com o boto direito na srie e renomeando a mesma.
Aps ter os dados no EViews R
, h diversas outras formas de trabalhar com eles de forma
a tornar a pesquisa mais fcil, em especial quando se trabalha com uma grande quantidade de
informao e diversos testes e estimativas.
Uma opo interessante do EViews R
o uso de diversas planilhas ao mesmo tempo, sendo
possvel preservar o vnculo entre as variveis. Tal recurso permite trabalhar com diversos modelos,
separados por planilhas, sem poluir o workfile principal. Selecione as variveis des, inf, j30d
e pib. A seguir, clique com o boto direito do mouse na planilha de nome New Page, selecione
Copy/Extract from Current Page e depois By Link to New Page.
Na janela que ser aberta, ao escrever @all, o EViews R
ir copiar todo o perodo amostral. Em
Objects to copy, selecione Listed Series, como mostrado na figura 1.7, e deixe a opo Include
Links selecionada. Caso queira dar um nome para a nova planilha, clique emPage Destination e,
em Page: escreva o nome que quiser.

Figura 1.7: Objetos com vnculo

Note que ser criada uma nova planilha com os dados selecionados com cores diferentes. Agora,
sempre que os dados nas sries da planilha original forem modificados, o mesmo ir ocorrer com
essas sries na nova planilha.

1.5 Abrindo os dados do FRED


Uma das funcionalidades interessantes do EViews R
poder abrir diversos formatos de dados, e
um deles que bastante til para anlise de conjuntura so os dados do FRED que uma base
de dados disponibilizada pelo Federal Reserve of Saint Louis1 . Como esse um banco de dados
disponibilizado na internet, sua leitura s possvel se houver conexo internet.
O primeiro passo descobrir o nome da srie que se quer abrir. Nesse caso, v no site do
Federal Reserve Board of Saint Louis e descubra o cdigo da srie que se busca. Como exemplo,
vamos usar o PIB Real dos EUA em dlares de 2005, cujo cdigo GDPC1.
Agora, abra um arquivo do EViews R
, v em File/ Open/ Database.. e selecione FRED
database e clique e ok. A janela que ir ser aberta a que permite fazer a conexo com o banco de
dados, tal como a Figura 1.8a. A seguir, v em EasyQuery, abrindo a caixa de dilogo da Figura
1 Se voc ainda no conhece esse recurso, vale a pena ver em: http://research.stlouisfed.org/fred2/
1.5 Abrindo os dados do FRED 17

(a) Seleo da Base de Dados (b) Easy Query

Figura 1.8: Abrindo dados do FRED

1.8b, e em name MATCHES, escreva o nome da srie. No nosso caso, GDPC1 e clique em ok. A
seguir, d dois cliques na srie e exporte a mesma para um banco de dados. Posteriormente iremos
mostrar como possvel voc mesmo criar um link entre o EViews R
e um banco de dados que
se queira para atualizao automtica. Tambm possvel criar um add-in que faz essa seleo
automtica.
2. Grficos no EViews
R

O recurso de grficos em econometria muito til para uma deteco prvia das caractersticas de
um conjunto de dados como, por exemplo, sua distribuio, a existncia de tendncia, movimentos
cclicos, sazonalidade, outliers, quebra estrutural, clusters dentre outras. No EViews R
possvel
personalizar a construo de grficos, escolhendo cores, tamanho e estilo de letra, linhas de
tendncia, combinar diferentes tipos de grficos, vincular os mesmos aos dados e demais aspectos.
H outras opes disponveis em Options/Graphics Default. Deixamos para o leitor explorar esse
ponto consultando o manual que acompanha o software.
Nesse captulo iremos utilizar o arquivo do EViews R
de nome exemplo1.wf1. Abra o mesmo.
Ali ir ver cinco sries de dados de nome qx, y, px, pm, qm. Inicialmente, d dois cliques
na srie de nome qx. O EViews R
ir abrir uma janela que se parece com as planilhas do Excel. A
sequncia de dados que vemos denominada de srie de tempo. Note que, na primeira coluna,
temos as respectivas datas que, para esse exemplo, trimestral, com incio no primeiro trimestre
de 1997 e terminando no segundo trimestre de 2015. Porm, o intervalo vai at 2015Q4, o que
resulta em uma sequencia de clulas que esto vazias, com o termo NA. Isso ir facilitar quando
quisermos prever o comportamento dos dados para alguns perodos a frente. Veremos isso no
captulo de regresso simples.
A seguir, a partir do menu View/Graph.... Note que h vrias opes de grficos. O mais
comum, e que ser mais explorado aqui, fazer um grfico de linha. Selecione esse e o resultado
como aparece na figura 2.1. Alternativamente, podemos fazer um grfico de barras para esse
conjunto de dados. Clique com o boto direito do mouse sobre o grfico e depois Options e
selecione Bar. O mesmo pode ser aplicado a cada uma das outras opes. Outra alternativa usar
o menu opes, localizado logo acima do grfico.
Note que ao fazer o grfico aparece na parte inferior do mesmo uma barra de rolagem. A partir
dessa podemos deslizar o grfico para diferentes datas, basta que mova o cursor na barra para a
esquerda ou para a direita.
O EViews R
permite que se escolha entre diferentes maneiras de apresentar os grficos, mudando
o fundo para cor branca, tornando as linhas mais ntidas, mudando a cor das linhas e etc. Para
verificar todas essas opes, com o grfico aberto clique com o boto direito do mouse e selecione
20 Captulo 2. Grficos no EViews
R

Figura 2.1: Opes de Grficos

Templates. A seguir, escolha cada um dos modelos e, antes de clicar em Ok, clique em Apply
para ver se te agrada.

Programao 2.0.1 Para fazer um grfico, usamos o comando graph. Para o exemplo de um
grfico de linha, aplicado srie qx colocamos o termo abaixo criando um grfico de nome gqx.
A seguir, especificamos que a linha tem cor vermelha, dado pelo RGB(255,0,0)a .

graph gqx.line qx
gqx.setelem linecolor(255,0,0)

Dentre as vrias opes a serem utilizadas em um grfico de linha, uma das mais teis para a
econometria a padronizao dos dados. Nesse caso, o que fazemos criar um grfico onde cada
informao subtrada da mdia e depois dividida pelo desvio-padro. Assim, o resultado final
uma nova sequencia de dados onde a mdia zero e o desvio-padro 1. Para essa opo use :

graph gqx.line(n) qx
a Se quiser outra cor, consulte os cdigos de cores RGB

Aps criar o grfico, como mostrado no box de programao, o produto final um grfico
no estilo congelado ou frozen. Esse uma espcie de grfico desvinculado dos dados. O
inconveniente dessa opo que toda vez que os dados originais forem atualizados isso no ser
feito no nosso grfico, ou seja, ao aplicar o freeze no grfico, o mesmo perde o vnculo com os
dados.
Para contornar esse problema devemos voltar a vincular os dados ao grfico. D dois cliques no
grfico gqx. A seguir selecione Graph Updating e, do lado direito as opes Automatic e, mais
abaixo, Update when data or the workfile sample changes.

Programao 2.0.2 Podemos montar um programa que faa automaticamente a atualizao


dos nossos grficos. Primeiro criamos um grfico de nome gqx e depois especificamos pelo
comando setupdate e, entre parnteses a, que o mesmo seja atualizado sempre que o conjunto
de dados mudarem. Ao fazer isso note que a cor da caixa que especifica o grfico no workfile
muda da cor verde para alaranjado.
21

Figura 2.2: Grfico de qx com a distribuio de frequncia

graph gqx.line(n) qx
gqx.setupdate(a)

Vimos anteriormente que tambm temos a opo de criar um grfico de barra. Porm, essa no
muito interessante quando h uma srie de dados com muitas informaes, isso porque as barras
acabam ficando muito finas, fazendo com que o grfico de barras se aproxime de um grfico de
rea. Para o exemplo da srie qx, selecione a opo de grfico de barra e veja como fica. Caso a sua
escolha seja para um grfico de barra h vrias opes interessantes. Clique duas vezes no grfico e
selecione Graph Elements/Bar-Area-Pie. Ali ser possvel escolher entre grficos com efeito de
cores, 3D, colocar os respectivos valores em cada barra e diversas outras opes.
Outra possibilidade de uso dos grficos no EViews R
combinar diferentes informaes. Por
exemplo, vamos ver como fazer um grfico que mostre simultaneamente a evoluo dos dados no
tempo e a distribuio dos mesmos.
Com a srie qx aberta, v em View/Graph..., selecione Line&Symbol e depois, na opo Axis
borders, escolha Histogram. Tambm h a opo de usar a densidade de kernel. Note que a srie
mostrada considerando as datas no eixo horizontal e as escalas no vertical. A distribuio de
frequncia dos dados colocada nesse eixo.

Programao 2.0.3 Esse grfico tambm pode ser feito a partir da opo ab=hist no comando
line, como mostrado a seguir:

graph gqx.line(ab=hist) qx

Alternativamente, se quisermos especificar ma distribuio de kernel ao invs da distribuio de


frequncia, podemos usar o comando:

graph gqx.line(ab=k) qx

Alm disso, podemos adicionar um texto para identificar nosso grfico. No exemplo abaixo
colocamos um ttulo srie de dados qx, entre aspas, com uma fonte de tamanho 12, do tipo
ubuntu light. Por fim, o comando t especifica que o texto centralizado.

gqx.addtext(pt=12,face="ubuntu light",t) "Serie de dados qx"

Algumas opes para grficos no EViews


R
somente se tornam disponveis quando o grfico
22 Captulo 2. Grficos no EViews
R

Figura 2.3: Grfico de qx com area

um objeto(nomeado ou no). Pela linha de comando criamos automaticamente o objeto, a exemplo


do grfico gqx criado acima. Para tanto, na interface grfica utilizamos a funo Freeze. Faa um
grfico da srie qx e, no menu superior, poder ver essa funo. Uma das funes interessantes do
EViews R
marcar perodos especficos de dados com uma rea escura, muito til quando estamos
avaliando ciclo dos negcios e gostaramos de sinalizar os perodos em que uma economia estava
em recesso. Ou ento queremos apenas sinalizar um intervalo de tempo para mostrar algum
acontecimento.
Para usar essa funo, clique com o boto direito do mouse no grfico e, a seguir, selecione
Add lines & shading. Note que esse recurso no est disponvel para grficos comuns. Como dito
anteriormente, para habilitar essa funo devemos selecionar antes o Freeze. A seguir, clique com o
boto direito do mouse, selecione Add lines & shading, marque Shaded Area, deixe em Vertical
Bottom axis e mude o perodo para 2008Q2 at 2009Q1. Caso no esteja satisfeito com esse
intervalo, clique duas vezes sobre a rea cinza e modifique o intervalo.
Lembre que a opo Freeze tem a desvantagem de no ser atualizada sempre que os dados
forem atualizados. Podemos contornar isso. Com o grfico aberto d dois cliques e depois selecione
Graph Updating. A seguir, selecione a opo Automatic e Update when data or the workfile
sample changes. Isso ir permitir que o grfico seja atualizado sempre que os dados forem
modificados no workfile.
Programao 2.0.4 Uma opo interessante a ser utilizada em grficos especificar uma rea
em um determinado perodo. Isso pode ser feito a partir do comando draw. Dentre as opes,
escolhemos que a rea segue as datas na parte horizontal (bottom), a cor cinza (gray) e o perodo
compreendido.

gqx.draw(shade,bottom,color(gray)) 2008Q2 2009Q1

Outra opo que pode ser utilizada mostrar duas sries de dados no mesmo grfico, em
especial quando as mesmas possuem escalas diferentes. Nesse caso, se fizermos esse grfico com
apenas um eixo vertical, visualmente podemos ter uma informao de baixa qualidade. O EViews R

permite que se faa um grfico com dois eixos, cada um com escala diferente.
23

Figura 2.4: Grfico de qx e px

Isso pode ser feito depois de se criar um grupo com as sries que se quer ilustrar. Selecione
primeiro a srie qx. Com o boto Ctrl do teclado pressionado, selecione a srie px. A seguir, clique
com o boto direito do mouse e Open as Group. O EViews R
ir abrir as duas sries em conjunto,
uma em cada coluna. A seguir, clique em View/Graph... e depois em Ok.
Note que temos uma nica escala do lado esquerdo do grfico. Agora, clique com o boto
direito do mouse, v em options e Axes & Scaling e, depois Data scaling. A seguir, do lado direito
da tela, para cada srie selecionada, escolha a escala que quer coloc-la, se esquerda ou direita.
Nesse exemplo, escolhemos deixar a srie qx no eixo esquerdo e a px no direito. Como exerccio,
veja se consegue tambm inserir a informao da distribuio de freqncia para cada conjunto de
dados como mostrado na figura 2.4.

Programao 2.0.5 Um grfico com duas linhas em duas colunas de escalas diferentes pode
ser obtido a partir de uma instruo por linha de comando. Nesse caso, usamos d, que permite
criar um grfico com duas colunas. No se esquea de especificar qual a segunda srie de
dados que se quer colocar junto. No exemplo abaixo usamos a srie px. Note que tambm
especificamos a opo de histograma.

graph gqx.line(ab=hist,d) qx px

Outra forma de usar os recursos grficos para identificar caractersticas estatsticas dos
dados, uma possvel relao entre diferentes variveis dentre outras opes. Vamos iniciar essa
discusso mostrando como so as funes de distribuio. Selecione a srie qx. A seguir, v em
View/Graph... e, em Graph Type, selecione Distribution. Do lado direito, em Details, poder ver
que h diversas opes de grfico. Selecionando Histogram, o EViews R
ir retornar a distribuio
dos dados de acordo com intervalos pr determinados.
Essa anlise pode ser complementada com um grfico que tem o mesmo formato, mas que, ao
invs de ser uma distribuio de frequncia, seja uma funo de densidade ou ento uma funo
de frequncia relativa. Essas trs opes podem ser selecionadas ao lado da opo Histogram na
caixa Options. V em Scaling e selecione Density. O desenho no ir mudar, mas, note que a
escala vertical sim. Isso porque, no caso da frequncia temos, no eixo vertical, a informao do
nmero de dados encontrados para cada intervalo. No caso da densidade estamos falando da rea, o
que tambm ser diferente para o caso de se selecionar Relative frequency.
Vamos agora adicionar uma estimativa da funo de distribuio utilizando uma funo de
Kernel. Com a srie de dados qx aberta, faa o grfico de distribuio e a seguir clique em Options.
24 Captulo 2. Grficos no EViews
R

Figura 2.5: Grfico de Distribuio de Frequncia

Figura 2.6: Adicionando uma densidade de Kernel

A seguir, na caixa Details, selecione Options e depois em Add. Escolha Kernel density e clique
em ok. A figura 2.6 mostra o resultado1 .
Note que h vrias opes para a densidade de kernel. A figura 2.7 a seguir, mostra a comparao
entre essas diversas funes utilizadas para estimar a funo de densidade de kernel. Note que h
pouca diferena entre os resultados.

Programao 2.0.6 Para fazer um grfico de distribuio conjugado com uma estimativa via
densidade de Kernel, podemos usar o seguinte comando.

qx.distplot hist kernel

Ou ento, se quisermos colocar em um nico grfico as diversas estimativas das funes de

1 A ferramenta de determinar a densidade de kernel uma forma no-paramtrica utilizada para determinar a densidade

de uma funo de distribuio de dados aleatrios, onde no conhecemos a funo de distribuio verdadeira. Nesse
caso, fazemos inferncia sobre essa distribuio utilizando estatsticas da amostra que temos. H vrias funes de
kernel disponveis no EViews R
: Epanechnikov, uniforme,triangular, normal, biweight, triweight e cosinus. Se a opo
utilizar a kernel normal, ento, na sua estimativa utilizada uma funo de densidade normal padro.
25

Figura 2.7: Comparao entre diversas funes de densidade de Kernel

Figura 2.8: Grfico de Distribuio de Freqncia

kernel, usamos:

qx.distplot kernel(k=u,x) kernel(k=e) kernel(k=r) kernel(k=n) kernel(k=b)


kernel(k=t) kernel(k=c)
Alternativamente, com o grfico aberto, clique em Proc/Make Distribution Plot Data. Como
pode ser visto, h vrias opes de distribuio que podemos investigar. Voltando ao nosso exemplo
da distribuio de frequncia, v em Options, depois em Add e podemos ver que h diversas
opes alm do histograma. J exemplificamos o uso da densidade de kernel. Selecione agora
Theorical Density, e clique em Ok. A seguir, clique novamente em Theorical distribution, e veja
que h diversas opes de funes de distribuio. Selecione a Normal e escolha os parmetros.
Se a escolha for = 0 e = 1, ento simularemos uma curva normal padro junto com nosso
histograma dos dados, como pode ser visto na figura 2.8.

Programao 2.0.7 Para inserir um grfico com distribuio terica junto com o histograma
podemos usar o seguinte comando:
26 Captulo 2. Grficos no EViews
R

qx.distplot hist theory(dist=normal)


As opes de construo de grficos tambm permite que sejam investigadas caractersticas
dessa distribuio. Como se sabe, a funo de distribuio cumulativa de dados que possuem
uma distribuio normal tem o formato de um S. Mais a frente entraremos em detalhe sobre
a funo cumulativa e sua importncia na determinao das probabilidades associadas a valores
na construo de intervalos de probabilidade, teste de hiptese e uso em modelos como probit.
Para investigar se os nossos dados possuem essa caracterstica, com o grfico aberto, clique com
o boto direito do mouse e selecione Options. A seguir, do lado direito da tela, em distribution,
selecione a opo Empirical CDF, que ir retornar os resultados para uma funo de ditribuio
cumulativa. Como pode ser visto pela figura 2.9a, os nossos dados no parecem ter uma distribuio
normal. Outra forma de verificar isso via quantis. Abra a srie qx, clique em View/Graph... e,
na tela Graph Type, na parte Specific, clique em Quantile-Quantile e depois, em Q-Q graph,
e selecione Theoretical. Note que, em ambos os resultados mostrados na figura 2.9, no h
evidncias de uma distribuio normal. Porm, para confirmar tal resultado necessrio que se
faa um teste especfico que ser explicado no Captulo 4.
A Figura 2.9 representa o grfico da distribuio cumulativa associa a cada valor, no eixo
horizontal, o percentual de vezes que o mesmo se encontra no conjunto de dados que so menores
ou iguais a esse valor. Dessa forma, no eixo vertical fica descrita essa participao percentual,
tambm denominada de frequncia. Note que, como estamos falando de distribuio acumulada, ao
final, teremos uma frequncia de valor 1, ou seja, 100%. No grfico da Figura 2.9a o valor 70 estaria
associado a uma frequncia de 0,33 no eixo vertical. Ou seja, a probabilidade de encontrarmos um
valor, no nosso banco de dados, que menor que 70, P(x 70) = 0, 33 de 33%. Alm de mostrar
essa linha, o EViews R
tambm coloca o intervalo de confiana, apresentado pela linha pontilhada.

(a) Funo distribuio cumulativa

(b) Quantis

Figura 2.9: Grfico da empirical CDF e quantile-quantile

Programao 2.0.8 Para ver o grfico da empirical CDF usamos o comando abaixo:

qx.distplot cdf

E, para fazer o grfico do quantile-quantile usamos:


27

qx.distplot quantile
Alm dos grficos para uma srie de dados apenas, podemos ver como se d a relao entre
dois conjuntos de dados, uma investigao prvia dos resultados da regresso simples. Nesse caso,
vamos comparar o resultado da srie y com a srie qx, considerando que qx=f(y).
Primeiro selecione a varivel y e depois qx e clique com o boto direito do mouse abrindo
ambas como grupo. A ordem das variveis aqui importa na hora de verificar o resultado final.
Selecione sempre a varivel independente e depois a dependente para esse tipo de grfico. A seguir,
em View/Graph... selecione o grfico tipo Scatter e em Fit lines escolha Regression Line. Isso
ir adicionar uma linha de regresso entre as duas variveis. Depois, para mostrar o resultado da
linha de regresso clique em Options e, em Legend Labels selecione Detailed. Por fim, em Axis
borders selecione Kernel density para termos a informao da distribuio de kernel para cada
um dos dados. O grfico resultante ir indicar a relao positiva entre os dois conjuntos de dados e,
em cada eixo, a estimativa da distribuio de kernel para cada um desses conjuntos. Tambm ser
mostrado o resultado da equao de regresso simples.

Figura 2.10: Scatter e linha de regresso entre qx e y

Programao 2.0.9 Para fazer um grfico do tipo scatter plot entre duas variveis, inserindo
uma curva de regresso e mostrando o resultado da equao de regresso, devemos primeiro
fazer o grupo com as variveis de interesse e depois pedir o grfico. Por fim, usamos a opo
kernel para mostrar a distribuio de kernel nos eixos:

group g1 y qx
g1.scat(ab=kernel) linefit(leg=det)

Alternativamente, pode-se estar interessado em ver a relao de todas as variveis em pares.


Nesse caso, selecione todas as sries qx, y, px, pm, qm e abra como grupo. A seguir, em
View/Graph... escolha Scatter, em Fit lines selecione Regression Line, e em Multiple series
selecione Lower triangular matrix ( uma matriz simtrica). O EViews R
ir retornar a relao
em par de todas as variveis.

Programao 2.0.10 Para fazer um grfico do tipo scatter plot entre diversas variveis, inse-
28 Captulo 2. Grficos no EViews
R

Figura 2.11: Scatter e linha de regresso entre todas as variveis

rindo uma curva de regresso, devemos primeiro fazer o grupo com as variveis de interesse e
depois pedir o grfico. Por fim, usamos a opo kernel para mostrar a distribuio de kernel nos
eixos. O comando m especifica que so mltiplos grficos. O comando mult=l especifica que
uma matriz de grficos triangular inferior.

group g1 y qx px pm qm
g1.scat(m, mult=l,ab=kernel) linefit(leg=det)

2.1 Dados Categricos


O formato de dados conhecido como categricos muito comum na investigao em economia.
Podemos citar, por exemplo, o uso de microdados da PNAD/IBGE, onde temos informaes de
indivduos com suas respectivas caractersticas como idade, cor, sexo, situao matrimonial, salrio
e etc. Os grficos que so feitos considerando dados categricos so diferentes daqueles utilizados
em sries de tempo.
Para ilustrar o uso de grficos com dados categricos usamos os dados de exemplo do EViews R

gulfcoast.wf1. Nesse esto informaes sobre demografia de distritos localizados em uma regio dos
EUA. So 234 informaes com 117 distritos, cada qual com duas informaes em dois momentos
do tempo. Os dados esto organizados no formato Unstructured/Undated. So quatro series: pop-
populao em 1.000 para cada distrito, pdiff, pop_previous e year. Como so dois momentos
no tempo, a organizao dos dados segue uma lgica de primeiro mostrar os 117 resultados para o
ano de 2005 e depois os 117 resultados para o ano de 2006. Note que so criados identificadores
para os indivduos. O County_code mostra o cdigo de cada municpio, County_name o nome dos
2.2 Exemplos de programas.prg 29

Figura 2.12: Dados categricos - soma da populao por ano

municpios, que se repetem a partir da observao de nmero 118. O id mostra o estado associado
ao distrito; state_code o cdigo do estado e state_name o nome do estado.
Vejamos como seria um grfico que compara o total da populao dos 117 distritos em cada um
dos dois anos analisados. Abra a srie pop e depois v em View/Graph... e mude para a opo
Categorical graph. A seguir selecione a opo Bar, para fazermos um grfico de barras, e depois
em Betails use Sums, para termos a soma da populao em cada um dos anos. Note no detalhe que
especificamos na opo Within graph a srie year. Isso ir fazer com que o programa entenda
que h dois momentos no banco de dados.

2.2 Exemplos de programas.prg


Com os conhecimentos adquiridos neste captulo somos capazes de criar programas para formatar
nossos grficos de uma mesma maneira, padronizando trabalhos de forma fcil. Para criar um
programa clique em File, ento New e Program.

Programao 2.2.1 Com o exemplo1.wf1 aberto, o programa abaixo ir gerar um grfico de


linha, na cor preta, para cada uma das sries padronizadas adicionando uma linha pontilhada, na
mdia zero, e redimencinar o tamanho.

for %a y qx px pm qm
graph g{%a}.line(n) {%a}
g{%a}.setelem linecolor(0,0,0)
g{%a}.draw(dashline, left, rgb(172,172,172)) 0
g{%a}.options size(6,2)
show g{%a}
next

Programao 2.2.2 Abaixo a sequncia de comandos que utilizamos para abrir automatica-
mente o exemplo1.wf1, criar um grfico com as sries qx e px, uma em cada eixo, com as
respectivas funes de distribuio. Alm de pintar na cor vermelha qx e px em azul, adicionar a
barra cinza vertical, entre 2008Q2 e 2009Q1, e adicionar o ttulo ao grfico.

%path = @runpath
30 Captulo 2. Grficos no EViews
R

cd %path
load exemplo1.wf1
graph gqx.line(ab=hist,d) qx px
gqx.setelem(1) linecolor(255,0,0)
gqx.setelem(2) linecolor(132,112,255)
gqx.draw(shade,bottom,color(gray)) 2008Q2 2009Q1
gqx.addtext(pt=12,face="ubuntu light",t) "Series QX e PX"
show gqx
Com a utilizao de sub-rotinas podemos sofisticar nossos programas. A criao destas feita
da mesma forma que um programa, File/New/Program. Para "chamar"uma sub-rotina dentro de
um programa necessrio especificar o caminho exato da mesma. Caso o caminho inteiro no
seja especificado o programa.prg deve estar salvo dentro do mesmo diretrio da sub-rotina a ser
excutada.
Programao 2.2.3 A sub-rotina sub_recessoescodace.prg descrita a seguir destaca as reces-
ses do ciclo de negcios brasileiro datado pelo Comit de Datao de Ciclos Econmicos
(CODACE), em 30 de Julho de 2015.

subroutine recessoescodace(graph g1)


g1.draw(shade,bottom) 1981Q1 1983Q1
g1.draw(shade,bottom) 1987Q3 1988Q4
g1.draw(shade,bottom) 1989Q3 1992Q1
g1.draw(shade,bottom) 1995Q2 1995Q3
g1.draw(shade,bottom) 1998Q1 1999Q1
g1.draw(shade,bottom) 2001Q2 2001Q4
g1.draw(shade,bottom) 2003Q1 2003Q2
g1.draw(shade,bottom) 2008Q4 2009Q1
g1.draw(shade,bottom, color(255,100,100)) 2014Q2 2015Q2
endsub

Com o exemplo2.wf1 aberto rode o programa prog_recessoescodace.prg, descrito abaixo.


Esse utiliza da sub-rotina sub_recessoescodace.prg e por isso ambos devem ser salvos na mesma
pasta antes da execuo.

include sub_recessoescodace.prg 'Arquivo com a subroutina CODACE


graph gpx.line(d) pib x ' Cria o grfico gpx com duas escalas
gpx.setelem(1) legend(PIB Brasil) ' Adiciona legenda da srie 1
gpx.setelem(2) legend(Exportaes Brasil) ' Adiciona legenda da srie 2
gpx.setelem(2) linecolor(0,0,0) ' Altera cor da linha da srie 2
' Chama subrotina para marcar as recessoes segundo CODACE
call recessoescodace(gpx)
show gpx 'Apresenta grfico gpx na tela

Com base nos programas apresentados acima inclua a sub-rotina sub_recessoescodace.prg ao


programa 2.2.2. Destacando as recesses do ciclo de negcios brasileiro datado pelo CODACE nos
grficos de todas as sries do exemplo1.wf1.
3. Funes de Distribuio

O EViews R
permite a construo de diversas curvas de distribuio, que podem tanto serem
discretas quanto contnuas. As mais utilizadas em testes de econometria so as funes normal,
t-student, log-normal, F e qui-quadrado, que aqui iremos ilustrar1 .
Ao trabalhar com funes de distribuio, devemos compreender dois pontos importantes. O
primeiro se a varivel em questo categrica ou numrica e, o segundo, as diferenas que existem
entre uma funo de probabilidade, ou densidade, uma distribuio cumulativa e uma distribuio
inversa, que a inversa da funo cumulativa. As variveis categricas so fceis de identificar. Ao
aplicar um questionrio com perguntas que contenham respostas como do tipo, sexo, nacionalidade
e etc, obtemos como resposta caractersticas e no nmeros. Essa classificao ser importante
para definir que tipo de teste ir usar para avaliar os resultados. Por exemplo, se perguntarmos o
sexo dos entrevistados, temos respostas categricas como homem ou mulher. Por outro lado, se
perguntarmos a idade teremos respostas numricas. Essas podem tanto serem discretas, ou seja, 25
anos, 35 anos, ou contnuas, expressando a idade inclusive em minutos, 13.140.325 minutos de
vida.
A funo de densidade representa a distribuio de probabilidade de uma varivel aleatria.
como a probabilidade ir se comportar de acordo com os valores que essa varivel aleatria ir
assumir. comum no conhecermos a funo de densidade que ir representar o nosso conjunto
de dados. Por isso que fazemos testes para ver se os nossos dados possuem uma distribuio que
pode ser aproximada, por exemplo, por uma curva normal, uma curva t-student, uma curva F ou
qualquer outra. Dada a nossa funo de densidade, toda a rea abaixo da curva dever somar 1, que
a probabilidade da varivel assumir qualquer valor. No EViews R
, supondo uma curva normal, a
funo densidade utilizada a partir do comando @dnorm(), onde dentro do parnteses podemos
colocar os valores do banco de dados2 . A funo de densidade pode ser determinada fazendo a
derivada da funo de distribuio cumulativa. Em termos matemticos uma funo densidade de x
1 H diversas outras distribuies contnuas em estatstica como a Beta, de Cauchy, Exponencial, Gamma, Gum-
bel, Logstica, Uniforme e de Weibull. Dentre as distribuies contnuas, destaque para a Binomial, Geomtrica,
Hipergeomtrica, Multinomial e de Poisson.
2 Os cdigos das diferentes funes de densidade no EViews so precedidos da letra d. Por exemplo:

@dlogistic(); @dpareto (); @dpoisson(); @dtdist(); @dunif().


32 Captulo 3. Funes de Distribuio
Rb
representada a partir de Fx (x) = P(a x b) = a f (x)dx.
Descoberta a funo de densidade, podemos usar a distribuio cumulativa. Esta ir determi-
nar o quanto da curva, ou da probabilidade, existe at determinado valor que se queira avaliar. Para
o exemplo de uma curva normal, podemos encontrar qual a probabilidade de se ter um valor menor
que x, por exemplo. Esse dado por toda a rea abaixo da curva e que inferior ao ponto x.
O conceito de distribuio cumulativa muito importante para os propsitos do entendimento da
econometria e em testes de hiptese, pois usamos esse conceito para encontrar o p-valor nos testes.
Para encontrar a resposta na distribuio cumulativa, especificamos o ponto da curva que se queira
e encontramos a rea (probabilidade) at esse ponto. A funo do EViews R
que iremos utilizar
para a distribuio cumulativa, para o caso de termos uma distribuio normal, a @cnorm(), e
a rea escura mostrada na figura 3.1 a rea resultante3 . Mais a frente, ao estudarmos sobre os
testes de hiptese, ficar claro que a rea dada por 1 - @cnorm representa o p-valor, ou como
comumente escrito, probability. Em termos matemticos a representao da funo de distribuio
cumulativa dada por: F(z) = P(z x).R No exemplo da Figura 3.1 a rea dada por @cnorm(x)
x
pode ser representada a partir de F(x) = f (x)dx.

Figura 3.1: Distribuio Cumulativa

Por fim, a distribuio inversa ir representar a rea da curva que complementar funo
de distribuio cumulativa. Agora fazemos o procedimento inverso da cumulativa, especificamos
a rea desejada e, com isso, obtemos o ponto na curva que representa essa rea. Aqui, temos
conhecimento da rea da curva que estamos avaliando e queremos encontrar o ponto associado. No
EViews R
o comando utilizado para a distribuio inversa, para o exemplo de uma curva normal,
@qnorm().
Todas essas trs formas de avaliar uma funo de distribuio esto disponveis noEViews R
e
sero aplicadas a diferentes formas de distribuio a seguir. Nesse caso, para cada uma das opes
de uma distribuio o EViews R
fornece cdigos diferentes. Por exemplo, para uma funo de
distribuio cumulativa, tambm denominada de CDF, usa-se o comando @c. Para uma funo de
probabilidade (densidade), usa-se @d e, por fim, para uma funo inversa, @q. Tambm possvel
criar funes de distribuio aleatrias a partir do comando @r, que gera nmeros aleatrios.
Veremos isso nas aplicaes para as diferentes distribuies a serem analisadas nos tpicos a seguir.

3 De maneira anloga ao visto, na funo de densidade cumulativa precedida da letra c nos comandos do EViews
R

. Por exemplo: @clognorm(); @cpareto(); @cpoisson(); @ctdist().


3.1 A Curva Normal 33

3.1 A Curva Normal


Essa uma das mais importantes e tambm mais usadas funes de distribuio de probabilidade,
tambm denominada de curva de Gauss. Suponha uma varivel aleatria X com n dados. Se
estamos assumindo que essa varivel tem uma distribuio normal, podemos determinar cada ponto
dessa curva a partir da equao:
1 (x)2
z = e 2 2 (3.1)
2
Onde a mdia da varivel aleatria X, o seu respectivo desvio-padro e x o ponto a
ser avaliado. Um caso particular e muito til dessa curva a normal padro". Nesta, a mdia
zero e o desvio-padro 1. Destaca-se que mesmo que nossa varivel X no tenha mdia igual a
zero e desvio-padro 1 podemos converter os mesmos para essas medidas, no que se denomina de
padronizao.
Como forma de ilustrar o uso de funes de distribuio, vamos criar um arquivo com 1 milho
de dados aleatrios. Abra o EViews R
e clique em Create a New EViews R
workfile. A seguir,
escolha uma estrutura tal como mostrado na figura 3.2a, digite 1000000 para especificar o nmero
de observaes que iremos usar e d um nome para o WF (workfile) e a pgina. A partir de 3.1,
podeos ver que uma curva norma padro representada por:
1 x2
z= e2 (3.2)
2

(a) Distribuio (b) Com densidade de Karnel

Figura 3.2: Alterando o intervalo

Voc pode modificar a qualquer momento o tamanho desse banco de dados, basta clicar duas
vezes em Range e aumentar ou diminuir o intervalo. Note que, nesse momento, no h nenhuma
informao, ou seja, nenhum dado associado. Como primeiro passo, vamos simular uma varivel
aleatria que tenha 1 milho de dados definindo que a mesma tenha uma distribuio normal. Para
fazer isso vamos usar o comando @rnorm como mostrado no box de programao.

Programao 3.1.1 Podemos gerar nmeros aleatrios no EViews


R
de vrias formas. Para
criar um arquivo do EViews R
com dados inteiros no total de 1 milho, ou seja, uma serie com
1000000 linhas, usamos o comando abaixo no arquivo:

rndseed 10
series z=@rnorm
34 Captulo 3. Funes de Distribuio

Dica : Muitas vezes melhor usar o conceito de series do que vector.

Ao iniciar os comandos descritos no box programao, determinamos a srie aleatria utilizada


com o comando rndseed 10 e criamos uma srie denominada z de 1 milho de dados aleatrios
com o comando @rnorm. Ao repetir esse procedimento sem aplicar rndseed 10 ou utilizando
qualquer outro gerador aleatrio (rndseed 1, por exemplo), a sequncia de dados ir diferir a cada
momento. Porm, como especificamos que os dados seguem uma distribuio normal padro a
partir de norm, sempre que simular um novo conjunto de informaes, ela ter a mesma distribuio.
Para confirmar, faa um grfico de distribuio dos nossos dados. Abra a srie z, v em View
/Graph . . . , em tipo de grfico selecione distribution e depois clique em ok. A seguir, adicione
uma estimativa da curva a partir da densidade de kernel. Dica: com a opo grfico aberta v em
details e crie um grfico personalizado custom.
Outra contribuio interessante para visualizar comparar nosso conjunto de dados com uma
distribuio normal terica, ou seja, uma curva normal que seja criada a partir da funo. Com
o grfico aberto clique em options, a seguir, do lado direito, em options novamente. Depois em
add e theoretical density. Vamos escolher primeiro uma curva normal e clique em ok. Note que
a mesma fica praticamente imperceptvel, uma vez que a curva terica se mistura com a curva
estimada pela densidade de kernel (Figura 3.3b).

(a) Distribuio
(b) Com densidade de Karnel

Figura 3.3: Distribuio Normal

Programao 3.1.2 Para fazer um grfico que tenha o histograma de uma srie e mais duas
curvas tericas com diferentes valores para a mdia, podemos usar o comando abaixo. O termo
p1=1 representa a mdia=1:

z.distplot hist theory(dist=normal,p1=1) theory(dist=normal,p1=2)

Para fazer o mesmo grfico, mas com diferentes valores para o desvio-padro, especificando trs
diferentes curvas, que o segundo parmetro na curva normal, usamos:

z.distplot hist theory(dist=normal,p2=1)


theory(dist=normal,p2=2) theory(dist=normal,p2=3)

Podemos mudar os parmetros dessa densidade terica para que ela fique mais ntida. Repita
os passos a seguir e, em theoretical density especifique mdia = 1 e desvio padro = 1. Note que
agora a curva de cor verde se desloca para a direita na Figura 3.4a.
Esse procedimento pode ser repetido para diferentes valores de mdia e desvio padro e, dessa
3.1 A Curva Normal 35

(b)
(a)

Figura 3.4: Alterando a mdia e o desvio-padro

forma, podemos encontrar diferentes formatos para a curva normal. Para exemplificar isso, com o
grfico aberto clique em options. A seguir, em options novamente e, do lado esquerdo, apague os
grficos histogram e kernel. Acrescente mais duas curvas normais tericas. No total, teremos trs
curvas (figura 3.4b). Agora, deixe todas com mdia igual a zero e faa para a primeira curva desvio
padro igual a 1, depois para a segunda um desvio padro igual a 2 e, para a terceira curva, desvio
padro igual a 3. Clique em ok e voc ir gerar o grfico da Figura 3.4b.
Ao especificar diferentes valores para o desvio-padro na curva, estamos determinando o que se
conhece como curtose. Note que, para a curva azul no grfico 3.4b, temos uma maior concentrao
de dados em torno da mdia e, na curva verde, mais achatada, os dados so mais espalhados. Iremos
ver como obter o resultado estatstico da curtose a partir da mdia e do desvio padro no prximo
captulo. Mas, o leitor j pode ir se familiarizando com o formato de uma distribuio de dados
com diferentes desvios em torno da mdia.
Programao 3.1.3 Para avaliar a funo de densidade em um ponto qualquer da nossa funo
de distribuio podemos usar o comando d antes da distribuio que est sendo avaliada. Para
o caso de uma distribuio normal, com mdia 0 e desvio-padro 1, usamos:

scalar r=@dnorm(0)

Aqui, o comando scalar cria a caixa de nome r para receber o valor da distribuio. A seguir,
especificamos d, para determinar que queremos a funo de densidade, seguido de norm, que a
curva normal com mdia 0 e desvio-padro 1 e, por fim, o valor 0 entre parnteses especifica
que estamos avaliando a densidade naquele valor.

Agora que j sabemos como gerar uma curva normal aleatoriamente, vamos testar outras opes.
Suponha que se queira um conjunto de dados que segue determinados parmetros, por exemplo,
mdia igual a 0 e desvio-padro igual a 1. Nesse caso, podemos criar a srie x usando apenas o
comando nrnd.
Por outro lado, se queremos especificar uma mdia diferente, como por exemplo, 100 e
varincia igual a 22 o melhor usar uma equao. Nesse caso, criamos a srie y e o comando @sqr
representa a raiz de 22, que seria o desvio-padro. A seguir, multiplicamos esse por uma srie
gerada aleatoriamente com distribuio normal.

Programao 3.1.4 Tambm podemos gerar uma srie de dados que segue uma distribuio
36 Captulo 3. Funes de Distribuio

normal com mdia zero e desvio-padro igual a 1 usando o comando nrnd:

Series x=nrnd

Alternativamente, para gerar uma srie de dados que tem mdia igual a 100 e varincia igual a
22, usa-se:

Series y=100+@sqr(22)*nrnd

O comando que especifica uma distribuio inversa tambm pode ser utilizado para gerar uma
sequncia de nmeros aleatrios porm, partindo de probabilidades. Vamos escolher a distribuio
normal para exemplificar, criando uma srie de nome t, e usando o comando q.

Programao 3.1.5 Por fim, podemos gerar dados com distribuio, como, por exemplo, uma
normal, com mdia zero e varincia igual 1 usando uma funo inversa. Para tanto, usamos o
termo q que representa que estamos construindo uma funo quantlica, ou seja, a inversa da
funo de distribuio cumulativa. O termo rnd especificado para o parmetro de probabilidade.
Esse tem que ser entre 0 e 1. Nesse caso, ao colocar rnd construmos a curva normal a partir de
diversos valores aleatrios para a probabilidade.

series t=@qnorm(rnd)

O comando q antes da especificao da curva tambm til para determinar o ponto da curva
que associado a uma determinada rea. Para o exemplo de uma curva normal padro sabemos
que o ponto 0, que representa a mdia dos dados, divide a rea em duas partes iguais, 50% antes e
50% depois. Se usarmos scalar a=@qnorm(0.5) encontraremos o valor 0, ou seja, o ponto a = 0
representa 50% da curva acumulada. Teste scalar a=@qnorm(0.025), que uma rea de 2,5%.
O resultado ser -1,959, ou seja, o ponto no qual a rea a esquerda de x representa 2,5% do total.
O que est dizendo esse comando? Primeiro que a funo utilizada qnorm() ir retornar um
valor. Sendo assim, especificamos a como um escalar, exatamente porque ir receber um nmero.
Em segundo lugar, o valor 0.5 representa uma probabilidade de 50% que ser aplicada funo
normal. Nesse caso, queremos saber qual o valor na curva normal que ir resultar em uma rea de
50%. Essa rea especificada como toda a rea a esquerda do valor.
Agora, se estamos interessados em saber qual o valor associado a uma curva normal padro
que ir determinar 95% da rea, como podemos proceder? Usamos scalar a = @qnorm(0.95)
o que ir retornar o valor 1,644854.
A informao sobre a funo inversa similar ao que obtemos ao usar a funo cumulativa.
Porm, enquanto que na funo inversa usando o comando @q especificamos a rea e obtemos o
ponto, com a funo cumulativa a partir de @c especificamos o ponto e obtemos a rea.

Exerccio 3.1 Encontre a rea entre dois pontos de curva normal padro que preencha entre
2,05 desvios padro. 

Exerccio 3.2 Determine o formato de diferentes curvas normais variando apenas o desvio
padro. Para uma mdia igual a zero, use os seguintes valores para os desvios padro: curva 1:
1,3; curva 2: 2,1; curva 3: 2,9. 

Nesse momento podemos inserir os conceitos de quantis. Seja a curva normal padro, imagine
que se queira dividir sua rea em 4 partes iguais. O que queremos obter aqui o quantil de uma
distribuio normal padro. Nesse caso, quais seriam os respectivos pontos que permitem ter, em
3.1 A Curva Normal 37

cada quantil, 25% da rea da curva normal? Isso pode facilmente ser obtido usando o comando
scalar quantil = @qnorm() como valores 0.25; 0.5; 0.75 o que ir retornar os pontos -0,67; 0;
0,67 respectivamente. Assim, entre e -0,67 h 25% da rea de uma curva normal padro. Entre
(-0,67; 0) h 25%, entre (0; 0,67) outros 25% e entre (0,67; ) tem 25%.

Figura 3.5: Diviso dos quantis da distribuio normal

Na estatstica denominamos de tercis a diviso da rea em 3 quantis; de quintis a diviso em


5 quantis; de decis a diviso em 10 quantis e de percentis a diviso em 100 quantis. H diversas
aplicaes para os conceitos de quantis, sendo as mais comuns em anlises de distribuio de renda
e o uso da regresso quantlica.
Continuando com o nosso exemplo da distribuio normal, podemos especificar um grfico
que ir representar essa distribuio. Para tanto, abra a srie z, a seguir em view/graph selecione
distribution e depois empirical CDF.

(b)
(a)

Figura 3.6: Distribuio Cumulativa com dados normais (CDF)

Como apontado na introduo deste captulo, em estatstica, a distribuio cumulativa representa


a probabilidade de se observar um valor de uma srie de dados que no excede determinado valor
especfico. Esse clculo pode ser representado a partir de:

F(z) = P(z r)
38 Captulo 3. Funes de Distribuio

onde F(z) a rea da curva acumulada at o ponto r, ou seja, a estatstica F(z) representa a funo
cumulativa. No exemplo da curva normal, temos que 50% dos dados se encontram abaixo da
mdia e 50% acima. Como a mdia zero para uma curva normal padro ento, a probabilidade
acumulada at o valor 0 50% ou ento, expresso de outra forma: F(z) = P(z 0) = 0, 5

Programao 3.1.6 Usando como exemplo a nossa curva normal com mdia 0 e varincia
unitria, sabemos que o valor 0 divide ao meio a funo de distribuio, colocando 50% da rea
para cada lado da distribuio. Nesse caso, isso pode ser verificado a partir de um comando do
EViews R
que usa o valor para encontrar a rea a partir de:

Scalar r=@cnorm(0)

Aqui, primeiro criamos um scalar de nome r e que ir receber o valor da funo. A seguir,
o comando c usado antes da especificao da curva normal norm serve para determinar que
estamos avaliando a funo CDF cumulativa. Por fim, o valor 0 entre parnteses significa
que queremos avaliar a probabilidade de um valor no exceder o valor 0. Isso ir retornar o
valor 0,5. Ou seja, o total da distribuio acumulada at o valor 0 de 50%.

Tambm podemos determinar a probabilidade associada a um valor mnimo especificado. Para


tanto usamos a chamada empirical survivor. Com a srie de dados z aberta, v em view/graph e
depois selecione distribution e, em details, empirical survivor. Note que o grfico (figura 3.7)
representa exatamente o inverso do grfico da distribuio cumulativa. Sendo assim, a probabilidade
de que um valor seja maior que 5, por exemplo, quase 0%. Por outro lado, a probabilidade de que
um valor seja maior que 0, que a mdia dos dados, de 50%. Expresso de outra forma, como a
rea total da curva 100% e a funo cumulativa nos fornece a rea at certo ponto, podemos usar
o comando abaixo para especificar a rea direita de um ponto:

S(z) = 1 F(z) = P(z 5) = 0

S(z) = 1 F(z) = P(z 0) = 0, 5

Figura 3.7: Empirical Survivor

Alm de encontrar a rea acumulada at um ponto ou acima de um determinado ponto, muito


comum querermos saber qual a rea definida entre dois pontos. Isso ser til para o entendimento
de testes de hipteses e construo de intervalos de confiana. Por exemplo, como podemos saber a
rea de uma curva normal entre z = 1 e z = 1? No box de programao 3.1.7 explicamos como
encontrar essa rea.
3.1 A Curva Normal 39

Programao 3.1.7 Para conseguir determinar a rea entre dois pontos da curva, podemos
combinar duas funes cumulativas. Primeiro determinamos a rea at o ponto maior e, depois,
retiramos a rea at o ponto menor.
Considerando uma curva normal padro, vamos avaliar a rea entre -1 e 1 desviopadro
usando o comando a seguir:

scalar area=@cnorm(1)-@cnorm(-1)

Esse ir retornar o valor de 0,682, que o mesmo que dizer que 68,2% dos dados esto entre
-1 e 1. Alm desse, um intervalo muito utilizado de z = 2 e tambm 3. Esses podem ser
encontrados apenas mudando o valor entre parnteses do comando acima.

No incio desse tpico aprendemos a gerar uma srie de nmeros aleatrios usando o comando
vector e dando o nome z para esse vetor. Porm, muitas vezes til que se tenha uma matriz de
nmeros aleatrios, ou seja, diversos vetores. Isso pode ser gerado no EViews
R
de forma simples
usando o comando m e, ao invs de criar um scalar, especificando matrix.

Programao 3.1.8 A seguir, podemos criar uma matriz de nmeros aleatrios que seguem
uma distribuio normal, usando os comandos mostrados abaixo. Para uma matriz de 1.000.000
linhas e 30 colunas, usamos:

matrix b=@mnrnd(1000000,30)
At esse ponto ilustramos o uso da curva normal considerando que a mdia zero e o desvio-
padro 1, porm, o mais comum em investigaes estatsticas que os dados possuem mdia
diferente de 0 e desvio padro diferente de 1. No se preocupe se seu banco de dados no possuir
essa caracterstica, isso fcil de ser contornado a partir da padronizao dos dados. Nesse caso,
transformamos a distribuio de nossos dados que podem ter qualquer mdia e desvio padro, em
uma distribuio que tenha mdia=0 e desvio padro=1. Isso feito facilmente a partir de:

x x
z=

Onde z o novo valor, x o valor da srie original, x a mdia dos dados e o desvio padro
dos dados. Isso pode ser feito no EViews R
especificando um comando.

Programao 3.1.9 Suponha que tenhamos um conjunto de dados com mdia 35 e varincia
de 3,5. Podemos gerar esses dados utilizando:

Series n=35+@sqrt(3.5)*nrnd

Podemos transformar essa distribuio em mdia 0 e desvio padro 1 usando o seguinte comando:

series y=(x-@mean(x))/@stdev(x)

Para o nosso exemplo, onde a srie n tem mdia 35 e desvio-padro de @sqrt(3.5), fazemos:

Series n1=(n-35)/@sqrt(3.5)

Agora que aprendemos os comandos que especificam a densidade, a funo cumulativa e a


inversa de uma curva normal, podemos explorar um pouco o comportamento de outras funes que
so muito teis em econometria e testes estatsticos.
40 Captulo 3. Funes de Distribuio

3.2 A curva t-student


A funo de distribuio mais utilizada em testes de hiptese a t-student, criada por William
Sealy Gosset que acabou adotando o nome de student para representar a funo. uma distribuio
simtrica, como a curva normal, mas possui caldas mais largas, o que a torna mais til para
representar distribuio de dados com valores extremos, como comum no conhecermos a
varincia da populao que estamos analisando, no podemos usar a curva normal. E aqui que
a curva t-student se torna interessante e til. Um parmetro importante na curva t-student o
v=graus de liberdade. Quanto maior for seu valor, mais a curva t-student ir se aproximar da curva
normal. Mas, o que significa os graus de liberdade? Suponha que temos um teste de laboratrio a
ser feito e coletamos uma amostra de 80 informaes. Nesse caso, temos que v=n-1 ou seja v=79
graus de liberdade. Por isso que dizemos que quanto maior for o nmero de graus de liberdade da
distribuio t-student, mais ela se aproxima da curva normal. Ou seja, quanto maior for a amostra
n, maior ser o valor de v.
Na Figura 3.8 esto simuladas uma curva normal e vrias curvas t-student com diferentes graus
de liberdade com v=2, v=5 e v=10. Note que, na medida em que esse parmetro aumenta, a curva
t-student vai se tornando mais prxima da curva normal, tornando a diferena entre elas quase
imperceptvel.

Figura 3.8: Curva t-student e curva normal padro

Suponha que temos uma srie de dados Z com distribuio normal padro e um outro conjunto
de dados Q(20) com distribuio q-quadrado com 20 graus de liberdade (veremos essa curva mais
a frente). Alm disso, suponha que Z e Q so sries de dados independentes. Se dividirmos uma
srie pela outra, teremos um conjunto de dados resultante com uma distribuio t-student com 20
graus de liberdade. Na frmula abaixo o parmetro v representa os graus de liberdade.
z
t(v) = r
Q(v)
v
Para montar isso vamos especificar z=rnorm e q = @qchisq(rnd,20) a seguir use o comando
series zq = z/@sqrt(q,20) e compare com uma curva encontrada a partir de series t =
@rtdist(20).
Programao 3.2.1 Para criar uma varivel aleatria que tenha distribuio t-student, usamos
o comando abaixo. Note que h um parmetro adicional a ser especificado, v, que representa os
3.2 A curva t-student 41

graus de liberdade da curva t-student.

series z=@rtdist(v)
Tal qual na curva normal tambm podemos usar aqui o comando que especifica uma distribuio
inversa para gerar uma sequncia de nmeros aleatrios. Alm de ser til para gerar uma curva
qualquer, o comando q til para determinar o ponto da curva que associado a uma determinada
rea. Para o exemplo de uma distribuio t-student a mdia dos dados divide a rea em duas partes
iguais, 50% antes e 50% depois. Se usarmos o termo scalar a=@qtdist(0.5,50) encontraremos
o valor 0. Note que aqui no faz diferena os graus de liberdade, a mdia sempre ir dividir a rea
ao meio. Teste scalar a=@qtdist(0.025,50), que uma rea de 2,5%. O resultado ser -2,008,
ou seja, o ponto no qual a rea a esquerda representa 2,5% do total para uma curva t-student com
50 graus de liberdade. Esse resultado para uma curva normal seria -1,959 comprovando que a curva
t-student til para representar dados com valores extremos.

Programao 3.2.2 Para gerar uma distribuio de dados t-student tambm podemos recorrer
a funo inversa usando o termo q, a inversa da funo de distribuio cumulativa. Como esse
comando usa uma rea para determinar os pontos, ao usar o comando rnd, teremos valores entre
0 e 1, exatamente o que precisamos para especificar as reas da distribuio. Aqui usamos um
exemplo com 50 graus de liberdade.

series t=@qtdist(rnd,50)

Lembre-se que, sempre que quiser encontrar um ponto que esteja associado a uma rea da
curva t-student, usamos o comando q. Anlogo a esse comando, temos a distribuio cumulativa,
que representa a probabilidade de se observar um valor de uma srie de dados que no excede
determinado valor especfico. Tal como fizemos na curva normal, esse clculo pode ser representado
a partir de:

F(z) = P(z r)

onde F(z) a rea da curva acumulada at o ponto z. Na curva t-student temos que 50% dos dados
se encontram abaixo da mdia e 50% acima. Com a mdia zero ento, a probabilidade acumulada
at o valor 0 50% ou ento, expresso de outra forma:

F(z) = P(z 0) = 0, 5

Programao 3.2.3 Para encontrar a rea acumulada at um determinado ponto na curva t-


student podemos usar o comando c. Nesse caso, no se esquea de tambm fornecer os graus de
liberdade. Para uma curva t(50) usamos:

Scalar z=@ctdist(0,50)

O resultado aqui ser 0,5, mostrando que toda a rea da curva acumulada at o ponto 0 de 50%.
Note que isso independe de colocarmos o valor dos graus de liberdade em 100 ou 200. Isso
porque estamos avaliando a curva em seu ponto mdio. Agora, se avaliarmos a curva em outro
ponto, os graus de liberdade produziro resultados diferentes.

Note que a informao sobre a funo inversa, dado por q, similar ao que obtemos ao usar a
funo cumulativa. Porm, enquanto que na funo inversa usando o comando @q e especificamos
42 Captulo 3. Funes de Distribuio

a rea para obtemos o ponto, no caso da funo cumulativa usa-se @c e especificamos o ponto para
obtermos a rea.
Programao 3.2.4 Para avaliar a funo de densidade de uma curva t-student usamos:

scalar r=@dtdist(x,v)

Aqui, o comando scalar cria a caixa de nome r para receber o valor da distribuio. A seguir,
especificamos d, para determinar que queremos a funo de densidade, seguido do nome da
distribuio tdist. Por fim, escolhemos o valor do ponto na distribuio x e os graus de liberdade
em v.
O mais importante ao estudar a curva t-student a construo de intervalos de confiana. Para
tanto precisamos saber qual a rea definida entre dois pontos. Por exemplo, como podemos saber
a rea de uma curva t-student com 50 graus de liberdade entre -1 e 1? Veja no box de programao.

Programao 3.2.5 Para encontrar a rea entre dois pontos na curva t-student combinamos
duas funes cumulativas. Suponha que se queira avaliar entre -1 e 1:

Scalar area=@ctdist(1,50)-@ctdist(-1,50)

O resultado ser 67,78%, o que menor que os 68,2% da curva normal. Agora vejamos no
extremo da curva, quando consideramos entre 3 e -3. O resultado para a t-student ser 99,57%
enquanto que para a curva normal ser de 99,73%.

Exerccio 3.3 Encontre a rea entre dois pontos +2,50 e -2,50 para uma curva t-student com 50
graus de liberdade. 

Exerccio 3.4 Encontre a rea entre 3 e -3 para diferentes curvas t-student usando:
Curva 1: 15 graus de liberdade;
Curva 2: 30 graus de liberdade;
Curva 3: 60 graus de liberdade.


3.3 A Curva Qui-Quadrado


A curva qui-quadrado (v2 ) possui um formato diferente da normal. Enquanto aquela tinha uma
distribuio bi-caudal, essa unicaudal. Isso interessante, pois vrios testes a serem feitos
posteriormente iro considerar esse tipo de anlise4 , alm de ser til em diversas outras aplicaes,
principalmente em finanas5 .
A sua funo densidade dada por:
1 v x
f (z) = v
 v  x( 2 )1 e 2 (3.3)
2
2
2
Onde v N? so os graus de liberdade, x uma varivel aleatria no intervalo [0,) e ()
uma funo Gamma6 . Assim, podemos construir a curva a partir da definio do valor de v e, de
4 Agradea a Karl Pearson pelo desenvolvimento da distribuio qui-quadrado.
5 Duas outras distribuies so prximas qui-quadrado, a Poisson e a Weibull.
6 A funo Gamma dada por (t) = R xt1 ex dx
0
3.3 A Curva Qui-Quadrado 43

posse da varivel aleatria x, encontrar seus diversos resultados.


Por exemplo, para uma funo com 2 graus de liberdade, v = 2, teremos:
x
e 2
f (z) =
2(1)
Um ponto a destacar aqui que quanto maior forem os graus de liberdade da qui-quadrado
mais sua distribuio vai se aproximando da normal.
No caso do uso do teste qui-quadrado tambm h uma particularidade a considerar. De uma
forma geral esse teste utilizado para identificar a existncia ou no de diferenas em variveis
categricas, como por exemplo, religio, sexo, raa, grupos de idade, ocorrncia de evento e etc.
Seu uso pode se dar para dois tipos de situaes: (i) para comparar se o valor observado diferente
do valor esperado, ou ento, se uma distribuio observada diferente de uma esperada, fazendo
comparao de frequncias; (ii) identificar se duas variveis aleatrias so independentes, usando
tabelas de contingncias.
Em ambas a aplicao poder ver que o teste no usar as estatsticas de mdia e desvio padro,
ou seja, um teste no paramtrico. Nesse caso, o que iremos fazer comparar propores. Como
regra, ao definir as hipteses a serem testadas seguimos que a hiptese nula aquela onde as
frequncias observadas no so diferentes das frequncias esperadas e, por consequncia, a hiptese
alternativa onde as frequncias so diferentes.
 Exemplo 3.1 Suponha que a razo de peso entre os estudantes homens e mulheres na universidade
seja de 2:1, ou seja, os homens tem o dobro do peso das mulheres. Porm, essa relao tem sido
de 1:1 em turmas de um curso especfico por vrios semestres. Essa relao seria estatisticamente
diferente da esperada? O teste qui-quadrado til nesse caso.
Como forma de ilustrar como o teste qui-quadrado utilizado, vamos usar um exemplo simples,
que descobrir se uma moeda honesta. Esse teste tambm pode ser chamado de teste de Goodness
of fit. Nesse caso, o nosso resultado esperado que, em 50% das vezes, se tenha cara e 50% coroa.
Agora vamos ao experimento lanando uma moeda 200 vezes e anotando os resultados. Suponha
que em 108 vezes se observe cara e 92 vezes coroa. Esse resultado estaria dentro do esperado?
O primeiro passo aqui determinar a hiptese nula que, para ns, ter uma distribuio igual
entre cara e coroa, ou seja, em 200 tentativas, esperamos que 100 dessas seja cara. A seguir,
podemos montar a seguinte tabela pra encontrar o valor da estatstica qui-quadrado:

Cara Coroa Total

Observado 108 92 200

Esperado 100 100 200

Diferena (O E) 8 -8 0

(O E)2 64 64 128

2 = (O E)2 /E 0,64 0,64 1,28

Tabela 3.1: Testando se uma moeda honesta


44 Captulo 3. Funes de Distribuio

Figura 3.9

Como pode ser visto, temos duas categorias, cara e coroa. Nesse caso, a estatstica qui-
quadrado dada pela soma da diferena das duas possibilidades em relao ao valor esperado, ou
seja, 2 = 1, 28. O passo seguinte determinar a probabilidade associada a esse valor. Mas, antes
de fazer isso, vamos entender como a distribuio qui-quadrado.
No EViews R
, essa funo de distribuio encontrada a partir do comando chisq. Com o
arquivo de antes aberto, vamos gerar uma distribuio aleatria com 1000000 de dados usando
o comando @qchisq(). Um ponto importante a destacar que o teste 2 s pode ser aplicado a
nmeros, no sendo aplicvel a propores, percentuais, mdias e etc.

Programao 3.3.1 A curva qui-quadrado tem um formato diferente. Usando o mesmo arquivo
de antes, com 1000000 de dados vamos construir uma curva qui-quadrado com 1 grau de liberdade
a partir do comando q, que fornece a inversa da curva:

rndseed 2
series q=@qchisq(rnd,1)

Aqui, o termo rnd utilizado para gerar nmeros aleatrios entre 0 e 1 e, nesse caso, representa
diferentes valores para a probabilidade. Note que a probabilidade deve ficar entre 0 e 1.

Um exerccio interessante identificar o valor que representa determinado percentual de uma


rea. Por exemplo, determine o valor que representa 96% de uma amostra com distribuio qui-
quadrado e 10 graus de liberdade(10 2 ). Para encontrar esse valor, denomine o mesmo de x e

podemos usar o comando scalar x=@qchisq(0.96,10) que ir retornar x=19,02074. Sendo


assim, para os parmetros especificados devemos esperar observar valores maiores que 19,02 em
apenas 4% das vezes.
Aps gerar os nmeros aleatrios que iro seguir uma distribuio qui-quadrado, faa um
grfico combinando um histograma e uma densidade de kernel. Para tanto, abra a srie q, v em
view/graph, selecione distribution e depois, do lado esquerdo, aps escolher histogram, v em
options e escolha kernel density, conforme a Figura 3.9.
Note na Figura 3.10 que essa distribuio unicaudal. Como forma de mostrar as mudanas na
curva de acordo com os graus de liberdade, estimamos mais duas curvas qui-quadrado, uma com 2
graus de liberdade e outra com 5.
3.3 A Curva Qui-Quadrado 45

(a) 1 grau de liberdade (b) Diferentes graus de liberdade

Figura 3.10: Curva Chi-Quadrado

Agora que conhecemos como a distribuio qui-quadrado podemos retornar ao nosso exemplo
das moedas e descobrir a probabilidade associada ao nosso teste. Pelos clculos, obtemos 2 = 1, 28.
Esse o valor que tem que ser colocado na curva para avaliar a probabilidade associada. Assim, o
total da curva entre 0 e 1,28 pode ser encontrado fazendo uso da opo de distribuio cumulativa
CDF at o ponto 1,28.

Programao 3.3.2 Para encontrar a rea da curva entre o valor 0 e um ponto especificado,
podemos usar o comando @cchisq(). Para o nosso exemplo, temos o valor de 1,28 com 1 grau
de liberdade. Sendo assim, usamos:

scalar qq=@cchisq(1.28,1)

Fazendo isso, encontramos o valor de 0,7421, que representa 74,21% da curva entre 0 e 1,28.
Ou seja, h uma probabilidade de 74% de nossa moeda ser viciada. O famoso p-valor associado
a esse teste, que ir determinar se aceitamos ou rejeitamos a hiptese nula, obtido a partir de
1 0, 7421 = 0, 2579. Ou seja, p-valor = 0,25 e, dependendo do nosso critrio de significncia
podemos aceitar ou rejeitar a hiptese nula. Com um critrio de 0,05 (ou 5%), ento aceitamos
a hiptese nula. Recorde-se que a nossa hiptese nula de que o valor observado fosse igual ao
esperado, ou seja, que a moeda era honesta. Portanto, podemos aceitar essa hiptese. 

Aqui deve surgir a dvida: porque 1 grau de liberdade? No nosso exemplo, estamos trabalhando
com duas classes, cara e coroa. Nesse teste, sempre subtramos o valor do total de classes de 1,
portanto n 1 = 2 1 e, nesse caso, temos 1 grau de liberdade.
 Exemplo 3.2 Vejamos outra aplicao de um teste qui-quadrado do tipo Goodness of fit onde
comparamos frequncias. Nesse caso, vamos ver se um dado honesto. Como se sabe, h a
possibilidade de sair seis diferentes nmeros e, nesse caso, a expectativa que cada um tenha uma
probabilidade igual. Ou seja, a probabilidade de sair o nmero 1 de 1/6, a mesma para sair o
nmero 4 e assim por diante. Definimos as nossas hipteses de teste como:
H0 : o dado honesto (as propores so iguais)
H1 : o dado no honesto (as propores so diferentes)
Agora, vamos lanar um dado 120 vezes e anotar os resultados observados junto com o esperado
em uma tabela como mostrado abaixo.
Note que o resultado para alguns nmeros supera em muito o valor que se esperava. Um
indcio de que o dado pode ser viciado. Para verificar isso, podemos usar o teste qui-quadrado
comparando o valor observado com o esperado a partir da frmula:
46 Captulo 3. Funes de Distribuio
(OE)2
Resultado Esperado E
1 30 20 5
2 12 20 3,2
3 27 20 2,45
4 18 20 0,20
5 17 20 0,45
6 16 20 0,80
Total 120 120 12,10

Tabela 3.2: Testando se um dado honesto

(O E)2
2 =
E
que aplicada para cada um dos resultados. Ao final, somamos todos os seis. Essa a estatstica
qui-quadrado. Para o nosso exemplo, 2 = 12, 1.
Para testar se esse valor corresponde ou no a aceitar ou rejeitar a hiptese nula, precisamos ter
o nmero de graus de liberdade. Temos um procedimento com seis termos que foram utilizados
para calcular a estatstica, ou seja, nosso nmero de linhas. Sabemos que o nmero de graus de
liberdade desse tipo de teste dado por esse valor menos 1 (No de linhas 1). Sendo assim, nosso
experimento tem 5 graus de liberdade, (5)2 = 12, 10.

A seguir, devemos encontrar o p-valor. Esse pode ser dado no EViews R


usando o comando
scalar qq=1-@cchisq(12.1,5) e que retorna como resultado 0,0334, ou ento, 3,34%. Com
esse resultado no possvel aceitar a hiptese nula, caso o nvel de significncia seja de 5%. O
que nos leva a crer que existe uma chance pequena do dado ser honesto. Por outro lado, se o nosso
nvel de significncia for de 1% para o teste, ento pelo resultado do p-valor=0,034 aceitamos a
hiptese nula de que o dado honesto. 

Vimos acima duas aplicaes do teste qui-quadrado para o que se conhece como Goodness
of fit. Esses testes so aplicados quando temos uma situao onde possvel determinar um valor
esperado, ou seja, a nossa hiptese baseada em uma teoria.
Outra possibilidade de aplicao desse teste para exerccios do tipo teste de independncia,
ou ento, como conhecido, via tabela de contingncia. Nesse caso queremos ver se duas variveis
so independentes e, para tanto, tambm fazemos uso do valor esperado. Mas, nesse tipo de teste,
no conhecemos o valor esperado e, para tanto, devemos construir o mesmo utilizando os dados
observados.
Como regra de formulao das hipteses a serem testadas, definimos como hiptese nula o fato
de que no h associao entre os grupos, ou distribuies, que esto sendo testadas, ou seja, as
variveis so independentes. Dessa forma, na hiptese alternativa teremos que as variveis so
dependentes, ou seja, h relao entre elas.
Vejamos um exemplo de teste de independncia usando a funo de distribuio qui-quadrado.
 Exemplo 3.3 Teste de Independncia. Considere que se tenha um experimento e que se queira

verificar se h relao de dependncia do resultado encontrado entre as diferentes categorias.


Nesse caso, suponha que, em determinado ano, tenha-se verificado a incidncia de trs diferentes
tipos de pragas (onde praga uma varivel) em vrias fazendas distribudas em trs estados (onde
estado tambm uma varivel). Podemos afirmar que existe uma relao entre uma determinada
praga e a localizao da fazenda? Ou seja, possvel afirmar que quando h um problema em uma
regio podemos esperar que o mesmo ir ocorrer em outra regio? Nesse caso queremos ver se
3.3 A Curva Qui-Quadrado 47

Estado 1 Estado 2 Estado 3 Total


Praga 1 54 45 87 186
Praga 2 6 76 89 171
Praga 3 87 34 32 153
Total 147 155 208 510

Tabela 3.3: Incidncia de praga em fazendas em trs estados

Tipo 1 Tipo 2 Tipo 3 Total


Categoria 1 a b c a+b+c
Categoria 2 d e f d+e+f
Categoria 3 g h i g+h+i
Total a+d+g b+e+h c+f+i N

Tabela 3.4: Tabela de Contingncia

existe uma relao entre duas variveis, praga e estado.


Como primeiro passo, formulamos a hiptese nula e alternativa:
H0 : No h relao entre regio e diferentes tipos de praga (variveis so independentes)
H1 : H relao entre regio e diferentes tipos de praga (variveis so dependentes)
Como dito acima, a hiptese nula se refere ao caso de independncia entre as duas variveis.
A seguir, fomos literalmente a campo e pesquisamos, nas trs regies, as fazendas que apresentaram
cada uma dessas pragas. No total foram 510 fazendas que apresentaram problemas e que foram
distribudas de acordo com a tabela:
Note que temos os resultados observados, e no temos os valores esperados. Dessa forma,
precisamos determinar qual o valor esperado para esse tipo de teste. Como regra geral para um
teste de independncia, podemos determinar os valores esperados para cada uma das clulas usando
uma formula especfica. No caso de uma matriz 3x3, no geral temos:
Dessa forma, para encontrar o valor esperado da clula i, devemos usar:

(g + h + i)(c + f + i)
N
Onde N dado por (a + b + c + d + e + f + g + h + i). Usando esse procedimento, podemos
produzir a matriz de valores esperados dos nossos resultados:
Depois de encontrar esses valores esperados o procedimento seguinte encontrar a estatstica
qui-quadrado, que ir seguir exatamente os passos dados anteriormente quando do clculo da
moeda honesta. Primeiro encontra-se a diferena entre cada valor observado e o esperado. A seguir,
eleva-se ao quadrado e divide pelo valor esperado da clula para, ao final, somar todos os resultados.
Esse ltimo valor a estatstica qui-quadrado. Esses resultados so mostrados na tabela a seguir,

Estado 1 Estado 2 Estado 3


Praga 1 53,61 56,52 75,85
Praga 2 49,28 51,97 69,74
Praga 3 44,10 46,50 62,40

Tabela 3.5: Valores observados


48 Captulo 3. Funes de Distribuio

Estado 1 Estado 2 Estado 3 Total


Praga 1 0,0028 2,35 1,63 3,99
Praga 2 38,01 11,11 5,31 54,44
Praga 3 41,73 3,36 14,81 59,90
Total 16,82 16,82 21,76 118,34

Tabela 3.6: Estatstica Qui-Quadrado

Vitria No ganhou total


Casa 103 76 179
Fora 42 137 179
Total 145 213 358

Tabela 3.7: Resultados de jogos do Grmio

2
onde o resultado de cada clula dado por (OE)
E .
2
Observe que = 118, 34. Agora falta determinar o nmero de graus de liberdade. A regra
para testes do tipo tabela de contingncia usar:

(No de colunas 1)(No de linhas 1) = (3 1)(3 1) = 4

O que ir nos gerar um total de 4 graus de liberdade. Portanto, o nosso teste envolve uma
2 = 118, 34. Usando a mesma funo de antes para encontrar o p-valor no
estatstica da forma (4)
EViews R
, ou seja, scalar qq=1-@cchisq(118.34,4), teremos pvalor=0,000. Para um critrio
de 5%, podemos concluir pela rejeio de H0 . Ou seja, no possvel aceitar H0 e, portanto,
podemos afirmar que existe uma relao entre os trs diferentes estados e as pragas que foram
observadas em determinado ano. 

 Exemplo 3.4 Muito se escuta falar que o fator jogar em casa costuma ser determinante para
uma equipe de futebol no decorrer de um campeonato. Para comprovar esse fato, vamos testar essa
hiptese para a equipe do Grmio durante o campeonato brasileiro de 2003 a 2012. A tabela a
seguir traz a diviso dos resultados, separados entre jogos em casa e fora e resultados de vitria ou
no vitria, que pode tanto ser derrota quanto empate.
Tal como estruturado, as nossas hipteses so assim dadas:
H0 : O fator joga em casa no faz diferena (variveis so independentes)
H1 : Jogar em casa faz diferena (variveis so dependentes)
Como temos uma tabela 2x2, para encontrar o valor do teste qui-quadrado no necessrio
encontrar a diferena entre cada valor observado e esperado, podemos usar, de forma direta, a
frmula:
2 (ad bc)2 (a + b + c + d)
(1) =
(a + b)(c + d)(a + c)(b + d)

Como temos uma tabela 2x2, h 1 grau de liberdade. Dessa forma, (1)2 = 43, 13. Usamos o

comando scalar qq=1-@cchisq(43.13,1) para encontrar o p-valor no EViews R


, encontramos
qq=0,0000. Ou seja, o p-valor 0,00%. Nesse caso, podemos optar pela rejeio da hiptese nula
se estivermos satisfeitos com um nvel de significncia de 5% ou at um nvel de significncia
menor. Sendo assim, conclui-se que, pelo menos para o campeonato brasileiro, entre 2003 e 2012,
para a equipe do Grmio, jogar em casa ou no foi determinante. 
3.4 Curva F 49

Apesar de termos comentado sobre o uso de tabelas de contingncia com o nmero de linhas
igual ao nmero de colunas, frequente termos tabelas de contingncia que no so quadradas.
Suponha um nmero de linhas r e de colunas c. De forma geral, a frmula para calcular a
frequncia esperada para cada clula dada por:
( da lina r)( da lina c)
E=
N
onde N o tamanho da amostra.
O ltimo ponto de discusso sobre a aplicao do teste qui-quadrado sobre amostras e valores
esperados pequenos. Em algumas situaes comum nos depararmos com um experimento onde o
nmero de resultados menor do que 40. Nesse caso, claramente teremos um problema no teste.
Alm disso, tambm podemos ter uma situao onde o valor esperado de um evento, uma das
clulas da tabela encontrada, tem um resultado menor do que 5.
Apesar de ser um problema, mesmo assim, podemos fazer o teste, basta que se faa uma
correo que, na literatura de estatstica, denominada de Correo de Yates. E isso simples.
Quando for calcular o valor esperado de cada uma das clulas, ao invs de utilizar a frmula:
(O E)2
2 =
E
Usamos a seguinte expresso:
(|O E| 0, 5)2
2 =
E

3.4 Curva F
Outra funo de distribuio muito til a F, comumente conhecida como distribuio de Fisher, ou
distribuio de Snedecor onde seu uso mais comum na anlise de varincia, tambm conhecido
como teste ANOVA. A distribuio F uma distribuio encontrada a partir da razo da varincia
de duas populaes independentes. Nesse caso, como estamos com duas populaes, ou amostras,
temos dois graus de liberdade. Por isso que a funo F aparece sempre com F(v1 ,v2 ) onde v1 so os
graus de liberdade dados pelo nmero de amostras menos 1 e v2 o nmero de tipos de medidas.
A funo densidade de probabilidade de uma varivel aleatria que tem distribuio F, comv2
e v1 graus de liberdade dada por:
    v21
v1 + v2 v1 v1
x( 2 )1
2 v2
F(x) =  (m+n) (3.4)
hv i hv i v   2
1 2 1
x+1
2 2 v2
onde o valor de x dado no intervalo x [0, ), ou seja, assume valores positivos e () uma
funo gamma. De forma geral, a curva F() mede a razo entre duas distribuies qui-quadrado
que sejam independentes.
Dentre as suas principais propriedades, temos que ela assimtrica direita, ou seja, seus
valores sempre sero positivos. Dentre seus principais usos podemos destacar o teste para identificar
se duas amostras independentes foram geradas por uma populao com distribuio normal com
a mesma varincia e tambm se duas amostras independentes possuem mesma varincia. Como
hiptese principal tem o fato de que a distribuio da populao no qual se est gerando a amostra
normal e que as duas populaes so independentes.
Vejamos como podemos gerar 1.000.000 nmeros aleatrios que descrevem uma distribuio F.
Nesse caso, usamos, no EViews R
, o comando @qfdist(), onde o termo q representa a distribuio
inversa, usada para gerar a curva procurada.
50 Captulo 3. Funes de Distribuio

Programao 3.4.1 A curva F tambm muito til para testes em estatstica e econometria.
Para simular essa curva no EViews
R
podemos usar os comandos a seguir:

rndseed 10
series f=@qfdist(rnd,10,10)

Para essa funo temos 3 parmetros a determinar dentro dos parnteses. O primeiro a
probabilidade associada. Como queremos 1.000.000 de nmeros, usamos o termo rnd, que
utilizado para gerar nmeros aleatrios entre 0 e 1 e, nesse caso, representa diferentes valores
para a probabilidade. A seguir temos o nmero de graus de liberdade do numerador e o nmero
de graus de liberdade do denominador. O mesmo grfico pode ser gerado a partir de:

Series f=@rfdist(10,10)
Note que, ao especificar valores pequenos para os graus de liberdade, temos uma curva mais
assimtrica (conforme a figura 3.11a). Na medida em que vamos aumentando os graus de liberdade,
a curva F vai tendo outro formato, at que, ao ter um nmero grande de graus de liberdade, ir se
aproximar da distribuio normal (conforme a figura 3.11b).

(a) Curva F(10,10) (b) Curva F(1000000,1000000)

Figura 3.11: Curva Chi-Quadrado

Da mesma forma que para as demais curvas aqui avaliadas, para se encontrar a rea abaixo
da curva F podemos usar a funo de distribuio cumulativa CDF. Por exemplo, para uma curva
F(50,10) qual seria a rea acumulada at o valor 2?

Programao 3.4.2 Para encontrar a rea da curva acumulada at determinado valor usamos a
funo abaixo:

scalar f4=@cfdist(x,v1,v2)

Onde x o valor a determinar o ponto na curva, v1 so os graus de liberdade do numerador e v2


os graus de liberdade do denominador. Para o nosso exemplo, usamos:

series f4=@cfdist(2,50,10)
3.5 Distribuio de Poisson 51

Que ir resultar em 0,8818, ou seja, 88,18% da rea.

3.5 Distribuio de Poisson


Se estamos diante da possibilidade de ocorrncia de um nmero muito grande de eventos e, que
a probabilidade de ocorrncia de um desses eventos seja bem pequena ento, podemos usar a
distribuio de Poisson. Seria como tentar medir a possibilidade de ocorrncia de um evento
raro, como um atropelamento em uma determinada rua de baixo movimento, o nascimento de
quadrigmeos dentre outros. A distribuio de Poisson uma distribuio de probabilidade discreta.
Para medir essa chance de ocorrncia de um evento, fazemos uso de trs parmetros. O primeiro,
que se refere ao espao de medida, pode tanto ser hora, minuto, segundo, dias, espao, rea, volume,
peso ou qualquer outro campo contnuo. Na frmula da distribuio a varivel t. Esse sempre
vem acompanhado do parmetro , que utilizado para medir a frequncia de ocorrncia do evento.
O ltimo parmetro, x, utilizado para definir a possibilidade do nmero de ocorrncias. A frmula
do teste de Poisson dada por:
et (t)x
P(x) = (3.5)
x!
Imagine que se queira medir a probabilidade de que uma pessoa entre no restaurante a qualquer
momento. Sabemos que o fluxo de clientes medido por hora e que esse de 3 por hora. Sendo
assim, t = 1 hora e = 3. Qual seria a probabilidade de no chegar nenhum cliente em 1 hora?

e3 (3)0
P(0) = = 0, 049
0!
Assim, a probabilidade de que em 1 hora no chegue nenhum cliente de 4,9%. Outra pergunta
interessante seria se, ao invs de querer saber o nmero exato, trabalharmos com um valor mnimo.
Sendo assim, qual a probabilidade de que chegue pelo menos um cliente? Nesse caso, podemos
estimar via diferena de no chegar nenhum com o total da curva. O total de 100% e ento:

P( 1) = 1 P(0) = 1 0, 049 = 0, 9502


Ou seja, a probabilidade de que chegue pelo menos um cliente de 95,02%.

Programao 3.5.1 Para aplicar o teste de Poisson no EViews


R
podemos usar a frmula da
distribuio cumulativa (CDF). Nesse caso, necessrio especificar dois parmetros, m e x. Com
m = t e x tal como definido anteriormente.

scalar p=@cpoisson(x,m)

Para o nosso exemplo acima usamos, para medir a probabilidade de no chegar nenhum cliente:

scalar p=@cpoisson(0,3)

Exerccio 3.5 Suponha que em uma esquina ocorram, em mdia, 4 acidentes por semana.
Encontre a probabilidade de que, em qualquer semana, ocorram 6 acidentes. Depois qual a
probabilidade de ocorrncia de pelo menos 2 acidentes por semana?
Dica: na primeira pergunta x = 6, = 4, t = 1. Na segunda pergunta P( 2) = 1 P(1),
x = 1, = 4, t = 1 

Vimos nesse captulo as curvas de distribuio e aplicao de testes, sejam esses paramtricos
ou no paramtricos. Nesse ponto importante entender a diferena entre esses dois tipos de
52 Captulo 3. Funes de Distribuio

testes. Quando fazemos uso de estatsticas dos dados da amostra e da distribuio dos mesmos em
algum teste como, por exemplo, o teste t, teste F, dentre outros, dizemos que o teste em questo
paramtrico. Ou ento, denominados de testes clssicos. Nesse tipo de teste assumimos que a
distribuio dos dados conhecida.
Porm, h tambm os testes no paramtricos, onde no feita nenhuma hiptese sobre o
tipo de distribuio de probabilidade dos dados que estamos usando. Ou seja, nesse tipo de teste
dizemos que estamos livres de especificar o tipo de distribuio. Portanto, usamos os testes no
paramtricos quando desconhecemos essa distribuio ou os dados no satisfazem s suposies
que so assumidas pelas tcnicas tradicionais.

3.6 Exerccios
Exerccio 3.6 Sua namorada te liga, em mdia, 2 vezes por dia, considerando 24 horas. Qual
a probabilidade de ela no te ligar em 1 dia? Qual a probabilidade dela te ligar pelo menos 1 vez
por dia? 

Exerccio 3.7 Probabilidade Considerando uma curva normal padronizada, encontre a proba-
bilidade de se ter um valor tal como:
(a) P(z) = (0 < z < 1, 18) = 30, 10%
(b) P(z) = (0 < 2) = 97, 72%
(c) P(z) = (3, 4 < z) = 99, 96%
(d) P(z) = (2, 45 < z) = 0, 71%


Exerccio 3.8 Probabilidade. Supondo que a renda da populao do Brasil (r) de R$ 6.200
por ms com um desvio padro de R$ 954. Imagine que a distribuio dessa renda seja
normal. Responda aos itens a seguir. Dica: note que no temos uma distribuio normal padro.
Padronize os dados primeiro usando:
r r
z=

(a) P(r < 3.200) = P(z < r
r
) = 0, 08%
(b) P(r < 9.000) = 0, 16%
(c) P(3.560 < r < 6.340) = 55, 55%


Exerccio 3.9 Considerando uma t-student, encontre a probabilidade de se ter um valor tal
como:
(a) use 20 graus de liberdade: P(z) = (0 < z < 1, 18) = 37, 40%
(b) use 30 graus de liberdade: P(z) = (0 < z < 1, 18) = 37, 63%
(c) use 300 graus de liberdade: P(z) = (0 < z < 1, 18) = 38, 05%
(d) use 20 graus de liberdade: P(z) = (z < 2) = 97, 03%
(e) use 30 graus de liberdade: P(z) = (z < 2) = 97, 26%
(f) use 20 graus de liberdade: P(z) = (3, 4 < z) = 99, 85%
(g) use 30 graus de liberdade: P(z) = (3, 4 < z) = 99, 90%
(h) use 20 graus de liberdade: P(z) = (2, 45 < z) = 0, 11%
(i) use 30 graus de liberdade: P(z) = (2, 45 < z) = 0, 10%

3.6 Exerccios 53

Exerccio 3.10 Teste de independncia. Em uma pesquisa foram entrevistados 340 alunos de
uma escola. Os entrevistados, separados por faixa de idade, deveriam apontar a preferncia
por uma cor. Sendo assim, estamos interessados em testar se existe uma relao entre idade e
preferncia por cor. Use como critrio de significncia 5%.
Escolha a hiptese nula H0 ;
Encontre a estatstica qui-quadrado 2 ;
Encontre o p-valor;
Conclua.

Idade (anos) Branco Verde Preto Total


10-12 35 76 65 176
13-16 65 54 45 164
Total 100 130 110 340


Exerccio 3.11 Teste de independncia. Nas eleies para prefeito de 2012 tivemos vrios
votos nulos e brancos. Esses podem ser interpretados como uma forma de protesto. Com dados
das eleies de 2012 no 1o turno para prefeito em todo o Brasil, separamos os mesmos entre
capital e interior. A pergunta : possvel afirmar que os eleitores das capitais esto mais
revoltados do que os eleitores do interior?

Votou Branco + Nulo Total


Capital 22.632.144 2.842.987 25.475.131
Interior 80.624.103 9.708.280 90.332.383
Total 103.256.247 12.551.267 115.807.514


Exerccio 3.12 Teste de independncia. Suponha que se queira testar se a faixa etria real-
mente faz diferena em relao a forma de dirigir. Nesse caso, com dados de jovens, adultos e
idosos, separados entre nmeros de acidentes e sem acidentes em um determinado ano, teste se
h relao entre idade e conduo ao volante.

Acidente Sem acidente Total


Jovens 25 45 70
Adultos 15 25 40
Idosos 10 30 40
Total 50 100 150


Exerccio 3.13 Teste de independncia. Na tabela abaixo foram coletados dados sobre casa-
mentos no Brasil no ano de 2011. Naquele ano ocorreram pouco mais de 1 milho de casamentos
divididos no estado civil do homem e da mulher na data do casamento. Por exemplo, 818.300
casamentos ocorreram entre homens e mulheres solteiros.
54 Captulo 3. Funes de Distribuio

Homem/Mulher Solteira Viva Divorciada Total


Solteiro 818.3 5.876 50.696 874.872
Vivo 8.557 2.925 5.297 16.779
Divorciado 88.805 4.806 38.221 131.832
Total 915662 13607 94214 1.023.483


3.7 Sites teis


www.statistics.com
www.portalaction.com.br
http://statlect.com/
http://stat.unipg.it/iasc/
4. Estatsticas, testes de hiptese e ANOVA

Fazer uma avaliao prvia de como um conjunto de dados se comporta um dos procedimentos
mais comuns em estatstica e econometria, e deve ser feito antes de qualquer outra ao, pois ir
permitir ter informaes importantes sobre os passos a serem dados posteriormente.

Nesse caso, h diversas formas de se avaliar os dados, e que depende de como os mesmos so
compostos, e que so classificados tanto em estatsticas descritivas como de inferncia. No primeiro
caso, h estatsticas que podem ser utilizadas para qualquer formato de conjunto de dados, como,
por exemplo, a mdia, a moda e a mediana, referidas como medidas de tendncia central. Por
outro lado, quantis, varincia e o desvio-padro, por exemplo, so classificadas como medidas de
disperso. Como o nome diz, no procedimento de estatstica descritiva o que temos apenas uma
descrio do comportamento dos dados. No geral, os resultados gerados pela estatstica descritiva
aparecem no formato de grficos ou de tabelas.

A inferncia estatstica envolve o conceito de amostragem. O mais comum em estatstica e


econometria termos um conjunto de dados que representa uma amostra da populao, uma vez
que muito difcil ter a informao da populao. Nesse caso, estamos assumindo que a nossa
amostra possa representar de maneira fiel o comportamento da populao. Porm, nem sempre isso
verdade, o que acaba por resultar em erros de medida. Nesse caso, trabalhamos com diversos
parmetros como mdia, desvio padro e etc, mas, os mesmos so estimados e so feitos testes
de hiptese para confirmar a consistncia dos mesmos. Em resumo, essa a ideia da inferncia
estatstica .

Portanto, enquanto que na estatstica descritiva estamos apenas preocupados com a descrio
dos dados, na inferncia estatstica estamos preocupados com a consistncia dos mesmos.

Como exemplo, vamos usar a srie z gerada na seo 3.1. Recorde-se que a mesma foi
gerada para ter uma distribuio normal com mdia zero e varincia unitria. A seguir, v em
view/descriptive statistics & tests e poder ver que h diversas opes para se aplicar s sries de
dados (conforme Figura 4.1). A seguir, mostraremos como interpretar cada uma dessas.
56 Captulo 4. Estatsticas, testes de hiptese e ANOVA

Figura 4.1: Testes e estatstica descritiva

4.1 Histograma e Estatsticas


Selecionando a alternativa de Histogram and Stats, o EViews R
ir retornar um resumo do que
podemos entender como estatstica descritiva, conforme Figura 4.3. Para o exemplo da srie z
podemos ver que os dados so bem distribudos em torno da mdia, como mostra o grfico
esquerda, que conhecido como histograma.
A seguir, do lado direito, h diferentes estatsticas que so reportadas. As duas primeiras so
medidas de tendncia central, como a mdia que, tal como esperado, prxima de zero. E, a seguir
est a mediana, que representa o ponto onde a funo de distribuio dividida exatamente ao meio.
Para o nosso exemplo ela tambm prxima de zero. Essa uma caracterstica de um conjunto de
dados que tem uma distribuio normal padro, onde a mdia zero.
Depois so reportados o valor mximo e o valor mnimo do nosso conjunto de dados. Note
que ambos so muito prximos. Isso ocorre pois geramos uma funo com distribuio normal
e, nesse caso, os valores extremos, tanto para a esquerda quanto para a direita, conhecidos como
caudas, devem ser prximos em mdulo. Se, por exemplo, o valor mximo fosse bem diferente, em
mdulo, do valor mnimo, teramos uma assimetria. A seguir est o desvio-padro que, tal como
especificado, esperava-se ter um valor unitrio.
Por fim, duas outras estatsticas so importantes para avaliar os nossos dados, a assimetria e
a curtose1 . Ambas so estatsticas derivadas a partir da mdia e do desvio-padro e teis para
caracterizar o tipo de distribuio dos dados.

Programao 4.1.1 Podemos fazer todas essas estatsticas descritivas utilizando os comandos
de programao do EViews R
. Abaixo, vamos utilizar o scalar para apresentar a funes tpicas
para obter as estatstica descritivas de uma srie x:
scalar m = @mean(x)
scalar md = @median(x)
scalar mx = @max(x)
scalar min = @min(x)
scalar std = @stdev(x)
scalar assimetria = @skew(x)
scalar curt = @kurt(x)
Como vimos acima, o valor mximo e mnimo dos dados so muito prximos em mdulo, o que
acaba no gerando caudas para a nossa distribuio. Sendo assim, podemos esperar que os nossos
1 Skewness e Kurtosis
4.1 Histograma e Estatsticas 57

Figura 4.2: Assimetria direita e assimetria esquerda

dados tivessem uma distribuio simtrica, tal como sinalizado, por exemplo, pela igualdade entre
a mdia e a mediana. Valores negativos para a assimetria indicam uma distribuio assimtrica para
a esquerda, enquanto um valor positivo indica assimetria a direita. Os grficos da Figura 4.2 mostra
como se comporta a assimetria direita e esquerda. Para comprovar isso, calculamos a assimetria
no EViews R
com a seguinte frmula:

1 N yi y 3
 
S=
N i=1

onde N o nmero de observaes que, no nosso caso 1 milho, yi cada uma das i observaes,
y a mdia dessas observaes e o desvio-padro amostral. Para o nosso exemplo, a assimetria
muito prxima do valor zero, o que esperado para uma curva com distribuio normal.
Podemos facilmente mostrar como que apenas alguns valores extremos contribuem para gerar
assimetria no banco de dados. V em View e depois SpreadSheet. Com a srie aberta mude os
cinco primeiros valores para nmeros elevados, como 6, 7 e 8. Para tanto clique em Edit +/- na
barra superior. Refaa o histograma e poder ver como os dados apresentam assimetria direita. Se
repetir esse exemplo colocando elevados valores negativos, poder ver que o histograma apresentar
assimetria esquerda.
A curtose, por outro lado, uma medida relacionada concentrao dos dados, influenciando no
desenho da curva verticalmente. Um conjunto de dados com um valor alto para a curtose concentra
os dados na mdia, diminuindo bastante rapidamente quando se afasta da mdia. Por outro lado,
dados com curtose baixa tendem a ser mais planos, com os dados mais distribudos. Distribuies
com curtose alta podem ser chamados de leptocrticos, como os retornos das aes na bolsa de
valores, enquanto distribuies com curtose mais baixa podem ser denominadas platicrticas. Para
o nosso exemplo, observamos na Figura 4.3 uma curtose com valor 3,0008, um valor muito prximo
ao que se espera de uma curva normal, que 3. O clculo da curtose pode ser feito a partir de:

1 N yi y 4
 
Z=
N i=1

note que, tambm para esse clculo, usamos apenas as estatsticas de mdia e desvio-padro.
As duas ltimas informaes esto relacionadas a um teste de funo de distribuio. At ento,
fizemos uma avaliao na forma de estatstica descritiva. Porm, somente a assimetria e curtose no
so suficientes para confirmar que os dados possuem ou no uma distribuio normal. H diversas
formas para testar a possibilidade de um conjunto de dados terem uma distribuio normal ou no.
Alm disso, h testes que so aplicados para conjunto de dados multivariados, e tambm podemos
testar outras distribuies. Nesse resumo de estatstica descritiva, o EViews
R
retorna o resultado
58 Captulo 4. Estatsticas, testes de hiptese e ANOVA

100,000
Series: Z
Sample 1 1000000
80,000
Observations 1000000

Mean 0.001053
Median 0.001563
60,000
Maximum 4.918970
Minimum -4.696525
Std. Dev. 0.998978
40,000
Skewness -0.005350
Kurtosis 3.000846

20,000 Jarque-Bera 4.799999


Probability 0.090718

0
-4 -3 -2 -1 0 1 2 3 4 5

Figura 4.3: Histograma e Estatsticas de uma srie Z

para o teste de normalidade de Jarque-Bera. Esse valor encontrado usando a frmula:


(k 3)2
 
N 2
JB = S +
6 4
onde N o nmero de observaes, S o valor da assimetria e k a curtose. Substituindo os valores
que vimos acima, encontraremos:
(3, 0008 3)2
 
1000000 2
JB = 0, 0053 + = 4, 799
6 4
Esse teste aplicado sob a hiptese nula de existncia de distribuio normal e, a hiptese
alternativa seria que os dados no so distribudos normalmente. Note que apenas estamos testando
se a curva normal, no estamos testando uma funo de distribuio alternativa. Portanto, podemos
apenas concluir se os dados so distribudos normalmente ou no. Ou seja, o teste no permite
inferir se a distribuio qui-quadrado, F ou qualquer outra funo.
No capitulo sobre funes de distribuio, aprendemos que a funo qui-quadrado utilizada
em testes para verificar diferenas de distribuio entre duas amostras. No caso do teste de Jarque-
Bera ocorre exatamente isso, temos um teste que tem uma estatstica que usa a funo qui-quadrado
para testar a hiptese nula possuindo 2 graus de liberdade. Sendo assim, o mesmo representado a
2 .
partir de (2)
Para o nosso exemplo, temos que (2) 2 = 4, 7999 e usamos essa informao para encontrar o

chamado p-valor, que no EViews R


o mesmo que probability. essa estatstica que ir dizer se
2 - qui-quadrado
aceitamos ou rejeitamos a hiptese nula. O nmero 4,7999 em uma distribuio (2)
com 2 graus de liberdade produz p-valor=0,0907. Isso pode ser encontrado no EViews R
a partir do
comando scalar qq=1-@cchisq(4.7999,2).
Sendo assim, no possvel rejeitar a hiptese nula de distribuio normal. As mesmas
informaes podem ser obtidas a partir da funo view/descriptive estatistics & tests/stats table,
por isso no h necessidade de comentar seu uso. No box de programao mostramos como
podemos montar um teste de Jarque-Bera usando os comandos que retornam o resultado para a
assimetria e a curtose.
Programao 4.1.2 Para fazer o histograma com a estatstica dos dados podemos usar o co-
mando hist para a srie x e aplicar o comando freeze para salvar um grfico com o nome G1:
4.2 Estatsticas por classificao (Statistics by Classification) 59

x.hist
freeze(G1) = x.hist

Se estivermos interessados em ver apenas o resultado do teste de normalidade de Jarque-Bera,


devemos construir o teste. Nesse caso, o primeiro passo determinar um escalar e escolher um
nome, suponha jb e depois aplicar seu resultado na curva qui-quadrado:

Scalar jb=((@obs(x))/6)*((@skew(x))^2+((@kurt(x)-3)\^2)/4)
Scalar testejb=@chisq(jb,2)

Na primeira parte construmos a estatstica de Jarque-Bera usando os comandos @obs() para


retornar o nmero de dados, @skew() para encontrar a estatstica de assimetria e @kurt() para
determinar a curtose. A seguir, encontramos o p-valor a partir da distribuio qui-quadrado, com
2 graus de liberdade.

4.2 Estatsticas por classificao (Statistics by Classification)


Quando estamos trabalhando com dados que podem ser separados por diferentes categorias ou
mesmo se quisermos compreender melhor um determinado subconjunto de dados dentro do conjunto
maior ou, ento, comparar diferentes conjuntos de dados, podemos recorrer s estatsticas por
classificao.
Com a srie de dados aberta, clique em view/ Descriptive Statistics/ Statistics by classifica-
tion. Do lado esquerdo da janela (ver Figura 4.4a), selecione apenas o nmero de observaes.
Depois, escreva o nome de duas sries, separadas por espao. Vamos usar, para esse exemplo, a
srie aleatria z, com distribuio normal e a srie t, que tem distribuio t-student com 50 graus
de liberdade.
Na opo Group into bins if, deixe marcado apenas para valores >100 e um nmero mximo
de bins de 3 (isso representa o nmero de classes de distribuio dos dados), a seguir, clique em
ok". A Figura 4.4b apresenta os resultados. O EViews R
mostra uma contagem dos dados dos
dois grupos. Na linha esto aqueles referentes a z, com trs intervalos e, na coluna, para a srie t
tambm com trs intervalos. A ltima linha e coluna so dos totais.
Note que feita a contagem de dados considerando a interseco entre os dois conjuntos de
dados. Por exemplo, no intervalo [-5,0) temos 249.688 dados. Porm, se avaliarmos apenas a linha
do intervalo [-5,0) para z teremos um total de 499.392 dados onde h informaes tanto de z quanto
de t nesse intervalo. Por fim, o total de dados reportados tem que ser igual ao total de cada srie.
Do total de 1 milho de dados, h 499.982 na srie x que esto no intervalo [-5,0) e outros 500.011
que esto no intervalo [0,5).
O mesmo tipo de anlise pode ser feito para obter informaes conjuntas sobre outras estatsticas,
como mediana, desvio-padro e etc. Vejamos como exemplo considerar o mesmo conjunto de
dados e selecionar tanto a estatstica de mdia (Mean) quanto a de assimetria (skewness). A tabela
de resultado como a tabela 4.5.
Mantemos o nmero mximo de classes em trs, a ltima linha e a ltima coluna so os totais
para cada subgrupo e o total de dados. Por exemplo, o valor -0,001053 na ltima clula da tabela
refere-se mdia do conjunto de dados z e, logo abaixo, o valor -0,005350 a assimetria dos dados
z. Isso acontece pois pedimos essa estatstica a partir da abertura do conjunto de dados z. Se,
ao invs disso tivssemos aberto o conjunto de dados t e feito a estatstica por classificao, essa
ltima clula revelaria a mdia e assimetria para a srie t. No intervalo [5, 0) de z com [5, 0) de
t a mdia -0,79 e significa que os 249.688 dados das duas amostras que caem meste intervalo
possuem mdia -0,79 e uma assimetria de -1,004.
60 Captulo 4. Estatsticas, testes de hiptese e ANOVA

(b) Classificao das observaes

(a) Opes de classificao

Figura 4.4: Statistics by Classification

Figura 4.5: Classificao por mdia e assimetria

4.3 Testes de Hiptese


Essa uma importante ferramenta estatstica para testar hipteses em sries de dados individuais
ou em conjunto. Vimos que a mdia da srie de dados x -0,001053 e que seu desvio padro
1. Vamos testar a hiptese que a mdia igual a 0,01. V em view/descriptive statistics &
tests/simple hypothesis tests e, na caixa de dilogo que aparece (Figura 4.6a) especifique o valor
da mdia a ser testado. No nosso exemplo 0.01. Podemos deixar em branco a informao do desvio
padro que pedida direita em mean test assumption.
Assim, na caixa que descreve mean digite o valor 0.01. E, na parte Enter s.d. if known, que
corresponde ao desvio-padro da nossa srie de dados, no especifique nada. A seguir, clique
em ok". Para esse exemplo, possvel ver como resultado apenas com a estatstica t, o teste de
mdia que segue uma distribuio t-student. Destaca-se que esse um teste bi-caudal, pois estamos

(b)
(a)

Figura 4.6: Teste de Hiptese


4.4 Teste de Igualdade por Classificao 61

testando:

H0 : mdia = 0, 01

H0 : mdia 6= 0, 01
O resultado mostrado para o p-valor nos leva a rejeitar a hiptese nula de igualdade inclusive a
menos de 1% de significncia. Ou seja, a mdia de x estatisticamente diferente de 0,01. O teste
realizado usando os valores amostrais para a mdia e o desvio padro, e a frmula:
x
t-statistic = .
s/ n

Substituindo os valores da Figura 4.6b teremos

0.00043 0.01
t-statistic = = 10.4265.
(1.00031)2 / 1000000

Por fim, o probability dado usando prob = @ctdist(-10.4265, 999999). Lembre que os
graus de liberdade so dados por N 1 e que esse um teste bicaudal.
Segue-se o mesmo procedimento para testar a igualdade da varincia ou da mediana. Podemos
refazer o teste especificando o desvio-padro. Nesse caso so reportados dois resultados, um para a
estatstica Z, que segue uma distribuio normal, e outro para uma estatstica t, com desvio padro
desconhecido. Se esse teste for aplicado para identificar se a varincia igual a determinado valor,
2
a hiptese nula de igualdade, e usa-se a estatstica (N1) para o teste. Sendo assim, aplicada a
frmula
(N 1)s2
2 = (4.1)
2
onde s2 a varincia amostral.

4.4 Teste de Igualdade por Classificao


Esse teste muito utilizado no caso de dados categricos e para verificar a relao entre subconjuntos
de dados. Por exemplo, possvel testar se a renda mdia a mesma para homens e mulheres.
Os testes assumem que as subamostras so independentes. Indo em view/descriptive statistics &
tests/equality tests by classification... ser apresentada a caixa de dialogo 4.7a. Existem as opes
de realizar testes de igualdade entra a mdia, a mediana e a varincia das sries. Em Series/Group
for classify informa-se as categorizaes de anlise. As opes disponveis em Group into bins if
so as mesmas descritas na seo 4.2.
O teste de igualdade de mdia um teste ANOVA2 . A hiptese nula que os subgrupos tem a
mesma mdia e que, dessa forma, a varincia entre as mdias da amostra devem ser as mesmas
que as varincias entre quaisquer subgrupos. Comparando a srie z categorizada pela srie t,
observamos pela Figura 4.7b que h uma alta probabilidade que z no difira entre os grupo definido
por t, pois tanto o teste ANOVA padro quanto o teste de Welch apresentam probabilidade acima
acima de 70%. Ou seja, no possvel rejeitar a hiptese nula de igualdade. Caso o teste fosse
categorizado por dois grupos, digamos t e q, seria apresentado apenas o teste ANOVA padro. Em
ambos os casos, o EViews R
retorna uma tabela com a fonte da varincia, comparando resultados
entre os grupos (between groups) e dentro dos grupos (within groups). O resultado do teste via
2O teste ANOVA, tambm conhecido como anlise de varincia, uma tcnica de teste de hiptese usada para testar
a igualdade de duas ou mais mdias amostrais de uma populao, tambm denominadas de tratamento. Na seo 4.8 ser
abordado esse tema com mais detalhamento.
62 Captulo 4. Estatsticas, testes de hiptese e ANOVA

(b)

(a)

Figura 4.7: Teste de Igualdade

distribuio F(G1,NG) , onde G o nmero de grupos, no exemplo G = 2, e N o nmero de


observaes.
Para o teste de igualdade de mediana, o EViews R
calcula vrios testes com a hiptese nula de
que os subgrupos tm a mesma distribuio geral, contra a hiptese alternativa de que pelo menos
um subgrupo tem uma distribuio diferente. Caso sejam definidos dois subgrupos, a hiptese nula
de que os dois subgrupos so amostras independentes da mesma distribuio.
Os testes de igualdade da varincia avaliam a hiptese nula de que a varincia em todos
os subgrupos igual, enquanto a hiptese alternativa de que pelo menos um dos subgrupos
tem varincia diferente. Os principais testes oferecidos pelo EViews R
para testar a igualdade da
varincia so: teste F, teste de Levene e o teste de Brown-Forsythe. Ao utilizar o teste F para atestar
diferena de varincia entendemos que os grupos tem distribuio normal, tornando os outros dois
mais robustos.

4.5 Teste de Distribuio Emprica (KolmogorovSmirnov)


De posse de um conjunto de dados, muito comum no conhecermos como os mesmos so
distribudos. Para tanto, podemos aplicar um teste de distribuio para comprovar se possuem uma
distribuio normal, por exemplo, como vimos no teste de Jarque-Bera, ou ento, podemos estar
interessados em saber se a distribuio de nossos dados igual a alguma outra distribuio terica.
Nesse caso, h vrias outras opes que podem ser verificadas no EViews R
, conhecidas como
EDF test.
Por exemplo, usando os dados do Captulo 3, pode-se investigar se a distribuio da srie de
dados z pode ser aproximada por uma normal. Nesse caso, com a srie z aberta, clique em View
/Descriptive statistics & tests /Empirical distribution tests . . . . A seguir, dentre as opes que
existem vamos testar se a srie de dados z tem uma distribuio normal. Deixe a opo para escolha
dos parmetros vazia, isso far com que o EViews R
estime os mesmos.
Note na figura 4.8b que h vrios resultados de testes, e que so mostrados em duas partes.
Na primeira, esto diversos testes estatsticos para verificar a hiptese nula de igualdade entre
a distribuio emprica e a terica que, nesse caso, a curva normal. Assim, temos o teste de
Lilliefors, Cramer-von Mises, Watson e Anderson-Darling. Na primeira coluna temos o valor do
teste e, na ltima, o p-valor. Pelo resultado do p-valor, aceitamos a hiptese nula de distribuio
normal em todos os quatro testes propostos. Ou seja, os dados em z possuem distribuio normal.
A segunda parte mostra os parmetros estimados da nossa distribuio terica. A mdia3
(MU") -0,001053 e o desvio-padro 4 (SIGMA") de 0,998978. Note que esses dois resultados
3 MU representa a letra grega
4 SIGMA representa a letra grega
4.5 Teste de Distribuio Emprica (KolmogorovSmirnov) 63

(a)

(b)

Figura 4.8: Teste de Distribuio Emprica

para a mdia e desvio-padro, so iguais aos obtidos quando pedimos o Histogram & Statistics
(Figura 4.3). A seguir, em Prob. temos o teste para identificar se esses valores so estatisticamente
iguais a zero. No primeiro caso, o p-valor=0,2918 sinaliza que o valor da mdia estatisticamente
igual a zero, esse foi encontrado usando z = 0.0010530
0.000999 = 1.054. Logo abaixo temos p-valor=0,0000
que significa que o valor de SIGMA, ou seja, o desvio-padro, estatisticamente diferente de zero,
o que era esperado. Lembre-se que simulamos um conjunto de dados com desvio-padro igual a 1.
Se tentar testar outras distribuies tericas, ir perceber que muitas no so possveis, pois temos
valores negativos.
Agora, faa o mesmo teste para identificar se a srie de dados q, simulada para ter uma
distribuio qui-quadrado, possui uma distribuio normal. O resultado como mostrado na Figura
4.9a. Note que, agora, rejeitamos fortemente a hiptese nula de igualdade da distribuio emprica
e a terica. Nesse caso, pela segunda tabela de resultados, podemos ver que os parmetros de mdia
estimados para a distribuio terica, nesse caso a normal, so mdia igual a 1,000459 e desvio
padro igual a 1,416870. Pelos resultados dos testes na primeira parte da tabela na Figura 4.9a
rejeitamos a hiptese nula de distribuio normal dos dados.
De fato, como a srie q foi gerada de acordo com uma distribuio qui-quadrado, podemos
testar essa distribuio. Refazendo o teste EDF s que, agora, especificando como funo terica
a curva qui-quadrado (deixe o EViews R
estimar o nmero de graus de liberdade), teremos um
resultado diferente. Nesse caso, pelo p-valor, todos <1, aceitamos a hiptese nula de igualdade das
distribuies. Mais abaixo, na segunda tabela, podemos ver a estimativa dos graus de liberdade5
(NU") =0,999453, praticamente o mesmo utilizado para formar a srie, onde consideramos = 1).

Programao 4.5.1 Para fazer o teste de distribuio emprica no eviews via programao
podemos usar o comando abaixo. Nesse caso, o default testar se a srie de dados em questo
possui uma distribuio normal onde os parmetros de mdia e desvio padro so estimados.

x.edftest

Alternativamente, podemos testar se a srie q possui uma distribuio qui-quadrado usando:

5 NU representa a letra grega


64 Captulo 4. Estatsticas, testes de hiptese e ANOVA

q.edftest(dist=chisq)

(a) (b)

Figura 4.9: Teste de Distribuio Emprica

4.6 Teste de Igualdade (Test of Equality)


comum querer testar se dois grupos de dados, sejam eles categricos ou ento sries de tempo,
possuem mdia ou varincia iguais. Para fazer isso noEViews
R
devemos primeiro criar um grupo.
Esse procedimento conhecido como ANOVA, e pode ser melhor entendido na Seo 4.8.

4.7 Grficos Analticos Fazendo a distribuio dos dados


Anteriormente, no captulo sobre grficos, aprendemos a fazer alguns tipos diferentes de grficos
misturando curvas tericas com estimativas de kernel e histograma. Porm, naquele momento, o
resultado conhecido era apenas de um grfico, o que inviabilizava usar os dados gerados para outra
anlise.
Felizmente o EViews R
permite salvar os resultados desses grficos em uma matriz. Assim, o
objetivo dessa funo poder salvar os resultados que so teis para avaliar a distribuio dos dados
criando os intervalos. Vejamos um exemplo. Abra a srie de dados z e, a seguir em Proc /Make
Distribution Plot Data . . . . Note que ir abrir a janela representada na Figura 4.10a. Nesta, h
vrias opes que podem ser testadas e customizadas, sendo que as especificaes do lado direito
da tela mudam conforme a seleo com o tipo de dado selecionado no lado esquerdo da janela.
Para iniciar, imagine que se queira salvar os dados que podem ser utilizados para construir
o histograma da srie z. Nesse caso, selecione a opo Histogram. Mais abaixo escolha um
nome (para poder diferenciar das demais estimativas, escolhemos como nome para essa matriz
histograma_z) e, do lado direito, vamos pedir que sejam salvos os dados de frequncia. A seguir,
clique em ok.
A matriz histograma_z que salva contm trs colunas, conforme a Figura 4.10b. As duas
primeiras, C1 e C2, so os diversos intervalos do histograma. A ltima coluna, a C3, a quantidade
de dados, ou seja, a frequncia dos mesmos, que aparece naquele intervalo. Por exemplo, entre -4 e
-3,75 temos 54 dados. As outras duas opes para dados de histograma ( Scaling na Figura 4.10a)
so densidade e frequncia relativa. Ainda na parte de Specification, possvel ver a opo Bin
Width. Esse se refere ao tamanho do intervalo que ser utilizado para gerar o histograma. Nesse
caso, podemos escolher entre um default do EViews ou diversas outras opes.
Uma alternativa interessante para ver como o formato da distribuio dos dados via Den-
sidade de Kernel. Para a srie de dados z, v em Proc /Make Distribution Plot Data . . . e
depois selecione Kernel Density. Nas demais opes, deixe em bandwidt selecionado EViews e 100
grids points. Para esse exemplo o EViews R
retorna duas colunas. Na primeira o intervalo
4.8 Teste de Razo de Varincia 65

(a)
(b)

Figura 4.10: Matriz de Distribuio

superior da classe e, na segunda coluna, sua respectiva densidade. Faa o grfico da coluna 2 (C2)
e ver que temos uma distribuio prxima da curva normal.
A ltima opo interessante usar em Data Type a funo de densidade terica, selecionando
Theoretical Density. Do lado esquerdo h diversas funes que podem ser selecionadas e que iro
retornar os resultados para a estimativa de uma funo.

Programao 4.7.1 Para obter os resultados de um histograma ou de uma funo de densidade


qualquer, podemos usar alguns comandos especficos. Para fazer um histograma da serie x e
depois salvando o resultado com o nome de histograma_x, usamos:

x.distdata(dtype=hist) histograma_x

Para fazer uma estimativa usando a densidade de kernel, usamos:

x.distdata(dtype=kernel) kernel_x

A opo Unit Root Test . . . ser vista quando estudarmos sries de tempo, bem como o teste
de razo de varincia. O BDS Independence Test . . . ser visto em regresso simples, bem como
o correlograma

4.8 Teste de Razo de Varincia


A anlise de varincia, conhecida como ANOVA, uma tcnica de teste de hiptese usada para
testar a igualdade de duas ou mais mdias amostrais de uma populao, tambm denominadas
de tratamento. Para tanto, a anlise feita via varincia amostral. Com essa tcnica possvel
determinar se a diferena entre duas amostras causada por um erro aleatrio ou ento uma
diferena estrutural.
Para o uso da anlise de varincia, temos que assumir trs hipteses: (i) todas as populaes
que esto sendo usadas devem seguir uma distribuio normal, o que acaba por caracterizar o teste
como sendo paramtrico6 ; (ii) todas as populaes devem ter a mesma varincia; (iii) as amostras
6 Isso no quer dizer que no possa ser feito uma anlise de varincia de forma no-paramtrica.
66 Captulo 4. Estatsticas, testes de hiptese e ANOVA

devem ser selecionadas de forma aleatria, ou seja, devem ser independentes.

Ao fazer o teste temos que ter em mente que a hiptese nula assumida sempre ser de que a
mdia das amostras selecionadas igual. Alm disso, como estamos trabalhando com a razo de
varincia nos dados, usamos a distribuio F para o teste.

H basicamente quatro tipos de teste ANOVA. O primeiro o testeone-way between groups.


Esse o teste ANOVA mais simples, e o objetivo testar se existe diferena entre os grupos.
O segundo o one-way repeated, usado para ver, por exemplo, diferenas em um experimento
repetido ou, ento, para ver mudanas ao longo do tempo. Os dois testes seguintes so mais
complexos: o two-way between group e two-way repeated. Nesses feita uma investigao iterativa
entre os diferentes grupos.

Vamos ver um exemplo simples para fixar o conceito, e que se encontra no arquivo de nome
distribuio na planilha ANOVA. Suponha que uma empresa aplicou trs diferentes mtodos para a
produo de um produto e, para cada um desses mtodos, coletou os resultados encontrados de
forma aleatria durante um ms. Ou seja, pro mtodo 1, temos 10 informaes de produtividade,
para o mtodo 2 e 3 de forma similar, completando um universo de 30 resultados. Esses mtodos
so descritos como c1, c2 e c3.

Figura 4.11: Dados da Planilha ANOVA

O natural nessa avaliao responder se a mdia de produo difere entre os trs mtodos. Em
uma avaliao prvia, podemos ver que o mtodo 1 tem uma mdia de produtividade de 5,44, ao
passo que para o segundo mtodo 3,99 e o terceiro mtodo 4,48. Para ver as estatsticas dos dados,
selecione as trs sries, clique com o boto direito, abra como grupo. A seguir, v em Stats, na
barra de ferramentas.

Mas, ser que essa mdia estatisticamente diferente entre c1, c2 e c3? Qual o melhor mtodo
e qual o pior? Ou, reformulando a pergunta, ser que o mtodo de produo utilizado influencia
na produo? Para responder a esses pontos vamos usar o mtodo ANOVA.

Para tanto, iremos fazer uso de trs estatsticas que representam a variabilidade dos dados, seja
dentro do grupo ou entre grupos: (i) SQT Soma ao quadrado total; (ii) SQE Soma ao quadrado
do erro; (iii) SQG Soma ao quadrado dos grupos.

De uma forma geral, uma tabela de teste ANOVA apresentada da seguinte forma, onde n
representa o nmero total de dados, m o nmero de grupos.
4.8 Teste de Razo de Varincia 67

Origem da varia- Soma dos qua- Graus de liber- Varincia do qua- Razo F
bilidade drados dade drado mdio
Entre mdias 10,82 2 5,41 5,70
Dados dos 25,62 27 0,95
grupos (within
groups)
Total 36,44 29

Tabela 4.2: Resultados das estatsticas para anlise da varincia dos dados

Origem da varia- Soma dos quadra- Graus de li- Varincia do qua- Razo F
bilidade dos berdade drado mdio
SQG
Entre mdias SQG = m1 MSG = m1 Fratio = MSG
MSE
m 2
n j=1 (x j x)

SQE
Dados dos grupos SQE = nm MSE = nm
(within groups) ni=1 mj=1 (xi j
xj )2
Total SQT = n1
SQE + SQG

Tabela 4.1: Estatsticas para anlise da varincia dos dados

Para encontrar a primeira estatstica, SQT, devemos calcular a mdia de todos os 30 dados,
denominada mdia total (x). Para o nosso exemplo, essa 4,643. A seguir, encontrar o desvio de
cada dado x j em relao a essa mdia, elevar ao quadrado e somar. a medida de variabilidade
total de todo o conjunto de dados. Assim, SQT=36,44.
A segunda estatstica, SQE, uma medida de variabilidade que deve ser encontrada para cada
grupo (within group). Nesse caso, para o primeiro mtodo, temos a mdia dos 10 dados que o
integram e, encontramos o desvio de cada dado em relao a essa mdia, elevamos ao quadrado
e, depois, somamos. Sendo assim, para o nosso exemplo, teremos trs valores de SQE, um para
cada um dos mtodos que estamos usando. Para o mtodo 1 temos um SQE de 8,57, para o mtodo
2 um SQE de 8,49 e, para o mtodo 3 um SQE de 8,55. A seguir, ao somar os trs resultados,
encontramos que SQE=25,62.
Por fim, a terceira estatstica, SQG, uma medida de variabilidade entre os diferentes grupos
(between group), e que tambm referida como entre mdias. Nesse caso, ela representa a soma
do quadrado dos desvios da mdia de cada grupo em relao a mdia total. Ou seja, encontramos
a variabilidade da mdia do grupo que representa o mtodo 1 em relao a mdia total, elevado
ao quadrado. Isso feito para cada uma das informaes. Assim, no nosso exemplo teremos um
resultado que se repete por 10 vezes no grupo 1. Depois fazemos o mesmo para o mtodo 2 e para
o mtodo 3. Sendo assim, teremos 30 resultados para SQG. Ao fim, somamos todos e obtemos
SQG=10,82.
De forma geral, essas trs estatsticas so encontradas sempre que se vai fazer o teste ANOVA,
independente de quantos grupos se est trabalhando. Outro ponto interessante a relao que existe
entre elas, dada a partir de:
SQT = SQE + SQG

SQT = 25, 62 + 10, 82 = 36, 44


68 Captulo 4. Estatsticas, testes de hiptese e ANOVA

Note que a variabilidade total pode ser dividida em duas partes, uma (SQE) que representa
as caractersticas de cada grupo, ou seja, representa a diferena dos grupos, cada qual com seu
tratamento e, a segunda (SQG), as diferenas entre os grupos, a partir de um tratamento comum,
que seria considerando a mdia global. Portanto, a origem da variabilidade total pode estar ligada a
cada uma dessas duas causas.
No nosso exemplo, cada grupo tem 10 dados. Dessa forma, no h problema em usar a medida
de variabilidade. Porm, pode ocorrer de compararmos grupos que possuem uma quantidade
diferente de dados. Nesse caso, o grupo com maior nmero de dados ir ter, naturalmente, um
maior valor para a variabilidade. Aqui que entra um ponto importante no uso da ANOVA, devemos
computar os graus de liberdade.
Para o conjunto total de dados, usamos n-1, onde n o nmero de dados. Sendo assim, com
30 dados, os graus de liberdade de SQT 29. No caso do SQE usamos n-m, onde n o nmero
de dados e m o nmero de grupos. No nosso exemplo, n-3=30-3=27. Sendo assim, SQE (within
group) tem 27 graus de liberdade. Por fim, para SQG temos a diferena entre os graus de liberdade
de SQT e SQE, ou seja, SQG tem 2 graus de liberdade.
De posse dos valores referentes aos graus de liberdade, podemos agora fazer a respectiva
ponderao nas variabilidades, chegando a uma medida mais prxima da varincia. Isso feito
simplesmente dividindo os valores pelos seus graus de liberdade. Em livros de estatstica essa
medida denominada de MS Mean Square. Assim, temos MST, para representar a estatstica SQT
ponderada pelos graus de liberdade, MSE=0,949 relativa a SQE e MSG=5,411 que se relaciona
com SQG.
Por fim, encontramos a estatstica F, que dada por:

MSG 5, 411
Fratio = = = 5, 70
MSE 0, 949
Se essa razo for igual a 1, ento, a parcela de variao explicada entre os grupos e a explicada
pelo respectivo grupo igual, ou seja, as mdias so iguais. Porm, podemos chegar a essa mesma
concluso para valores diferentes de 1. Lembre-se, isso estatstica e, nesse caso, podemos ter um
resultado que seja estatisticamente significante.
Porque estamos usando a estatstica F para esse teste? Na discusso sobre funes de distri-
buies, ilustramos que a distribuio F dada a partir da razo de varincias sob a hiptese nula.
Portanto, a curva F ir ter todos os resultados possveis para as razes de varincia. A seguir,
calculamos o Fratio e identificamos se seu valor pode ser considerado estatisticamente significante
comparando o mesmo com a distribuio F.
No nosso exemplo, temos uma distribuio F(2,27) , ou seja, com 2 graus de liberdade no
numerador e 27 no denominador. Podemos encontrar seu desenho a partir de um conjunto de
1000000 de dados aleatrios para ver como seria essa distribuio.

Programao 4.8.1 Para encontrar a forma como os dados de uma distribuio F se compor-
tam, com 1000000 de dados aleatrios, 2 graus de liberdade no numerador e 27 no denominador,
podemos usar:

series f5 = @qfdist(rnd, 2,27)

Para fazer essa estimativa no se esquea de usar uma planilha que tenha uma dimenso de
1000000 de dados, como a usada no exemplo distribuio.

Note na Figura 4.12 que, como temos 27 graus de liberdade no denominador, a curva tem sua
rea um pouco menos concentrada perto do valor zero. O prximo passo seria determinar qual o
4.8 Teste de Razo de Varincia 69

Figura 4.12: Curva F2,27

p-valor associado a estatstica Fratio = 5, 7 que foi encontrada no nosso teste. Para tanto, podemos
fazer uso da funo cumulativa @cfdist() - veja o box de programao 4.8.2.
Esse ir produzir como resultado p-valor=0,008, que a rea da curva direita do valor F=5,7.
Sendo assim, podemos concluir que os trs mtodos apresentam diferena no resultado final, ou
seja, rejeitamos a hiptese nula a 0,8%.

Programao 4.8.2 Para encontrar o p-valor associado ao valor do teste F, devemos ter em
mente que a funo cumulativa fornece a rea at determinado valor. Sendo assim, devemos
subtrair de 1, a partir de:

scalar f=1-@cfdist(5.70, 2,27)


Esse procedimento pode ser facilmente feito no EViews R
, sem a necessidade de todos esses
clculos. Na planilha de nome ANOVA, temos as nossas trs sries de dados referentes aos nossos
trs mtodos. Como primeiro passo, crie um grupo com essas trs sries. A seguir, v em View
/Tests of equality . . . , selecione mean e clique em ok. Os resultados so apresentados em trs
partes. Na primeira est o resultado final (Figura 4.13a), que aponta o teste F e tambm o teste de
Welch.
A seguir, est o bloco com o resultado da anlise de varincia (Figura 4.13b), com suas
respectivas estatsticas SQG, SQE e SQT, alm das MSG, MSE e MST, que so ponderadas pelos
graus de liberdade.
Por fim, no terceiro bloco (Figura 4.13c), so mostradas as estatsticas referentes s sries de
dados que foram avaliadas, suas respectivas mdias, desvio padro e erro padro, tanto por grupo
quanto no conjunto.
Vale destacar que apenas concluir que as mdias so diferentes, como identificado pelo teste
acima, no o suficiente. Muitas vezes estamos interessados em saber a origem dessa diferena, e
isso pode ser verificado a partir do intervalo de confiana. O primeiro passo determinar o tamanho
do intervalo. Vamos supor 95% para uma estatstica t. Nesse caso, com 27 graus de liberdade, o
valor de t95% = 2, 05 e, o intervalo para cada grupo construdo a partir de:

mdia t95%

Como obtemos esse resultado para t? Usando a funo do EViews que descreve o ponto a partir
da rea. Lembre-se que a curva t bicaudal. Como queremos 95% de intervalo de confiana, sobra
70 Captulo 4. Estatsticas, testes de hiptese e ANOVA

(b) Anlise da Varincia


(a) Testes F e de Welch

(c) Estatsticas do Grupo

Figura 4.13: Teste de Igualdade das Mdias entre as Sries - ANOVA

5% para ser dividido nas duas reas, uma esquerda com 2,5% e outra direita com 2,5%. Assim,
usamos a funo scalar intervalo = @qtdist(0.025,27). Aplicando isso para os nossos
valores da tabela anterior, podemos encontrar os resultados apresentados na Tabela 4.3.

Mnimo Mdia Mximo


C1 4,81 5,44 6,07
C2 3,36 3,99 4,62
C3 3,85 4,48 5,11

Tabela 4.3: Intervalo de Confiana para a Mdia 95%

 Exemplo 4.1 Tambm h outra forma de fazer o teste ANOVA conhecendo apenas o nmero
de observaes, a mdia e a varincia dos dados em questo. Suponha, por exemplo, que se
queira verificar se o nvel de qualificao de um trabalhador em determinada empresa influencia
na sua produtividade. Nesse caso, selecionamos trs tipos de trabalhadores: estagirios, formado,
ps-graduado para serem avaliados. Os resultados so mostrados na tabela.

No Mdia Varincia
Estagirio 23 29,1 18,3
Graduado 21 28,1 16,9
Ps-graduado 16 21,3 15,2

Como primeiro passo, definimos as hipteses:


H0: no h diferena entre os nveis de qualificao e produtividade
Ha: Existe diferena de produtividade entre os nveis de qualificao
No total foram 60 dados distribudos em 23 estagirios, 21 trabalhadores graduados e 16 com
ps-graduao. A seguir temos as respectivas mdias de tempo gasto para executar uma tarefa e a
varincia. Note que aqui no temos os dados da pesquisa, apenas os resultados de mdia e varincia.
Mas, podemos fazer o teste ANOVA mesmo assim.
O primeiro passo determinar a mdia total entre os trs grupos. No nosso exemplo essa
dada por 21,16. A seguir, fazemos a soma do quadrado total, que consiste em fazer a diferena
4.8 Teste de Razo de Varincia 71

entre a mdia de cada grupo e a mdia total:

SQG = n1 (x1 x)
+ n2 (x2 x)
+ n3 (x3 x)

SQG = 23(29, 1 26, 16) + 21(28, 1 26, 16) + 16(21, 3 26, 16)
SQG = 655, 34

A seguir encontramos a estatstica SQE, que uma medida de variabilidade de cada grupo (within
group) usando a formula do SQE, onde (s2i ) a varincia do grupo i, temos:

SQE = (n1 1)(s21 ) + (n2 1)(s22 ) + (n3 1)(s23 )


SQE = (22)(18, 3) + (20)(16, 9) + (15)(15, 2)
SQE = 968, 60

Agora, devemos fazer o ajuste para cada uma das estatsticas pelos graus de liberdade. No caso
da SQG, os graus de liberdade so dados pela diferena entre o nmero de argumentos menos um.
Como temos trs diferentes argumentos, estagirio, graduado e ps-graduado ento, h 2 graus de
liberdade para SQG. No caso de SQE, os graus de liberdade so dados pela diferena entre o total
de dados utilizados e o nmero de argumentos. Como temos um total de 60 dados ento, os graus
de liberdade de SQE sero 57.
Podemos, assim, encontrar a estatstica F:
SQG/m1 655,34/2
F= = = 19, 2828
SQE/(nm) 968,60/57

Com esse resultado rejeitamos fortemente a hiptese nula, basta ver em scalar f= 1-@cfdist
(19.2828, 2,57) no EViews R
, que produz um p-valor=0,000. Sendo assim, o nvel de qualifica-
o importante para determinar diferenas na produtividade.
Descobrimos que existe diferena, mas, no de onde vem essa diferena. Para responder a esse
ponto, aplicamos um teste de diferena de mdia que usa a curva t. Como temos trs argumentos,
para descobrir a origem da diferena temos que testar aos pares. Nesse tipo de teste temos que
determinar apenas qual o nvel de significncia procurado para que se construa o intervalo de
confiana.
Como regra geral, ao avaliar a diferena entre a mdia do grupo 1 com a mdia do grupo 2,
usamos: s  
SQE 1 1
1 2 t/2c +
(m n) n1 n2
onde 1 a mdia do grupo 1, t/2c a estatstica t avaliada em um ponto, o nvel de significncia,
(m n) o nmero de graus de liberdade n1 o total de dados do grupo 1 e c dado por:

m(m 1)
c=
2
Como regra de deciso, se o intervalo de confiana no contiver o valor 0 ento, rejeitamos
a hiptese nula. Primeiro vamos descobrir se tem diferena entre o resultado para estagirio e
graduado:
H0: estagirio = graduado ;
Ha: As mdias so diferentes
Nesse caso temos:
3(3 1)
c= =3
2
72 Captulo 4. Estatsticas, testes de hiptese e ANOVA

e, para = 0, 05 temos que encontrar o valor de t/2c = t0,05/6 = 0, 0083. Isso pode ser feito no
EViews R
utilizando scalar t=@qtdist(0.0083,57). Com isso, temos um valor de 2,46. Agora
s determinar o intervalo:
s  
1 1
29, 1 28, 1 2, 46 16, 992 +
23 21

Dessa forma, no rejeitamos a hiptese nula. Ou seja, a mdia entre estagirios e graduados
estatisticamente igual. Faa a mesma conta para verificar a diferena de mdia entre estagirio e
ps-graduado. O resultado ser: 4, 49 < 1 3 < 11, 10, fazendo com que se rejeita a hiptese
nula, ou seja, h diferena de mdia entre estagirios e ps-graduados. Por fim, podemos fazer para
verificar a diferena entre graduado e ps-graduado, o que ir resultar em: 3, 43 < 1 3 < 10, 16.
Tambm apontando para a rejeio da hiptese nula, ou seja, temos diferena entre as mdias.

Programao 4.8.3 Diante de dados como o apontado no exemplo da qualificao, podemos


usar de programao para produzir os resultados do teste ANOVA de maneira direta.

`programa para calcular o intervalo de confiana em um teste ANOVA


`os parametros abaixo podem ser modificados
`n representa o total de dados por grupos
`m representa a media do grupo
scalar n1=23
scalar n2=21
scalar n3=16
scalar total=n1+n2+n3
scalar m1=29.1
scalar m2=28.1
scalar m3=21.3
scalar sqe1=968.60/(total-3)

`parmetros de escolha para o intervalo


scalar alfa=0.05

`resultado para a estatstica t


scalar t=-@qtdist(alfa/6,total-3)

`testando a diferena entre m1 e m2


scalar minimo=m1-m2-t*@sqrt(sqe1*((1/n1)+(1/n2)))
scalar maximo=m1-m2+t*@sqrt(sqe1*((1/n1)+(1/n2)))

4.9 Exerccios
Exerccio 4.1 Trs tipos de baterias esto sendo testadas sob condies de alta presso. Na
tabela abaixo est o tempo, em horas, que 10 baterias de cada marca funcionou antes de ficar
sem energia.
4.9 Exerccios 73

Marca da bateria
1 2 3
5,60 5,38 6,40
5,43 6,63 5,91
4,83 4,60 6,56
4,22 2,31 6,64
5,78 4,55 5,59
5,22 2,93 4,93
4,35 3,90 6,30
3,63 3,47 6,77
5,02 4,25 5,29
5,17 7,35 5,18

(a) Use a anlise de varincia para determinar se as baterias de cada marca levaram tempos
significativamente diferentes para descarregar por completo. Se o tempo de descargamento for
significativamente diferente (ao nvel de confiana de 0,05) determine qual marca de bateria
diferem uma das outras. Especifique e verifique os pressupostos do modelo.
(b) Podemos dizer que resultados da marca 1 tem distribuio normal a 5% de significncia?


A tabela ANOVA do Exerccio 4.1 :

Soma dos quadrados Graus de liberdade Var. do quadrado mdio Razo F


Entre mdias 10,77 2 5,39 4,79
Within groups 30,33 27 1,12
Total 41,11

Testando 5% de significncia, a regio crtica inclui os valore superiores a F2,27 (0, 95) = 3, 354.
O resultado da Razo F 4,79 fica na regio crtica, portanto, rejeitamos a hiptese das mdias serem
iguais. O teste indica que no h diferena entre as marcas 1 e 2, mas a marca 3 difere-se da marca
2.
O resultado do teste de Jarque-Bera foi 5,0603 e, aplicando uma distribuio qui-quadrado
com 2 graus de liberdade temos que (2)2 = 0.0796. Portanto, no podemos rejeitar a hiptese nula

de existncia de distribuio normal.

Exerccio 4.2 Uma siderrgica est testando a eficincia do seus alto-fornos. Para a produo
de uma pea especfica, o forno precisa alcanar rapidamente a temperatura de 900 C. Quatro
fornos foram testados vrias vezes para determinar o tempo (em minutos) que levavam para
atingir essa temperatura e foram obtidos os seguintes resultados:

Forno ni xi si
1 15 14,21 0,52
2 15 13,11 0,47
3 10 15,17 0,60
4 10 12,42 0,43

O tempo mdio de aquecimento dos fornos so diferentes? Caso sejam, qual forno o mais
rpido? E qual o mais lento? 

A tabela ANOVA para o Exerccio 4.2 :


74 Captulo 4. Estatsticas, testes de hiptese e ANOVA

Soma dos quadrados Graus de liberdade Var. do quadrado mdio Razo F


Entre mdias 47,106 3 15,702 61,303
Within groups 11,782 46 0,2561
Total 58,888 49

Testando um nvel de 5% de significncia, F3,46 (0, 95) = 2, 802. Considerando que 61, 303 >
2, 806 rejeitamos a hiptese nula. Assim, consideramos que o tempo mdio de aquecimento dos
fornos diferem-se. Realizando mltiplas comparaes, conclumos que o forno nmero 4 o mais
rpido e o nmero 3 o mais lento.
5. Caractersticas dos dados de sries de tempo

Um banco de dados pode ser organizado de vrias formas e os testes e modelos aplicados seguem
esse desenho. Para dados com periodicidade definida, como ms, trimestre ou ano, usamos os
conceitos de srie de tempo. Por outro lado podemos ter dados que descrevem as caractersticas,
em um dado momento, de vrios indivduos, denominados de cross section. Tambm h a opo
de dados em painel que agrega informaes de indivduos com o tempo. Nesse captulo sero
apresentadas as principais caractersticas de uma srie de tempo, assim como os ajustes e filtros
possveis de serem aplicados com o EViews R
. Com conjunto de dados de srie de tempo possvel
extrair vrias informaes que ajudam a compreender o comportamento desses ao longo do perodo.

5.1 Ajuste Sazonal


A sazonalidade entendida como um processo que pode ter diferentes periodicidades dentro de
um determinado perodo. Podemos identificar a presena de sazonalidade em dados trimestrais
ou mensais, os mais comuns, mas tambm possvel que se tenha um comportamento sazonal em
dias dentre de uma semana, horas e etc. As primeiras investigaes 1 sobre essa caracterstica dos
dados remontam a 1884 e, at mais recentemente, a forma de identificar essa era decompondo a
srie de dados yt a partir de seus componentes, como tendncia (Tt ), ciclo (Ct ), sazonalidade (St ) e
componentes irregulares (It ).
Os modelos construdos a partir de ento so denominados de modelos de componentes
no-observveis, podendo ter a forma de aditivo:

yt = Tt +Ct + St + It

Ou ento, multiplicativo:
yt = Tt Ct St It
De incio, os modelos que procuravam determinar o comportamento sazonal de uma srie
de tempo assumiam que esse era constante ao longo do tempo. Porm, h diversos fatores,
1 Uma boa referncia para essa discusso histrica est em Hylleberg(1986).
76 Captulo 5. Sries de tempo

como mudanas na temperatura mdia, diferentes expectativas, mudana de comportamento do


consumidor, efeito feriado e outros, que podem produzir um padro sazonal diferente hoje do que
se identificava no passado. Um ponto importante a lembrar que a no correo da caracterstica
sazonal dos dados, antes de se fazer uma anlise de regresso, bem como, a aplicao de um filtro
errado para corrigir a sazonalidade, podem distorcer os resultados finais e prejudicar a interpretao.
Nesse caso, podemos escolher resolver o problema sazonal de maneira integrada com o modelo
final ou ento, de maneira individual antes da modelagem final. Esse caso o mais comum, onde
so usadas variveis dummy para corrigir o problema da sazonalidade. Outra alternativa o uso
do Band Pass Filter onde a anlise feita a partir do domnio da freqncia e utilizada uma
transformao de Fourier na srie de dados.
Os modelos de srie de tempo para correo da sazonalidade, como apontado por Hylle-
berg(2006) podem ser de vrios tipos. No caso univariado: (i) modelos de Box-Jenkins; (ii)
modelos de componentes no-observveis; (iii) modelos de parmetros variveis no tempo. Para o
caso multivariado: (i) cointegrao sazonal; (ii) cointegrao peridica; (iii) caractersticas sazonais
comuns.
Como primeiro passo de investigao de uma caracterstica sazonal vamos ver sua representao
grfica. Para essa seo vamos usar a srie que descreve o PIB mensal do Brasil e calculada pelo
Banco Central, o IBC-BR, nmero 17439, sem ajuste sazonal. Voc pode fazer o download da
mesma no site do BC ou abrir o arquivo de nome IBCbr.wf1. Selecione a srie ibcbr e clique em
View/Graph.../Seasonal Graph, tal como mostrado na figura 5.1.

Figura 5.1: Opes de Grfico Sazonal

Note que em seasonal type, temos duas opes, a primeira, quando selecionado Paneled
lines & means, ir mostrar como a srie de dados se comporta para cada ms ou trimestre e, na
segunda opo, em Multiple overlayed lines, os dados so divididos em diferentes linhas, cada
qual representando o perodo especfico, para todo o perodo amostral. Vai da opo de cada um ver
qual dos dois grficos melhor descreve o comportamento dos dados, no havendo regra. Ambos os
grficos so mostrados na figura 5.2. O primeiro, 5.2a, indica doze linhas de cor azul lembre-se
que estamos usando dados mensais e que sinalizam como evoluram os dados em cada ms
durante todo o perodo de anlise. Esse complementado com a informao da mdia para cada
ms, indicada pela linha vermelha. Por exemplo, a primeira informao relacionada ao ms de
5.1 Ajuste Sazonal 77

fevereiro ocorre em 2002M02, e tem valor 99, ao passo que a ltima, em 2015M2, tem valor 138.
A mdia dos valores do ms de fevereiro 121, e exatamente a linha vermelha horizontal. Para
identificar esse valor o leitor deve deixar o mouse posicionado sobre a linha vermelha no grfico
no EViews R
. Note que a mdia de valores do ms est bem longe dos extremos, sinalizando que,
durante o perodo de anlise, a sazonalidade do ms teve forte modificao, tendo atingido um
mnimo de 99 e um mximo de 144. Certamente seria um erro considerar a sazonalidade mdia
como representativa de tudo.
A segunda forma de ver o comportamento dos dados separados para cada um dos meses
selecionando a opo de mltiplos grficos: Multiple overlayed lines, cujo resultado est mostrado
na figura 5.2b. Note que h uma tendncia de crescimento dos valores para cada ms ao longo
do tempo. Isso tem uma implicao importante como comentado acima, em especial pelo fato
de que usar a mdia de cada ms para identificar e corrigir padro sazonal estaria incorreto, ou
seja, a mdia de cada trimestre no constante ao longo do tempo. Uma parte da literatura em
econometria usa a mdia como fator de dessazonalizao. Isso conhecido como sazonalidade
determinstica e sua correo feita com o uso de variveis dummy (valores zero e um).

(a) Linhas em painel e mdias (b) Linhas sobrepostas

Figura 5.2: Grfico da Sazonalidade

Mas h outros mtodos mais sofisticados e especficos que podem ser utilizados, e oEViews
R

permite seu uso. Com a srie ibcbr aberta, v em Proc/Seasonal Adjustment. Note que so
fornecidas cinco diferentes opes para se dessazonalizar os dados. Vamos discutir os aspectos
gerais do mtodo X-12 comparativamente ao mtodo das mdias mveis e TRAMO/SEATS, sem
entrar no detalhe tcnico, que pode ser visto em outros livros de econometria.

5.1.1 Mtodo das Mdias Mveis (Moving Average Methods)


Esse mtodo simples a ponto de resultar em uma importante perda de informao do comporta-
mento sazonal dos dados. Nesse caso, a modelagem feita a partir de:
S
yt = st ms + t
s=1

Onde S o nmero de perodos, se dados mensais S=12 e se forem trimestrais S=4; st assume
valores 1 para o respectivo perodo sazonal em questo e zero caso contrrio; ms o valor da mdia
desses perodos e, por fim t estacionrio com mdia zero. Sendo assim, a equao geral que ir
medir a sazonalidade por mdias para dados trimestrais, dada por:

qxt = 1t m1 + 2t m2 + 3t m3 + 4t m4 + t
78 Captulo 5. Sries de tempo

No caso de uma srie de dados com periodicidade mensal teremos 12 variveis st Para encontrar
os respectivos valores devemos criar sries de dados usando variveis dummy de valor 1 e 0, tal
como mostrado abaixo no caso trimestral:

qx Primeiro Segundo Terceiro Quarto


trimestre trimestre trimestre trimestre
1997Q1 38.027 1 0 0 0
1997Q2 44.520 0 1 0 0
1997Q3 45.070 0 0 1 0
1997Q4 46.547 0 0 0 1
1998Q1 45.003 1 0 0 0
1998Q2 42.943 0 1 0 0
1998Q3 44.047 0 0 1 0

A seguir, rodamos a regresso para encontrar os respectivos valores de ms . Note que essa
regresso feita sem o uso da constante. Caso contrrio seria encontrado cinco valores para a mdia
em dados trimestrais e treze em dados mensais, e a matriz no seria simtrica. Vejamos como o EVi-
ews R
faz essa estimativa. Com a srie ibcbr aberta, v em Proc/Seasonal Adjustment/Moving
Average Methods. Escolha o mtodo multiplicativo e um nome para a srie resultante (aqui no
exemplo colocamos o nmero 1 na frente para diferenciar esse mtodo de dessazonalizao do
X-12 a ser visto a seguir).

Programao 5.1.1 Tambm pode ser usado um comando para se fazer a dessazonalizao.
Nesse caso, para o mtodo multiplicativo, podemos escrever:

seas(m) ibcbr ibcbr_sa ibcbr_sf

A letra m representa o mtodo multiplicativo. Caso queira o mtodo aditivo, use a. O


comando seguido pelo nome da srie, o nome da srie ajustada sazonalmente e o fator sazonal.
comum trabalhar com modelos com vrias sries de tempo, o que demandaria tempo para
aplicar o mtodo de dessazonalizao para cada uma. Como forma de operacionalizar isso de
maneira rpida, podemos usar um loop para dessazonalizar todas as sries do banco de dados
ao mesmo tempo com apenas um comando simples. Porm, nesse caso, necessrio abrir um
programa antes. V em File/New/Program. A seguir, escreva o programa abaixo e salve em
qualquer lugar do computador e feche o mesmo.

for %a qx y px pm qm
seas(m) {%a} {%a}_sa {%a}_sf
next

Aqui, o termo %a, denominado no EViews R


como string variable indica para o programa
que ele ir aplicar a frmula a todas as sries descritas na sequncia, seguindo uma de cada
vez (qx, y, px, pm, qm). A seguir, esto os comandos para salvar as respectivas sries ajustadas
sazonalmente e o fator sazonal.
Para rodar o programa, abra o arquivo onde esto os dados. Depois v em window/command.
Note que foi aberta uma janela onde pode ser escrito qualquer frmula ou programa. Assim,
para rodar o nosso programa, escreva o comando run, seguindo a localizao do programa no
5.1 Ajuste Sazonal 79

computador, como por exemplo, c:\....:

run localizao do programa

A seguir, aperte o enter e o programa ser executado. Esse procedimento vlido para
todas as demais aplicaes a seguir que envolvem a construo de um programa.

Como selecionamos a opo de aparecer o fator sazonal, o EViews


R
retorna 12 fatores, um para
cada ms, em uma tabela. Para no perder essa informao clique em Freeze, escolha um nome e
depois salve a mesma. Esses representam exatamente os fatores sazonais para cada trimestre. Se
estivssemos com dados mensais, seriam 12 fatores. Como nesse mtodo assumido que os fatores
ficam contnuos durante todo o perodo amostral, o grfico do padro sazonal apresenta um fator
constante, como pode ser visto na figura 5.3.

(a) Ajuste sazonal - mdias m-


veis (b) Fator sazonal - mdias mveis

Figura 5.3: Grfico da Sazonalidade - Mtodo das Mdias Mveis

Uma forma interessante de representar esse comportamento sazonal via uma funo trigono-
mtrica:

S/2     
2kt 2kt
qxt = 0 + k cos + t sen + t
k=1 S S
Onde o 0 uma constante que representa a mdia e S o nmero de componentes sazonais.
Suponha o exemplo de uma srie trimestral. Nesse caso S=4 e teremos:

2     
2kt 2kt
qxt = 0 + k cos + t sen + t
k=1 4 4

       
2t 2t 22t 22t
qxt = 0 + 1 cos + 1 sen + 2 cos + 2 sen + t
4 4 4 4
 t   t 
qxt = 0 + 1 cos + 1 sen + 2 cos (t) + 2 sen (t) + t
2 2
Mas,sen (t) = 0, sendo assim, teremos:
 t   t 
qxt = 0 + 1 cos + 1 sen + 2 cos (t) + t
2 2
80 Captulo 5. Sries de tempo

Onde t=1,2,3,... , de acordo com o perodo amostral, e o comportamento cclico para as


trajetrias anuais e semi-anual dado por:
 t 
cos = 0, 1, 0, 1, 0, 1, ...
2
 t 
sen = 1, 0, 1, 0, 1, 0, 1, ...
2
cos (t) = 1, 1, 1, 1, ...
Os componentes 1 e 1 representam a oscilao anual nos dados, ao passo que 2 representa
o componente semi-anual. Para encontrar os valores desses componentes, podemos usar:

1
1 =
(m2 + m4 )
2
1
1 = (m1 m3 )
2
1
2 = (m1 + m2 m3 + m4 )
2
Vejamos para o nosso um onde m1 = 0.9479, m2 = 1.0105, m3 = 1.035, m4 = 1.0078. Sendo
assim, teremos:

1 1
1 = (m2 + m4 ) = (1.0105 + 1.0078) = 0.00133
2 2
1 1
1 = (m1 m3 ) = (0.9479 1.035) = 0.0438
2 2
1 1
2 = (m1 + m2 m3 + m4 ) = (0.9479 + 1.0105 1.035 + 1.0078) = 0.0086
2 2
E o ciclo que domina todo o processo o anual ( 1 e 1 so maiores que 2 ). Ou seja, a
frequncia mais forte no ciclo anual. Os valores so pequenos pois o conjunto de dados tem uma
pequena sazonalidade, como mostrado pelas mdias de cada trimestre. Para construir a srie do
fator sazonal podemos usar o fato de que: 0 = 1, 1 = 0.00133, 1 = 0.0438 e 2 = 0.0086
em:
 t   t 
qxt = 1 0.00133cos 0.0438sen + 0.0086cos (t) + t
2 2

5.1.2 TRAMO/SEATS
Na tcnica TRAMO/SEATS2 de dessazonalizao combina dois mtodos TRAMO e SEATS para
decompor a srie em seus componentes no observados. A primeira similar a uma regresso
ARIMA, e utilizada antes como uma espcie de ajuste dos dados3 . Ao passo que o SEATS
usado para extrair os sinais da srie de tempo, ou seja, os componentes no observados a partir de
um modelo aditivo:
yt = TCt + St + It
Sendo que TCt o componente tendncia-ciclo e os demais como dito anteriormente, o
componente sazonal e o irregular. Para selecionar esse mtodo, com a srie de dados ibcbr
aberta, v em Proc/Seasonal Adjustment/TRAMO/SEATS.... O EViews R
ir abrir uma caixa
que contm trs diferentes opes. A primeira delas refere-se s especificaes bsicas. No
2 TRAMO Time Series Regression with ARIMA Noise, Missing Observation and Outliers. SEATS Signal
extraction in ARIMA time series.
3 Mais a frente iremos aprender como so os modelos ARIMA.
5.1 Ajuste Sazonal 81

Figura 5.4: Opes TRAMO/SEATS

primeiro bloco, podemos escolher rodar apenas o filtro TRAMO, somente o SEATS ou ento esse
aps o TRAMO, mtodo mais recomendado. Normalmente deixamos o horizonte de previso tal
como o default do EViews R
, sem prejuzo dos resultados finais. Na escolha do modelo ARIMA,
podemos determinar que a mesma feita via seleo de dados em nvel, com transformao log
ou uma seleo automtica. No ltimo bloco podemos deixar o filtro TRAMO escolher a melhor
especificao ARIMA ou, ento, fazermos a escolha do modelo especificando os parmetros.
Esse ponto interessante pois muitas sries de dados que so dessazonalizadas por institutos de
pesquisas j contm o modelo ARIMA e so fornecidos para uso por parte de terceiros. Nesse
caso, se quisermos reproduzir o mesmo modelo, basta imputar os dados, tal que D o nmero de
diferenciaes, AR o nmero do componente autorregressivo e MA o de mdias mveis. Do lado
direito esto as opes para salvar as sries de dados. Podemos escolher todas as opes, encontrar
as sries de tendncia e do fator sazonal e depois fazer o grfico. Para extrair o componente
sazonal, temos que encontrar o fator sazonal pelo mtodo aditivo. H duas outras abas com opes
que podem ser uteis. A Regressors para especificar se no processo de identificao queremos
colocar alguma varivel exgena. Na aba Outliers podemos escolher se tem algum, especificando
o perodo, ou ento deixar que o programa faa a identificao.
Ao clicar em OK o EViews R
ir mostrar um relatrio que contm todos os procedimentos,
testes e ajustes necessrios no processo de estimativa. Podemos salvar esse relatrio clicando em
Freeze. Atualizando o mesmo poder ver que o modelo final da forma (2,1,1)(0,1,1) sem mdia,
sem correes para dias da semana ou pscoa. A ordem dos nmeros mostrados acima (AR, D,
MA)(SAR, SD, SMA) ou seja, temos um modelo ARIMA (2,1,1) com sazonalidade SARIMA
(0,1,1). Veremos isso mais a frente. A seguir o EViews R
salva todos os resultados em um grupo
de sries. Salve esse como grupo 1 para consulta futura. Agora selecione a srie ibcbr_trd e
ibcbr_sf e faa um grfico com dois eixos como mostrado em 5.5.

5.1.3 Mtodo Census X-12


Esse , sem dvida, um dos mtodos de identificao dos componentes de uma srie de dados mais
utilizado na literatura at o momento. Quando esse selecionado, possvel identificar vrias
opes. A primeira delas a X-11 Method. H pequenas diferenas no uso de cada uma , mas
recomenda-se ao leitor que utilize o mtodo Additive caso tenha valores negativos ou zero. Na
82 Captulo 5. Sries de tempo

Figura 5.5: Tendncia e fator sazonal

opo Seasonal Filter, que ir gerar os fatores sazonais, est selecionado como default o mtodo
X-12. Sugere-se fortemente seu uso4 .
Na opo Trend Filter, o leitor poder notar que o default deixar o EViews R
determinar
quantos termos sero utilizados nas mdias mveis para extrair a tendncia. Em Component
Series to Save, pode-se especificar o nome da srie que ser salva alm de outros seis componentes.
A primeira opo retorna a serie ajustada sazonalmente. Alm disso, a aplicao do filtro X-12
permite que se tenha a informao de trs importantes caractersticas dos dados: os fatores sazonais;
a tendncia cclica; o componente irregular. Nos dois ltimos esto as opes de ajuste dos fatores
ao efeito calendrio de dias de negociao no mercado ou para feriados. Esses esto definidos
no EViews R
para os feriados dos EUA e pscoa no Canad. Quando aplicados, duas opes so
selecionadas, abre outras opes na aba Trading Day/Holiday.
H trs outras abas com diferentes opes. Em Outliers podemos especificar se em determinada
data haver um outlier. Na opo ARIMA Options escolhemos se h ou no transformao dos
dados se teremos repressores exgenos ou se queremos usar alguma amostra de dados na estimativa.
Por fim, na aba Diagnostics podemos pedir para que seja feita uma anlise da sazonalidade e que
seja mostrado o diagnstico dos resduos, deteco de outliers ou grficos.
Na aba Seasonal Adjustment vamos selecionar o mtodo multiplicativo, selecionando as
quatro opes de componentes, como mostra a figura 5.6a, e ento clique em Ok. No esquea
de mudar o nome base para ibcbr2 para que a nova estimativa no apague a anterior. Ao
fazer a dessazonalizao, o EViews R
retorna uma pgina com diversas descries do processo
implementado. Essa pode ser fechada sem prejuzo da anlise futura ou ento salva com clicando
em Freeze. Ao voltar para a pgina do workfile, poder ver que foram criadas quatro novas sries
de dados, todas com o nome da srie original mais os termos que representam cada uma dos
componentes. No nosso caso: ibcbr2_sa, ibcbr2_sf, ibcbr2_tc, ibcbr2_ir.
A figura 5.6b mostra a evoluo do fator sazonal para a srie qx. Note que o mesmo no
constante ao longo do tempo, sugerindo que a correo pela sazonalidade deve preservar essa
diferena.
Esse fator sazonal pode ento ser utilizado para dessazonalizar os dados originais. Para tanto, no
workfile, clique em Genr/Generate Series by Equation. Essa opo abre uma janela e permite que
4O mtodo X-12 ARIMA melhor do que o X-11, e incorpora diversos pontos interessantes, como por exemplo,
a possibilidade de detectar outliers, mudanas no padro sazonal, mudanas de nvel na srie, melhor para tratar com
sries de dados com falhas de informao, efeito calendrio e testes de diagnstico.
5.1 Ajuste Sazonal 83

(b) Fator sazonal - ibcbr_sf


(a) Ajuste sazonal - X-12

Figura 5.6: Grfico da Sazonalidade - Mtodo X-12 multiplicativo

Figura 5.7: Gerar srie por equao

se crie uma srie nova a partir de outras existentes. Vamos usar um nome teste para representar
essa dessazonalizao, tal como mostrado na Figura 5.7, onde vamos dividir a srie original pelo
ibcbr
fator sazonal: teste = . A seguir, clique em Ok e confira os dados com os obtidos em
ibcbr2s f
ibcbr_sa. O leitor poder ver que so idnticos.
Os dois outros componentes so a tendncia cclica descrito como ibcbr_tc e o componente
irregular ibcbr_ir, cujos grficos esto dispostos na figura 5.8. Note que, juntamente com os
mesmos, foi escolhida a opo Kernel density em Axis borders. Isso ajuda a compreender como
os dados esto distribudos, possibilitando observar que os resduos do modelo X-12 ARIMA
possuem distribuio normal, tal como esperado.
De forma geral, o que obtemos aqui uma decomposio da nossa srie original em 3 impor-
tantes fatores: (i) fator sazonal; (ii) tendncia cclica; (iii) componente irregular. Assim, tambm
podemos obter a srie original a partir desses 3 fatores, basta fazer:

ibcbr = ibcbr_s f ibcbr_tc ibcbr_ir.

Nesse caso, escolhemos um nome para essa nova srie teste, e construmos uma frmula para
ela a partir da multiplicao dos trs componentes anteriores. A seguir, o leitor poder ver que foi
criada uma srie de nome teste no workfile.
Alm de determinar os componentes de uma srie de tempo, o EViews R
tambm faz a correo
sazonal dos dados, como o leitor pode ver no workfile a partir da srie ibcbr2_sa. Essa obtida
dividindo-se a srie original pelo seu fator sazonal:
ibcbr2t
ibcbr2_sat =
ibcbr2s ft
84 Captulo 5. Sries de tempo

(a) Tendncia cclica ibcbr_tc (b) Componente irregular ibcbr_ir

Figura 5.8: Grfico dos componentes da srie ibcbr

Figura 5.9: Gerar srie por equao

Programao 5.1.2 O mtodo de dessazonalizao X-12 possui muitas opes. A forma mais
bsica pode ser aplicada como a seguir, seguindo o exemplo utilizado para as mdias mveis.
Assim, usamos um procedimento para aplicar tanto o mtodo das mdias mveis quanto o X12 a
vrias sries ao mesmo tempo. Abra o mesmo programa de antes e agora acrescente o termo
para a dessazonalizao pelo X-12. Depois, v ao arquivo original e rode o mesmo.

for %a qx y px pm qm
seas(m) {%a} {%a}_sa {%a}_sf
{%a}.x12(mode=m, filter=msr, save= "d10 d11 d12") {%a}_x12
next
Nesse caso, usamos o mtodo multiplicativo (se quiser usar o mtodo aditivo mude de m para
a), como filtro selecione o X-12 e salvamos, respectivamente, os fatores sazonais (d10), as
sries ajustadas sazonalmente (d11) e a tendncia cclica (d12). Ao final, o termo {%a} serve
para usar o nome da srie como nome base. Por exemplo, quando o programa estiver aplicando a
dessazonalizao para a srie qx, ir salvar a srie de fatores sazonais como qx_sf.

Uma alternativa de dessazonalizao via mtodo aditivo. Nesse caso, tambm podemos
selecionar a opo de obter os trs fatores: (i) fator sazonal; (ii) tendncia; (iii) componente
irregular, alm da srie ajustada sazonalmente. Algumas diferenas de resultado aparecero entre
o mtodo multiplicativo e aditivo, como por exemplo, o fator sazonal e o irregular. Mas, a srie
ajustada sazonalmente ir produzir resultados semelhantes. Porm, ao invs de dividir a srie
original pelo seu fator sazonal, como feito no mtodo multiplicativo, agora diminumos a mesma
de seu fator sazonal.
5.1 Ajuste Sazonal 85

(b) Fator sazonal - qx_ad_sf


(a) Ajuste sazonal - X-12

Figura 5.10: Grfico da Sazonalidade - Mtodo X-12 aditivo

Programao 5.1.3 Como forma de complementar a anlise das sries quando se tem mais de
uma, pode ser mais til agrupar as mesmas. Nesse caso, recorremos ao comando group, como
mostrado abaixo, onde agrupamos todas as sries ajustadas sazonalmente no seu banco de dados
feitas anteriormente em um grupo de nome ajustada.

group ajustada qx_x12_sa px_x12_sa pw_x12_sa pr_x12_sa y_x12_sa

Para ver como isso ocorre repita os passos anteriores mas escolha o mtodo aditivo. Para que
as sries salvas sejam diferentes das anteriores, use um subndice ad, tal como mostrado na figura
5.10a:
Note que o resultado do fator sazonal oscila em torno do valor zero, ao invs de oscilar em
torno de 1, como no mtodo multiplicativo mas, o resultado o mesmo. A seguir, use:

ibcbr2_ad_sat = ibcbr2t ibcbr2_ad_s ft

Para encontrar a srie ajustada sazonalmente. Por fim, para obter a srie original no multiplicamos
os trs fatores tal como no caso do mtodo multiplicativo e, sim, somamos os mesmos:

ibcbr2t = ibcbr2_ad_s ft + ibcbr2_ad_tct + ibcbr2_ad_irt

H diversas opes que o EViews R


permite aplicar no ajuste sazonal. Em especial, e muito comum
para o Brasil, seria um ajuste que considerasse os feriados. Apesar de disponibilizar essa opo em
Trading day/Holiday, a mesma est formatada para feriados nos EUA.

Programao 5.1.4 O grfico do fator sazonal para cada uma das sries do seu banco de dados
pode ser solicitado. Nesse caso, usamos o objeto graph. Como queremos um grfico de linha,
usamos o comando line. Por fim, especificada a srie que ser feito o grfico. Nesse caso,
{%a}_x12_sf.

for %a qx y px pm qm
seas(m) {%a} {%a}_sa {%a}_sf
{%a}.x12(mode=m, filter=msr, save= "d10 d11 d12") {%a}_x12
graph gra {%a}x12.line {%a}_x12_sf
next
86 Captulo 5. Sries de tempo

Programao 5.1.5 Alternativamente, podemos estar interessados em avaliar como fica cada
uma das sries ajustadas sazonalmente a partir de dois diferentes mtodos. Nesse caso, aplicamos
o mtodo das mdias mveis e depois o X-12. Em ambos, fazemos tanto a sazonalidade aditiva
quanto multiplicativa. A seguir, calculada a correlao entre as sries ajustadas sazonalmente e
o resultado armazenada em uma tabela de nome correl.

scalar sum=1
table(3,4) correl
correl(2,1)="aditivo"
correl(3,1)="multiplicativo"
correl(1,2)="ctotal"
correl(1,3)="preco"
correl(1,4)="renda"
for %a qx y px pm qm
seas(a) {%a} {%a}asa {%a}asf
seas(m) {%a} {%a}msa {%a}msf
{%a}.x12(mode=a, filter=msr, save= "d10 d11 d12") {%a}a
{%a}.x12(mode=m, filter=msr, save= "d10 d11 d12") {%a}m
correl(2,sum+1)=@cor({%a}asa,{%a}a_sa)
correl(3,sum+1)=@cor({%a}msa,{%a}m_sa)
sum=sum+1
next

5.1.4 Mtodo Census X-13


Esse um dos mais novos mtodos de dessazonilizao disponvel e que foi desenvolvido pelo U.S.
Census. Sua aplicao deve ser feita apenas para dados mensais ou trimestrais sendo necessrio ter,
ao menos, trs anos completos de dados. Com a srie de dados ibcbr aberta clique em view/seasonal
adjustment/censos x-13.... A caixa de dilogo que aparece, como mostrado na Figura 5.11, permite
especificar aspectos da varivel, como alguma transformao que tenha sido feita do tipo log ou
logit, determinar o modelo ARIMA, escolher o mtodo de ajuste sazonal e os resultados a serem
mostrados.
A opo X-13 built in regressors permite inserir uma constante no modelo, sazonalidade
via dummy ou trigonometricamente, especificar os dias de negociao, determinar os feriados
ou escolher o tipo de outlier que pode ser usado no processo de estimativa. A seguir podemos
especificar, em User-defined regressors, se queremos usar alguma varivel exgena para melhorar
o modelo proposto. Na opo ARIMA podemos escolher o tipo de modelo, caso se tenha um
conhecimento prvio, selecionando a opo manual. Nesse caso, os parmetros so (p, d, q)(P,
D, Q) com as letras minsculas representando o componente ARIMA e as letras maisculas os
componentes sazonais. Por exemplo, a srie do PIB trimestral do IBGE para servio de informao
tem uma decomposio dos componentes do modelo ARIMA aditivo e dado da forma (0,1,1)(0,1,1).
J a srie da indstria de transformao tem um mtodo aditivo do tipo (2,1,0)(0,1,1) mas com trs
intervenes dummy: AO 1996.3 representa uma dummy aditiva no ms de maro de 1996; LS
2008.4 dada por uma dummy do tipo level-shift mudana no nvel no ms de abril de 2008;
TC 2009.1 uma dummy definida como constant-level-change, ou seja, uma mudana no nvel
em janeiro de 2009. Todas essas intervenes podem ser facilmente inseridas via X-13 built in
regressors, juntamente com ARIMA model e escolhendo manual e colocando (2,1,0)(0,1,1).
Logo abaixo da opo manual, est a opo X-11 Auto. Nessa o EViews R
ir estimar
todos os modelos que esto especificados na lista (voc pode inserir mais opes) e modificar as
opes de escolha. Uma opo interessante fazer a especificao with limits que ir estimar
5.1 Ajuste Sazonal 87

Figura 5.11: Opes do Mtodo X-13

todas as possveis combinaes de modelos com AR, MA e D especificadas. Veremos um exemplo


mais a frente. Por fim temos a opo TRAMO Auto que permite a escolha o modelo ARIMA
e diferenciao mximos. A seguir, temos as opes de estimao do modelo ARIMA, onde
escolhemos os critrios e o perodo a ser utilizado. Na opo ARIMA forecast, podemos usar o
melhor modelo encontrado para prever dados futuros com base em suas caractersticas encontradas.
Na opo Seasonal Adjustment podemos escolher o mtodo de ajuste sazonal entre x-11 ou
SEATS. Se escolher none, no ser feito nenhum ajuste sazonal na srie, sendo apenas escolhido
o melhor modelo ARIMA. A ltima escolha para Output, onde selecionamos os resultados a
serem mostrados. Note os cdigos das sries resultantes: D11 dados ajustados sazonalmente; D12
tendncia; D10 fator sazonal; D13 componente irregular. Vejamos como usar essas opes do
x-13 na srie do ibcbr. Abra a mesma e clique em Proc /Seasonal Adjustment /Census X-13 . . .
. Nas opes Variables vamos deixar como default, ou seja, os dados no possuem transformao
(transform option); no feita interveno no X-13 built in regressors; no usamos varivel
exgena e, por fim, no usamos Automatic outliers. Como primeiro passo vamos investigar qual
seria o melhor modelo ARIMA para descrever a sazonalidade de ibcbr. Na opo ARIMA
/Model . . . selecione TRAMO Auto tal como mostrado na Figura 5.12.
Aps clicar em OK ser produzido um relatrio de resultados. Sugiro fortemente olhar o
relatrio, pois ali ir constar as caractersticas do melhor modelo final selecionado, que da forma
(3,1,1)(0,1,1). Esse processo convergiu aps 64 iteraes, tendo sido investigadas 415 funes.
Os coeficientes estimados e os erros padro tambm so fornecidos, bem como alguns critrios
que so utilizados para comparar modelos, como AIC, BIC e HannanQuinn (veremos isso mais a
frente). Como no fizemos nenhuma seleo adicional, o EViews R
ir retornar a srie ibcbr_d11
que descreve os dados ajustados sazonalmente. Para ver os demais resultados das sries v em
output e escolha D_12, D_10 e D_13.
Uma opo interessante tentar identificar se existe outlier ou no no modelo ARIMA. Com a
srie ibcbr aberta selecione X-13 e na opo Automatic outliers clique em Temporary change
(TC). Mantenha todo o perodo amostral e o processo de seleo One at a time, como mostrado
na Figura 5.13a. A seguir, em ARIMA /Model . . . , clique em manual e especifique o modelo
(3,1,1)(0,1,1), tal como na Figura 5.13b. Por fim, em Output selecione todas as opes e clique
88 Captulo 5. Sries de tempo

Figura 5.12: Mtodos ARIMA em X-13

(a) Automatic outliers (b) ARIMA Model

Figura 5.13: Identificao de outliers

em OK. Na pgina de resultados so mostradas as estimativas para o outlier do tipo TC. Primeiro
veja o valor crtico, |t| 3, 91. A data com o resultado do t-valor mais alto dezembro/2008
com t = 3, 60. Note que esse resultado fica dentro do intervalo de confiana especificado
3, 91 t 3, 91 e, com isso, aceitamos a H0 de no existncia do outlier do tipo TC. Dado que
ele no significativo, as estimativas seguintes so testes sem a presena do outlier.

5.1.5 Alisamento Exponencial


Esse recurso muito til para fazer previses, especialmente para sries de dados de curta pe-
riodicidade, e com a vantagem de que seus coeficientes so atualizados a cada momento, no
permanecendo fixos ao longo do processo5 . H dois tipos de alisamento disponveis no EViews
R
,
o SES - Simple Exponential Smoothing e o ETS - Exponential Smoothing.
Vamos exemplificar seu uso com a srie de dados qx, que tem periodicidade trimestral. Com
a srie qx aberta, selecione Proc/Exponential Smoothing/ Simple Exponential Smoothing....
Como mostra a figura 5.14, o EViews R
permite que se escolha dentre 5 diferentes opes de
5 Porm, no processo de previso, os mesmos tornam-se fixos.
5.1 Ajuste Sazonal 89

Figura 5.14: Alisamento exponencial da srie qx

mtodo para se fazer o alisamento exponencial


Alm de selecionar o mtodo, o leitor tambm tem a opo de determinar os parmetros a
serem utilizados ou ento deixar a letra E para que o EViews
R
estime os mesmos. Valores prximos
a zero significam que informaes passadas so importantes para determinar o futuro. Ao passo
que, valores mais prximos de 1 representam um comportamento tipo random walk, onde apenas a
ltima informao til para prever o futuro. Recomenda-se deixar o EViews R
estimar o valor dos
parmetros. Na tabela 5.1 est uma descrio das equaes e aplicaes desses diferentes mtodos.

Tabela 5.1: Diferentes mtodos de alisamento exponencial

Mtodo Equao Aplicao


Simples yt = yt + (1 )yt1 Em sries sem constante, ten-
dncia ou sazonalidade.
Duplo yt = yt + (1 )yt1 Melhor para sries com ten-
D t = yt + (1 )D t1 dncia linear. Aplica o m-
todo simples duas vezes.
Holt-winters sem sazonali- yt+k = + tk til para sries com tendncia
dade linear e sem sazonalidade.
Holt-winters mult. yt+k = ( + tk)ct+k til para sries com tendncia
linear e sazonalidade multipli-
cativa.
Holt-winters adit. yt+k = + tk + ct+k til para sries com tendncia
linear e sazonalidade aditiva.

Nota: o termo o parmetro de alisamento, t a tendncia e c a sazonalidade.

Do lado direito da janela que ser aberta, o EViews R


sugere um nome para a srie alisada
qxsm. Logo abaixo tem o perodo de especificao da amostra. Se deixarmos como data final
2015Q4, o EViews R
ir fazer a previso a partir desse ponto. O problema com essa escolha que,
aps feita a previso, no h informao verdadeira para comparar com essa previso. Portanto, se
90 Captulo 5. Sries de tempo

o objetivo apenas prever, tudo bem, podemos usar como data a ltima observao. Por outro lado,
se o objetivo testar essa previso, o melhor seria determinar uma data anterior ao final, reservando
dados para comparao.
Por fim, tem a opo do Cycle for seasonal. Note que, para esse exemplo, temos o nmero
4, que representa a quantidade de trimestres no ano. Se os dados forem mensais, o EViews R
ir
retornar o nmero 12. Caso o leitor tenha dados sem periodicidade, ou ento dados dirios do
mercado financeiro, pode escolher um nmero diferente. Como exemplo, vamos estimar cada um
dos cinco mtodos para a srie qx. Para o primeiro mtodo, selecionamos a srie de resultado como
qxsm1. Para o segundo mtodo, qxsm2 e assim sucessivamente. Alm disso, vamos deixar quatro
trimestres de dados para comparar com as previses, digitando como data final em estimation
sample, 2014q4. Os resultados so mostrados na tabela 5.2.

Tabela 5.2: Resultados do alisamento exponencial para qx

Simples Duplo Holt- Holt- Holt-


winters winters winters
sem sazo- adit. mult.
nalidade
Parameters: Alpha 0.9990 0.4680 1.0000 1.0000 1.0000
Beta 0.0100 0.0000 0.0000
Gamma 0.0000 0.0000
Sum of 2963.3370 3060.6500 2413.8800 1353.1410 1339.7440
Squared
Residuals
Root Mean 6.4154 6.5199 5.7902 4.3352 4.3136
Squared Er-
ror
End of Mean 87.7719 87.8750 87.7700 87.4709 86.8356
Period
Levels:
Trend 0.9136 1.0562 0.6047 0.6047
Seasonals:
2014Q1 -4.2175 0.9429
2014Q2 0.8709 1.0105
2014Q3 3.0475 1.0358
2014Q4 0.2991 1.0108

Note que o coeficiente varia de um valor mnimo de 0,48 a um mximo de 1 sinalizando


que as informaes passadas so teis para prever o comportamento futuro. O valor zero para o
parmetro beta e gamma indicam que os mesmos foram constantes. Por exemplo, para o modelo
simples, temos: yt = 0.999yt + (1 0.999)yt1 Tambm so fornecidas duas estatsticas de previso
que podem ser utilizadas para comparar os diferentes modelos: SSR soma do quadrado dos
resduos 6 ; RMSE raiz do erro quadrado mdio7 . Comparando essas para os cinco modelos,
podemos ver que praticamente no h diferenas entre o Holt-Winters aditivo e o multiplicativo e
que, ambos, so os melhores modelos de previso. Os valores de mdia e de tendncia fornecidos
6 SSR = n (y y) 2
t=1
q
7 RMSE
n
t=1 2
(yy)
= n
5.1 Ajuste Sazonal 91

para o fim do perodo so usados para fazer a previso, bem como a estimativa da sazonalidade. A
figura 5.15 mostra o comportamento da estimativa (entre 1997Q1 e 2014Q4) e tambm da previso
para os quatro trimestres frente 2015Q1 a 2015Q4, usando esses cinco mtodos, juntamente com
o resultado de verdadeiro de qx.

(b) Valores previstos

(a) Previso dos dados

Figura 5.15: Alisamento exponencial da srie qx

Note que, pelo mtodo mais simples, que no considera a presena de tendncia e sazonalidade,
as previses so constantes, e refletem exatamente o valor da mdia (87,7719) obtido para o ltimo
perodo da estimativa (2014Q4). J o mtodo Duplo tem a influncia de uma tendncia de valor
1,0167. Nesse caso, o resultado para a primeira previso dado por:

duplo2015q1 = mdia + tendncia

duplo2015q1 = 87, 8750 + 0, 9136 = 88, 7886


No segundo momento, a previso passa a diferir apenas na magnitude da tendncia. Ou seja, usa-se
a estimativa da mdia do momento anterior e, com base nela, somada a tendncia. Assim, a
previso do prximo trimestre dada por:

duplo2015q2 = 88, 7886 + 0, 9136 = 89, 7022

Ou ento:
duplo2015q2 = 87, 8750 + 2 0, 9136 = 89, 7022
E assim sucessivamente para mais perodos a frente:

duplo2015q3 = 87, 8750 + 3 0, 9136 = 90, 6159

No modelo Holt-Winters sem sazonalidade, tambm h dois resultados para se fazer a previso, a
mdia e a tendncia. E basta fazer a previso para os trimestres a frente como fizemos no mtodo
duplo. Porm, os dois ltimos mtodos contemplam a presena da sazonalidade. Nesse caso,
as previses devem considerar essa influncia em seus respectivos trimestres. Por exemplo, no
Holt-Winters aditivo, a previso para 2014Q1 dada pela soma da mdia, da tendncia e tambm
da sazonalidade do primeiro trimestre:

HWaditivo2015q1 = mdia + tendncia + sazonalidade2014q1

HWaditivo2015q1 = 87, 4709 + 0, 6047 4, 2175 = 83, 8581


Na previso do segundo trimestre, multiplicamos a tendncia por 2 e aplicamos a sazonalidade de
2015q2;
HWaditivo2015q2 = mdia + 2 tendncia + sazonalidade2014q2
92 Captulo 5. Sries de tempo

HWaditivo2015q2 = 87, 4709 + 2 0, 6047 + 0, 8785 = 89, 5513


E assim sucessivamente, sempre aplicando um multiplicador para a tendncia e considerando o
fator sazonal do respectivo trimestre que est sendo feita a previso. Por exemplo, se quisermos
fazer essa previso para 6 trimestres frente, usamos:
HWaditivo2016q2 = 87, 4709 + 6 0, 6047 + 0, 8785 = 91, 9701
Por fim, temos o mtodo Holt-Winters multiplicativo. Nesse caso, a sazonalidade multiplicativa,
e fazemos a previso para 2015Q1 da seguinte forma;
HW multiplicativo2015q1 = (mdia + tendncia) sazonalidade2014q1
HW multiplicativo2015q1 = (86.8356 + 0.6047) 0.9429 = 82.4517
Para prever o segundo trimestre, multiplicamos a tendncia por 2 e consideramos a sazonalidade de
2015q2:
HW multiplicativo2015q1 = (mdia + 2*tendncia) sazonalidade2014q1
HW multiplicativo2015q1 = (86.8356 + 2 0.6047) 1.0105 = 88.9725

Programao 5.1.6 O mtodo de alisamento exponencial permite que sejam escolhidas cinco
diferentes alternativas (s,d,n,a,m), e que seguem respectivamente as opes de escolha entre
os modelos simple, duplo, Holt-winters no seasonal, Holt-winters seasonal aditivo e, por
ltimo o multiplicativo.
Para usar o mtodo multiplicativo em uma nica srie de dados, como por exemplo, qx,
deixando que os parmetros sejam estimados, usamos:

qx.smooth(m,e,e,e) qxsm1

Alternativamente, dando sequencia ao programa anterior, podemos determinar que o ali-


samento exponencial seja feito para uma sequencia de sries de dados. Nesse caso, apenas
acrescentamos ao nosso programa a opo abaixo:

for %a qx y px pm qm
seas(m) {%a} {%a}_sa {%a}_sf
{%a}.x12(mode=m, filter=msr, save= "d10 d11 d12") {%a}_x12
graph gra {%a}x12.line {%a}_x12_sf
{%a}.smooth(m,e,e,e) {%a}sm1
next

Alternativamente, para uma nica srie de dados, podemos ver como se comportam as
previses a partir dos cinco diferentes mtodos de alisamento exponencial. Nesse caso, usando a
srie qx de exemplo, o loop pode se modificar para:

for %a s d n a m
smooth({%a},e,e,e) qx qx{%a}
next

Ou ento, podemos pedir que os cinco mtodos sejam aplicados para cada uma das sries
de dados que temos. Nesse caso, podemos usar um comando for dentro de outro comando for:
5.2 ETS-ERROR-trend-seasonal 93

for %b qx y px pm qm
for %a s d n a m
smooth({%a},e,e,e) {%b} {%b}{%a}
next
next

Programao 5.1.7 Alternativamente, podemos fazer os cinco diferentes mtodos de alisa-


mento exponencial, para cada uma das sries de dados e, a seguir, armazena o resultado do
RMSE em uma tabela de nome alisa.
table(6,4) alisa
alisa(2,1)="single"
alisa(3,1)="doble"
alisa(4,1)="no seas"
alisa(5,1)="HW-no seas"
alisa(6,1)="HW-seas"
alisa(1,2)="ctotal"
alisa(1,3)="preco"
alisa(1,4)="renda"
scalar sum=1
scalar numero=1
for %b ctotal preco renda
for %a s d n a m
smooth({%a},e,e,e) {%b} {%b}alisa{%a}
alisa(sum+1,numero+1)=@rmse({%b},{%b}alisa{%a})
sum=sum+1
next
numero=numero+1
scalar sum=1
next

5.2 ETS-ERROR-trend-seasonal
Os modelos ETS so bem mais complexos e eficientes que a proposta anterior (ES) e se diferenciam
por incorporar o erro de previso do passo anterior para melhorar a estimativa no momento presente.
Aqui a ideia decompor a srie de dados em trs componentes T - tendncia; S - sazonalidade e I -
componente irregular, ou resduo. Tal como visto anteriormente nos mtodos de dessazonalizao,
aqui podemos ter modelos aditivos e multiplicativos, ou ento combinados totalizando 30 diferentes
tipos de modelos. Em resumo temos:
Modelo aditivo puro: y = T + S + I
Modelo multiplicativo puro: y = T S I
Modelo misto: y = (T S) + I

Modelo ANN
Vejamos como o modelo mais simples de todos, dado por A, N, N (erro aditivo, sem tendn-
cia, sem sazonalidade) aplicado ao IBC-Br. Para estim-lo, abrimos a srie ibcbr e vamos em
Proc /Exponential Smoothing /ETS Exponential Smoothing . . . , abrindo a caixa de dilogo
apresentada Figura 5.16a, a qual tambm j apresenta as configurao utilizadas para o modelo
mais simples. O resultado tal como mostrado na figura 5.16b. De forma geral, teremos que
94 Captulo 5. Sries de tempo

(a) Especificaes do ETS Smoothing

(b) Resultado do ETS Smoothing

Figura 5.16: ETS Smoothing Simples

yt = yt1 + t1 . Dito de outra forma, nossa previso corrigida pelo erro de previso do passo
anterior.
Ali temos a estimativa do parmetro x=0,624931 e o valor inicial de 97.65847. Logo abaixo
temos diversas estatsticas de comparao de modelos. Voc deve estar se perguntando: de onde
vem esse valor inicial?. E o alfa? Aqui comeamos a ter o primeiro contato com o processo de
maximizao em srie de tempo e iterao. Para comear o modelo precisamos de um valor inicial,
a semente, e um valor de x. O valor inicial para representar a previso do primeiro ms que,
no nosso exemplo, de y1=96,15. O valor de para encontrar a evoluo da nossa estimativa.
Suponha um valor inicial de y1 = 97, 6584. Com esse encontramos um erro de previso de:

y1 y1 = 1
96, 15 97, 65 = 1, 508

Considerando = 0, 6249, podemos fazer:

y2 = y1 + (1 )y1
y2 = (0, 62) 96, 15 + (0, 38) 97, 65 = 96, 71

Como podemos prever o momento y2 ? Precisaremos do valor de . Veja que, para prever o
passo atual, usamos a informao verdadeira em t 1 e a estimada ou ento, a previso em t + 1
pode ser encontrada aplicando y2 = y1 + 1 ou y2 = 97, 65 + 0, 62(1, 508). Agora podemos
encontrar o erro de previso no passo 2 (2 ) da mesma forma que antes,

2 = y2 y2
= 98, 67 96, 71
= 1, 954,

ou ento, usando o erro de previso anterior: y3 = y2 + 2 = 96, 71 + 0, 62(1, 95) = 97, 93.
5.2 ETS-ERROR-trend-seasonal 95

Figura 5.17: Previso simples no modelo ETS

Fazemos isso sucessivamente e encontraremos diversos erros de previso. Esses so utilizados


para encontrar as estatsticas SSR, RMSE e AMSE bem como o valor do log verossimilhana
(veremos isso mais a frente). Porm, o que garante que o valor inicial que usamos (97,65) e o
= 0, 624931 produzem o melhor modelo? Automaticamente, no processo de iterao so testadas
combinaes de diferentes valores iniciais com diferentes valores de, at que se encontre aquele
que gera o menor erro. Esse o produto final mostrado nas estimativas.
Agora vamos ver como fica a previso n passos a frente:

y2016M2 = y2016M1 + (1 )y2016M1


= (0, 62)127, 92 + (0, 38)135, 20
= 130, 6514.

Da em diante, como no h mais valor conhecido, a previso ser dada por:

y2016M3 = y2016M2 = 130, 6514.

E nosso grfico de previso tal como mostrado na Figura 5.17.


Modelo MAN
Esse modelo tambm conhecido como mtodo de holt com erros multiplicativos e uma tendncia
aditiva. Na caixa de dilogo do ETS Smoothing selecionamos Multiplicative em Erros / Innovation
type, Additive em Trand Type e deixamos None em Seasonal Type, conforme a Figura 5.18a. A
Figura 5.18b apresenta os resultados desse modelo.
Note que agora temos um parmetro adicional, e valor inicial para a tendncia em 0,312577.
Todas as demais estatsticas de comparao so como antes. Com a incorporao da tendncia a
previso no momento t fica da forma:

yt = (yt1 + Tt1 ) + t1
Quando a taxa de crescimento do componente tendncia for zero, ou seja, = 0. O valor inicial
estimado para a tendncia T = 0, 312577 e o valor do nvel inicial 97, 44160. Sendo assim,
nosso valor inicial dado por:

y1 = N1 + T1
= 97, 4416 + 0, 312577 = 97, 7541

Como temos uma tendncia, essa deve ser incorporada na previso dos passos seguintes e,
tambm devemos usar o erro de previso do passo anterior para melhorar o modelo no passo
96 Captulo 5. Sries de tempo

(a) Especificaes do ETS Smoothing MAN


(b) Resultado do ETS Smoothing MAN

Figura 5.18: ETS Smoothing MAN

Figura 5.19: Grfico da previso conforme a especificao MAN

seguinte. Sendo assim, nossa previso para o passo dois dada por:

y2 = (y1 + T1 ) + 1
= (97, 75 + 0, 3125) + 0, 54(1, 604)
= 97, 2003

Com essa estimativa, encontramos o erro de previso no passo dois,

2 = y2 y2
= 98, 67 97, 20
= 1, 47,

que ser til para corrigir a previso no passo trs. Fazemos isso at a ltima observao. A partir
de ento, a previso passa a evoluir de acordo com a tendncia, como mostra a Figura 5.19.
5.2 ETS-ERROR-trend-seasonal 97

(a) Especificao do ETS Smoothing MAM

(b) Resultado do ETS Smoothing MAM

Figura 5.20: ETS Smoothing MAM

Modelo MAM
Esse o descrito pela presena de erro multiplicativo, tendncia aditiva e sazonalidade multiplicativa.
Com a srie ibcbr aberta selecione ETS e depois as opes como mostrado na Figura 5.20a. Note
que agora abre a opo de especificao cclica. Como estamos com dados mensais, temos um
valor cycle=12.
Os resultados agora possuem estimativa de 3 parmetros (, , ). O primeiro para atualizao
do erro de previso, o para a tendncia e o para a sazonalidade. Logo abaixo esto os valores
iniciais para o nvel, a tendncia e os 12 estados, cada qual representando um ms; ver Figura 5.20b.
O valor inicial estimado corresponder soma de valor do nvel, da tendncia e, como temos
uma sazonalidade multiplicativa, essa soma multiplicada pelo respectivo estado que corresponde
ao ms anterior:
y1 = (N1 + T1 ) St1
= (101, 0184 + 0, 3372) 0, 9503
= 96, 322.
Como o primeiro ms janeiro, usamos estado dezembro = 0,950338. Lembre-se que esses valores
de estado correspondem aos fatores sazonais vistos anteriormente. Com base em y1 podemos
determinar o erro de previso no primeiro passo usando:
1 = y1 y1
= 96, 15 96, 32 = 0, 172
98 Captulo 5. Sries de tempo

A seguir, para prever o passo seguinte usamos o erro de previso do passo anterior, o valor de
e, como = 0, 021679, temos que considerar a taxa de crescimento da tendncia. O grfico de
previso pode ser visto na Figura 5.21.

Figura 5.21: Grfico da previso conforme a especificao MAM

5.3 Ciclo
Outra caracterstica observada nas sries de tempo o componente cclico, (Ct ). Entender como
o comportamento cclico de uma srie de tempo tem sido objeto de estudo com aplicaes
principalmente na macroeconomia. H diversas tcnicas paramtricas e no paramtricas que foram
desenvolvidas para esse fim. A seguir so apresentados os diferentes filtros disponveis no EViews
R

para a estimar a tendncia de longo prazo e ciclo.

5.3.1 Filtro Hodrick-Prescott


Esse mais conhecido como filtro HP, em referncia a seus autores, ver Hodrick e Prescott (1997)
e usado para estimar o componente de tendncia de longo prazo de uma srie de tempo. Sua
estimativa considera a escolha de um parmetro que ir determinar o grau de aderncia dessa
tendncia srie de tempo. Quanto maior for, mais linear torna-se a tendncia de longo prazo
estimada.
Essa tcnica de extrao do componente cclico do grupo das que so aplicadas no domnio
do tempo. Com a srie qx aberta, selecione Proc/Hodrick-Prescott Filter. O filtro produz duas
estimativas, uma para a srie filtrada, ou seja, a estimativa de tendncia de longo prazo e uma outra
para o ciclo, que a diferena entre a srie original e filtrada. Escolha um nome para cada uma
das opes. No nosso exemplo escolhemos qxhp e qxciclo. A seguir esto as opes de escolha
para o parmetro de alisamento. Como default, feita a sugesto com base em Hodrick e Prescott
(1997), que leva em conta a periodicidade dos dados. Como temos dados trimestrais, sugere-se
usar 1600. Outra alternativa determinar o valor de com base em Ravn e Uhlig (2002) escolhendo
a potncia. Ao escolher a opo de 1600, duas sries de dados sero salvas no workfile: qxhp e
qxciclo. simples o leitor confirmar como que se obtm a srie de ciclo, basta fazer:

qxciclo = qx qxhp

Ou seja, o ciclo representa a diferena da srie original em relao a sua tendncia de longo
prazo e o resultado de qxciclo muitas vezes visto como gap. Valores acima de zero significam
que estamos acima da tendncia de longo prazo. No caso de usar o PIB, esse seria um exemplo
de produo acima do potencial, uma informao til para avaliao de conjuntura e que o leitor
interessado pode ver em relatrios de bancos, corretoras e tambm do Banco Central. Por outro
lado, valores abaixo de zero so indicaes de que estamos abaixo da tendncia de longo prazo.
5.3 Ciclo 99

Na figura 5.22 estimamos trs tendncias de longo prazo para diferentes valores de : (i) = 0
nome qxhp1; (ii) = 1600 nome qxhp; (iii) = 100000 nome qxhp2. Como pode ser visto, para
um valor de = 0, a tendncia de longo prazo igual srie em questo (linha azul). No valor
sugerido de de = 1600 , a tendncia de longo prazo oscila um pouco (linha verde). Por fim, para
um valor muito alto, = 100000 , a tendncia de longo prazo se aproxima de uma reta.

Figura 5.22: Filtro HP aplicado a qx

Um ponto interessante que o leitor poder notar que, ao se escolher como parmetro de
alisamento a alternativa de Ravn e Uhlig(2002) mas, deixando o valor 2 em power, os resultados
sero idnticos ao aplicado o parmetro = 1600 sugerido por Hodrick e Prescott(1997).

Programao 5.3.1 O mtodo de Hodrick-Prescott tambm pode ser aplicado a partir de uma
programao. Nesse caso, usamos:
qx.hpf(lambda=1600) qx_hp @qx_ciclo

Entre parnteses colocado o lambda e o valor que se pretende para o parmetro. Nesse
exemplo, escolhemos 1600. A seguir esto os nomes das duas sries que sero geradas, a primeira
o componente de tendncia de longo prazo e, a segunda, o componente cclico. Note que,
nessa funo, exigido que se tenha @ antes do nome da segunda srie de dados. Seguindo a
mesma linha de raciocnio, podemos juntar, em uma nica funo, a dessazonalizao dos dados,
o alisamento exponencial e a aplicao do filtro HP a partir de:
for %a qx y px pm qm
seas(m) {%a} {%a}_sa {%a}_sf
{%a}.x12(mode=m, filter=msr, save= "d10 d11 d12") {%a}_x12
{%a}.smooth(m,e,e,e) {%a}sm1
{%a}.hpf(lambda=1600) {%a}_hp @{%a}_ciclo
next

Programao 5.3.2 A OECD(2008), em suas anlises de ciclo e construo de indicadores an-


tecedentes e coincidentes sugere a utilizao de dupla filtragem pelo mtodo de Hodrick-Prescott
para extrao do ciclo de crescimento. Primeiramente feita uma filtragem ajustando um
de alto valor para extrair a tendncia de longo prazo. Para ento, com um menor extrair os
movimentos de alta frequncia e alizar o ciclo. Desta forma a OECD extrai o componente cclico
dentro de uma banda de frequncia de 12 a 120 meses que corresponde respectivamente ao
100 Captulo 5. Sries de tempo

2 = 13.93 e 1 = 133107.94.

scalar lambda1= 133107.94


scalar lambda2= 13.93
for %a qx
{%a}.hpf(lambda={lambda1}) {%a}_hptrend1 @{%a}_hpciclo1
{%a}_hpciclo1.hpf(lambda={lambda2}) {%a}_hptrend2 @{%a}_hpciclo2
genr {%a}_chp = ({%a}_hptrend2-@mean({%a}_hptrend2))/
@stdev({%a}_hptrend2) + 100
next

Note que, em primeiro lugar, definimos o valor dos 1 e 2 dentro das variveis de nome
lambda1 e lambda2 pelo comando scalar. Isso facilita visualmente na hora de reescrever a
programao para testar diferentes lambdas. Em seguida, declaramos um loop onde indicamos
que %a tomar os valores de qx.Ento, utilizando duas vezes o comando .hpf aplicamos o filtro
HP, com os lambdas definidos anteriormente. Alm de rodarmos a dupla filtragem, padronizamos
o ciclo e adicionamos mdia 100, conforme sugerido OECD(2008). A programao pode incluir
diversas sries e testes, abaixo trazemos um exemplo da dessazonalizao pelo mtodo X-12
multiplicativo seguido da extrao do ciclo de crescimento sugerido em OECD(2008).

scalar lambda1= 133107.94


scalar lambda2= 13.93
for %a qx y px pm qm
{%a}.x12(mode=m, filter=msr, save= "d10 d11 d12") {%a}_sa
{%a}_sa.hpf(lambda={lambda1}) {%a}_hptrend1 @{%a}_hpciclo1
{%a}_hpciclo1.hpf(lambda={lambda2}) {%a}_hptrend2 @{%a}_hpciclo2
genr {%a}_chp = ({%a}_hptrend2-@mean({%a}_hptrend2))/
@stdev({%a}_hptrend2) + 100
next

A dupla filtragem aproxima o filtro HP aos Band-Pass filters mostrados a seguir.

5.3.2 Filtros de Frequncia


Tambm conhecidos como Band-Pass filter, um filtro linear que extrai o componente cclico
de uma srie de tempo a partir de um intervalo de durao do mesmo. Aqui, a anlise feita
no domnio da frequncia, e a srie de tempo representada a partir de uma soma ponderada de
oscilaes seno e cosseno. Sendo assim, a questo como encontrar essa matriz de pesos que ser
aplicada srie de dados.
H vrios mtodos de aplicao do filtro. O que ir diferenci-los a forma de clculo
das mdias mveis. So trs alternativas. As duas primeiras consideram um filtro simtrico
e so diferentes apenas na forma como a funo objetivo estima os pesos das mdias mveis.
Ao selecionar um desses dois mtodos, e escolher os Lead/lags refere-se ao comprimento da
frequncia do ciclo, importante ter em mente que so perdidos os dados do incio e fim da srie
para que seja feita a estimativa. Destaca-se que o comprimento da frequncia do ciclo fica constante
durante toda a srie de dados, por isso que esse um filtro de comprimento fixo.
O terceiro filtro, de nome Christiano-Fitzgerald, assimtrico com as ponderaes sendo
diferentes no tempo e se comportando de acordo com os dados. O fato de ser um filtro que
variante no tempo, o torna mais completo para se determinar os ciclos de uma srie. Nesse caso,
5.3 Ciclo 101

no necessrio especificar o comprimento da frequncia do ciclo.


Com a srie qx aberta, v em Proc/Frequency Filter..., e aparecer uma tela para selecionar
as opes do filtro. Escolha o primeiro deles (Baxter-king). A seguir, do lado direito, a opo
Lead/lags refere-se ao comprimento da frequncia com que ocorre o ciclo. Vamos deixar o valor
12. Isso ir resultar na perda de informao do ciclo, 12 trimestres antes e 12 trimestres depois,
reduzindo a estimativa para apenas 36 trimestres.
A parte do Cycle periods, se refere durao do ciclo. Como default o EViews R
retorna o valor
Low=6 e High=32. Ou seja, o ciclo de menor durao tem 6 trimestres e, o de maior durao, 32
trimestres. Depois, escolha os nomes para os resultados como mostrado na Figura 5.23. Do lado
esquerdo est a escala para a srie qx e qxbp, esse sendo o componente de longo prazo.

Figura 5.23: Filtro Baxter-King aplicado a qx

Como procedimento na estimativa vemos que, primeiro, encontrada a matriz de pesos bppeso.
Como escolhemos Lead/lags igual a 12, a matriz ter 13 colunas (ser sempre uma a mais que o
nmero de Lead/lags). Destaca-se que essa matriz posteriormente utilizada para gerar a srie
qxbpciclo a partir de:
q+1 q+1
qxbpciclot = w(1, c)yt+1c + w(1, c)yt+c1
c=1 c=2

Com t=q+1,q+2,...,n-q onde w(1,c) a matriz linha de pesos, aqui denominada de


bppeso,c cada uma das colunas dessa matriz,q o nmero de Lead/lags (no nosso exemplo
12), e n o nmero de dados, no nosso exemplo, 74 observaes. Assim, o intervalo de qxbpciclo
ser dado por t = 13, 14..., 62. Portanto, o primeiro resultado, com t = 13, encontrado usando:
13 13
qxbpciclo13 = w(1, c)y14c + w(1, c)y12+c .
c=1 c=2

Note que, tal como anteriormente:

qxbpciclot = qxt qxbpt .

Uma ltima informao fornecida diz respeito resposta que a srie filtrada qxbp, responde srie
qx, em uma dada  frequncia,
 ver figura 5.24. A linha vermelha mostra a resposta ideal que deve
1 1
estar no intervalo PU , PL , onde PU o maior perodo e PL o menor. No nosso exemplo, PU = 32
e PL = 6, e o intervalo timo entre (0,031;0,167).
102 Captulo 5. Sries de tempo

Figura 5.24: Funo resposta de frequncia Baxter-King

Programao 5.3.3 Podemos fazer a estimativa do filtro Baxter-King via programao. Nesse
caso, a funo utilizada dada por:

qx.bpf(type=bk, low=6, high=32, lag=12,noncyc=qxbpfciclo,w=wqxbp) qxbpf

Dentre as vrias opes que podem ser especificadas, o termo type=bk refere-se ao filtro
Baxter-King. Se quiser escolher o filtro Christiano-Fitzgerald fixo, coloque type=cffix e, para
o filtro assimtrico use type=cfasym. A seguir est o perodo mnimo do ciclo e o mximo.
Depois, a srie de dados ajustada pelo ciclo. Por fim, podemos selecionar os resultados a serem
mostrados. Ainda no conjunto de opes, podemos escolher o nome da srie ajustada pelo
ciclo a partir de noncyc=qxbpfciclo. Podemos especificar a matriz de pesos do ciclo usando
weight=wqxbp. A seguir, colocamos o nome da srie do ciclo, qxbpf. Se o nome da srie
do ciclo (qxbpf) for omitido, o EViews R
ir criar uma srie de nome BPFILTER01. Assim,
possvel agregar essa estimativa s anteriores, a partir de:

for %a qx y px pm qm
seas(m) {%a} {%a}_sa {%a}_sf
{%a}.x12(mode=m, filter=msr, save= "d10 d11 d12") {%a}_x12
{%a}.smooth(m,e,e,e) {%a}sm1
{%a}.hpf(lambda=1600) {%a}_hp @{%a}_ciclo
{%a}.bpf(type=bk,low=6,high=32,noncyc={%a}bpfciclo,w=w{%a}bp) {%a}bpf
next
O segundo filtro simtrico que pode ser utilizado o CF. Ao fazer essa escolha, ser habilitada
a opo de estacionriedade dos dados, alm do mtodo de diferenciao da srie8 . Ao selecionar
a opo I(0), h trs alternativas para se proceder diferenciao dos dados. Por outro lado, ao
8 Para maiores esclarecimentos sobre o grau de integrao de uma srie de dados, o leitor deve consultar a seo sobre

Raiz Unitria.
5.3 Ciclo 103

escolher que o processo um random walk, h uma opo adicional. Assuma por hora que a
srie qx um processo I(0) e que vamos usar o mtodo Remove linear trend. Mantenha todas as
demais opes como anteriormente, ou seja, Lead/lags igual a 12, a mesma periodicidade para o
ciclo e d nomes para as variveis, como mostra a figura 5.25a. A forma de clculo de qxcfciclo
a mesma de antes, usando a matriz de pesos.

(a) Opes filtro CF simtrico (b) Ciclo comparado pelos dois mtodos

Figura 5.25: Filtro CF simtrico aplicado a qx

No geral, os resultados so muito parecidos. A matriz de pesos em pouco difere (no foi aqui
mostrada, mas o leitor pode comparar bppeso com cfpeso) e, como mostrado na figura 5.25b, o
componente cclico, resultante da srie filtrada, tambm similar.
O ganho maior no Band-Pass filter est em usar o mtodo assimtrico. Nesse caso, no
perdemos informaes com o uso de lead/lags. Alis, como pode ser visto, a opo do terceiro filtro
no habilita a escolha do nmero de lead/lags. Escolha a opo Full sample asymmetric, mantenha
a periodicidade cclica de 6 e 32, I(0) e use o mtodo remove linear trend. Escolha nomes
diferentes para os resultados para no coincidir com as estimativas anteriores. Tal procedimento
mostrado na figura 5.26.
A determinao da periodicidade cclica pode variar de acordo com a percepo sobre a durao
do ciclo. O menor valor a ser especificado em Low 2, o que ir produzir uma estimativa de
ciclo bem errtica. Obviamente, a durao mxima em High tem que ter um valor maior que o
especificado em Low. Outra opo que precisa ser avaliada em Stationarity Assumption se a
srie em questo que estamos extraindo o ciclo estacionria I(0) ou ento possui raiz unitria I(1)
e, por fim, tem-se que especificar o mtodo para eliminar essa no estacionariedade.

Figura 5.26: Filtro CF assimtrico aplicado a qx


104 Captulo 5. Sries de tempo

Note que o ciclo agora estimado para todo o conjunto de dados. Alm disso, o leitor poder
ver que, ao analisar a matriz de pesos, a mesma de dimenso 74x74, refletindo o fato de que os
pesos variam no tempo. Para encontrar o resultado do primeiro trimestre, usa-se o primeiro vetor
linha, multiplicado pelo vetor coluna de qx. Isso ir produzir como resultado, a primeira informao
do ciclo, no nosso exemplo, a srie qxcfciclo2. Na linha 1, as primeiras 13 informaes de pesos
so idnticas s encontradas pelo mtodo CF simtrico. Na figura 5.27, comparamos os resultados
da estimativa pelo filtro HP com a obtida pelo mtodo CF assimtrico. Note que esse tem uma
estimativa de ciclo mais suavizada.

Figura 5.27: Ciclos de qx comparados

Programao 5.3.4 Podemos fazer a estimativa do filtro Christiano-Fitzgerald assimtrico


usando diversas combinaes entre ciclo mnimo e mximo. Nesse caso especificamos primeiro
um escalar de valor 4, a durao mnima do ciclo. A seguir usamos type=cfasym e, em low
denominamos esse escalar fixando o mximo em 60. Depois, especificamos que a srie seja
diferenciada para eliminar a tendncia especificando uma ordem de integrao iorder=1.
A seguir especificamos a srie ajustada pelo ciclo a partir de noncyc=qxbpfciclo. Podemos
especificar a matriz de pesos do ciclo usando weight=wqxbp. A seguir, colocamos o nome da
srie filtrada, qxbpf. Se o nome da srie do ciclo (qxbpf) for omitido, o EViews
R
ir criar uma
srie de nome BPFILTER01.

scalar num=4
for %a qx y px pm qm
{%a}.bpf(type=cfasym,low=num,high=60,detrend=t,iorder=1,nogain,
noncycle={%a}cf) {%a}bpf
num=num+1
next

5.3.3 O Filtro Corbae-Ouliaris


As tcnicas de extrao do componente cclico so divididas, de forma geral, em dois grupos, ou
no domnio do tempo ou da frequncia. Esse particularmente importante na anlise de sries
econmicas devido a no-estacionariedade, ver Corbae e Ouliaris (2006). Aps feita a instalao
do add-in fdfilter no EViews podemos usar esse filtro (veja o captulo que fala sobre add-in). Abra a
srie mensal do ibcbr em proc/add-ins selecione corbae_ouliaris FDfilter. A Figura 5.28a mostra
5.4 Autocorrelao (Correlograma) 105

a caixa de dilogo onde devemos preencher com os valores.

(b) Estimativa do ciclo com o filtro Corbae-Ouliaris


(a) Caixa de dilogo do add-in

Figura 5.28: Filtro Corbae-Ouliaris

Programao 5.3.5 Uma vez que o add-in FDfilter esteja instalado no EViews
R
possvel
aplicar o filtro a partir do menu ou ento a partir de um comando da sub-rotina. Para o exemplo
do IBCBR teremos:
call ideal bandpass (ibcbr, 0.0625, 0.033, ibcbr_cicle, data inicial,
data final)
Caso tenha vrias sries de dados podemos usar um loop para aplicar o filtro a todas elas:
For %a a1 a2 a3
%name = ciclo + %a
call ideal bandpass (%a, 0.062, 0.333, %name, 2003MOI, 2016MI)
next
Como primeira opo colocamos a extenso do nome da srie do ciclo que ser calculada.
Nesse exemplo usamos _FD. As duas opes seguintes se referem aos valores dos perodos iniciais
e finais ou, frao de , que ser usado na determinao da frequncia do ciclo. Como default
usamos 0.0625 e 0.3333. Por fim especifique o perodo de anlise dos dados. Como queremos uma
estimativa para todo o perodo escrevemos @all. A Figura 5.28b mostra a estimativa do ciclo do
IBCBr.

5.4 Autocorrelao (Correlograma)


O conceito de autocorrelao ser bem til quando analisarmos os modelos ARIMA, mas j
podemos comear a compreender algumas caractersticas e implicaes da autocorrelao. Como o
prprio nome diz, a autocorrelao descreve a relao de correlao que uma varivel aleatria,
o PIB por exemplo, tem com ela mesma no passado. Em sries de tempo de economia muito
comum vermos a presena de autocorrelao, bem como em sries financeiras. Imagine a taxa de
cmbio hoje. Seu resultado ser altamente correlacionado com o valor da taxa de cmbio ontem.
Quanto maior for essa relao, maior ser a medida de autocorrelao. H formas de ver a presena
ou no de autocorrelao em uma srie de dados, sendo a mais comum fazer o correlograma.
Com uma srie de tempo aberta, qx por exemplo, selecione View/Correlogram.... A janela
de opes, conforme figura 5.29a, possibilita analisarmos a srie em nvel e primeira ou segunda
diferena como adicionar o nmero de defasagens. Um correlograma em nvel avalia a srie original.
Quando selecionamos 1st difference, aplicamos o conceito de autocorrelao para a srie de dados
106 Captulo 5. Sries de tempo

qx, ou seja, na primeira diferena da varivel em questo. A opo dos lags a incluir apenas para
o teste e a visualizao grfica. O programa nos retorna dois grficos de barras (correlogramas) e
quatro estatsticas vinculadas: autocorrelao (AC), autocorrelao parcial (PAC), estatstica Q e a
probabilidade, conforme figura 5.29b.

(a) Opes

(b) Correlograma de qx

Figura 5.29: Correlograma

A funo de autocorrelao (AC) mensura a correlao de uma varivel e suas defasagens. Seu
clculo obtido atravs da diviso da covarincia com a defasagem k pela varincia da amostra.
Ligeiramente diferente da definio terica o EViews
R
estima autocorrelao pela seguinte frmula:
n
t=k+1 (xt x)(x
tk x)

tk = n 2
,
t=1 (xt x)

tal que, quando k = 1, estamos medindo a autocorrelao de ordem um e assim sucessivamente.
J a autocorrelao parcial (PAC) calcula a autocorrelao da defasagem k descontando o poder
preditivo das defasagens anteriores, t1 ,t2 , ...tk1 . Os resultados de AC e PAC so apresentados
de forma grfica nos dois correlogramas, onde a linha vertical continua indica o zero e as duas

linhas pontilhadas aproximadamente dois desvios padro, computados por 2/( n). Ou seja,
para que o coeficiente, tk , seja significativamente diferente de zero, ao nvel de significncia de
aproximadamente 5%, este no pode estar entre as linhas pontilhadas.
No exemplo apresentado na figura 5.29b, qx tem 74 observaes ento 2/( 74) = 0.2325.
Logo, para que o coeficiente seja significativo e estatisticamente diferente de zero, no pode
pertencer ao intervalo de confiana de 95%:

Prob(tk 0.2325 tk tk + 0.2325) = 0.95

Alm de calcularmos a significncia estatstica para determinada defasagem individualmente,


podemos utilizar estatstica Q de Ljung-Box (Q-Stat) para uma hiptese conjunta. Esse teste
estatstico avalia a autocorrelao na defasagem k sob a hiptese nula de que todos coeficientes,
t1 ,t2 , ...tk , so simultaneamente iguais a zero. A frmula da estatstica Q dada por:

k 2j
QLB = T (T + 2) .
j=1 T j
5.4 Autocorrelao (Correlograma) 107

Assim, supondo a avaliao da autocorrelao at k=1, teremos:


1
0, 9362
QLB = 74(76)
j=1 74 1
= 67, 54.

Alm disso, a estatstica Q e seu p-valor, apresentados nas ltimas duas colunas do correlograma,
so comumente utilizados para testar se a srie rudo branco. Cabe destacar nesse caso que,
considerando uma srie qualquer yt = t , tal que o choque t no serialmente correlacionado, esse
processo, com mdia zero e varincia constante, ser denominado rudo branco. Adicionalmente,
se t e, consequentemente, yt , forem serialmente independentes, podemos dizer que y rudo
branco independente escrevendo yt iid(0, 2 ), ou seja, y independentemente e identicamente
distribudo com mdia zero e varincia constante.
O correlograma tambm nos permite algumas consideraes sobre modelagem das sries
de tempo. Se a autocorrelao apresentar coeficientes significativos que diminuem lentamente
de forma geomtrica e a autocorrelao parcial for para zero depois da defasagem p, podemos
evidenciar que a srie obedece um processo autorregressivo puro de ordem p, AR(p). Como o
correlograma na figura 5.29b, que nos sugeri que a srie qx segue um processo autorregressivo de
primeira ordem AR(1).
Enquanto processos puros de mdias moveis (MA) apresentam autocorrelao prxima a zero
depois de algumas defasagens, junto de autocorrelao parcial persistente caindo gradualmente
para zero, conforme figura 5.30a. Da mesma forma, um correlograma que apresente um padro
sazonal de movimentos recorrentes como ondas sugeri a presena de sazonalidade, figura 5.30b.
Vale ressaltar, o padro de sries no-estacionrias mostram coeficientes de autocorrelao altos e
persistentes em diversas defasagens, como qx na figura 5.29b.

(a) MA(4) (b) AR(4) com sazonalidade

Figura 5.30: Correlograma

Programao 5.4.1 A programao para acessarmos o correlograma dada pelo comando


.correl(k),onde k a quantidade de defasagens a serem testadas. Abaixo executamos o correlo-
grama na varivel qx com 21 defasagens.
qx.correl(21)
Tambm podemos criar para diversas sries de tempo um loop que salve as informaes estatsti-
108 Captulo 5. Sries de tempo

cas do correlograma em uma tabela de resumo.

scalar k = 25
table corres
!j=0
for %a qx y px
for !i = 1 to k
freeze(mode = overwrite, temp) {%a}.correl(k)
corres(1,1+!j) = %a
corres(2,1+!j) = "k"
corres(2,2+!j) =temp(5,4)
corres(2,3+!j) =temp(5,5)
corres(2,4+!j) =temp(5,6)
corres(2,5+!j) =temp(5,7)
corres(2+!i,1+!j) =temp(6+!i,3)
corres(2+!i,2+!j) =temp(6+!i,4)
corres(2+!i,3+!j) =temp(6+!i,5)
corres(2+!i,4+!j) =temp(6+!i,6)
corres(2+!i,5+!j) =temp(6+!i,7)
next
!j = !j+5
next
Note que inicialmente criamos o escalar k, que recebe o nmero de defasagens, a tabela
resumo corres, que receber as estatsticas calculadas, e a varivel de contagem !j, que organizar
as colunas em corres quando houver mais de uma srie de tempo. Ento, aplicado o comando
.correl em qx,y epx e guardamos as informao dentro da tabela temporria, temp, usando o
comando freeze. Para preenchermos corres com os dados contidos em temp.

5.5 Anlise Espectral


A anlise espectral tem muita aplicao na fsica, qumica e demais cincias. Na economia, sua
importncia est, principalmente, na explicao das informaes de frequncia que podemos extrair
e que acaba por revelar caractersticas cclicas. Toda srie de tempo pode ser expressa a partir da
soma de senos e cossenos que oscilam de acordo com uma determinada frequncia. O desafio
poder identificar essas frequncias, e isso pode ser feito via estimativa do periodograma. Esse
conhecido como densidade espectral e relaciona as variabilidades do conjunto de dados com as
frequncias, ao passo que, na anlise de srie de tempo, as variabilidades so relacionadas com o
domnio do tempo. Um dos pontos importantes utilizar sries de dados que sejam estacionrias.
Sendo assim, podemos afirmar que a densidade espectral uma representao das caractersticas
da srie de tempo, mas no domnio da frequncia. O canal para se fazer essa relao, entre uma
srie de tempo expressa no domnio do tempo com uma que expressa no domnio da frequncia
a transformada de Fourier. Na literatura da rea so disponveis diversos mtodos paramtricos e
no-paramtricos para estimar a densidade espectral de um conjunto de dados.
Diversos pontos emergem a partir dessa relao e esto relacionados, principalmente, a varincia
dos dados. Primeiro, podemos citar que a integral da densidade espectral igual a varincia da
srie de dados. Na verdade, o espectro de uma srie de tempo pode ser visto como a distribuio de
varincia dessa srie como uma funo da frequncia. Em segundo lugar, que h uma relao entre
o espectro, que contm informaes do conjunto de dados no domnio da frequncia, com a funo
de autocovarincia, que contm informaes no domnio do tempo.
5.5 Anlise Espectral 109

Figura 5.31: Opes da Anlise Espectral

Uma vez identificada a densidade espectral podemos avaliar os picos de frequncia e os perodos
associados a ele. Suponha uma srie de dados mensal e que na anlise espectral tenha-se encontrado,
por exemplo, um pico na frequncia "a". Nesse caso, o perodo associado a esse ciclo, medido em
meses, dado por 1/a. normal termos mais de um pico na densidade espectral e veja que quanto
maior for o valor de a, menor ser o perodo, em tempo, associado a essa frequncia.
O Eviews faz anlise espectral, mas necessrio instalar o add-in Spectral Analysis. Vejamos
como a aplicao desse mtodo a srie mensal IBCBR do Banco Central do Brasil sem ajuste
sazonal. Lembre-se que essa anlise deve ser feita com a srie estacionria. Como a nossa srie
possui tendncia, primeiro temos que eliminar essa tendncia, o que feito a partir de uma regresso
simples tendo como varivel independente o tempo e uma constante. A seguir, analisamos os
resduos dessa equao.
Com a srie residuo aberta v em Proc/Add-ins/Spectral Analysis. A janela que ser aberta
como mostrado na figura 5.31. Note que h vrias opes de escolha para o processo de alisamento
do periodograma. Vamos usar como default o ponto 20 como de truncagem e, por enquanto, no
vamos selecionar as demais opes, apenas deixe output table.
Aps clicar em ok perguntado se queremos gerar o ciclo timo. Clique, novamente, em
ok. A seguir aberta uma janela que pergunta o p-valor e o nmero de ciclos. Digite 0.05.
Deixe selecionada a opo weighted cycle e selecione individual-cycles. Clique em ok. Diversos
resultados so reportados, mas vamos olhar primeiro para o grfico do periodograma, como
mostrado na figura 5.32. Note que o mesmo no foi alisado e apresenta diversos picos. Cada um
desses picos, na respectiva frequncia, possui um ciclo no tempo.
Mas, tal como colocado no grfico no seria possvel identificar essas frequncias. Felizmente
esses resultados so salvos em uma tabela no workfile de nome "data". Abra e poder ver que
o mesmo possui quatro colunas, como mostrado na figura 5.33. A segunda coluna corresponde
ao eixo horizontal do grfico do periodograma e traz a relao ciclo/tempo. A ltima coluna,
de nome periodogram, corresponde ao eixo vertical do grfico, e permite identificar os picos da
nossa densidade espectral. Veja por exemplo que a primeira frequncia, de valor 0,006369 tem
o maior pico encontrado, de valor 4,65. A terceira coluna nos mostra a relao tempo/ciclo, ou
seja, o perodo de ocorrncia do ciclo, dado por 1/frequncia. Sendo assim, para a frequncia
0,006369 temos um perodo cclico de 157 meses. Note que h um pico no periodograma de valor
2,89 associado com a frequncia 0,025478 e que gera um perodo de 39 meses. H outro pico
na frequncia 0,082803 e que gera um perodo cclico de 12 meses, revelando a existncia de
sazonalidade no nosso banco de dados.
110 Captulo 5. Sries de tempo

Figura 5.32: Periodograma da srie residuo

Figura 5.33: Data

Alternativamente ao uso do periodograma para encontrar a densidade espectral, podemos usar


os demais filtros. O grfico 5.34a mostra a estimativa da densidade espectral usando o mtodo de
Hamming. Note que o resultado mais suave que o apontado pelo periodograma e sinaliza para a
presena dos mesmos picos identificados anteriormente. No grfico 5.34b esto todas as estimativas
de densidade. Para fazer esse grfico primeiro faa a estimativa considerando cada um dos mtodos
disponveis. A seguir, monte um grupo com todas as sries denominadas de "spectral density"e que
esto na ltima coluna da tabela que salva. Por fim, selecione View/Graph../XY line e, do lado
direito, em details, onde est multiple graphs, escolha single graph - First vs. All.
Vejamos agora como pode ser obtido o ciclo. Para esse exerccio vamos primeiro extrair o
ciclo pelo filtro HP. Isso ir produzir uma srie estacionria. Abra a srie do ciclo resultante da
aplicao do filtro HP e vamos usar o add-in de Spectral Analysis, selecionando o filtro de Bartlett
e selecione as opes como mostrado na figura 5.35a. Na opo do filtro spectral vamos selecionar
um teste a 0,05% e ciclos individuais tal como mostrado no grfico 5.35b. Note que h a opo de
Cycle Sum. Essa a soma dos ciclos individuais pedidos acima. O nmero de ciclos individuais
que so gerados so quatro: sfw_13, sfw_26, sfw_39 e sfw_4. Se somarmos os quatro teremos
como resultante o ciclo estimado para a nossa srie.
No conjunto de grficos 5.36a esto os ciclos individuais estimados, e no grfico 5.36b est a
soma dos quatro ciclos individuais.
5.6 Exerccios 111

(a) Hamming (b) Comparativo de Densidade Espectral

Figura 5.34: Estimativa Espectral

(a) Opes de Filtro

(b) Opes do Ciclo

Figura 5.35: Anlise Espectral

(a) Ciclos Individuais (b) Ciclos da srie IBCBR

Figura 5.36: Ciclos estimados

5.6 Exerccios
Exerccio 5.1 Aplique os quatro diferentes mtodos de dessazonalizao na srie qx, agrupe
em um grfico e discuta as diferenas. 
112 Captulo 5. Sries de tempo

Exerccio 5.2 Aplique os cinco diferentes mtodos de alisamento exponencial na srie y e


discuta as diferenas de resultado entre eles. 

Exerccio 5.3 Utilize os diferentes mtodos de alisamento exponencial para prever 6 trimestres
de px. 

Exerccio 5.4 Monte um grfico de y que compare os trs diferentes mtodos da opo detren-
ding method para o filtro CF simtrico em I(0). 

Exerccio 5.5 Monte um grfico de y que compare os trs diferentes mtodos da opo detren-
ding method para o filtro CF assimtrico I(0). 

Exerccio 5.6 Monte um grfico de y que compare os quatro diferentes mtodos da opo
detrending method para o filtro CF assimtrico I(1). 

Exerccio 5.7 Extraia o ciclo de y pelo mtodo de dupla filtragem HP, utilizado pela OECD(2008),
e compare aos resultados encontrados com uma nica filtragem. 

Exerccio 5.8 Compare as melhores estimativas para y encontradas nos exerccios 5.5, 5.6 e
5.7. 

Exerccio 5.9 Quais so as caractersticas de uma srie de rudo branco? E por que a estatstica
Q til para identific-la? 

Exerccio 5.10 Crie uma srie de rudo branco e prove as afirmaes feitas no exerccio 5.9
utilizando o correlograma e a estatstica Q. 

Quais so as caractersticas de uma srie de no-estacionria? E como podemos utilizar a autocor-


relao para inicialmente identific-la?

Exerccio 5.11 Por que consideramos o calculo de autocorrelao feito pelo EViews
R
diferente
da definio terica? 

Exerccio 5.12 Calcule o correlograma de y para 30 defasagens e indique quais autocorrelaes


so estatisticamente diferentes de zero ao nvel de significncia de 5%. 

Exerccio 5.13 Calcule o correlograma de y para 30 defasagens e indique quais autocorrelaes


so estatisticamente diferentes de zero ao nvel de significncia de 10%. 

5.7 Bibliografia
Christiano, L. J. e Fitzgerald, T. J. (2003), The Band Pass Filter. International Economic
Review, 44: 435465.
Corbae, Dean e Ouliaris, Sam (2006). Extracting Cycles from Nonstationary Data. In: Dean
5.7 Bibliografia 113

Corbae et al. (eds.) Econometric Theory and Practice. Cambridge: Cambridge University
Press, pp. 167-177.
Gyomai, G., e Guidetti, E. (2008). OECD system of composite leading indicators. Organisa-
tion for Economic Co-Operation and Development (OECD). Disponvel em:
http://www.oecd.org/std/leading-indicators/41629509.pdf.
Hodrick, R. J., e Prescott, E. C. (1997). Postwar US business cycles: an empirical investiga-
tion. Journal of Money, credit, and Banking, 1-16.
Hylleberg, Svend (1986). Seasonality in Regression.
Morais, I.A.C., Bertoldi, A., Anjos, A.T.M. (2010), Um modelo no-linear para as exporta-
es de borracha. Revista Sober.
Nilsson, R., e Gyomai, G. (2011). Cycle extraction: A comparison of the Phase-Average
Trend method, the Hodrick-Prescott and Christiano-Fitzgerald filters.
6. Regresso Simples

O primeiro contato com modelos de econometria comea agora. Entretanto esse livro no tem
a inteno de esgotar o assunto do ponto de vista metodolgico, e sim com aplicaes. Nesse
sentido, se o leitor precisar de fundamento s e discusses tcnicas sobre o tema, diversos livros
tcnicos podem se consultados. O procedimento aqui simples. Comeamos com a estimao
de um modelo com apenas uma varivel independente e explicamos todas as opes de testes e
identificao de problemas que por ventura possam aparecer e que esto disponveis noEViews R
.
Entendido esse ponto, o captulo seguinte passa a explicar um modelo de regresso mltipla.
O primeiro passo na estimativa de um modelo de regresso definir as variveis dependentes
e independentes. No nosso exemplo a ideia trabalhar com uma curva de demanda aplicada a
exportao de mveis (qx) e que pode ser explicada pela varivel renda (yw), que representa o
nmero ndice do PIB mundial. Vejamos como estimar uma regresso simples. Abra o arquivo do
EViews R
regresso simples.wf1. H um conjunto de variveis, mas usaremos apenas duas nesse
momento. Nesse caso, vamos rodar a seguinte equao de regresso 1 :

qxt = 1 + 1 ywt + t

H trs caminhos possveis no EViews R


para se estimar uma equao. O mais simples deles
selecionar cada uma das variveis a constar nessa equao, sempre selecionando em primeiro lugar
a varivel dependente e, a seguir, clicar com o boto direito e clicar em Open/as Equation.... A
segunda maneira ir em Quick/Estimate Equation... e escrever o formato da equao. Esses
dois mtodos so mostrados na figura 6.1. Note a diferena sutil que existe, podemos escrever
nossa equao de duas maneiras. Na primeira opo, aparece apenas o nome das variveis, sempre
seguindo a ordem da dependente como a inicial. No segundo mtodo, necessrio escrever a
equao, onde o termo c(1) e c(2) representam os coeficientes a serem estimados.

1 Note que h dados com e sem ajuste sazonal, onde esses so representados por _sa. Aqui foi usado o mtodo X-12.

Desse ponto em diante usaremos apenas os dados com ajuste sazonal.


116 Captulo 6. Regresso Simples

Figura 6.1: Como Estimar Uma Equao no EViews


R

Logo abaixo do campo onde se especifica as equaes, na figura 6.1, est o mtodo de estimao,
que no nosso caso o LS Least Squares, tambm conhecido como mnimos quadrados, e o
Sample que o perodo amostral onde sero feitas as estimativas. Clique em OK. Qualquer que
seja a forma utilizada para rodar essa regresso, o resultado ser o mesmo, como mostrado na
figura 6.2. Diversas estatsticas podem ser visualizadas. Na primeira linha est descrita a varivel
dependente, seguido do mtodo de estimao, a data em que foi feita essa estimativa(tilpara ver
se os alunos fizeram o exerccio na data certa), o perodo utilizado para gerar os resultados e o
total de dados. Note que so usados 187 dados que vo de janeiro de 2000 a julho de 2015. Logo
abaixo, em uma tabela, so mostrados os resultados da nossa equao e que, normalmente, so
assim representados em livros e artigos de econometria:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

onde, entre parnteses, ficam descritos os valores dos respectivos desvio-padro. A terceira forma de
estimar uma equao no eviews via programao e pode ser visualizado no box 6.0.1.

Programao 6.0.1 No caso da programao, h duas formas de se rodar uma regresso. Na


primeira, escrevemos o mtodo que, no presente caso, dado pelo comando ls, que signi-
fica Least Square (Mnimos Quadrados) seguindo pela ordem das variveis onde primeiro
colocada a dependente. H uma lista de opes que podem ser colocadas depois do termo ls,
consulte o manual. Antes de qualquer coisa, o melhor a fazer especificar o intervalo de dados
que estamos trabalhando que, no presente exemplo, de 2000M1 a 2015M7.

smpl 2000M1 2015M7


ls qx_sa yw_sa c

A segunda maneira seria escrever o comando equation seguido do nome a ser dado para a
equao e da lista das variveis. H algumas vantagens nesse segundo mtodo que vo ficar mais
claras mais a frente. Uma delas o fato de j especificarmos o nome da nossa regresso como
eq1:
117

Figura 6.2: Resultado da Regresso Simples

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c

Programao 6.0.2 O arquivo regresso simples.wf1, tambm, contm as sreis originais


sem ajuste sazonal. Podemos adicionar os comandos aprendidos no captulo anterior, para
dessazonalizar as sries pelo mtodo X-12 multiplicativo e, ento, rodar a regresso simples pelo
mtodo dos mnimos quadrados.

qx.x12(mode=m) qx
yw.x12(mode=m) yw
smpl 2000M1 2015M7
equation eq1.ls qx_sa yw_sa c

Os resultados para a nossa primeira estimativa de regresso simples podem ser visualizados na
figura 6.2.
Aps os valores dos coeficientes (parmetros), esto os desvios-padro (StdError) e, na coluna
seguinte da tabela est a estatstica t (t-statistic) e o p-valor (Prob). A primeira utilizada para
testar se o seu respectivo coeficiente estatsticamente diferente de zero, a partir da frmula:

x
t=

Por exemplo, podemos testar se 1 = 0 que a nossa constante. Nesse caso, a estatstica t
dada por:

1 0 18.389 0
t= = = 2.779
6.616
O mesmo podendo ser feito para testar se 1 = 0, onde:

1 0 0.647 0
t= = = 10.216
0.063
118 Captulo 6. Regresso Simples

Por fim, o resultado do Prob ir indicar se aceitamos ou rejeitamos a hiptese nula de que o
coeficiente em questo estatsticamente igual a zero. O Prob aqui o mesmo que o P-valor.
Destaca-se que, para esse teste, estamos assumindo uma distribuio t-student e que bicaudal. No
nosso exemplo, tanto para o coeficiente da constante, quanto para o da renda, rejeitamos a hiptese
nula de que so estatsticamente iguais a zero.
O valor Prob tambm pode ser encontrado a partir da funo tdist. Nesse caso, como o resultado
um nmero, criamos primeiro um escalar e especificamos os valores para a funo tdist a partir
de scalar pvalor=@tdist(10.216,187). O valor 10.216 o valor da estatstica t e 187 representa o
nmero de graus de liberdade do teste, equivalente ao nmero de observaes utilizadas aps o
ajuste (veja no incio dos resultados na fig. 6.2).

Programao 6.0.3 Dando sequencia nossa regresso simples, os comandos abaixo podem
ser usados para testar se o parmetro da elasticidade-renda igual a zero 1 = 0 . Nesse caso,
primeiro especificamos a estatstica t e armazenamos a mesma em um escalar de nome valort,
salvamos o nmero de observaes no escalar obs e, a seguir, aplicamos o teste para encontrar
seu respectivo p-valor e armazenar o resultado em um escalar de nome pvalor:

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
scalar valort=eq1.@tstats(1)
scalar obs=eq1.@regobs
scalar pvalor=@tdist(valort,obs)

Alm desses resultados bsicos, h diversos outros que so mostrados logo abaixo e que servem
para avaliar o modelo em questo. Por exemplo, no caso do R-squared, conhecido como R2 ou R2 ,
o valor de 0.360 deve ser interpretado como: cerca de 36% das variaes em qx so explicadas por
variaes em yw. Alguns costumam afirmar que esse resultado, na verdade, estaria se referindo ao
grau de explicao do modelo, o que no deixa de ser verdade. A frmula dada por:
T 2
t=1 t
R2 = 1 T
t=1 (Yt Y )2
T
O termo t=1 t 2 denominado de soma do quadrado dos resduos, e que est mostrado na
tabela como Sum squared resid. t=1T
t 2 = 36438.21.
Esse resultado pode ser feito manualmente. Primeiro pegue todos os resduos da regresso e
eleve cada um deles ao quadrado e depois some todos.
Esse termo tambm poderia ser expresso da seguinte forma:
T
( )2
t=1

Onde a mdia dos resduos. Porm, por definio, a mdia dos resduos igual a zero,
uma vez que a reta de regresso foi estimada de forma a passar exatamente na mdia de todos os
pontos. Sendo assim, tudo o que se erra na estimativa para cima, tambm se erra para baixo. Ou
seja, teremos valores positivos e negativos que se anulam e, sua mdia daria zero. Sendo assim,
acabamos por fazer:
T T T
( )2 = ( 0)2 = 2
t=1 t=1 t=1
Caso queira verificar a srie de resduos,com a equao aberta, v em View/Actual,Fitted,Residual.
Ou ento, se quiser gerar a srie dos resduos, v em Proc/Make Residual Series..., e escolha um
nome para essa srie.
119

Programao 6.0.4 Uma alternativa interessante rodar vrias regresses com uma janela
fixa de, por exemplo, 60 dados, ou seja, 5 anos. Nesse caso, iniciamos uma regresso em
2000M1 que vai at 2004M12. A seguir, a segunda regresso vai de 2000M2 at 2005M1 e
assim sucessivamente. Isso ir representar 99 regresses no total, com a ltima indo de 2008M4
a 2013M3. Para tanto, podemos declarar um loop usando o comando for:

for !i=1 to 99
smpl 2000M1+!i 2004M12+!i
equation eq2.ls qx_sa yw_sa c
next

Porm, isso ir gerar apenas um resultado para as nossas estimativas, qual seja, a ltima
regresso. Nesse caso, no iramos saber como evoluiu, por exemplo, ao longo dessas 99
regresses, o valor do coeficiente da elasticidade renda-demanda. O ideal seria comparar essa
estimativa com a que envolve todos os dados, como feito anteriormente em eq1. Para tanto,
podemos usar o comando matrix, para criar uma matriz de 100 linhas de nome coef e, depois,
pedir para salvar esse coeficiente nessa matriz.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
matrix(100) coef
coef(100)=eq1.@coefs(1)
for !i=1 to 99
smpl 2000M1+!i 2004M12+!i
equation eq2.ls qx_sa yw_sa c
coef(!i)=eq2.@coefs(1)
next

Como ltimo complemento, note que, aps fazer isso, seu conjunto de dados amostral se reduziu
para 60 dados, mostrado na parte superior do workfile em sample. Para fazer o banco de dados
contemplarem todos os dados escreva no final do programa:

smpl @all

A figura 6.3a mostra como so os resduos e a 6.3b a distribuio dos mesmos. Veja que a
mdia zero, satisfazendo a premissa do modelo de regresso E() = 0. Mas no possuem uma
distribuio normal, sinalizando que podemos melhorar essa estimativa no futuro.
120 Captulo 6. Regresso Simples

(b) Distribuio dos Resduos


(a) Resduos

Figura 6.3: Resduos da Regresso Simples

T
A seguir, o termo t=1 (Yt Y )2 representa o quanto a varivel dependente desvia em relao
sua mdia. O termo elevado ao quadrado exatamente para evitar que desvios positivos sejam
anulados por desvios negativos. A mdia da varivel dependente mostrada na tabela como Mean
dependent var e, para o nosso exemplo, tem valor qxt = 85.168.Para encontrar esse valor podemos
usar o comando scalar media = eq1.@meandep. Isso tambm pode ser feito manualmente,
T
onde teremos t=1 (Yt Y )2 = 85.168. Por fim, no nosso exemplo, basta encontrar:
36438.21
R2 = 1 = 0.360
56994.139
Veja que, independente do modelo que for utilizado, o denominador da equao acima nunca se
modifica. Porm, o numerador, ou seja, o desvio dos erros em relao a sua mdia, que igual a
zero, ser diferente para cada modelo. Ou seja, tem modelos que erram mais que outros. Dessa
forma, quanto maior for o numerador, relativamente ao resultado do denominador, mais o modelo
estar errando e, com isso, menor ser o valor de R2 . Um modelo que tem erro prximo a zero ir
produzir um R2 prximo ao valor 1.
Logo abaixo dessa estatstica h outra que deve ser considerada mais til, a Adjusted R-
squared. Nessa, o valor do R2 corrigido pelo nmero de coeficientes que esto sendo utilizadas
no modelo. Sua frmula geral dada por:

T 1
R 2 = 1 (1 R2 )
T k
Onde T o nmero de observaes utilizadas e k o nmero de coeficientes. No nosso exemplo,
temos 187 dados e dois coeficientes, um para a constante e outro para a varivel independente.
Sendo assim:

187 1
R 2 = 1 (1 0.360) = 0.357
187 2
Porque utilizar o R 2 e no o R2 ? Em regresso simples os dois valores so bem parecidos, pois
termos no mximo dois coeficientes a utilizar, a constante e o . Mas em modelos de regresso
mltipla onde k maior as estimativas podem diferir de forma significativa.

Programao 6.0.5 Seguindo no exemplo das nossas 100 regresses, podemos pedir agora
para que seja criada uma srie com todos os valores dos R2 . Isso ser til para identificar em
qual sequncia de regresses obtemos a melhor estimativa. Assim, criamos mais uma matriz, s
que agora de nome explicado e pedimos para salvar os valores nela. Note que os valores da
regresso com o conjunto total dos dados ficam na ltima linha dessa matriz:
121

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
matrix(100) coef
coef(100)=eq1.@coefs(1)
matrix(100) explicado
explicado(100)=eq1.@r2
for !i=1 to 99
smpl 2000M1+!i 2004M12+!i
equation eq2.ls qx_sa yw_sa c
coef(!i)=eq2.@coefs(1)
explicado(!i)=eq2.@r2
next
smpl @all

Veja que o valor do R2 obtido usando o comando .@r2 logo depois do nome da equao
(nesse exemplo eq1 e eq2). Caso queira determinar a srie de valores do R2 ajustado use
.@rbar2.
A seguir, na tabela com o resultado da regresso, h a informao do desvio padro da regresso,
ou ento, S.E. of regression. Seu resultado dado de forma direta a partir do conhecimento da
varincia dos resduos, visto anteriormente:
T
( )2
t=1

Ou seja, como a mdia dos resduos igual a zero, = 0, a varincia pode ser encontrada a partir
de: s
T
t=1 t2
s=
(T k)
No nosso exemplo, s = 14.034. O comando para obter esse valor dado por scalar desvio =
eq1.@se.
A estatstica seguinte mostrada na tabela de resultados a log likelihood, ou ento, o log da
verossimilhana, onde os erros so avaliados supondo-se uma distribuio normal a partir de:
 T
t=1 ( )2
 
T
l= 1 + ln(2) + ln
2 T
Para os dados do nosso exemplo, temos que T = 187 e, sendo assim:
  
187 36438.213
l= 1 + ln(2) + ln = 758.298
2 187
O comando no EViews R
para determinar o valor do log da verossimilhana dado por scalar
logver = eq1.@logl.
A seguir, est a estatstica F. Essa tem como objetivo testar se todos coeficientes das variveis
independentes no modelo, em conjunto, so estatsticamente iguais a zero. Esse teste no inclui a
constante. usada a seguinte frmula geral para o teste:

R2 T k
F=
(k 1) (1 R2 )
122 Captulo 6. Regresso Simples

Para o nosso exemplo, teremos:


0.360 187 2
F= = 104.364
(2 1) (1 0.360)

E, com base no p-valor, podemos rejeitar a hiptese nula de que 1 = 0.O Prob pode ser encon-
trado usando scalar probf = 1- @fdist(104.364,1,185). E usando scalar f = eq1.@f
encontramos o teste F.
Programao 6.0.6 O teste F pode ser feito via programao. Primeiro criamos o scalar
de nome f que calcula o valor da estatstica. A seguir, criamos o scalar de nome testef para
especificar o p-valor dessa estatstica que tem k-1 graus de liberdade no numerador e T-k graus
de liberdade no denominador:

scalar f= (eq1.@r2)*(eq1.@npers-eq1.@ncoef)/(eq1.@ncoef-1)*(1-eq1.@r2)
scalar testef=(1-@cfdist(f,eq1.@ncoef-1,eq1.@npers-eq1.@ncoef))

Alm da estatstica R2 , muito utilizada para comparar modelos, o EViews


R
fornece outras trs que
so bem mais eficientes e que so conhecidas como critrios de comparao. Em ambas, quanto
menor o valor, em mdulo, melhor. A primeira delas o critrio de Akaike. De forma geral, sua
frmula dada por:
2
AIC = (k l)
T
Onde l o log da verossimilhana. Usando os dados do nosso exemplo, vemos que:
2
AIC = (2 (758.298)) = 8.131
187
Esse valor tambm pode ser encontrado usando scalar aic = eq1.@aic. A segunda estatstica
o critrio de informao de Schwarz. A vantagem desse mtodo em relao ao de AIC que
agora aplicada uma espcie de penalidade para o uso de coeficientes adicionais:
1
SC = (kln(T ) 2l)
T
O comando no EViews R
que retorna essa estatstica dado por scalar sc = eq1.@schwarz.
Para os dados do nosso exemplo, teremos:
1
SC = (2ln(187) 2(758.298)) = 8.166
187
Por fim, tambm pode ser usado o critrio de comparao de Hannan-Quinn, que adiciona mais
uma penalidade:
2
HQ = (kln(ln(T )) l)
T
Usando os dados do nosso exemplo, encontramos:
2
HQ = (2ln(ln(187)) (758.298)) = 8.145
187
Para encontrar essa estatstica podemos usar o comando scalar hq = eq1.@hq. Um ponto
importante a destacar que essas trs estatsticas no so comparveis entre si. Ou seja, de posse de
diferentes modelos, comparamos o AIC do modelo 1 com o AIC dos demais modelos. No usamos
a comparao entre AIC e HQ, por exemplo.
123

Programao 6.0.7 Ao rodar as 100 regresses, podemos estar interessados em criar uma srie
de dados que mostre a evoluo dos critrios de comparao. Como iremos usar os trs critrios,
a nova matriz que usaremos, de nome criterio, tem que ter 3 colunas. Criamos a mesma e
salvamos os valores desses critrios para a eq1. A seguir, ao rodar o loop, fazemos o mesmo para
cada uma das outras 99 regresses:

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
matrix(100) coef
coef(100)=eq1.@coefs(1)
matrix(100) explicado
explicado(100)=eq1.@r2
matrix(100,3) criterio
criterio(100,1)=eq1.@aic
criterio(100,2)=eq1.@hq
criterio(100,3)=eq1.@schwarz
for !i=1 to 99
smpl 2000M1+!i 2004M12+!i
equation eq2.ls qx_sa yw_sa c
coef(!i)=eq2.@coefs(1)
explicado(!i)=eq2.@r2
criterio(!i,1)=eq2.@aic
criterio(!i,2)=eq2.@hq
criterio(!i,3)=eq2.@schwarz
next
smpl @all

At esse momento vimos como avaliar os resultados das estatsticas do modelo de regresso e
como as mesmas so calculadas. A figura 6.4 traz um resumo das funes utilizadas at o presente
momento. Esses comandos devem ser aplicadas em uma equao. Por exemplo, para determinar a
nmero de observaes do modelo de de nome eq1, utilizado o comando eq1.@regobs.

Figura 6.4: Comandos para Resultados do Modelo de Regresso

Aps avaliar esses resultados, podemos ver, graficamente, como o nosso modelo, para o
conjunto de dados, se comportou. Para tal, com a janela de resultados da nossa regresso aberta,
124 Captulo 6. Regresso Simples

clique em Resids. O mesmo ir mostrar o grfico conforme figura 6.5.

Figura 6.5: Resultados do Modelo de Regresso

Tal como citado na legenda do grfico, a linha vermelha mostra os verdadeiros valores da
varivel dependente, no nosso caso, qx. A linha verde so as estimativas obtidas a partir do modelo
de regresso. E, por fim, a linha azul a srie de resduos que nada mais que a diferena entre
o verdadeiro valor e o estimado. Note que o nosso modelo no to bom para reproduzir o
comportamento de qx em determinados momentos, errando muito.
Nesse momento, o leitor pode estar se perguntando como feita a estimativa dos valores para
cada perodo. Vamos recordar a equao encontrada:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

Com base nela podemos determinar qualquer valor de qx ao longo do tempo. Por exemplo, a
estimativa para janeiro de 2000 pode ser dada a partir da substituio do respectivo valor da varivel
independente naquela data. Ou seja, olhando a srie de ywt , ajustada sazonalmente, vemos que, em
janeiro de 2000 tem-se yw jan/2000 = 76.333. Sendo assim, podemos encontrar o valor de qx jan/2000
fazendo:
qx jan/2000 = 18.389 + 0.647(76.333) = 67.850

Esse procedimento pode ser repetido para qualquer ms que se queira avaliar, modificando apenas o
respectivo valor de ywt e mantendo fixo o coeficiente da constante, 18,389, e da inclinao, 0,647.
Aps fazer a regresso necessrio proceder a uma investigao detalhada sobre os resultados.
H no EViews R
3 blocos de testes que so explorados nas sees a seguir. Primeiro feita a
investigao sobre os coeficientes. A seguir sobre os resduos e, por fim, sobre a estabilidade do
modelo.

6.1 Diagnstico Dos Coeficientes


Alguns estatisticas podem ser avaliadas para testar a robusts dos coeficientes. Com uma equao
aberta, o diagnostico dos coeficientes pode ser acessado em View/Coefficient Diagnostics. Note
que so nove diferentes tipos de testes que avaliaremos na sequncia.
6.1 Diagnstico Dos Coeficientes 125

6.1.1 Scaled Coefficients


Essa opo s funciona se a equao for estimada a partir de um comando de lista. Lembre-se
disso, pois vrios outros testes exigem esse formato. Como o modelo estimado em lista? Voc
ter que, ao abrir a janela de estimativa da equao, escrever as variveis em ordem. No nosso
exemplo colocamos qx_sa yw_sa c .
Essa opo permite que se tenha uma viso da estimativa dos coeficientes, os coeficientes
padronizados e as elasticidades mdias. Para o nosso exemplo, temos os resultados mostrados na
figura 6.6.

Figura 6.6: Scaled Coefficients

Na primeira coluna esto as variveis, na segunda coluna o valor dos coeficientes estimados.
Na terceira coluna os coeficientes padronizados e, por fim, a estimativa das respectivas elasticidades
no ponto mdio.Essa tabela tambm pode ser encontrada usando o comando eq1.coefscale .

6.1.2 Intervalo de Confiana


Uma informao til na interpretao dos resultados de uma regresso usar o intervalo de
confiana dos coeficientes. Ao clicar em View/Coefficient Diagnostics, selecione Confidence
Intervals.... Na janela que ir abrir, podemos selecionar qualquer tamanho para o intervalo de
confiana. Por exemplo, na figura 6.7 mostramos como seriam os resultados para estimativas com
95% de significncia.

Figura 6.7: Intervalo de Confiana

Note que, ao no marcar a opo Arrange in pairs, os resultados mostrados so mais fceis
de interpretar, com o intervalo mnimo esquerda, no meio a mdia do coeficiente e, depois, o
intervalo mximo. A tabela com os instervalos de confiana pode ser obtida usando o comando
eq1.cinterval(nopair) .95 . Para encontrar esses valores a um nvel de significncia de 95%
e uma distribuio t-student, o resultado para o coeficiente de ywt ser dado por:
126 Captulo 6. Regresso Simples

yw 1, 972y w < yw < yw + 1, 972y w


0.647 1, 972(0.063) < yw < 0.647 + 1, 972(0.063)
0, 522 < yw < 0, 773
Com 99% de significncia, usamos:

yw 2, 346y w < yw < yw + 2, 346y w

0.482 < yw < 0.813


O mesmo tambm pode ser feito para todos os demais coeficientes encontrados, inclusive a
constante. A forma de interpretar esse resultado : Acredita-se que o valor de ywt tem 95% de
probabilidade de ficar entre 0,522 e 0,773.

Programao 6.1.1 Para o nosso exemplo de 100 regresses, podemos pedir para que seja
criado, a cada passo, o intervalo de confiana para o primeiro coeficiente. Nesse caso, mudamos
a matriz coef para 3 colunas onde, na primeira, temos o intervalo inferior, a 95%; na segunda
coluna temos a estimativa do coeficiente; na terceira coluna o intervalo superior a 95%. Note que
tambm modificada a parte do loop:

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
matrix(100,3) coef
coef(100,2)=eq1.@coefs(1)
coef(100,1)=eq1.@coefs(1)-1.975*eq1.@stderrs(1)
coef(100,3)=eq1.@coefs(1)+1.975*eq1.@stderrs(1)
for !i=1 to 99
smpl 2000M1+!i 2004M12+!i
equation eq2.ls qx_sa yw_sa c
coef(!i,2)=eq2.@coefs(1)
coef(!i,1)=eq2.@coefs(1)-1.972*eq2.@stderrs(1)
coef(!i,3)=eq2.@coefs(1)+1.972*eq2.@stderrs(1)
next
smpl @all

Um ponto importante na construo do intervalo de confiana definir o valor na curva de


distribuio. Nesse caso, como usamos a curva t-student, devemos ter em mente que necessrio
especificar tambm os graus de liberdade. Sendo assim, o valor de 1,972 para 95% s vlido
para 185 graus de liberdade do nosso modelo (N-k), onde N o nmero de dados e k o nmero de
coeficientes. Se o nmero de dados ou o nmero de coeficientes variarem, o valor para 95% no
ser mais 1,972. Felizmente existe uma funo no EViews R
que permite encontrar esse ponto na
curva de distribuio: @qtdist(rea,graus de liberdade). No nosso exemplo, queremos saber o
ponto para 95%. Note que, como temos uma curva bi-caudal, devemos especificar uma rea divida
em dois(5%/2=0,025), sendo assim, o valor de rea=0,975 e os graus de liberdade=185. Com isso
podemos encontrar 1,972.

Programao 6.1.2 Encontrando o ponto na curva t-student que especifica o intervalo de


confiana de acordo com uma rea e um valor dos graus de liberdade. Para encontrar o ponto no
qual a rea interna 90% e temos 185 graus de liberdade:
6.1 Diagnstico Dos Coeficientes 127

Figura 6.8: Intervalo de Confiana 90% 95% 99%

scalar ponto=@qtdist(0.95,185)

Alternativamente podemos pedir uma estimativa de intervalo de confiana com vrios nveis de
significncia. Para tanto podemos usar o comando eq1.cinterval(nopair) .90 .95 .99 que
ir produzir os resultados da figura 6.8.

6.1.3 Teste de Wald


Ao criar intervalos de confiana, podemos ter uma idia de inferncia sobre valores mnimos e
mximos. Porm, podemos querer testar algumas restries nos coeficientes. Isso pode ser feito a
partir do teste de Wald. V em View/Coefficient Diagnostics/Wald Test.... A seguir, vamos testar
se o coeficiente de ywt estatsticamente igual a 2. Nesse caso, temos:

H0 : c(1) = 2 ou ento: H0 : c(1) 2 = 0

Ha : c(1) 6= 2 ou ento: Ha : c(1) 2 6= 0

Como temos que c(1) = 0.647, ento c(1) 2 = 1.353. Esse o valor reportado no sumrio da
hiptese nula e que dever ser testado. O Std. Error, ou seja, o desvio-padro a ser usado nesse
teste o mesmo da estimativa de regresso para o coeficiente em questo. Nesse caso,c(1) = 0.063.
Sendo assim, podemos encontrar a estatstica t-student a partir de:

x
t=

1.353
t= = 21.316
0.063
No caso da estatstica t o probability dado a partir de (1-@ctdist(-21.316,185)). Lembre-
se que esse um teste bicaudal. Note que tambm mostrado o resultado para um teste F. No geral,
o teste F que compara dois modelos dado por:
h i
SSE2 SSE1
k1 k2
F= h i
SSE1
nk1

Onde n o nmero de observaes de um modelo no restrito, que no nosso caso o resultado com
c e yw_sa e dado por 187; k1 o nmero de parmetros do modelo no restrito, k1 = 2 no nosso
exemplo, dado pelo parmetro da constante e do coeficiente de yw_sa; SSE1 a soma ao quadrado
dos resduos de um modelo no restrito, que para o nosso exemplo dado por 36438, 2. Esse
modelo no restrito combinado ao modelo restrito onde teramos que testar a hiptese de C(1) = 2.
Para tanto vamos estimar uma equao onde qxt = c(1) + 2ywt o resultado ser qxt = 120, 9 + t ,
128 Captulo 6. Regresso Simples

uma equao com apenas um parmetro, ou seja, k2 = 1. Tendo a SSE2 = 125934, 7. Substituindo
esses valores no teste F encontramos:

h i
125934,736438,2
21
F= h i = 454, 3817
36438,2
1872

Para encontrar o p-valor desse teste s fazer scalar pvalorf =(1-@cfdist(454.3817,1,185)).


O teste F vlido nesse caso apenas se assumirmos que os erros s independentes e com distribuio
normal. Assim, pelo resultado do p-valor ( probability), podemos dizer que o coeficiente de ywt
estatsticamente diferente de 2. Como pode ser visto na figura 6.9.

Figura 6.9: Teste de Wald c(1)=2

Tambm podemos estar interessados em testar se os coeficientes do nosso modelo de regresso


so estatisticamente iguais. Nesse caso, devemos mudar a hiptese nula para:

H0 : c(1) = c(2) ou ento: H0 : c(1) c(2) = 0

Ha : c(1) 6= c(2) ou ento: Ha : c(1) c(2) 6= 0

Para fazer isso no EViews R


, v em View/Coefficient Diagnostics/Wald Test..., e especifique tal
como mostrado na figura 6.10. Pelo resultado do teste, no possvel aceitar a hiptese nula. Sendo
assim, os dois coeficientes so estatisticamente diferentes.
6.1 Diagnstico Dos Coeficientes 129

Figura 6.10: Teste de Wald c(1)=c(2)

6.1.4 Confidence Ellipse


Apesar do teste de Wald ser muito til, normal que se queira testar mais de uma restrio, como
por exemplo, se c(1)=0 e ao mesmo tempo, se c(2)=0 . Nesse caso, o teste de Wald no o mais
apropriado, e devemos recorrer a View/Coefficient Diagnostics/Confidence Ellipse. Isso pode
ser feito apenas digitando os coeficientes, omitindo o valor 0. Assim, da forma como digitado,
c(1) o mesmo que testar se c(1)=0. Como tambm deixamos c(2), estamos, na verdade, testando
se c(1)=c(2)=0. Em confidence levels, selecione 0.95 (95%). Em individual intervals, selecione
Shade, que uma opo melhor de visualizar os resultados. A seguir, clique em Ok.

Figura 6.11: Confidence Ellipse

Como mostra a figura 6.11, h um ponto central na cor vermelha. Esse representa a es-
timativa dos dois coeficientes na equao de regresso, com c(1) = 0, 647 e c(2) = 18, 389.
Para conferir isso coloque o mouse sobre o ponto vermelho que esses valores iro aparecer.
A rea que est na cor cinza representa o intervalo de confiana individual para um teste a
95% de significncia, ou seja, para cada um dos coeficientes. Note que, para o coeficiente
130 Captulo 6. Regresso Simples

c(1) esse dado por 0, 522 < c(1) < 0, 773 no eixo horizontal. Lembre-se que encontramos
esse valor do intervalo de confiana anteriormente. Para a constante, que o segundo coefi-
ciente, 5, 335 < c(2) < 31, 443 e est no eixo vertical. Dentro do crculo est o resultado do
teste conjunto. No nosso caso, testando se c(1) = c(2) = 0. Esse grfico pode ser gerado
usando o seguinte comando no EViews R
: eq1.cellipse(ind=shade) C(1)=0, C(2)=0 .

A anlise pode ser feita tanto para


um teste individual quanto para um
teste conjunto. Por exemplo, se qui-
sermos testar a 95% se c(1) = 1, 2,
vemos que esse valor est fora da
rea cinza do grfico na linha hori-
zontal. Sendo assim, rejeitamos a hi-
ptese nula. Para comprovar esse re-
sultado faa o teste de Wald para c(1).
Da mesma forma, podemos testar se
c(2) = 2, 5. Olhando no grfico ve-
mos que esse valor est fora da rea
cinza (no se esquea de agora ver a
linha vertical). Dessa forma, rejeita-
mos a hiptese nula.
Mas, se queremos um teste con-
junto entre dois coeficientes, como
no nosso caso, entre c(1) e c(2), deve-
mos olhar para a elipse. Sempre que
a combinao entre os dois pontos fi- Figura 6.12: Confidence Levels: 0.99 0.90
car dentro da elipse, no possvel
rejeitar a hiptese nula. Uma outra opo interessante colocar mais de um intervalo. Na caixa de
opo Confidence levels digite 0.99 0.90 e em Individual intervals a opo Line. Tal como no
comando eq1.cellipse(ind=line, size = 0.99 0.90) C(1)=0, C(2)=0 . O resultado
como na mostrado na figura 6.12.

6.1.5 Variance Inflation Factors


Essa medida tem como objetivo apon-
tar o nvel de colinearidade que existe
entre as variveis independentes do
modelo. Duas variveis so ditas se-
rem colineares se todos os pontos es-
tiverem sob uma linha reta. Nesse
sentido, se duas variveis possuem
determinado grau de colinearidade
natural esperar que uma esteja influ-
enciando a estimativa do coeficiente
Figura 6.13: Variance Inflation Factors da outra. O VIF permite identificar
a presena de colinearidade na nossa
equao dividindo a varincia dos parmetros em questo. O resultado apresentado de duas
formas. O VIF centrado encontrado a partir da diviso da varincia do coeficiente obtida no
modelo completo, no nosso caso 0, 004023, pela varincia do mesmo coeficiente mas estimado a
partir de um modelo que contenha apenas a constante e o coeficiente em questo. Como temos um
6.1 Diagnstico Dos Coeficientes 131

modelo de regresso simples, esses dois valores so iguais, resultando em um VIF centrado emyw
de 1. Veja na figura 6.13.
A segunda medida o VIF no-centrado. Esse dado pela razo da varincia do coeficiente
obtida a partir de um modelo completo (0, 004023) e um modelo sem constante (faa uma regresso
qx_sa c(2)yw_sa e encontrar = 0, 82211 com varincia de 0, 00010028). Esse resultado
pode ser acessado a partir de eq1.varinf na janela de comando.

6.1.6 Decomposio da Varincia do Coeficiente


Essa uma ferramenta til para de-
terminar a existncia de uma possvel
colinearidade entre as variveis inde-
pendentes. O mtodo se d pela cons-
truo da matriz de covarincia dos
coeficientes, a seguir, so encontra-
dos os autovetores e, por fim, a pro-
poro da decomposio da varincia.
Vejamos como interpretar esses resul-
tados para a regresso que estamos
usando. A figura ?? mostra esses cl-
culos.
A ltima parte da tabela mostra
a estimativa dos autovetores para os
dois parmetros do modelo (para en-
tender isso consulte o captulo sobre
anlise de componente principal). A
partir desses autovetores obtm-se a
proporo da decomposio da vari-
ncia, mostrado no meio da tabela.
Por fim, feito o clculo do condi-
tion number. Como regra se esse va-
lor menor que 1/900 = 0, 001 en-
to h colinearidade. Se for verifi-
cado na linha condition mais de um
resultado menor que 0, 001 ento
necessrio avaliar a proporo da de-
composio da varincia. Veja que no
Figura 6.14: Decomposio da Varincia do Coeficiente nosso exemplo o condition apresenta
um resultado menor que 0, 001 dado
por 0, 00000221, associado ao autovalor 43, 78. Isso sinalizaria que temos colinearidade. Porm,
estamos trabalhando apenas com uma varivel independente. Esse tipo de investigao faz sentido
em um modelo com mais de uma varivel independente. A tabela com os resultados apontados
acima pode ser facilmente encontrada usando eq1.cvardecomp .

6.1.7 Variveis Omitidas


Frequentemente nos deparamos com a possibilidade de inserir uma nova varivel no modelo de
regresso como forma de melhorar o poder de explicao do mesmo. Porm, pode ocorrer de, ao
se fazer isso, a contribuio no seja to boa. Nesse caso, o ideal seria fazer um teste de variveis
omitidas. J fizemos o modelo de regresso mais bsico, onde:
132 Captulo 6. Regresso Simples

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

Agora, vamos investigar se a omisso, por exemplo, da varivel pxt foi ruim para o modelo.
Nesse caso, com a janela da equao acima aberta, v em View/Coefficient Diagnostics/Omitted
Variables Test.... A seguir, digite o nome da varivel em questo (ela tem que existir no workfile).
Os resultados so apresentados na figura 6.15. Ao final ser possvel identificar a regresso na
forma:

qxt = 21.625 + 1.531ywt 0.428 pxt + t


(10.096) (0.185) (0.085)

Esse o primeiro contato com a ideia de regresso mltipla. O resultado dessa regresso
aparece na parte final da tabela. A estatstica t e o Prob so avaliados como anteriormente.
Ou seja, para poder fazer o teste, primeiro rodada uma regresso com a presena da varivel
que est supondo ter sido omitida. Posteriormente, so feitos os testes e apresentados no incio da
tabela. O primeiro resultado para o teste t-statistic, refere-se apenas hiptese de o coeficiente
da nova varivel, no nosso caso, pxt , ser estatsticamente igual a zero. Pelo p-valor, rejeitamos a
hiptese nula e, individualmente, o coeficiente diferente de zero. Ou seja, desse ponto de vista, ele
seria importante para o modelo. Veja a primeira parte da tabela na figura 6.15. Aqui desnecessrio
mostrar como chegamos no Probability, pois j comentamos isso anteriormente.
Logo abaixo est o teste F-statistic, que representa o teste conjunto para ver se todas as variveis
so estatsticamente iguais a zero, ou seja, se c(1) = c(2) = c(3) = 0 . Porm, esse teste feito
com base em um modelo restrito (sem a varivel pxt ) relativamente a um modelo no-restrito, com
a presena da varivel pxt . O conjunto de informaes em F-test summary mostra os resultados
para a soma do quadrado dos resduos para os dois modelos, o restrito(sem a varivel px) e o no
restrito (com a varivel px).
(SSRR SSRUR )
q
Fstat = SSRUR
(T k)
Onde SSRR a soma dos resduos ao quadrado do modelo restrito, SSRUR a soma ao quadrado do
modelo no-restrito, com todas as variveis, q o nmero de restries impostas, T o nmero de
observaes e k o nmero de parmetros presentes no modelo no restrito. A hiptese nula que a
varivel que foi omitida no significativa para o modelo. Substituindo esses valores encontramos:
(36438,2132031,26)
1
Fstat = 32031,26
= 25, 315
(1873)

Assim, o valor de F = 25, 315[0, 000] sinaliza que rejeitamos a hiptese nula e, os coeficientes no
so iguais e, dessa forma, adicionar a varivel pxt no modelo representa ganhos. Note que o teste F
para variveis omitidas tem distribuio Xq2 onde q o nmero de restries impostas. Nesse caso,
podemos encontrar o p-valor diretamente no EViews R
.

Programao 6.1.3 Podemos encontrar o p-valor do teste escrevendo um comando no EViews


R

. Na barra de ferramentas, clique em Window e depois selecione Command. Essa ao ir


abrir uma parte em branco na parte superior do EViews R
. Ali podemos escrever o comando
abaixo e verificar que ele cria uma varivel escalar de nome testef com o resultado do p-valor.

scalar testef
testef=@chisq(25.315,1)
6.1 Diagnstico Dos Coeficientes 133

Figura 6.15: Variveis Omitidas - px_sa

Note que devido ao fato de executarmos as linhas de programao pela janela de comandos,
devemos executar cada linha de uma vez.
Por fim, temos o teste de razo de verossimilhana, conhecido como LR. Esse tambm tem
como objetivo comparar o modelo restrito e o no-restrito e tem, como hiptese nula, que adicionar
uma nova varivel no seria significante para o modelo. De forma geral, o teste dado por:

LR = 2(lrestrito lnaorestrito )

Onde lrestrito o log da verossimilhana para o modelo restrito. No nosso exemplo, olhando os
resultados das estimativas, temos que:

LR = 2(758.298 (746.245)) = 24.105

E, pelo resultado do p-valor, mostrado no incio da tabela, rejeitamos a hiptese nula de que inserir
a varivel no estatsticamente significativo para o modelo. Portanto, conclumos pela importncia
de inserir a varivel pxt . Um lembrete importante: esse teste no se aplica quando usamos variveis
dependentes defasadas. Isso ficar mais claro aps ter estudado os modelos autoregressivos.A
tabela com os resultados para o teste de variveis omitidas pode ser facilmente encontrada usando:
eq1.testadd px_sa para o nosso exemplo.
Tambm podemos testar a omisso de mais de uma varivel. Seja por exemplo, o modelo
bsico, restrito, dado por:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

E queremos testar se a omisso da varivel px_sa e pm_sa so estatisticamente significativas


para o modelo ou no. Nesse caso, o modelo completo seria dado por:

qxt = 126.641 + 1.815ywt 1.343 pxt + 1.686 pmt t


(15.682) (0.163) (0.135) (0.209)

Para fazer esse teste, com a janela da equao acima aberta, v em View/Coefficient Diagnos-
tics/Omitted Variables Test.... A seguir, digite o nome das variveis que esto sendo omitidas, tal
como mostrado na figura 6.16.
134 Captulo 6. Regresso Simples

Figura 6.16: Variveis Omitidas - px_sa e pm_sa

Note que no mostrado o resultado para o teste t. Isso ocorre pois estamos testando mais
de uma varivel. Tanto pelo teste F quanto pelo LR rejeitamos a hiptese nula de que inserir as
variveis no estatisticamente significativo para o modelo. Ou seja, a incluso dessas variveis no
nosso modelo deve resultar em melhora nas estimativas. Nesse caso, o teste F dado a partir de:
(36438.21323656.802)
2
Fstat = 23656.802
= 49.436
(1874)

E o teste LR dado por:

LR = 2(758.298 (717.909)) = 80.777

Programao 6.1.4 Podemos fazer o teste LR para variveis omitidas a partir da programao.
Nesse caso, de acordo com o nosso exemplo, especifique a equao restrita, que tem apenas uma
varivel independente e a no-restrita, com duas variveis independentes. Aps estimar, calcule
o teste usando o comando do log da verossimilhana.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c equao restrita
equation eq4.ls qx_sa yw_sa px_sa c equao no-restrita
matrix(1,2) testeomitida cria uma matriz com 1 linha e 2 colunas
testeomitida(1,1)=-2*(eq1.@logl)+2*(eq4.@logl)
testeomitida(1,2)=@chisq(testeomitida(1,1),1)
o nmero de graus de liberdade no teste quiquadrado igual ao nmero de restries, variveis
omitidas.

6.1.8 Variveis Redundantes


Um teste complementar ao teste de variveis omitidas seria verificar se um conjunto de variveis
do modelo poderia ser excludo sem prejuzo. Esse o tipo de investigao que s faz sentido em
modelos de regresso mltipla, onde o mtodo de estimao foi mnimos quadrados, TSLS, binrio
do tipo logit e demais que possuem varivel dependente do tipo ordenada. Outro ponto importante
para fazer esse teste que ele s funciona se quando for estimar a equao utilizar variveis em
lista. Vamos exemplificar esse teste usando um modelo completo, especificado em lista, como na
figura 6.17a.
6.1 Diagnstico Dos Coeficientes 135

(b) Resultados

(a) Especificao em Lista

Figura 6.17: Variveis Redundantes - Regresso eq2

Note que primeiro escreve-se a varivel dependente, seguida das demais independentes e, se
for o caso, a constante. A figura 6.17b mostra os resultados dessa regresso. Nomeie-a como
eq2. A seguir v em View/Coefficient Diagnostics/Redundant Variables Test... e especifique as
variveis que quer investigar se podem ser excludas do modelo. No nosso exemplo vamos escolher
pm_sa e qm_sa, como mostrado na figura 6.18a. Os resultados dos testes aparecem como mostrado
na figura 6.18b.

(a) Excluso de pm_sa e qm_sa


(b) Resultados

Figura 6.18: Variveis Redundantes

Na parte inferior do resultado aparece a regresso sem os dois parmetros de restrio que
estamos testando. Veja que, da mesma forma do teste de variveis omitidas, sa fornecido os
resultados par o teste LR e F. Seus valores so calculados como anteriormente, dispensando
apresentao. Esse resultado tambm pode ser obtido usando o comandoeq2 .testdrop pm_sa
qm_sa .

6.1.9 Teste Factor Breakpoint


Esse teste uma forma de encontra uma possvel mudana estrutural na equao. A maneira de fazer
isso estimar a equao em diferentes subperodos da amostra e depois comparar os respectivos
136 Captulo 6. Regresso Simples

modelos via soma dos resduos ao quadrado em um tpico teste F. Fizemos isso anteriormente ao
comparar o SSE de um modelo restrito com outro no restrito.
Alm do teste F tambm reportado o teste LR. Onde a hiptese nula de ausncia de quebra
estrutural e tem distribuio X2 com (m 1)k graus de liberdade. Aqui k o nmero de parmetros
na equao e m o nmero de subamostras. Por fim tem o teste de Wald, onde a hiptese nula
de ausncia de mudana estrutural. Esse um teste que, para ser feito, tem que ter uma varivel
dummy especificando as datas em que possivelmente tenha ocorrido uma quebra estrutural. At
esse momento o leitor no foi apresentado ao conceito de quebra estrutural nem variveis dummy.
Uma varivel dummy uma varivel indicador, que assume valores 0(zero) e 1(um). uma tpica
varivel categrica, e que veremos sua aplicao em vrias reas da econometria, como modelos
probit, logit, em quebra estrutural e etc. Vamos criar uma variveldummy no nosso banco de dado
que separe dois intervalos de tempo. Nesse caso, o objetivo testar se os anos eleitorais no Brasil
resultaram em problemas para o nosso modelo. O box de programao 6.1.5 mostra como criar
essa dummy.

Programao 6.1.5 Para criar uma varivel dummy podemos usar vrios recursos; digitar
os valores diretamente no EViews
R
; criar a srie no Excel e copiar para o EViews
R
; usar
programao. Abaixo mostramos como criar uma dummy de valor 1 para os anos eleitorais e
0(zero) para os demais anos.

series dummy=0
smpl 1998m1 1998m12 2002m1 2002m12 2006m1 2006m12 2010m1 2010m12 2014m1
2014m12
dummy=1
smpl @all

A figura 6.19a mostra como ficou nosso grfico da varivel dummy. Veja que nos anos eleitorais
esta assume o valor 1. Agora vamos ver se esses perodos tm impacto no modelo. Vamos
usar a equao eq1 como base. Abra ela e depois v em View/Coefficient Diagnostics/Factor
Breakpoint Test... e insira a varivel dummy no quadro, como mostrado na 6.19b.

(a) Varivel Dummy

(b) Inserindo Dummy

Figura 6.19: Teste Factor Breakpoint


6.2 Diagnstico Dos Resduos 137

O resultado tal como mostrado na figura 6.20. Nas primeiras linhas esto descritas a varivel
considerada como fator no teste, a hiptese nula e o fato de que estamos testando um impacto em
todos os parmetros do modelo. So fornecidas trs estatsticas, em todas no possvel rejeitar a
hiptese nula de ausncia de quebra estrutural. Sendo assim, no podemos afirma que os ciclos
eleitorais estejam afetando o nosso modelo.

Figura 6.20: Resultados do Teste Factor Breakpoint

6.2 Diagnstico Dos Resduos


Alm do diagnstico dos coeficientes h uma srie de opes para diagnostico dos resduos e que
sero vistas nessa seo. O processo de avaliar os resduos muito importante, pois ali que ficam
caracterizados todos os problemas que possam existir na especificao do modelo. Aps estimar
uma equao de regresso, h uma srie de pressupostos que devem ser investigados como forma
de validar o modelo. Por exemplo, de uma forma geral, ao especificar nosso modelo de regresso
colocamos:
qxt = 1 + 1 ywt + t
E, na verdade, apesar de no ter sido afirmado, estamos supondo que:

t NIID(0, 2 )

Ou seja, estamos supondo que os resduos tm distribuio normal, so independentes e identica-


mente distribudos, tem mdia zero e varincia finita. E esses pressupostos so importantes para
garantir que o modelo tem boa especificao. Assim, esse passo tem como objetivo investigar cada
uma dessas afirmaes. Vamos comear pela mais simples e que menos influncia pode ter nos
resultados, que a distribuio normal dos resduos.

6.2.1 Teste de Normalidade


J vimos anteriormente como podemos testar se uma srie de dados possui distribuio normal.
Agora, queremos saber se os resduos da regresso(eq1) so distribudos normalmente:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

Com a janela da regresso aberta, v em View/Residual Diagnostics/Histogram Normality


test. Ao fazer isso, ser retornado o grfico da distribuio dos resduos bem como diversas estats-
ticas descritivas, como mdia, mediana, desvio-padro, assimetria, curtose e, a mais importante, o
teste de Jarque-Bera. J vimos isso em captulo anterior. Portanto, no h necessidade de explorar
138 Captulo 6. Regresso Simples

os resultados. Pelo resultado reportado, JB=9,140[0,010], rejeitamos a hiptese nula, ou seja, no


podemos afirmar que os resduos possuem distribuio normal 2 .

6.2.2 O teste de Independncia (BDS)


J para o teste de independncia, opo que no est disponvel no diagnsticos dos resduos,
temos que primeiro salvar a srie dos resduos. Esse teste pode ser feito para qualquer srie de
tempo e o objetivo saber se os dados podem ser considerados independentes. Nesse caso, h dois
importantes parmetros para escolher.
O primeiro a distncia entre um par de pontos, denominado de (epsilon). Para uma srie ser
verdadeiramente iid, considerando qualquer par de pontos, a probabilidade de que a distncia entre
esses pontos seja menor ou igual a , ou seja, c1 (), deve ser constante. O segundo parmetro a
dimenso do teste, ou seja, em quantos pares de pontos o mesmo aplicado. Por exemplo, a partir
de uma srie de dados qualquer yt com t=1,2,...T podemos criar vrios pares de mesma distncia:

{yt , ys }, {yt+1 , ys+1 }, ..., {yt+m1 , ys+m1 }

Note que foram criados m pares que possuem cm () probabilidades associadas. Assim, como temos
m pares, ento,
H0 : cm () = cm
1 () = independncia

Ou seja, a probabilidade associada a todos os pares cm () igual ao produto de todas as


probabilidades individuais cm 1 ().Se isso se verificar, ento os dados so independentes. Vamos
aplicar esse teste nos resduos da equao 1:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

Com a eq1 aberta v em Proc/Make Residual Series... e escolha um nome para a srie dos
resduos da equao 1. Abra a srie de resduos e, a seguir, v em View/BDS Independence test.
A seguir, selecione como mostrado na figura 6.21 e clique em OK.

Figura 6.21: Teste BDS

Dentre as opes de escolha de , que ir determinar a distncia para os pontos, recomenda-se


Fraction of pairs, que tem menos influncia da distribuio dos dados. As demais opes so
variaes para a definio do valor de . Ao especificar a dimenso mxima em 6, o teste aplicado
para cada valor de m=2,...,m=6. O terceiro conjunto de opo para o clculo das probabilidades do
teste. Essa pode ser utilizada em sries de dados pequenos que no possuem uma distribuio muito
bem definida. Nesse caso, a distribuio do teste BDS seria diferente da curva normal. A parte de
resultados que interessa analisar a mostrada na figura 6.21. Note que pelo p-valor, rejeitamos
2 Lembre-se que a hiptese nula nesse caso de distribuio normal.
6.2 Diagnstico Dos Resduos 139

a hiptese nula de independncia, ou seja, os resduos no so independentes. O teste pode ser


apresentado da seguinte forma:
BDSm=2 = 0, 101[0, 000]
e assim sucessivamente at o valor de m = 6.

6.2.3 Correlograma Q-stat


Para entender o teste de Ljung-Box, necessrio compreender o que o clculo da autocorrelao
representa para uma srie de tempo. Conhecemos a correlao que existe entre duas variveis. A
ideia a mesma para o caso da autocorrelao. Nesse caso, queremos justamente medir o grau de
relao que existe entre a informao no tempo t, para uma varivel y e a informao no tempo k,
para a mesma varivel. Isso feito no EViews
R
a partir de:
T
t=k+1 (yt y)(y
tk y)

tk = T 2
t=1 (yt y)

Onde k justamente o lag entre as duas informaes, e y a mdia da srie. Vejamos o exemplo
dos resduos da equao de regresso:
qxt = 18.389 + 0.647ywt + t
(6.616) (0.063)

Esses possuem mdia zero e, considerando k=1 temos:


187
t=2 (yt yt1 ) y2 y1 + y3 y2 + ...y187 y186
t1 = 187
= = 0.825
t=1 (yt )2 y21 + y22 + ... + y2187
O mesmo pode ser feito para a autocorrelao de ordem k que se desejar. Com isso, construmos
a funo de autocorrelao, que ir mostrar como essa se comporta ao longo do tempo. O passo
seguinte seria testar se essa autocorrelao estatisticamente significativa. Nesse caso, recorremos
ao teste de Ljung-Box, que tem a seguinte forma:
k t 2j
Q = T (T + 2)
j=1 (T j)

onde T o nmero de observaes, k o lag mximo para o teste e t j a autocorrelao de ordem j.


A hiptese nula para o teste ausncia de autocorrelao at o lag k e o mesmo possui distribuio
qui-quadrado com os graus de liberdade dados pelo nmero de autocorrelaes que se est medindo.
Para operacionalizar esse teste, aps rodar uma regresso v em View/Residual Diagnos-
tic/Correlogram - Q-statistics.... A seguir, escolha o nmero de lags e clique em OK, conforme
figura 6.22. Um ponto importante para lembrar que o teste pode ser sensvel ao nmero de lags
que escolhido.

Figura 6.22: Teste de Ljung-Box


140 Captulo 6. Regresso Simples

Para o nosso exemplo, o teste de Ljung-Box para 36 lags sinaliza que, pelo menos at o lag
7 no possvel aceitar a hiptese nula de ausncia de autocorrelao nos resduos. Ou seja, h
evidncia de autocorrelao. Podemos usar a frmula acima para encontrar o valor do teste Q onde
T=187 e a autocorrelao de ordem 1 t1 = 0.825:
1
0.8252
Q = 187(187 + 2) = 129.270
j=1 (187 1)

A forma de apresentar os resultados tal como:


Q( 1) = 129, 270[0, 000]

6.2.4 Correlograma dos Resduos ao Quadrado


O correlograma pode ser usado para identificar a presena ou no de heteroscedasticidade nos
dados. Nesse caso, ao invs de calcular a funo de autocorrelao considerando os resduos, como
no teste Q anterior, a mesma feita com base nos resduos ao quadrado. Sendo assim, primeiro
calculada a funo de autocorrelao para cada lag e, a seguir, aplicado o teste Q. Sua forma de
avaliao tal como anteriormente.

Figura 6.23: Correlograma dos Resduos ao Quadrado

Fazendo esse teste para os resduos ao quadrado da equao 1, figura 6.23, podemos ver que
no possvel aceitar a hiptese nula de ausncia de autocorrelao nos resduos ao quadrado,
sinalizando que os mesmos podem ter heteroscedasticidade.

6.2.5 Teste de Autocorrelao LM


Esse teste feito com base na hiptese nula de ausncia de autocorrelao at o lag especifi-
cado. Aps ter estimado a equao de regresso, como fizemos anteriormente no teste Q, v em
View/Residual Diagnostics/Serial Correlation LM Test.... A seguir escolha o lag mximo que
gostaria de testar, no nosso exemplo colocamos 2, e clique em OK. O que o EViews R
faz pegar
a srie de resduos da primeira regresso e fazer uma nova regresso entre esses resduos, seus
valores passados e tambm a varivel independente. A figura 6.24 reporta o resultado do teste.

Programao 6.2.1 O teste LM tem distribuio qui-quadrado e com graus de liberdade de


acordo com o nmero de lags avaliados sob a hiptese nula. Para encontrar o respectivo p-valor
do teste no EViews
R
, clique em Window e depois selecione Command.... A seguir, escreva o
comando abaixo para encontrar o p-valor.

scalar testef
testef=@chisq(142.223,2)
6.2 Diagnstico Dos Resduos 141

Figura 6.24: Teste LM para Autocorrelao

Dica: lembre de executar uma linha por vez, quando utilizar a janela de comandos.

Note que h duas estatsticas mos-


tradas. O teste F no tem uma distri-
buio amostral finita conhecida sob
a hiptese nula, mas, mesmo assim,
mostrado seu resultado. A seguir,
tem a segunda estatstica, que possui
uma distribuio qui-quadrado, sendo
mais recomendada para avaliao do
teste de autocorrelao. Para enten-
der como foi feito o teste basta olhar
no final dos resultados a estimativa de
uma equao para os resduos, figura
6.25.
Como pode ser visto pelos resul-
tados acima, para ambas as estats-
ticas rejeitam-se a hiptese nula de
ausncia de autocorrelao nos res-
duos. Esse teste pode ser apresentado Figura 6.25: Teste LM - Regresso dos Resduos
da seguinte forma:

LM(2) = 142, 223[0, 000]

Programao 6.2.2 Para fazer o teste LM de autocorrelao, rodamos a regresso e salvamos a


srie dos resduos. A seguir, fazemos uma regresso desses resduos com a varivel independente
e o resduo com 1 defasagem. Por fim, usado um teste quiquadrado com 1 grau de liberdade no
valor de T R2 da regresso dos resduos.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.makeresid resid1
equation autocor.ls resid1 yw_sa c resid1(-1)
matrix(1,2) testelm
testelm(1,1)=autocor.@regobs*@r2
testelm(1,2)=@chisq(testelm(1,1),1)
142 Captulo 6. Regresso Simples

Figura 6.26: Teste de Heteroscedasticidade Breusch-Pagan-Godfrey

Alternativamente, podemos fazer um loop para que sejam testados vrios lags no teste LM e
armazenar os resultados em uma tabela:
smpl 2000M1 2015M7
table(11,2) teste_lm
teste_lm(1,1)="valor do teste"
teste_lm(1,2)="p-valor"
equation eq1.ls qx_sa yw_sa c
eq1.makeresid resid1
for !i=1 to 10
equation eq10.ls resid1 yw_sa c resid1(-1 to -!i)
teste_lm(!i+1,1)=eq10.@regobs*@r2
teste_lm(!i+1,2)=@chisq(eq10.@regobs*@r2,!i)
next

6.2.6 Testes de Heteroscedasticidade


Na literatura da rea h vrios testes de heteroscedasticidade que podem ser aplicado a uma srie
de templo. O EViews R
apresenta algumas opes que discutiremos a seguir e que so aplicados
srie dos resduos da nossa equao.

Breusch-Pagan-Godfrey
Esse teste feito a partir de uma regresso auxiliar dos resduos ao quadrado relativamente a todas
as variveis independentes. Nesse caso, suponha que se tenha feito a seguinte regresso:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

E que se pretende investigar a existncia de heteroscedasticidade nos resduos. Nesse caso,


podemos fazer a regresso:
t2 = c(1) + c(2)ywt
E testar a hiptese nula de ausncia de heteroscedasticidade a partir de 3 diferentes estatsticas
propostas pelo EViews R
. Portanto, aps feita a regresso, podemos ir em View/Residual Diagnos-
tics/Heteroskedastic Tests... e selecionar o teste de Breusch-Pagan-Godfrey, tal como mostrado
na figura 6.26. O primeiro teste mostrado um teste F. Esse ir testar se todos os coeficientes da
equao so estatisticamente iguais a zero. Note que seu valor igual ao teste F mostrado ao fim
da regresso. Pelo p-valor de 0,190 podemos dizer que no possvel rejeitar a hiptese nula de
ausncia de heteroscedasticidade a pelo menos 18% de significncia.
6.2 Diagnstico Dos Resduos 143

O segundo teste dado pela multiplicao do nmero de observaes e o R2 da regresso. No


nosso exemplo:
Obs R2 = 187 0, 0092 = 1, 725
O mesmo tem distribuio X 2 e, pelo resultado, no possvel rejeitar a hiptese nula a, por
exemplo, 18% de significncia.

Programao 6.2.3 Os testes de heteroscedasticidade so aplicados aps ter rodado uma re-
gresso. Dessa forma, s solicitado aps a equao de regresso ter sido especificada. Para
aplicar um teste eq1 usamos a funo abaixo.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.hettest(type=BPG) @regs

Utilizando essa funo, aberta uma janela com o resultado. Alternativamente, podemos
aplicar o teste BPG por uma equao de regresso. Note que construmos o teste a partir da
regresso original, fazendo a srie dos resduos e aplicando uma nova regresso de nome bpg.
A seguir, armazenamos a estimativa do teste no escalar bpgtest e, depois, o p-valor no escalar
quiteste.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.makeresid res1
equation bpg.ls res1^2 yw_sa c
scalar bpgtest=bpg.@r2*@regobs
scalar quiteste=@chisq(bpgtest,bpg.@ncoef-1)

Agora que sabemos como fazer o teste para uma nica equao, podemos inserir o mesmo
no loop de 100 regresses que usamos anteriormente. Note que, nesse caso, no usamos mais
o termo scalar e, sim, criamos a matriz que ir armazenar os resultados dos vrios testes de
heteroscedasticidade heterosc. Nesse caso, na primeira coluna esto os vrios resultados para
o valor do teste e, na segunda coluna, o p-valor do mesmo, seguindo um teste qui-quadrado.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
matrix(100,3) coef
coef(100,2)=eq1.@coefs(1)
coef(100,1)=eq1.@coefs(1)-1.975*eq1.@stderrs(1)
coef(100,3)=eq1.@coefs(1)+1.975*eq1.@stderrs(1)
matrix(100,2) heterosc
eq1.makeresid res1
equation bpg.ls res1^2 yw_sa c
heterosc(100,1)=bpg.@r2*@regobs
heterosc(100,2)=@chisq(bpg.@r2*@regobs,bpg.@ncoef-1)
for !i=1 to 99
smpl 2000M1+!i 2004M12+!i
equation eq2.ls qx_sa yw_sa c
144 Captulo 6. Regresso Simples

Figura 6.27: Teste de Heteroscedasticidade - Harvey

coef(!i,2)=eq2.@coefs(1)
coef(!i,1)=eq2.@coefs(1)-1.975*eq2.@stderrs(1)
coef(!i,3)=eq2.@coefs(1)+1.975*eq2.@stderrs(1)
eq2.makeresid res2
equation bpg.ls res2^2 yw_sa c
heterosc(!i,1)=bpg.@r2*@regobs
heterosc(!i,2)=@chisq(bpg.@r2*@regobs,bpg.@ncoef-1)
next
smpl @all

Harvey
Para fazer esse teste primeiro rodamos a regresso normal, tal como mostrado abaixo:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

A seguir, salvamos os resduos e fazemos uma regresso no qual, diferentemente do teste de


Breusch-Pagan-Godfrey, no teste de Harvey usamos o logaritmo, tal como mostrado a seguir:

logt2 = c(1) + c(2)ywt


Tal regresso ir produzir um R2 e, com isso, podemos construir a estatstica do teste a partir de
T R2 . Outra estatstica fornecida a F-statistics, que ir testar se todos os coeficientes da regresso
dos resduos so estatisticamente iguais a zero, como apresentado na figura 6.27.

Programao 6.2.4 Para fazer o teste de Harvey usamos o mesmo comando de antes, hettest
mas, modificamos o tipo para harvey.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.hettest(type=harvey) @regs

Como a diferena entre o mtodo de Harvey e o de BPG est apenas no fato de que aquele usa
logt2 , podemos usar a mesma sequencia de comandos de antes e modificar apenas a estimativa
de regresso do teste, como mostrado abaixo.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.makeresid res1
equation harvey.ls @log(res1^2) yw_sa c
scalar harveytest=harvey.@r2*@regobs
scalar quiteste=@chisq(harveytest,harvey.@ncoef-1)
smpl @all
6.2 Diagnstico Dos Resduos 145

Glejser
Para fazer esse teste primeiro rodamos a regresso normal, tal como mostrado abaixo:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

A seguir, salvamos os resduos e fazemos uma regresso no qual, diferentemente do teste de


Harvey, utilizamos os resduos em mdulo, tal como mostrado a seguir:

|t | = c(1) + c(2)ywt

A figura 6.28 mostra os resultados para esse teste. Na primeira linha est o teste F, que testa se
todos os coeficientes da regresso dos resduos so iguais a zero. A seguir est o teste que considera
T R2 , tal como feito anteriormente nos dois outros testes.

Figura 6.28: Teste de Heteroscedasticidade - Glejser

Programao 6.2.5 O teste de Glejser pode ser feito modificando no comando hettest o tipo
para glejser.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.hettest(type=glejser) @regs

Nesse teste, usamos o valor absoluto dos resduos, e no os resduos ao quadrado. E isso pode
facilmente ser modificado no nosso comando usando @abs, tal como mostrado a seguir.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.makeresid res1
equation glejser.ls @abs(res1) yw_sa c
scalar glejsertest=glejser.@r2*@regobs
scalar quiteste=@chisq(glejsertest,glejser.@ncoef-1)
smpl @all

ARCH
Sem dvida esse um dos testes mais recomendados para identificar a presena de heteroscedasti-
cidade nos resduos de uma regresso. Partindo do nosso modelo de regresso:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

Salvamos os resduos e fazemos uma nova regresso no qual, diferentemente dos testes anterio-
res, tambm usamos os resduos ao quadrado em defasagens como varivel explicativa, tal como
mostrado a seguir:
146 Captulo 6. Regresso Simples

Figura 6.29: Teste de Heteroscedasticidade - ARCH

t2 = c(1) + c(2)t1
2

So mostrados dois testes, o F-statistic e o T R2 . Em ambos podemos ver que no possvel


aceitar a hiptese nula de homoscedasticidade. Um ponto interessante desse modelo que ele difere
do encontrado anteriormente pelos outros testes de heteroscedasticidade. Porm, devido ao poder
do teste recomendamos que o leitor considere fortemente o teste ARCH como o mais importante.

Programao 6.2.6 Para fazer o teste ARCH via programao, modificamos no comando
hettest o tipo de teste para arch. Porm, nesse caso, devemos especificar quantos lags sero
utilizados para o teste. Como exemplo, usamos uma defasagem para os resduos ao quadrado,
como mostrado a seguir:

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.hettest(type=arch, lags=1) @regs

Esse teste tambm pode ser construdo no EViews R


a partir dos comandos mostrados a seguir.
Primeiro feita a estimativa do modelo inicial e os resduos so salvos. A seguir, como queremos
apenas 1 lag, fazemos uma regresso dos resduos ao quadrado tendo como varivel independente
a dependente com 1 defasagem. Por fim, aplicamos a estatstica qui-quadrado.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.makeresid res1
equation arch.ls res1^2 c res1^2(-1)
scalar archtest=arch.@r2*@regobs
scalar quiteste=@chisq(archtest,1)
smpl @all

Programao 6.2.7 O loop a seguir faz 100 regresses acrescentando, a cada passo, um novo
ms na amostra. A seguir, faz os quatro testes de heteroscedasticidade apresentados, BPG,
Glejser, Harvey e ARCH, e salva o p-valor em uma matriz com 100 linhas e quatro colunas.
Esse exerccio ir permitir avaliar, para qual sequncia de dados, possvel aceitar ou rejeitar a
hiptese nula de ausncia de heteroscedasticidade.
6.3 Diagnstico De Estabilidade 147

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
matrix(100,4) testeh
for !i=1 to 100
smpl 2000M1+!i 2004M12+!i
equation eq3.ls qx_sa yw_sa c
eq3.makeresid res3
equation bpg.ls res3^2 yw_sa c
testeh(!i,1)=@chisq(bpg.@r2*@regobs,bpg.@ncoef-1)
equation harvey.ls @log(res3^2) yw_sa c
testeh(!i,2)=@chisq(harvey.@r2*@regobs,harvey.@ncoef-1)
equation glejser.ls @abs(res3) yw_sa c
testeh(!i,3)=@chisq(glejser.@r2*@regobs,glejser.@ncoef-1)
equation harch.ls res3^2 c ar(1)
testeh(!i,4)=@chisq(harch.@r2*@regobs,1)
next
smpl @all

6.3 Diagnstico De Estabilidade


Avaliamos anteriormente diversas caractersticas dos resduos que so importantes para sinalizar a
eficcia do modelo formulado. Essas so investigaes consideradas padro, como a normalidade
nos resduos, a autocorrelao, a independncia e a heteroscedasticidade. Porm, alguns desses
resultados podem estar sendo influenciados pela presena de quebra estrutural e que pode se
manifestar de vrias formas, na mdia, nos parmetros ou na tendncia. Em sntese, os coeficientes
podem no ser estveis ao longo do tempo, e isso resulta em problemas de formulao. A seguir
apresentamos alguns testes disponveis noEViews R
parar lidar com a estabilidade nos parmetros.

6.3.1 Teste de Chow


Esse um dos testes mais antigos e simples para identificar a existncia ou no de quebra estrutural.
Aqui a proposta , a partir da especificao de uma data na amostra de dados, dividir o mesmo
em 2 partes, rodar trs regresses e comparar os resultados. A primeira regresso, denominada de
modelo no-restrito, feita para todo o conjunto de dados. A segunda, considerada modelo restrito,
estima uma regresso entre a data inicial e a data especificada como de mudana estrutural. E, por
fim, a terceira regresso feita entre essa data especificada e o fim do perodo amostral. Assim,
suponha que se tenha feito a seguinte regresso:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

E que se quer verificar se ocorreu uma mudana estrutural em 2008M1, tanto na constante
quanto no coeficiente de inclinao. Nesse caso, especificamos essa data e o EViews
R
ir rodar
duas regresses da forma:

qxt = c(1) + c(2)ywt + t (entre 2000M1 e 2007M12)

qxt = c(3) + c(4)ywt + t (entre 2008M1 e 2015M7)

Onde a primeira usa os dados entre a data inicial e 2007M12 e, a segunda entre 2008M1 e a data
final. Note que a data escolhida utilizada na segunda regresso. A seguir, feito um teste F para
148 Captulo 6. Regresso Simples

Figura 6.30: Teste de Chow

comparar os dois modelos com a estimativa para todo o perodo amostral. Esse teste utiliza a soma
ao quadrado dos resduos (SSR) de cada uma das trs regresses.
(SSR(SSR1 +SSR2 ))
k
Fstat = (SSR1 +SSR2 )
(T 2k)

Onde SSR a soma ao quadrado dos resduos da regresso que usa todo o conjunto de dados. SSR1
a soma dos resduos ao quadrado para a regresso do perodo pre mudana estrutural e SSR2 a
soma dos resduos ao quadrado da segunda regresso, que usa o perodo pos quebra estrutural. Por
fim, T o nmero de dados e k o nmero de parmetros da regresso. A hiptese nula de que as
duas subamostras so iguais, ou seja, no tem mudana estrutural. Um ponto importante nesse teste
que, caso no seja especificado, o EViews R
ir testar a instabilidade em todos os parmetros.
Vejamos como isso pode ser feito no EViews R
. Aps estimar a equao de regresso para todo
o perodo amostral, v em View/Stability Diagnostics/Chow Breakpoint Test.... Na janela que
vai abrir, escreva a data de mudana estrutural que, para o nosso exemplo, 2008M1 (janeiro de
2008). Abaixo esto os parmetros que se quer testar a mudana estrutural, tanto para a constante
quanto para a elasticidade-renda. Nesse nosso exemplo vamos testar uma mudana estrutural na
constante e elasticidade-renda. Na janela de resultados, figura 6.30, primeiro especificada a data
de quebra estrutural, a seguir a hiptese nula e os parmetros onde ocorreram a mudana. Por fim,
a amostra de dados utilizada.
Para encontrar a estatstica F, vamos especificar cada uma das 3 regresses. Para a que contempla
todo o conjunto amostral, temos que SSR = 36438.213. J na regresso que vai de 2000M1 at
2007M12, encontra-se SSR1 = 2816.406 e, para a da segunda parte de dados, SSR2 = 8719.257. O
conjunto amostral T=187 e o nmero de parmetros k=2. Portanto, a estatstica F :
(36438.213(2816.406+8719.257))
2
Fstat = (2816.406+8719.257)
= 197.525
(1874)

A estatstica F, os testes de razo de verossimilhana e Wald trabalham sob a hiptese nula de


no existncia de mudana estrutural para toda a amostra. Esses dois ltimos possuem distribuio
X 2 com mkv graus de liberdade, onde m a quantidade de quebras e kv os nmero de parmetros
testados na mudana estrutural. Para o nosso exemplo, figura 6.30, baseado nos trs testes rejeitamos
a hiptese nula, ao nvel de confiana de 99% e, portanto, a data escolhida 2008M1, pode ser
considerada como de quebra estrutural do modelo especificado.
6.3 Diagnstico De Estabilidade 149

Programao 6.3.1 O teste de Chow tem distribuio qui-quadrado para o teste LR e de Wald,
considerando como graus de liberdade q = mkv . Por isso utilizamos o comando @chisq(valor
do teste, graus de liberdade) . Para o teste F, a distribuio a F. Logo, seu p-valor
dado por 1-@cfdist(F-stat,q,T-(q+k)), onde F-stat o valor do teste F, q = mkv o
nmero de restries sob a hiptese nula e T (q + k) o nmero de observaes menos as
restries e os parametros da regresso original.
Assim, para encontrar o respectivo p-valor dos testes no EViews R
, clique em Window e
depois selecione Command.... A seguir, escreva os comandos abaixo e execute um de cada vez.

scalar testeF=1-@cfdist(197.525,2,183)
scalar testeLR=@chisq(215.082,2)
scalar testeWald=@chisq(395.050,2)

Programao 6.3.2 Para aplicar o teste de Chow, primeiro especificamos a regresso e, a


seguir, o teste colocando a data que queremos testar para ver se ocorreu uma mudana estrutural.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.chow 2008M1

Um aspecto ruim do teste de Chow que devemos especificar a data da quebra estrutural, o
que dificulta encontrar o ponto ideal da quebra. Uma forma de contornar isso usar um loop.
No exemplo abaixo, comeamos com a primeira data de quebra em 2008M1 e, a seguir, so
rodadas 50 regresses. Note que, a cada momento, aps escolher as datas de quebra, so feitas
duas regresses restritas, uma para a primeira parte e outra para a parte final. A seguir, feito os
testes F e de Wald, calculados os p-valores e armazenados os resultados em uma tabela chamada
chowresult.

smpl 2000M1 2015M7


equation eq5.ls qx_sa yw_sa c
scalar chowfteste
scalar chowfpvalor
scalar chowwaldteste
scalar chowwaldpvalor
table chowresult
chowresult(1,1)="Data de Mudana Estrutural"
chowresult(1,2)="Estatstica F"
chowresult(1,3)="Prob"
chowresult(1,4)="Teste de Wald"
chowresult(1,5)="Prob"
for !i=1 to 50
smpl 2000M1 2007M11+!i
equation eq6.ls qx_sa yw_sa c
smpl 2007M12+!i 2015M7
equation eq7.ls qx_sa yw_sa c
chowfteste=((eq5.@ssr-eq6.@ssr-eq7.@ssr)/(eq5.@ncoef))/((eq6.@ssr
+eq7.@ssr)/(eq5.@regobs-2*eq5.@ncoef))
chowfpvalor=1-@cfdist(chowfteste,2,eq5.@regobs-eq5.@ncoef-eq6.@ncoef)
150 Captulo 6. Regresso Simples

chowwaldteste=(@transpose(@identity(eq5.@ncoef)*(eq6.@coefs- eq7.@coefs
))*@inverse(eq6.@cov/(eq6.@se)^2+eq7.@cov/(eq7.@se)^2)*@identity
(eq5.@ncoef)*(eq6.@coefs-eq7.@coefs))*((eq5.@regobs-2*eq5.@ncoef)
/(eq6.@ssr+eq7.@ssr))
chowwaldpvalor=@chisq(chowwaldteste,eq5.@ncoef)
chowresult(!i+1,1)=@otods(1)
chowresult(!i+1,2)= chowfteste
chowresult(!i+1,3)=chowfpvalor
chowresult(!i+1,4)=chowwaldteste
chowresult(!i+1,5)=chowwaldpvalor
next
smpl @all

O teste de Chow tambm pode ser especificado de forma a identificar a presena de quebra
estrutural apenas em um dos parmetros ou em parte. Com a equao aberta, v em View/Stability
Diagnostics/Chow Breakpoint Test... e a seguir, para testar mudanas na constante especifica-se
a data e depois deixa escrito apenas c na parte de baixo da janela.

Programao 6.3.3 Para especificar em quais parmetros queremos aplicar o teste de Chow,
adicionamos ao comando chow, depois declarao da data de mudana estrutural, a instruo @
seguido do nome das variveis.

eq1.chow 2008M1 @ yw_sa


O EViews
R
tambm permite testarmos mais de uma quebra estrutural com o teste de Chow.

eq1.chow 2008M1 2010M7 @ yw_sa c

6.3.2 Teste de Quandt-Andrews


O teste de Chow muito simples e de difcil soluo prtica, uma vez que devemos testar vrias
datas e formatos para ter certeza de onde veio a instabilidade e em que parmetro. Uma evoluo
natural seria permitir que fossem feitos diversos testes ao mesmo tempo em uma sequncia e, ao
final, escolher a data apropriada. Essa justamente a proposta do teste de Quandt-Andrews.
Esse teste pode ser aplicado para identificar mais de uma data de quebra estrutural, usando
como base a ideia do teste de Chow. Nesse caso, o mesmo aplicado a cada informao entre a
data de incio e final do conjunto de dados. A hiptese nula de ausncia de quebra estrutural, e
pode ser feito para toda a equao, considerando todos os parmetros ao mesmo tempo ou, ento,
para o caso de uma equao linear, para cada um dos parmetros de forma isolada.
Uma diferena importante entre esse teste e do de Chow que aqui especificamos o trimming
ou seja, o percentual de dados que so isolados do teste e no so utilizados. No eviews, como
default, fornecido o valor 15. Se escolher esse ento, na verdade, estamos retirando 15% dos
dados, 7,5% do incio da amostra e 7,5% do final, e o teste feito com o restante dos dados entre
dois pontos 1 e 2.
Como pode ser visto na figura 6.31, tambm escolhemos qual parmetro ser utilizado para o
teste. No exemplo abaixo, aplicamos o mesmo para os dois parmetros da nossa regresso simples,
o da elasticidade-renda e a constante. Por fim, como opcional, especificamos um nome para a srie
dos testes, tanto para o LR quanto para o teste de Wald. O que acontece com esse teste que, como
o mesmo aplicado a cada uma das datas entre 1 e 2, ento, iremos produzir uma estatstica LR
e Wald para cada uma dessas datas. Com isso, estaremos formando uma srie com o resultado do
teste. A estatstica LR, com distribuio F, compara um modelo restrito com um no restrito e, aps
6.3 Diagnstico De Estabilidade 151

Figura 6.31: Teste de Quebra Estrutural de Quandt-Andrews

Figura 6.32: Resultados dos Testes LR e Wald

ter todos os resultados, a data da quebra escolhida a partir do valor mximo do teste, como em:

MaxF = max (F())


12

Pelos resultados do teste de Quandt-Andrews, aplicado ao modelo de regresso simples:

qxt = 18.389 + 0.647ywt + t


(6.616) (0.063)

podemos ver que rejeitamos a hiptese nula de ausncia de quebra estrutural. Nesse caso, h uma
mudana estrutural e essa especificamente em agosto de 2008.
As duas estatsticas so mostradas no grfico 6.32. Note que ambas revelam que o valor mximo
para o teste, tanto o LR quanto Wald, em agosto de 2008. Com a escolha de um trimming de 15%
foram eliminados 29 dados do incio e outros 28 do final da srie, restando 130 datas para serem
testadas.
152 Captulo 6. Regresso Simples

Figura 6.33: Teste de Previso de Chow Quebra Estrutural

Programao 6.3.4 Para fazer o teste de Quandt-Andrews, usamos a funo ubreak e que pode
ser aplicada a qualquer equao. No exemplo abaixo, aplicamos a mesma regresso simples.
Uma opo interessante pedir a srie dos testes de wald e de LR, usados para selecionar o
ponto de quebra estrutural. O nmero aps a funo se refere ao tamanho da parte da amostra
que retirada do teste. No caso de 15, estamos escolhendo 15% dos dados.

smpl 2000M1 2015M7


equation eq1.ls qx_sa yw_sa c
eq1.ubreak(wfname=testewald,lfname=testelr) 15

6.3.3 Teste de Previso de Chow


Aqui feita duas regresses, uma para todo o conjunto de dados e outra apenas com os dados que
vo at a data anterior da quebra estrutural. So reportadas duas estatsticas, a primeira o teste F,
que dado por:
(SSRSSR1 )
T2
Fstat = SSR1
(T1 k)

Onde SSR a soma dos resduos ao quadrado da regresso completa, SSR1 a soma dos resduos
ao quadrado da regresso com dados que vo at T1 , que o nmero de dados utilizados nesse
perodo. T1 o nmero de dados da segunda parte da regresso e k o nmero de parmetros da
regresso completa. A hiptese nula de ausncia de quebra estrutural.

LR = 2(lrestrito lnaorestrito )

Para fazer esse teste, v em View/Stability Diagnostics/Chow Forecast Test.... Os resultados do


exemplo de um teste de quebra estrutural para a data 2008M8 so mostrados na figura 6.33.
Note que, pelos resultados do teste F, rejeitamos a hiptese nula de ausncia de quebra estrutural,
confirmando o resultado encontrado pelo teste de Quandt-Andrews anterior. A estatstica F pode
ser calculada a partir de:
(36438,2133573,942)
84
Fstat = 3573,942
= 11, 056
(1032)

E, para a estatstica LR usamos:

LR = 2(758, 298 (541, 196)) = 434, 204


6.3 Diagnstico De Estabilidade 153

Figura 6.34: Teste de Ramsey Quebra Estrutural

6.3.4 Teste de Ramsey


Aprendemos anteriormente a testar se os resduos possuem distribuio normal, se h presena de
heteroscedasticidade ou ento autocorrelao. Porm, h outros problemas que podem aparecer na
nossa regresso, como por exemplo, de varivel omitida, de m especificao da forma funcional,
ou a correlao entre a varivel independente e os resduos. Esses aspectos iro resultar que o
estimador de mnimos quadrados viesado e no consistente e, dessa forma, o vetor dos resduos
no ter mdia zero, ver Ramsey(1969).
Assim, o teste feito considerando como hiptese nula que os resduos da equao so
distribudos normalmente, com mdia zero e varincia constante, contra a hiptese alternativa de
que a mdia dos resduos no zero. Na figura 6.34, especificamos que o nmero de termos a
serem considerados no teste 1, ou seja, usamos como varivel adicional o quadrado da varivel
dependente:
qxt = 1 + 1 ywt + qxt2 + t
Assim, temos que o teste considera as seguintes hipteses:
H0 : qxt = 1 + 1 ywt + t
Ha : qxt = 1 + 1 ywt + qxt2 + t
E pode ser visto como um teste de varivel omitida. A figura 6.34 apresenta os resultados para esse
teste. Note que so fornecidas trs estatsticas para o teste e todas apontam para a no aceitao da
hiptese nula. Portanto, a nossa equao possui problema de especificao.

6.3.5 Estimativas Recursivas


As Estimativas Recursivas podem ser acessadas em View/Stability Diagnostics/Recursive Esti-
mates.... Essa seo aplicada de seis formas diferentes, cada uma fornecendo uma informao
especfica.
Recursive Residual
Para esse teste so feitas vrias regresses, a partir do mtodo MQO, mudando apenas o perodo
amostral. A primeira regresso feita com uma quantidade de informaes igual ao nmero de
coeficientes. Considerando a nossa equao bsica, com a quantidade como funo da renda, temos
2 coeficientes, a constante e a elasticidade renda, tal como:
qxt = 1 + 1 ywt + t
154 Captulo 6. Regresso Simples

Figura 6.35: Resultado dos Resduos Recursivos

Note que temos k=2, onde k o nmero de coeficientes. Assim, a primeira regresso feita
considerando os 2 primeiros dados da amostra. O resultado para esses coeficientes utilizado
para prever o valor da varivel dependente no perodo seguinte. Depois calculada a diferena
entre o valor previsto e o verdadeiro valor e dividida pela varincia da previso. Esse resultado
denominado de recursive residual e seu valor armazenado em um vetor.
A seguir, acrescentamos o terceiro dado da amostra e fazemos novamente a regresso, en-
contrando os coeficientes, fazendo a previso para um passo frente, dividindo pela varincia
da previso e encontrando o resduo. Esse resduo armazenado no vetor de resduos. Esse
procedimento continua at que se utilize todo o conjunto amostral, ou seja, as T observaes. Sendo
assim, fazemos um total de T k + 1 regresses e obtemos um total de T k + 1 estimativas para
os resduos. Vejamos como fica esse processo a partir dos dados da equao acima. A primeira
regresso, com apenas os dois primeiros dados, ou seja, usando 2000M1 a 2000M2, produz o
seguinte resultado:
qxt = 640, 656 + 9, 106ywt + t
Se usarmos esses coeficientes para prever o valor de qx para 2000M3, encontramos:

qx2000M3 = 640, 656 + 9, 106 (77, 169) + t = 62, 082

O verdadeiro valor qx2000M3 = 55, 747, gerando um resduo de valor 6,335. A seguir, temos que
calcular a varincia da previso e depois:
6, 335
recursive residual2000M3 = = 2.920
2, 169
Esse procedimento repetido at o fim da amostra, gerando uma sequncia de valores para os
resduos recursivos. O EViews R
retorna o grfico dessa sequncia com o respectivo intervalo de
confiana, conforme apresentado na figura 6.35. Valores que esto fora do intervalo sinalizam
instabilidade nos parmetros da equao. Note que a data entre 2008M8 e 2009M6 est fora do
intervalo de confiana, sinalizando possvel quebra estrutural nesse perodo.
Teste CUSUM
Os resduos recursivos obtidos do teste anterior recursive residual, so usados para produzir o
teste CUSUM, ou seja, esse teste nada mais que a soma cumulativa dos resduos encontrados
no teste anterior. Nesse caso, esse dividido pelo seu respectivo desvio-padro e depois feita
6.3 Diagnstico De Estabilidade 155

Figura 6.36: Teste CUSUM

Figura 6.37: Teste do CUSUM ao Quadrado

a soma desses resduos. Se o valor ficar fora do intervalo crtico de 5% do teste, ento, h uma
sinalizao de instabilidade nos coeficientes da equao. Ao aplicar esse teste nossa equao
acima, encontramos o seguinte resultado, mostrado na figura 6.36. Note que, em 2009M9, o teste
ultrapassa o valor crtico a 5%, sinalizando uma instabilidade no modelo.

Teste do CUSUM ao Quadrado


Da forma como o teste calculado, seria como obter a varincia dos resduos recursivos. Na
verdade deriva do teste CUSUM e do teste recursivo, s que aqui elevamos os resduos ao quadrado
e depois somamos os mesmos. A expectativa do resultado desse teste, sob a hiptese de estabilidade
dos parmetros, que inicie em zero e termine em 1 e que seu resultado fique dentro do intervalo
de 5% de significncia. Aplicando o teste ao nosso modelo, encontramos que h uma instabilidade
entre 2001M12 e 2013M12, figura 6.37.

Teste de Previso One-Step


Esse teste tambm utiliza os resultados dos resduos recursivos, complementando a anlise do
mesmo com o desvio-padro da amostra total. Seu resultado, para o nosso modelo, mostrado
na figura 6.38. Note que h duas informaes. Primeiro, a srie do resduo recursivo mostrada
156 Captulo 6. Regresso Simples

Figura 6.38: Teste de Previso One-Step

Figura 6.39: Teste de Previso N-Step

novamente, com seus valores no eixo direito. Alm desse, tambm mostrado o p-valor do teste, ou
seja, a probabilidade associada rejeio da hiptese de estabilidade dos parmetros. Nos pontos
com valores menores, significa a no aceitao da hiptese nula de estabilidade. Como pode ser
visto, h vrios desses pontos, em especial entre 2007 e 2015

Teste de Previso N-step


Esse teste tambm usa os resultados dos resduos recursivos e equivalente ao teste de Chow, mas,
sem a necessidade de informar cada uma das datas que se queira testar. Ou seja, o teste feito para
vrias datas, e retorna o valor dentro de um intervalo de confiana e com o p-valor. Os resultados
paro o nosso modelo so apresentados na figura 6.39.

Coeficientes Recursivos
Esse teste pode ser utilizado para identificar como o comportamento de cada um dos coeficientes
ao longo do tempo. Para tanto, o mtodo segue a estimativa feita anteriormente, quando foram
obtidos os resduos recursivos para encontrar o valor a cada momento do tempo, adicionando, a
cada passo, uma nova observao.
Para o nosso modelo, o teste foi feito para os dois coeficientes e seus resultados sinalizam
6.3 Diagnstico De Estabilidade 157

(a) Constante (b) Elasticidade Renda

Figura 6.40: Coeficientes Recursivos

instabilidade presente nas informaes adicionadas at meados de 2004, conforme mostrados na


figura 6.40.

6.3.6 Leverage Plots


Esse mtodo grfico fornece a in-
formao sobre a presena de pos-
sveis outliers a partir de vrias re-
gresses e a comparao dos resduos.
Clique em View/Stability Diagnos-
tics/Leverage Plots... que sero mos-
tradas as opes em uma janela. Na
primeira parte, devem ser definidas
as variveis que sero utilizadas na
anlise. No nosso exemplo, sabemos
que a varivel qx_sa dependente e,
especificamos yw_sa e c (constante)
como regressores. A seguir, selecione
a opo para adicionar uma linha de
tendncia e para a informao parcial,
que a mais ilustrativa. Por fim, espe-
cifique um nome para que, ao salvar
as sries de resduos resultantes, se
tenha um nome como complemento.
Nesse exemplo, sero geradas quatro
sries adicionais no workfile. Duas
sries so geradas usando a varivel
dependente. Na primeira, temos a s-
rie de nome qx_sa_p_yw_sa_lv que Figura 6.41: Opes Leverage Plots
representa os resduos da regresso:
qxt = c + t
A segunda dada pela srie de nome qx_sa_p_c_lv, e representa os resduos da regresso:
qxt = ywt + t
A seguir, temos duas outras sries que so geradas a partir do uso das variveis independentes.
Nesse caso, como temos apenas uma independente, teremos duas sries derivadas. A primeira a
158 Captulo 6. Regresso Simples

(a) Constante (b) Yw_sa

Figura 6.42: Leverage Plots

srie de nome c_lv, que representa a srie de resduos da regresso:

ywt = c + t

De acordo com o nosso exemplo, sero gerados dois grficos de disperso. O primeiro, mostrado na
figura 6.42a, representa a relao entre a srie c_lv e qx_sa_p_c_lv. A seguir, o segundo grfico,
figura 6.42b, representa a relao entre a srie yw_sa_lv e qx_sa_p_yw_sa_lv

6.3.7 Estatsticas de Influncia


Uma forma de identificar a presena de outliers atravs das estatsticas de influncia. Uma
informao considerada como um outlier se ela produz um impacto significativo na regresso.
Assim, partindo dessa definio, essa estatstica aplicada ao conjunto de dados para identificar
o quanto que uma nica observao pode modificar o modelo de regresso. So seis diferentes
estatsticas que podem ser utilizadas. V em View/Stability Diagnostics/Influence Statistics.... A
seguir, selecione trs estatsticas, como mostrado na figura 6.43.
Os resultados sero salvos nas respectivas sries IS1, IS2 e IS3 e mostrados em um conjunto de
grficos. Note na figura 6.44 que, para cada uma das estatsticas, h um intervalo de confiana. Os
testes RStudent e COVRATIO apontam 2008M1 como um outlier e, tambm, RStudent junto do
teste DFFITS sinalizam para a existncia de um outlier em 2014M8.

6.4 Previso - Forecast


A partir do momento que temos a estimativa dos parmetros do modelo, podemos fazer previses
para o futuro e, mais do que isso, encontrar um intervalo de confiana para essa previso. De um
modo geral, nosso modelo simples pode ser representado pela equao linear:

qxt = 1 + 1 ywt + t

onde os valores de yw so conhecidos. Lembre-se que os dados so ajustados sazonalmente.


Para cada valor de ywt+n utilizado, podemos encontrar um respectivo valor de qxt+n , o que nos
permitir obter, futuramente, o erro de previso. Sendo assim, podemos modificar essa equao
linear como forma de obter o erro de previso:
6.4 Previso - Forecast 159

Figura 6.43: Opes Estatsticas de Influncia

(a) RStudent (b) DFFITS (c) COVRATIO

Figura 6.44: Teste de Quebra Estrutural Estatstica de Influncia


160 Captulo 6. Regresso Simples

(qx t qxt ) = ( + ywt + t ) qxt


Alm disso, usando o fato 3 de que qxt = 1 + 1 ywt + t podemos substituir o mesmo na equao
acima e obter:
(qx t qxt ) = ( + ywt + t ) ( + ywt )
(qx t qxt ) = ( ) + ( )ywt + t
Esse valor que encontramos corresponde ao valor mdio de erro de previso. Porm, para fazer
inferncia estatstica sobre a previso, devemos conhecer outros resultados, em especial a varincia
do erro de previso. A partir da equao acima, aplicamos o operador V (), que corresponde
varincia, encontramos a varincia do erro de previso:

V (qx t qxt ) = V [( ) + ( )ywt + t ]

V (qx t qxt ) = V ( ) + ywt2V ( ) + 2ywt cov( , ) +V (t )


Usando o fato de que:

2
 
2 1 yw
V ( ) = + T
2
T i=1 yw2 T yw

2
V ( ) =
Ti=1 yw2 T yw
2

yw
cov( , ) = 2
Ti=1 yw2 T yw
2
Ento, temos que a varincia do erro de previso pode ser calculada a partir de:

2 2 2 yw
 
1 yw
V (qx t qxt ) = 2 + T +yw2
t T +2ywt T + 2
2
T i=1 yw2 T yw i=1 yw 2 T
yw 2
i=1 yw 2 T
yw 2

onde 2 a varincia da regresso. Colocando 2 em evidncia, chegamos a uma formulao


mais reduzida da varincia do erro de previso:

2)
 
2 1 (yw yw
V (qx t qxt ) = 1 + + T
T i=1 yw2 T yw 2
Essa equao mostra para cada informao de ywt+n prevista, a varincia dessa previso.
Sendo assim, para qualquer valor de ywt+n que utilizarmos, o correspondente valor de qxt+n ir se
encontrar exatamente na reta de regresso que estimamos. Seria como se estivssemos prolongando
a nossa reta de regresso para poder fazer uma previso dos valores futuros4 .
Mas essa uma estimativa por ponto e, uma vez que estamos diante de incerteza, o que acaba
por incorporar a presena de probabilidade de ocorrncia de um evento e devemos ter cuidado ao
trabalhar com essa informao. Sendo assim, recorremos estimativa de um intervalo para a nossa
previso. E, como vimos anteriormente, para construir esse intervalo, precisamos do clculo da
varincia.
3O leitor deve prestar bastante ateno diferena que existe entre a equao conhecida y = + x e a estimada
y = + x + .
4 Considere que a escolha de um modelo economtrico para fazer previso resulta em um casamento com a relao

entre as variveis independentes e a dependente. Com a vantagem de ser menos burocrtico troc-lo.
6.4 Previso - Forecast 161

Figura 6.45: Fazendo a Previso

A previso da varivel dependente da nossa equao no EViews R


pode ser feita a partir de trs
diferentes formas. Na primeira, com os resultados da equao aberto, clique em Forecast, que
ir aparecer a janela conforme figura 6.45. O que temos que fazer especificar o nome da srie
prevista na parte Forecast name e, caso queira, o desvio-padro da previso, especificado como
S.E.. Esse ir construir um intervalo de previso para os dados. O mais interessante aqui construir
o intervalo com 2 desvios padro em relao mdia. Nesse caso, a informao de S.E deve ser
multiplicada por 2 e depois acrescida e subtrada da srie prevista para se ter o intervalo. No box de
programao a seguir construmos esse intervalo mnimo e mximo.
Os resultados podem ser mostrados tanto em um grfico quanto em uma tabela com estatsticas
de informao que so teis para comparar diferentes modelos. A segunda forma de fazer essa
previso clicar em Proc/Forecast, que ir abrir a mesma janela de previso
Na primeira linha mostrado que a previso feita para a equao de nome eq1 e a srie que est
sendo prevista qx_sa. Uma vez que temos uma equao de regresso simples, apenas algumas
opes em Forecast so abertas. No caso do Method, como no temos varivel dependente
defasada, fazemos uma previso que no dinmica. Podemos mudar o intervalo da previso no
campo denominado de Forecast Sample. Alm disso, podemos mudar, na parte de Output, o que
queremos que seja mostrado, os grficos e os resultados de avaliao dessa previso. Por economia
de espao foi pedido apenas os resultados da previso e no mostramos o grfico na figura 6.45 .
Vamos discutir as estatsticas mostradas nesse clculo e que se referem aos erros de previso.
Em todas as trs primeiras estatsticas quando for comparar diferentes modelos podemos escolher
aquele que tem o menor valor para essas estatsticas.
A primeira delas o RMSE, e que dado a partir de:
s
T +h

t=T t qxt )2
+1 (qx
RMSE =
h
Ou seja, calculamos o erro de previso para cada ponto do intervalo t, elevamos ao quadrado,
somamos todos eles, dividimos pelo nmero de dados utilizados h e, por fim, extramos a raiz.
162 Captulo 6. Regresso Simples

A segunda estatstica o erro mdio absoluto, tambm referido como MAE. Esse dado a
partir de:
T +h

t=T +1 |qx t qxt |
MAE =
h
Nesse caso, para cada erro de previso aplicado o operador mdulo, que transforma valores
negativos em positivos e, a seguir, cada um desses erros absolutos so divididos pelo total de dados.
Por fim, somam-se todos esses erros. A terceira estatstica o erro percentual mdio absoluto,
tambm referido como MAPE, e que dado por:
 
T +h qx t qxt
|
t=T +1 qxt |
MAPE = 100
h
Nesse caso, cada erro de previso dividido pelo valor observado, extrado o valor absoluto e
dividido pelo nmero de dados. Por fim, esses resultados so somados e multiplicados por 100.

Programao 6.4.1 A terceira forma de fazer previso via programa. A primeira linha
determina a equao de regresso de nome eq1. A seguir, especificado o perodo para a
previso. Por fim, feita a previso para a equao e o resultado colocado na srie qx_saf.
Tambm pedido que seja fornecido o S.E., e damos o nome ao mesmo de qx_sase. Por fim,
construmos outras duas sries de dados, uma para especificar o intervalo de previso mnimo,
com 2 desvios-padro e outra srie para o intervalo mximo, tambm com 2 desvios-padro.

equation eq1.ls qx_sa yw_sa c


smpl 2000M1 2015M7
eq1.fit qx_saf qx_sase
series minimo=qx_saf-2*qx_sase
series maximo=qx_saf+2*qx_sase

Por fim, h um bloco de resultados que se refere ao coeficiente de desigualdade de Theil onde
os resultados oscilam entre 0 e 1, sendo que um modelo com resultado 0 considerado como um
que faz a perfeita previso dos dados. A primeira estatstica uma relao do RMSE total com
suas partes, a prevista junto com a observada. Note que no numerador temos o resultado para a
estatstica RMSE que calcula o erro para cada ponto de previso. Por outro lado, no denominador,
essa estatstica quebrada em duas partes. Na primeira, cada valor previsto da varivel dependente
elevado ao quadrado e dividido pelo nmero total de dados. Ao final, esses valores so somados e
extrados a raiz. Na segunda parte do denominador esto os valores observados, onde os mesmos
so elevados ao quadrado, divididos pelo total de dados e, por fim, somados e extrada a raiz.
q T +h
(t=T +1 (qx t qxt )2 )
h
T heil = q T +h q T +h
(t=T +1 (qx t )2 ) (t=T +1 (qxt )2 )
h + h
As trs estatsticas seguintes de previso so propores. A primeira delas, denominada de Bias
Proportion, relaciona duas medidas. No numerador temos a diferena entre o valor previsto mdio
(valor previsto dividido pelo total de dados) e a mdia do valor observado. A seguir, esse valor
T +h
elevado ao quadrado. Note que t=T t /h a mdia do valor previsto. No denominador temos a
+1 qx
estatstica de RMSE sem a extrao da raiz. Essa estatstica mostra o quanto a mdia da previso se
distancia da mdia da srie atual. Ela ir oscilar entre 0 e 1. Se for 0, significa que a mdia dos
valores previstos igual mdia dos valores observados. Por outro lado, se for 1, significa que
a mdia dos valores previstos so bem diferentes dos valores observados. Portanto, quanto mais
prximo de 0 for o valor de bias, melhor o modelo estimado.
6.4 Previso - Forecast 163

 2
T +h qx t
(t=T +1 h )
qx t
bias = T +h
(t=T t qxt )2 )
+1 (qx
h
A segunda estatstica a Variance Proportion, justamente porque relaciona a varincia. Nesse caso,
no numerador temos a diferena entre a varincia da previso com a varincia do valor observado.
A seguir, essa diferena elevada ao quadrado. Essa estatstica mostra o quanto a varincia do erro
de previso se distancia da varincia do erro do valor observado. Quando esse valor for prximo de
0, menor a diferena das varincias entre o valor previsto e observado, ou seja, o modelo melhor
do que aquele que apresenta uma estatstica de variance mais prxima de 1.

(y y )2
variance = T +h
(t=T t qxt )2 )
+1 (qx
h
A terceira estatstica a Covariance Proportion, que considera a estimativa da covarincia entre os
valores previstos e observados. No numerador temos que r a correlao entre o valor previsto e
observado. Essa estatstica mede os erros de previso restante. Quanto melhor for o modelo, menor
deve ser a estatstica bias e variance o que, por sua vez, faz com que a maioria do vis do modelo
esteja concentrado na estatstica de covarincia. Essa estatstica tambm vai de 0 a 1.

2(1 r)y y
covariance = T +h
(t=T t qxt )2 )
+1 (qx
h
Vamos agora juntar os conhecimentos adquiridos com a regresso simples e a estimativa por
alisamento exponencial para produzir uma previso da varivel qx alguns meses frente. No
arquivo regresso simples.wf1 as sries j esto ajustadas sazonalmente e nomeadas com o sufixo
"_sa". A ideia fazer uma regresso simples com todos os dados disponveis. Como no sabemos a
trajetria futura das variveis independentes, usamos o mtodo do alisamento exponencial para
prever vrios passos a frente. A seguir, fazemos uma previso da varivel dependente considerando
essas trajetrias.

Programao 6.4.2 Podemos usar a tcnica de alisamento exponencial para definir uma traje-
tria para as variveis independentes e, de posse desses valores, usar o recurso de previso do
EViews R
para prever o comportamento da varivel dependente.

smpl @first @last


for %a px_sa yw_sa
%a.smooth(m,e,e,e) %asm
next
smpl @first 2013M7
series pxsa=px_sa
series ywsa=yw_sa
smpl 2013M7 2015M12
pxsa=px_sasm
pxwsa=yw_sasm
smpl @first @last
equation eq1.ls qx_sa ywsa pxsa c
smpl 2013m7 2015m12
164 Captulo 6. Regresso Simples

eq1.fit qx_saf
smpl @first @last

6.5 ANEXO ESTATSTICO


6.5.1 MNIMOS QUADRADOS ORDINRIOS
Vimos anteriormente que, em um modelo de regresso simples, partindo dos dados de y e x
queremos encontrar a equao que melhor ir descrever o comportamento dos mesmos. Nesse caso,
considerando a relao lineary = + x + , procuramos os valores de e . Um dos mtodos
que podem ser empregados para estimar esses valores o MQO (Mnimos Quadrados Ordinrios),
que consiste na minimizao da soma ao quadrado dos resduos:
n n
Min (i )2 = (yi xi )2
(, ) i=1 i=1

Inicialmente, vamos resolver esse problema para .

(ni=1 i2 ) n
= 2(yi xi ) = 0
i=1

yi + n + xi = 0

n = yi xi

yi xi
=
n n

= y x
Para facilitar o clculo de , podemos substituir o valor de encontrado na equao dos
resduos:

i = yi xi

xi
i = yi (y x)

(xi x)
i = (yi y)
O termo (yi y) representa o desvio de cada yi em relao mdia amostral y.
Dessa forma,
teremos i desvios, que podem ser representados por yi . O mesmo se aplica para os desvios de xi ,
no qual temos, xi . Assim, elevando esse termo ao quadrado e somando para todos os valores i:
n n
(i )2 = (yi xi )2
i=1 i=1

Minimizando esse termo em relao a encontraremos:

( 2 )
= 2(yi xi )xi = 0

yi xi + (xi )2 = 0
6.5 ANEXO ESTATSTICO 165

(xi )2 = yi xi
yi xi
=
(xi )2
cov(y, x)
=
var(x)

Exerccio 6.1 Utilizando o arquivo regresso simples.wf1, repita os testes e confirme os resul-
tados apresentados nesse captulo. 

Exerccio 6.2 Imagine duas regresses distintas, eq1 e eq2, que possuem a mesma varivel
dependente, y. Onde, eq1 uma regresso simples, eq2 possui trs variveis independentes,
estatisticamente diferentes de zero, e a soma dos resduos ao quadrado de eq2 maior que a
de eq1. Podemos dizer que o R2 de eq2 maior que o R2 de eq1, pois eq2 explica melhor os
movimentos de y? Por qu? 

Exerccio 6.3 Em posse do arquivo regresso simples.wf1, adote qx_sa como varivel depen-
dente e rode cinco regresses simples, utilizando as variveis px_sa, pm_sa, qm_sa, y_sa e
yw_sa como explicativa. Ento, escolha o melhor modelo pelo R2 . 

Exerccio 6.4 Em posse do arquivo regresso simples.wf1, adote qx_sa como varivel depen-
dente e rode cinco regresses simples, utilizando as variveis px_sa, pm_sa, qm_sa, y_sa e
yw_sa como explicativa. Ento, escolha o melhor modelo pelo critrio de Schwartz. 

Exerccio 6.5 Em posse do arquivo regresso simples.wf1, adote qm_sa como varivel depen-
dente e rode cinco regresses simples, utilizando as variveis px_sa, pm_sa, qx_sa, y_sa e
yw_sa como explicativa. Ento, escolha o melhor modelo pelo critrio de Hannan-Quinn. 

Exerccio 6.6 Considerando a equao qmt = 1 + 1 yt + t , onde qmt representa as importa-


es de produtos de borracha e material plstico e yt o PIB do Brasil. Utilize o mtodo dos
mnimos quadrados para encontrar a elasticidade da renda, apresente seu intervalo de confiana
de 95% e explique se o resultado est de acordo com o esperado. 

Exerccio 6.7 A partir da equao da quantidade importada como funo da renda, teste se a
incluso de px_sa, pm_sa, qm_sa, y_sa e yw_sa so significativas para o modelo. 

Exerccio 6.8 Analise os resduos na regresso da equao qmt = 1 + 1 yt + t e responda:


A) Os resduos apresentam distribuio normal?
B) Os resduos so independentes?
C) Existe autocorrelao nos resduos?
D) Os resduos apresentam comportamento homocedstico ou heteroscedstico? 

Exerccio 6.9 Preencha a tabela a seguir com os resultados dos testes de heteroscedasticidade,
apresentados nesse captulo. Ento, conclua sobre o padro de comportamento dos resduos da
166 Captulo 6. Regresso Simples

regresso na equao qmt = 1 + 1 yt + t .


Heteroscedasticidade
Teste Estatstica F Prob. F Obs*R2 Prob. Qui Quadrado
Breusch-Pagan-Godfrey

Harvey
Glejser
ARCH ( 1 lag)

Exerccio 6.10 Utilize o teste Quandt-Andrews para verificar a possvel existncia de quebra
estrutural na regresso qmt = 1 + 1 yt + t . 

Exerccio 6.11 Com o teste de Chow, comprove o resultado sobre a existncia ou no de quebra
estrutural encontrado no exerccio anterior. 

Exerccio 6.12 Utilize a estatstica F e a razo de verossimilhana do teste RESET de Ramsey


para concluir se o modelo est mal especificado na regresso qmt = 1 + 1 yt + t . 

Exerccio 6.13 Teste a existncia de outliers na regresso qmt = 1 + 1 yt + t , utilizando os


testes RStudent, DFFITS e COVRATIO. 

Exerccio 6.14 Baseado no coeficiente de desigualdade de Theil escolha qual dos modelos a
seguir apresenta o menor erro de previso.
A) qmt = 1 + 1 ywt + t
B) qmt = 1 + 1 yt + t
C) qmt = 1 + 1 yt + 2 pmt + t
D) qmt = 1 yt + t 

6.6 Bibliografia
Hodrick, R. J., e Prescott, E. C. (1997). Postwar US business cycles: an empirical investiga-
tion. Journal of Money, credit, and Banking, 1-16.
Morais, I.A.C., Bertoldi, A., Anjos, A.T.M. (2010), Um modelo no-linear para as exporta-
es de borracha. Revista Sober.
Ramsey, J. B. (1969). Tests for specification errors in classical linear least-squares regression
analysis. Journal of the Royal Statistical Society. Series B (Methodological), 350-371.
7. Regresso Mltipla

A passagem da anlise de regresso simples para mltipla nada mais do que acrescentar mais
variveis independentes (x), resultando em um modelo da forma:

yt = + 1 x1 + 2 x2 + + n xn + t

Aqui assumimos as mesmas hipteses relativas aos resduos que foram feitas anteriormente, ou
seja, que possuem uma mdia zero E(t ) = 0, varincia constante E(t2 ) = 2 , so independentes
entre eles E(t ti ) = 0 e tambm entre as diversas variveis independentes E(t xt ) = 0 e so
distribudos normalmente t N(0, 2 ).
Uma hiptese adicional importante a ser feita aqui que as variveis independentes no possuem
uma relao linear determinstica. Ou seja, que as mesmas no possam ser combinadas de maneira
a se produzir uma outra srie. Para exemplificar essa questo, suponha um modelo com duas
variveis do tipo:
yt = + 1 x1 + 2 x2 + t

se existir colinearidade entre as duas variveis independentes (x1 , x2 ), como por exemplo ax1 +
bx2 = c, ento podemos dizer que x2 = bc ab x1 , e o modelo final seria diferente do original:
c a 
yt = + 1 x1 + 2 x1 + t
b b
c2 a
yt = + 1 x1 + 2 x1 + t
  b b
c2 a 
yt = + 1 2 x1 + t
b b
 
ou seja, ao invs de estimar , podemos ento estimar + cb2 . Alm disso, ao invs de estimar
, seria encontrado 1 ab 2 . Portanto, se as variveis independentes forem correlacionadas, o


modelo ir produzir parmetros bem diferentes dos originais.


168 Captulo 7. Regresso Mltipla

7.1 O modelo com duas variveis independentes


Vamos exemplificar o uso da regresso mltipla acrescentando apenas uma varivel independente.
Considere a estimativa de um modelo linear:

yt = a + 1 x1 + 2 x2 + t ,

onde os resduos so obtidos a partir de

t = yt 1 x1 2 x2

e queremos encontrar os parmetros , 1 e 2 .


Para tanto, podemos fazer uso do mtodo dos mnimos quadrados ordinrios, da mesma forma
que foi aplicado para o modelo de regresso simples. Ou seja, vamos minimizar a soma ao quadrado
dos resduos:

Q = (t2 )
min Q = min (yt 1 x1 2 x2 )2

1 e 2 , tal como a seguir1 :


que ir produzir os valores de ,

= y 1 x1 + 2 x2 ,
S22 S1y S12 S2y
1 = 2
,
S11 S22 S12
S11 S2y S12 S1y
2 = 2
,
S11 S22 S12

S2y = x2 y nx2 2 e
onde defini-se S11 = x12 nx1 2 , S22 = x22 nx2 2 , S1y = x1 y nx1 y,
2 2
Syy = y ny .
Da mesma forma que para a regresso simples, alm dos coeficientes estimados, na regresso
mltipla tambm possvel encontrar as seguintes estatsticas:
Soma ao quadrado dos resduos (RSS) = Syy 1 S1y 2 S2y

Soma ao quadrado da regresso (ESS) = 1 S1y + 2 S2y

Soma ao quadrado total (TSS) = ESS + RSS = Syy

ESS 1 S1y + 2 S2y


Coeficiente de determinao. = R212 =
T SS Syy
Destaca-se que o valor de RSS a parte da regresso que no explicada pelo modelo com
duas variveis, ou seja, est relacionada ao resduo2 . J ESS define a parte explicada. Dessa
forma, a soma da parte explicada com a no explicada, nos fornece o total, ou seja, TSS. Por fim,
relacionando a parte explicada com o total, temos a parcela da varivel dependente que explicada
pelo modelo, ou seja, o R212 .
Assim como no modelo de regresso simples, aqui podemos encontrar as estatsticas associadas
a cada parmetro. Porm, devido o fato de se ter mais de uma varivel independente, necessrio
considerar a relao que existe entre elas. Para tanto, usamos o coeficiente de correlao ao
1 Os passos para se encontrar essas relaes podem ser vistos em qualquer livro texto de econometria
2 Como pode ser visto, a diferena entre esse resultado e o encontrado para o modelo de regresso simples, com uma
nica varivel dependente, deve-se a 2 S2y .
7.1 O modelo com duas variveis independentes 169

quadrado3 que, no caso de duas variveis, dado por r122 = 2 . O conjunto de equaes que ir

determinar as estatsticas dos coeficientes do modelo de regresso mltipla so dadas por:


2 2
2 = 2 )
,
2
= 2 )
,
1 S11 (1 r12 2 S22 (1 r12
2 r12
2
cov(1 , 2 ) = 2 )
e
S12 (1 r12
2
2 = + x1 2 2 + 2x1 x2 cov(1 , 2 ) + x22 2 .
n 1 2

tal que o coeficiente de correlao entre x1 e x2 dado por r12 .


Um resultado interessante aqui que, quanto maior for a correlao entre as duas variveis,x1
2 . Como r 2 tambm est presente no clculo
e x2 , mantendo tudo o mais constante, maior ser o r12 12
da varincia de 1 e 2 ento, quanto maior for a correlao entre as duas variveis, maior ser a
varincia desses parmetros. Da mesma forma, como a varincia de 1 e 2 fazem parte do clculo
da varincia de , podemos inferir que, uma maior correlao entre as variveis independentes
ir resultar em maior varincia do intercepto. Portanto, uma elevada correlao entre as variveis
independentes torna insignificante a estimativa de seus coeficientes. Por fim, enquanto no modelo
de regresso simples os graus de liberdade utilizados para se fazer os testes estatsticos eram dados
por n 2, no modelo de regresso mltipla, com 2 variveis independentes, tem-se n 3. No limite,
para k variveis independentes teremos que os graus de liberdade so dados por n k 1.
Vejamos como seria o exemplo da estimativa de um modelo de regresso mltipla acrescentando
apenas uma varivel ao modelo de regresso simples feito anteriormente. Nesse caso, escolhemos
adicionar os preos praticados pelo exportador, dado por pxt mas, ajustado sazonalmente, e a nossa
equao ficaria:

qxt = 1 + 1 ywt + 2 pxt + t (7.1)


Tal como antes, temos duas formas distintas de estimar essa equao, como mostrado na Figura
7.1. A primeira seria selecionando a varivel dependente e a seguir, todas as outras independentes.
Depois, clique em open /as equation . . . , abrindo a janela da Figura 7.1a. A segunda forma seria
selecionar quick /estimate equation . . . e escrever a equao, conforme a Figura 7.1b.
As duas formas de estimativa iro conduzir ao mesmo resultado e o EViews R
ir mostrar um
conjunto de informaes, como mostrado na Figura 7.2. Como sugesto, prefira estimar conforme
a Figura 7.1a, pois tal procedimento condio necessria para realizar alguns testes no futuro.
Note que aparece um coeficiente a mais na nossa equao. Nesse caso, o c(3), que o parmetro
relacionado ao preo de exportao pxt . Todas as demais estatsticas informadas so iguais ao
modelo de regresso simples mas, com algumas diferenas na interpretao. Para mostrar esse
resultado em formato de equao, usamos:

qxt = 21, 6254 + 1, 5312ywt 0, 4280 pxt + t


(10,0968) (0,1854) (0.0851)

onde, entre parnteses, ficam descritos os valores dos respectivos desvio-padro.


Tal qual nos resultados apresentados para o modelo de regresso simples, na coluna especificada
como StdError, esto os desvios-padro de cada parmetro. Depois, a estatstica t (t-statistic) e
o p-valor (Prob). A primeira utilizada para testar se o seu respectivo parmetro estatisticamente
diferente de zero, a partir da frmula:
x
t= .

3 Repare a diferena que existe entre R2 e r2 . O primeiro representa a relao entre as duas variveis independentes
12 12
e a dependente. Por outro lado, r122 est relacionado apenas relao que existe entre as variveis independentes.
170 Captulo 7. Regresso Mltipla

(a) (b)

Figura 7.1: Como estimar uma regresso mltipla

Figura 7.2: Resultado da Regresso Mltipla

Por exemplo, podemos testar se o parmetro da elasticidade-preo da demanda estatisticamente


igual a zero (2 = 0) a partir de:
2 0 0, 4280
t= = = 5, 0314.
1 0.085071

Por fim, o resultado do Prob ir indicar se aceitamos ou rejeitamos a hiptese nula de que o
coeficiente em questo estatisticamente igual a zero. Destaca-se que, para esse teste, estamos
assumindo uma distribuio t-student. No nosso exemplo, tanto para o coeficiente da constante,
quanto para o da renda, rejeitamos a hiptese nula de que so estatisticamente iguais a zero.

Programao 7.1.1 Tal qual na regresso simples, a outra forma de estimar um modelo de
regresso mltipla via programao, apenas acrescentando o nome das novas variveis a
serem utilizadas. Vejamos o exemplo de se ter uma regresso com duas variveis independentes,
adicionando apenas os preos internacionais pxt
7.1 O modelo com duas variveis independentes 171

Smpl 2000m01 2015m07


equation eq1.ls qx_sa yw_sa px_sa c

A estatstica t e seu respectivo teste podem ser aplicados a partir de uma programao, tal qual
mostrado na regresso simples. Nesse caso, queremos testar se 2 = 0. Primeiro especificamos
a estatstica t e armazenamos a mesma em um escalar de nome estatisticat. A seguir, criamos
uma tabela com trs linhas e uma coluna de nome testet, e armazenamos na primeira linha o
valor de estatisticat, na segunda linha o p-valor e, na terceira linha uma varivel string que ir
nos dizer se aceitamos ou rejeitamos a hiptese nula. Para fazer isso, usamos o comando if e
tambm como nvel de significncia 5%.

scalar estatisticat=eq1.@tstats(2)
table(3,1) testet
testet(1,1)=estatisticat
teste(2,1)=@tdist(estatisticat,157)
if testet(2,1)>0.05 then
estet(3,1)="aceitamos h0
else
estet(3,1)="rejeitamos h0
endif

Alm desses resultados bsicos, tal qual no modelo de regresso simples, h diversos outros
que so mostrados logo abaixo e que servem para avaliar o modelo em questo. O R-squared,
conhecido como R2, tem um valor de 0,437990 mas, deve ser interpretado de maneira diferente ao
valor encontrado para o R2 do modelo de regresso simples. Aqui, dizemos que: cerca de 43,80%
das variaes em qx so explicadas por variaes em yw e px. A frmula tal como antes, e dada
por:
T 2
t=1 t
R2 = 1 T ,
2
t=1 (yt y)
T 2
onde t=1 t denominado de soma do quadrado dos resduos (sum squared resid) e, no nosso
T
exemplo tem valor de 32031,26. Tal qual na regresso simples, o termo t=1 2 representa
(yt y)
o quanto a varivel dependente desvia em relao sua mdia, ou ento, mantendo a notao
anterior, o mesmo que Syy = y2 ny2 . Antes de prosseguir no clculo, cabe destacar que para
realizar a regresso o EViews R
precisou ajustar a amostra, como visto na Figura 7.2 em Sample
(adjusted): 2000M01 2015M07. Essa alterao feita pois em algumas das sries utilizadas
faltam as observaes anteriores a janeiro de 2000, como a srie yw_sa. Assim, para encontrar
o valor de Syy , utiliza-se a mdia da varivel dependente nesse perodo, representada na Figura
7.2 por Mean dependent var. No presente caso, a mdia da varivel dependente 85,16810. E,
se fizermos o quadrado da diferena de cada observao da varivel dependente em relao a sua
mdia e somarmos, encontraremos 56.994,14. Assim:

32031, 26
R2 = 1 = 0, 437990284.
56994, 14
O valor de R2 ajustado, Adjusted R-squared corrigide pelo nmero de coeficientes (k) que
esto sendo utilizadas no modelo. Sua frmula geral dada por:

T 1
R 2 = 1 (1 R2 ) ,
T k
172 Captulo 7. Regresso Mltipla

e, aplicando para os dados do modelo:


187 1
R 2 = 1 (1 0, 437990) = 0, 431881483.
187 3
No caso da regresso simples, o R2 tem uma interpretao direta. Porm, na regresso
mltipla, podemos estar interessados no em identificar quanto o modelo explicado pelas variveis
independentes, mas, sim, quanto que cada varivel explica o modelo. Nesse caso, usamos a
estatstica de correlao parcial, dada por:

tx2
R2y,x = ,
tx2 + (T k)
onde tx a estatstica t do coeficiente x, T o nmero de observaes e k o nmero de parmetros
do modelo completo.
Suponha, por exemplo, que na nossa regresso acima, se queira determinar o efeito da
elasticidade-renda da demanda (yw_sa), mantendo todas as demais variveis independentes cons-
tantes, eliminando o impacto que 2 tem sobre 1 . Assim, usamos:
2
tyw
R2qx,yw = 2 ,
tyw + (T k)
8, 25922
R2qx,yw = = 0, 270460.
8.25922 + (187 3)
Para o caso de se querer saber o impacto apenas da elasticidade-preo usamos:

5, 03142
R2qx,px = = 0, 120943.
5, 03142 + (187 3)
Portanto, note que a elasticidade tem uma capacidade explicativa mais do que o dobro da varivel
preo. A soma de ambas d 0,39 de um total de 0,43 do valor de R2 .
O desvio-padro da regresso (S.E. of regression na Figura 7.2) dado por:

r
RSS
= 2 =
T k
onde, alm do nmero de observaes (T) e do nmero de parmetros (k), temos RSS como a soma
ao quadrado dos resduos. Na regresso representada pela Equao 7.1, que temos como exemplo,
o desvio-padro da regresso ser dado por:
r
32031, 26
= = 13, 19405
187 3
A estatstica do log da verossimilhana (log likelihood) e os critrios de comparao de Akaike,
Schwarz e Hannan-Quinn so feitos da mesma forma que para a regresso simples. Por isso
no entramos no detalhe desses resultados. E estatstica F tambm calculada da mesma forma,
mas, sua interpretao feita de maneira diferente. Nesse caso, como a nossa regresso tem trs
parmetros, o teste-F est testando, na hiptese nula, se:

1 = 1 = 2 = 0

Pelos resultados apresentados no teste F, onde seu p-valor=0, no podemos aceitar a hiptese
nula. Nesse caso, os parmetros em conjunto so estatisticamente diferentes de zero.
7.1 O modelo com duas variveis independentes 173

Programao 7.1.2 Como forma de ilustrar cada uma das funes que so utilizadas para gerar
as estatsticas apresentadas acima, essa rotina monta uma tabela com quatro colunas e 8 linhas e,
a seguir, especifica cada estatstica e coloca a mesma de tal forma que seja possvel comparar
com os resultados apresentados pelo EViews R
. Note que, na ltima linha (oitava linha) foi
colocada a correlao parcial, primeiro da elasticidade-renda e depois da elasticidade-preo.

Smpl 1997m1 2015m09


equation eq1.ls qx_sa c yw_sa px_sa
table(8,4) result
result(1,1)"R2
result(1,2)=eq2.@r2
result(2,1)="R2 ajustado
result(2,2)=eq2.@rbar2
result(3,1)="erro padro da regresso
result(3,2)=eq2.@se
result(4,1)="Soma dos resduos ao quadrado
result(4,2)=eq2.@ssr
result(5,1)="Log da verossimilhana
result(5,2)=eq2.@logl
result(6,1)="estatstica F
result(6,2)=eq2.@f
result(7,1)="p-valor da estatstica f
result(7,2)=eq2.@fprob
result(1,3)="mdia da varivel dependente
result(1,4)=eq2.@meandep
result(2,3)="desvio-padro da varivel dependente
result(2,4)=eq2.@sddep
result(3,3)="Akaike
result(3,4)=eq2.@aic
result(4,3)="Schwarz
result(4,4)=eq2.@schwarz
result(5,3)="Hannan-Quinn
result(5,4)=eq2.@hq
result(6,3)="Durbin-watson
result(6,4)=eq2.@dw
result(8,1)="parcela explicada por yw
scalar ryw=(eq2.@tstats(2)^2/(eq2.@tstats(2)^2+(eq2.@regobs-eq2.@ncoef))
result(8,2)= ryw
result(8,3)="parcela explicada por px
scalar rpx=(eq2.@tstats(3)^2/(eq2.@tstats(3)^2+(eq2.@regobs-eq2.@ncoef))
result(8,4)= rpx

Com os resultados da equao abertos, podemos ver o grfico clicando em Resids ou View
/Actual, Fitted, Residual /Actual, Fitted, Residual Graph . . . . Observando a Figura 7.3, note
que, agora, nosso modelo erra menos do que no modelo de regresso simples, demonstrado na
Figura 6.5, e que tambm pode ser comprovado pelo resultado do R2.
A estimativa dos valores para cada perodo feita tal como no modelo de regresso simples. S
que, agora, temos uma varivel a mais para especificar, como demonstrado pela Equao 7.1 do
modelo de regresso mltipla. Nesse caso, vejamos como a estimativa do valor de qx para janeiro
174 Captulo 7. Regresso Mltipla

Figura 7.3: Resultado do Modelo de Regresso Mltipla

de 2003:

qxt = 21, 6254 + 1, 5312ywt 0, 4280 pxt + t .


(10,0968) (0,1854) (0.0851)

Naquela data, temos os seguintes valores para as variveis independentes yw jan/2003 = 1, 917077 e
px jan/2003 = 1, 904287. Substituindo esses valores na equao acima encontramos:

qx jan/2003 = 21, 6254 + 1, 5312(1, 917077) 0, 4280 (1, 904287) = 19, 5050.
(10,0968) (0,1854) (0.0851)

A seguir, todos os procedimentos de diagnsticos dos coeficientes ou ento dos resduos pode
ser feito tal como no modelo de regresso simples. Por isso, no iremos apresent-los aqui.

Programao 7.1.3 O loop a seguir pode ser usado para rodar vrias regresses e colocar os
resultados em uma tabela, permitindo que se faa a escolha do melhor modelo atravs do R2 e
dos critrios de comparao.

smpl 1997m01 2015m09


table(5,5) modelos
modelos(1,2)=``eq1
modelos(1,3)=``eq2
modelos(1,4)=``eq3
modelos(1,5)=``eq4
modelos(2,1)=``R2
modelos(3,1)=``akaike
modelos(4,1)=``Schwarz
modelos(5,1)=``Hannan-Quinn
equation eq1.ls qx_sa c yw_sa
equation eq2.ls qx_sa c yw_sa px_sa
equation eq3.ls qx_sa c yw_sa px_sa pxw_sa
equation eq4.ls qx_sa c yw_sa px_sa pxw_sa e_sa
7.2 Previso - Forecast 175

for !i=1 to 4
modelos(2,!i+1)=eq!i.@r2
modelos(3,!i+1)=eq!i.@aic
modelos(4,!i+1)=eq!i.@schwarz
modelos(5,!i+1)=eq!i.@hq
next
Os testes de diagnstico de estabilidade, tal como o Teste de Chow, Teste de Quandt-Andrews,
Teste de Previso de Chow, Teste de Ramsey, estimativas recursivas e estatsticas de influncia,
podem ser aplicados da mesma forma apresentada no captulo de Regresso Simples. A sua
interpretao tambm feita da mesma forma.

7.2 Previso - Forecast


A previso em modelos de regresso mltipla pode ser feita tal como nos modelos de regresso
simples. Com a equao aberta selecione Forecast, escolha um nome para a srie de resultados da
previso, aqui usamos qx_saf, e um nome para a srie do desvio-padro, usamos qx_sef. Por fim
selecione o intervalo de previso e clique em ok.
No resultado, tal como mostrado na Figura 7.4, podemos ver a srie de previso com seu
respectivo intervalo de confiana com 2 desvios. Para comparao dos resultados do modelo
de regresso simples com o modelo de mltiplas variveis, observa-se as estatsticas de erro de
previso (RMSE, MAE e MAPE). Enquanto os resultados de RMSE, MAE e MAPE da regresso
simples foram, respectivamente, 18,9004, 16,1485 e 23,8140, a Figura 7.4 apresenta os resultados
dessas estatsticas de previso para o modelo de regresso mltipla com as variveis independentes
px_sa e yw_sa. Assim, as estatsticas de previso mostram que, em comparao com o modelo
de regresso simples, o modelo com duas variveis adere melhor aos dados, apesar dos resultados
ainda estarem longe do ideal.

Figura 7.4: Previso do modelo de regresso mltipla

Programao 7.2.1 Tambm podemos fazer uma previso de um modelo de regresso mltipla
via programa. A primeira linha determina a equao de regresso, onde colocamos primeiro
a varivel dependente e, a seguir, as independentes. A seguir, especificado o perodo para a
previso. No exemplo abaixo colocamos para todo o perodo amostral. Por fim, feita a previso
para a equao e o resultado colocado na srie qx_saf, juntamente com o desvio padro com
nome qx_sef. Esse ltimo ir permitir que seja construdo o intervalo de confiana da previso,
referente aos comonados series min e series max.
176 Captulo 7. Regresso Mltipla

equation eq1.ls qx_sa c yw_sa px_sa


smpl 1997m01 2015m09
eq1.forecast qx_saf qx_sef
series min=qx_saf-2*qx_sef
series max=qx_saf+2*qx_sef

7.3 Mtodo STEPLS


A programao no a nica maneira de se fazer vrias regresses, testes e a aplicao de diversas
outras ferramentas estatsticas no EViews R
. Tambm podemos aplicar o mtodo STEPLS. A
partir deste, vrias equaes so estimadas, considerando as variveis em questo e, fornecidos os
resultados para que seja selecionada a melhor.
Para no nosso exemplo, temos cinco variveis que podem ser combinadas de vrias formas.
Alm do quantum de exportaes do setor de produtos de borracha e materiais plsticos ( qx_sa),
do PIB mundial (yw_sa) e do ndice de preos das exportaes desse setor (px_sa), temos o PIB
brasileiro (y_sa), o ndice de preo das importaes (pm_sa) e o quantum das exportaes do setor
de produtos de borraa e material plstico (qm_sa). As mesmas esto no arquivo 07rm.wf1. Os
mesmos j esto ajustados sazonalmente. Nosso objetivo encontrar a melhor equao linear com,
no mximo cinco variveis independentes.
Como j foi demonstrado, para estimar uma equao podemos selecionar as varveis e abrir
como equao ou via quick /estimate equation . . . e escrever a equao que queremos estimar.
A seguir, na opo method, selecione STEPLS - Stepwise Least Squares. Na parte onde
possvel especificar a varivel dependente, coloque qx_sa e a constante, depois, na parte da lista
dos repressores, especifique todas as demais independentes, conforme a Figura 7.5a.
Na aba options podemos escolher diversas formas de estimao, conforme Figura 7.5b. Vamos
comear selecionando stepwise forwards. A diferena entre os opes de forwards e backwards
est na adio ou remoo de variveis independentes com o menor p-valor ou maior estatstica
t na equao, conforme critrio definido. Alm disso, tambm possvel selecionar o mtodo
uni-directional, swapwise e combitional. O mtodo unidirecional adiciona (forward) ou remove
(backward) variveis at que o menor p-valor das variveis no includas ser maior que o critrio
de parada definido. O mtodo stepwise nada mais que uma combinao da rotina uni-direcional
forward e backward. No mtodo swapwise necessrio optar por mximo ou mnimo incremente
ao R2. Esse mtodo busca maximizar o R2, sendo que o Max R-Squared Increment adiciona as
variveis que mais contribuem para o aumento do R2 e o Min R-Squared Increment adiciona as
variveis que menos contribuem para o incremento do R2. O mtodo combitional testa todas as
combinaes de variveis e seleciona o modelo com maior R2. Esses mtodos sero explorados na
prxima subseo, onde haver uma explanao mais detalhada para cada um deles.
Na opo de critrio de parada (Stoping Criteria), definimos se o mtodo ir ser coordenado
pelo menor p-valor ou maior resultado da estatstica t. Essa opo s aparece para o mtodo
unidirecional e stepwise. No nosso exemplo, utilizando o stepwise forward, coloque 0.001 para o
p-valor forwards e deixe o resto tal como sugerido. Um ponto importante nesse passo a opo
use number of regressors, utilizada em todos mtodos. Se colocarmos o valor 1, o melhor modelo
ter apenas uma varivel independente. Se selecionarmos o valor 2, o melhor modelo ter duas
variveis independentes. Se no selecionarmos essa opo, o procedimento ir determinar o nmero
de variveis independentes a serem consideradas.
O resultado ser a seleo de uma equao com todos os coeficientes. O mtodo stepwise inicia,
no nosso exemplo, com uma regresso da forma:

qxt = c + t .
7.3 Mtodo STEPLS 177

(a) Estimando regresso pelo mtodo STEPLS (b) Opes do mtodo STEPLS

Figura 7.5: Mtodo STEPLS

A seguir, inserida uma varivel independente gerando mais quatro regresses simples, cada uma
com uma constante. Por exemplo, ser feita uma regresso com o seguinte formato abaixo, onde a
varivel independente yw:
qxt = c + 1 yw_sa + t .

As demais regresses simples iro ter uma constante e uma varivel independente diferente.
Dessa forma, teremos uma regresso apenas com px_sa como varivel independente e assim
sucessivamente. De acordo com os nossos dados o modelo final sugerido dado por:

qxt = c + 1 yw_sa + 2 y_sa + 3 qm_sa + 4 px_sa + t .

No resultado (Figura 7.6) da estimativa podemos ver que o mtodo manteve apenas uma
varivel em todas as regrees (Number of always included regressors), a constante, e que o total de
variveis independentes foi 4. O mtodo de seleo o Stepwise forwards e o critrio de incluso
o p-valor ao nvel de 0,001. Note que todos os coeficientes so estatisticamente diferentes de
zero e as demais estatsticas podem ser interpretadas de forma igual ao que vimos em modelos de
regresso por mnimos quadrados. Alm disso, percebemos que a varivel pm_sa no foi adicionada
regresso, pois o p-valor ficava acima do critrio determinado. Em comparao com as outras
regresses apresentadas, destacamos o resultado do R2 de 0,8659, maior que a regresso simples e
a regresso mltipla apenas com as variveis yw_sa e px_sa.

Programao 7.3.1 O mtodo STEPLS pode ser feito via programao. O default o mtodo
stepwise, para utilizar as outras opes utilizamos method = uni (para o uni-directional), text
(swapwise) ou comb (combinatorial). De qualquer forma, vamos utilizar o padro stepwise.
O procedimento forward tambm default, no sendo necessrio especificar o mesmo. Caso
contrrio, podemos especificar back. No critrio de seleo o p-valor default e, de outra forma,
podemos escolher tstat. Para definir os critrio, utilizamos ftol=0.001 para o critrio forward, sem
termos que utilizar btol = 0.5 para o critrio backward, pois este o valor padro. O procedimento
acima pode ser feito via:

eq1.stepls(method=stepwise, ftol=0.001) qx_sa c @ yw_sa y_sa qm_sa px_sa


178 Captulo 7. Regresso Mltipla

Figura 7.6: Resultado do mtodo STEPLS

7.3.1 Os mtodos de Seleo STEPLS


Dentro do procedimento de escolha do melhor modelo de regresso possvel selecionar dentre
vrios tipos de mtodos, sendo que, os mesmos, podem ser divididos entre forward e backward e
tambm tendo como opo de seleo das variveis o p-valor ou a estatstica t. A seguir fazemos
uma breve explanao sobre esses mtodos.

Uni-direcional
Esse processo pode ser utilizado tanto para adicionar variveis ao modelo (forward) quanto para
retirar (backward) e, nesse caso, a deciso feita com base ou no p-valor ou na estatstica t, sendo
necessrio escolher qual o critrio de deciso para essas duas estatsticas.
Suponha que seja o p-valor. Com essa opo o modelo comea como uma regresso simples,
rodando vrias regresses com diferentes combinaes, sempre tendo apenas uma varivel. A
varivel com menor p-valor fica. A seguir, so feitas regresses mltiplas adicionando mais uma
varivel dentre todas as que foram especificadas. Aquela que atender o critrio estabelecido e tiver o
menor p-valor, acrescentada ao modelo. O procedimento continua at que no seja mais possvel
adicionar varivel que atenda aos critrios especificados, p-valor e nmero de passos Maximum
steps.
J no mtodo unidirecional backwards o procedimento se inicia com todas as variveis e vai
retirando aquelas com maior p-valor at que restem apenas aquelas que atendam aos critrios
especificados. Nesse caso, como o mtodo backward, utilizado o critrio Maximum steps
backwards.
Esse procedimento complementado com a escolha da opo User Number of Regressors, que
7.3 Mtodo STEPLS 179

determina quantas variveis devem constar no modelo final. Se no selecionar essa opo, o modelo
ir conter o mximo de variveis que atendem as especificaes anteriores. Caso contrrio, se o
mesmo for selecionado, podemos especificar quantas variveis queremos que o modelo final tenha.

Stepwise
Da mesma forma que no mtodo unidirecional o mtodo Stepwise pode ser escolhido com a opo
de forwards e backwards. Independente da escolha da opo, o fato que o mtodo Stepwise
uma combinao do mtodo unidirecional forward com o unidirecional backward. O que muda a
ordem de execuo da seleo e escolha das variveis.
Por exemplo, suponha que se tenha escolhido o mtodo Stepwise forward com opo de p-valor.
Aqui, o processo comea sem varivel, so feitas diversas regresses simples, ou seja, adicionando
apenas uma varivel. A seguir, aquela que apresentar o menor p-valor mantida no modelo.
O procedimento se repete, testando todas as demais variveis e escolhendo aquela que tambm
ir ter o menor p-valor. Nesse momento teremos um modelo com duas variveis independentes.
Antes de testar a terceira varivel, feito o procedimento backward no modelo com duas variveis
independentes. Se alguma delas no atender ao critrio do p-valor ou estatstica t, removida.
No passo seguinte escolhida a terceira varivel a ser adicionada no modelo e que deve
atender aos critrios especificados (p-valor ou estatstica t). Escolhida essa terceira varivel,
feito novamente o procedimento backward com o modelo tendo trs variveis para confirmar as
mesmas. A seguir, para toda e qualquer varivel que se queira acrescentar ao modelo feito o
mesmo procedimento, primeiro testando forward e, a seguir, backward.
Podemos comparar o resultado do mtodo Stepwise forward com o mtodo backward para ver
se encontramos o modelo com o mesmo nmero de variveis. Pra tanto selecione backward e o
critrio de seleo, que pode tanto ser o p-valor quanto a estatstica t. Destaca-se que o mtodo
Stepwise backward exatamente o contrrio do Stepwise forward. Primeiro todas as variveis so
inseridas no modelo e a que tiver o maior p-valor excluda. A seguir, dentro daquelas que ficaram
no modelo feita a investigao forward para confirmar a presena das mesmas.
O procedimento se repete e, as variveis que foram excludas so verificadas pelo mtodo
forward. Se alguma delas tiver um p-valor mais baixo ou uma estatstica t maior, inserida
novamente no modelo. O procedimento se repete at que todos os critrios sejam atendidos.

Swapwise
Esse mtodo utiliza dois importantes critrios de escolha, a estimativa do R quadrado para fazer a
seleo do melhor modelo dividindo a escolha entre um incremento mximo ou mnimo e o nmero
de variveis independentes a considerar.
Vejamos como o exemplo do mtodo via R quadrado mximo. O procedimento se inicia sem
varivel independente e, aps feitas vrias regresses simples, escolhida aquela que maximiza
o R quadrado. A seguir, so testadas as demais variveis adicionando uma a uma no modelo. A
que gerar o maior incremento no R quadrado permanece. Para confirmar a presena dessas duas
variveis, as mesmas so comparadas com cada uma das que esto fora do modelo. Ou seja, imagina
que temos uma regresso do tipo:

yt = c + 1 x1t + 2 x2t + t .

Para confirmar a presena dessas variveis, so feitas regresses do tipo:

yt = c + 1 x1t + 3 x3t + t

e tambm
yt = c + 2 x2t + 3 x3t + t ,
180 Captulo 7. Regresso Mltipla

e assim sucessivamente para todas as variveis que no estavam no modelo bsico. Isso feito para
ver se as diferentes combinaes no gera um R quadrado incremental maior. Uma vez descoberta
a melhor combinao com duas variveis, o procedimento continua para a terceira varivel que
gera o melhor incremento no R quadrado.
A seguir, partindo de um modelo de trs variveis independentes, so feitas vrias combinaes
para descobrir qual gera o melhor incremento no R quadrado. De outra forma, se escolhermos o
mtodo Swapwise com R quadrado mnimo, o procedimento parecido com o que considera o R
quadrado mximo. A diferena que, na hora de testar as diferentes combinaes o procedimento
feito escolhendo aquela que gera o menor incremento no R quadrado.
Combinatorial
Nesse mtodo devemos especificar quantas variveis independentes queremos testar no modelo e
as mesmas so testadas em vrias combinaes e selecionada aquela combinao que produz o
maior R quadrado. Esse mtodo o que requer o maior nmero de estimativas e, dependendo do
nmero de variveis a serem especificadas, o resultado pode demorar em ser fornecido.

7.4 Bibliografia
Hamilton, J. (1994). Linear Regression Model. In: _______. Time Series Analysis. Prince-
ton University Press, pp. 200 - 232.
Wansbeek, T., e Meijer, E. (2008). Measurement error and latent variables. In: Baltagi, B. H.
(Ed.). A companion to theoretical econometrics. John Wiley & Sons, pp. 162 - 179.
Referncias Bibliogrficas

[1] Lawrence J. Christiano and Terry J. Fitzgerald. The band pass filter*. International Economic
Review, 44(2):435465, 2003.