Vous êtes sur la page 1sur 10

Uma breve

STATA

introduo

ao

As operaes bsicas
Preparao de dados
H vrios modos de introduzir dados no STATA. O primeiro e
mais simples deles atravs da digitao direta dos dados
no editor do STATA

A janela acima representa uma matriz onde as linhas


representam as observaes e as colunas representam as
variveis. Ao inserir um dado em uma clula cuja coluna
est em branco, automaticamente o STATA d nome
varivel. Por exemplo: se a clula for da 1 coluna, o nome
da varivel torna-se automaticamente var1, e assim
sucessivamente. Para dar o nome desejado varivel (por
exemplo, gdpgrow), v janela de comando e digite:
rename var1 gdpgrow

ou apenas
ren var1 gdpgrow
Caso se queira apagar uma varivel da base de dados (no
exemplo a seguir, a varivel gdp60), basta digitar o
seguinte comando:
drop gdp60
Toda vez que se executa um comando, automaticamente o
STATA mostrar o comando correspondente na janela de
resultados. Atravs da tecla PgUp quando o cursor estiver
sobre a janela de comandos ir surgir toda a seqncia de
comandos anteriormente executada.
Para transferir dados de uma planilha do Excel para o
STATA, o modo mais fcil e rpido copiando no Excel todos
os dados desejados e colando no editor do STATA. Para isso,
deve-se selecionar no Excel a rea de informao de
interesse e copi-la (Control+C). J na janela do editor dos
dados do STATA, deve-se selecionar a clula da 1 linha e 1
coluna e teclar Control+V. Vale lembrar que
importantssimo que no Excel o separador de decimais seja
ponto e no vrgula, caso contrrio o STATA no
reconhecer os dados transportados de modo correto.
O do-file
Outro recurso do STATA so os do-files, arquivos de registro
de comandos que podem ser salvos e abertos
posteriormente, permitindo que uma mesma extensa rotina
possa ser executada sem a necessidade de digitar todos os
comandos na janela de comandos. Para criar um do-file,
tecle Control+8. Ser aberta uma janela em branco, onde a
sequencia de comandos deve ser copiada. Selecione a
sequencia de comandos desejada na janela de comandos.

Nesse ponto, importante que no seja selecionado


nenhum comando que na janela de comandos esteja
destacado em vermelho. Caso contrrio o do-file, quando
aberto, funcionar apenas at o comando anterior quele
ponto.
Aps salvar o do-file, para abri-lo simples. No canto
esquerdo superior da janela, v em File Do... e
selecione o arquivo salvo na extenso .do.
bom ressaltar que o do-file no salva a base de dados, e
sim os comandos. Portanto, antes de utilizar o do-file
preciso que o STATA esteja aberto com a mesma base de
dados utilizada para a execuo dos comandos.
Comandos bsicos
Um modo til de explorar os dados, seja para simples
conferncia ou para anlise profunda, checar as principais
estatsticas de cada varivel. Por exemplo:
Na janela de comando do STATA possvel obter com
facilidade o mnimo, mximo, mdia aritmtica, desviopadro de cada varivel nos dados atravs do comando:
summarize
Caso voc tambm queira saber como a srie se comporta
de acordo com cada percentil, digite:
summarize, detail
Se o seu interesse relativo a apenas uma varivel, apenas
inclua o nome dessa varivel aps o comando summarize:
summarize gdpgrow, detail
bastante til tambm a diviso da amostra em subamostras, por motivos diversos. Para isso, utiliza-se o
comando if , que restringe o comando inicial a uma
determinada condicional. Por exemplo, se voc deseja ver
apenas a parte da sua amostra que vai do ano 1990 ao ano

2000, digite na janela de comando (vale ressaltar que,


nesse caso, a varivel yeartem que estar especificada
como uma das variveis da sua base de dados):
summarize if year>=1990&year<=2000
Para o exemplo acima tornar-se malevel, vlido
apresentar cada um dos operadores lgicos do STATA.
~= significa diferente
== significa igual
>= significa maior ou igual
<= significa menor ou igual
& significa e
| significa ou
Os operadores matemticos seguem o padro da maioria
dos outros programas, ou seja, so (+,-,*,/)
Em vrias oportunidades ser necessrio manusear
matematicamente as variveis da sua base de dados para
obter novas variveis de interesse analtico. Para isso,
pode-se usar de modo prtico os operadores aritmticos.
O comando generate (ou apenas gen) o principal
comando utilizado nessas transformaes.
Por exemplo, caso se queira criar uma nova varivel que
seja a soma de outras duas (suponhamos que a nova
varivel chame-se gdppercapita e seja a diviso da
varivel gdp por pop) deve-se digitar na janela de
comandos:
generate gdppercapita =gdp/pop
ou
gen gdppercapita = gdp/pop

O mesmo procedimento pode ser feito para realizar outras


operaes, como:
quadrados: gen popgrow2 = popgrow^2
razes quadradas: gen popgrowroot = sqrt(popgrow)
exponenciais: gen exppopgrow = exp(popgrow)
logaritmos naturais: gen lpopgrow = log(popgrow)
vlido ressaltar que nova varivel deve ser atribudo um
nome com no mximo 8 caracteres, caso contrrio o
sistema acusar erro.
Explorando recursos grficos
Como se sabe, algumas relaes entre variveis podem ser
descobertas primeiramente atravs da anlise grfica,
antes de procedimentos estatsticos que comprovem essas
relaes. Suponhamos que se queira ver a relao entre a
varivel gdpgrow com a varivel popgrow. Para isso
necessrio o seguinte comando:
plot gdpgrow popgrow
. plot gdpgrow popgrow
9.2 +
|
*
|
*
|
*
|
*
|
* *
|
* *
*
**
g
|
*
*
*
d
|
* * ** ** * *
p
|
*
* ****
*
g
|
*
*
* * * *
**
r
|
** *
* * *
* *
o
| ****
* * *
** **
* **
w
| *** *
*
* *
* *
| *
*
* ** **
*
|
* **
* * **
*
*
|
*
*
*
|
*
*
* **
|
|
-.9 +
*
+----------------------------------------------------------------+
.3
popgrow
6.8

O grfico acima mostra uma relao aparentemente


positiva entre as variveis popgrow e gdpgrow.

Uma forma mais elegante de fazer um grfico de dois eixos


no STATA, adicionando ttulo ao grfico inclusive utilizando
a funo twoway. Essa funo requer 3 entradas: tipo de
grfico (scatter, line, bar, area, spike, etc), varivel do eixo
Y e varivel do eixo X. Assim, para fazer um grfico do tipo
scatter com as variveis gdpgrow e popgrow com ttulo
gdpgrow X popgrow, deve-se digitar na janela de
comandos:
twoway (scater gdpgrow popgrow), title(gdpgrow X
popgrow)
e o resultado ser:

g d p g ro w
4
6

10

gdpgrow X popgrow

4
popgrow

Outro recurso interessante do STATA a matriz de grficos,


que relaciona vrios grficos e permite a visualizao em
uma nica matriz. O comando necessrio o graph
matrix. Por exemplo: para uma matriz de grficos com as
varivels popgrow, gdpgrow e gdp85, necessrio o
seguinte comando:
graph matrix popgrow gdpgrow gdp85
e a sada ser:

10
6
4

popgrow

2
0

10

gdpgrow

0
30000
20000

gdp85
10000
0
0

10000

20000

30000

O STATA oferece outra infinidade de recursos grficos, de


acordo com a necessidade estatstica. Para explor-los, v
na parte superior da janela e clique em graphics.
Regresso Linear
extremamente importante, antes de qualquer
procedimento economtrico, checar a correlao entre as
variveis de interesse. Alm do procedimento grfico j
mencionado acima, tambm possvel gerar uma tabela de
correlao, que mostra exatamente a correlao entre
todas as variveis desejadas. Para isso, usa-se o comando
correlate, como feito abaixo:
correlate gdpgrow popgrow inv school
A matriz gerada ser a seguinte:
. correlate gdpgrow popgrow inv school
(obs=105)

gdpgrow
popgrow
inv
school

gdpgrow popgrow

inv

school

1.0000
0.2424 1.0000
0.3834 -0.3313
0.2297 -0.1931

1.0000
0.6106

1.0000

Vale lembrar que a diagonal da matriz 1 para todas as


variveis porque a correlao entre uma varivel e ela
mesma sempre um.
Agora damos um passo frente, estimando um modelo de
regresso linear simples:
regress gdpgrow gdp60
ou de outra forma,
reg gdpgrow gdp60
O resultado ser o que se segue:
. reg gdpgrow gdp60
Source

SS

df

MS

Model
Residual

5.96489884
393.652688

1
114

5.96489884
3.45309375

Total

399.617587

115

3.47493554

gdpgrow

Coef.

gdp60
_cons

-.0000304
4.172254

Std. Err.
.0000231
.1924008

t
-1.31
21.69

Number of obs
F( 1,
114)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.191
0.000

=
=
=
=
=
=

116
1.73
0.1914
0.0149
0.0063
1.8583

[95% Conf. Interval]


-.0000762
3.79111

.0000154
4.553399

importantssimo notar que no h a necessidade de


incluir o intercepto, j que o STATA o faz automaticamente.
Para regresses lineares mltiplas, vale o mesmo princpio.
Por exemplo:
reg gdpgrow popgrow inv school gdp60

. reg gdpgrow popgrow inv school gdp60


Source

SS

df

MS

Model
Residual

150.225887
217.069734

4
100

37.5564716
2.17069734

Total

367.295621

104

3.53168866

gdpgrow

Coef.

popgrow
inv
school
gdp60
_cons

1.032439
.1200686
.0916699
-.000092
-.5286679

Std. Err.
.16382
.024523
.0575799
.0000215
.6001386

t
6.30
4.90
1.59
-4.28
-0.88

Number of obs
F( 4,
100)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.000
0.000
0.115
0.000
0.380

=
=
=
=
=
=

105
17.30
0.0000
0.4090
0.3854
1.4733

[95% Conf. Interval]


.7074248
.0714157
-.0225671
-.0001346
-1.719326

1.357453
.1687215
.2059068
-.0000494
.6619899

Testes de hipteses lineares:


A seguir, sero apresentados alguns testes estatsticos de
fcil procedimento no STATA. O mais simples deles o teste
de correlao entre a varivel dependente e uma das
variveis explicativas.
No exemplo
reg gdpgrow popgrow inv school gdp60
podemos testar se a correlao entre as variveis gdpgrow
e popgrow estatisticamente significativa. Assim sendo,
preciso digitar o comando:
test popgrow
. test popgrow
( 1) popgrow = 0
F( 1, 100) =
Prob > F =

39.72
0.0000

O teste acima um teste F com a hiptese nula de que


popgrow=0 contra a hiptese alternativa de popgrow~=0
possvel tambm fazer um teste para a significncia
conjunta entre duas variveis, como o que se segue
test popgrow inv

. test popgrow inv


( 1) popgrow = 0
( 2) inv = 0
F( 2, 100) =
Prob > F =

26.18
0.0000

Aqui testada a hiptese nula de que todas as correlaes


so conjuntamente iguais a zero, contra a hiptese
alternativa de que pelo menos uma delas diferente de
zero. Como se observa, a hiptese nula rejeitada mesmo
a um baixssimo grau de significncia.
O mesmo procedimento pode ser estendido para testar se o
efeito de duas variveis explicativas na varivel
dependente numericamente o mesmo:
test popgrow=inv
. test popgrow=inv
( 1) popgrow - inv = 0
F( 1, 100) =
Prob > F =

32.50
0.0000

Acima testada a hiptese nula de que popgrow-inv = 0.


Como o valor do F estatstico claramente tende a zero,
possvel rejeitar a hiptese nula.
Consideraes finais
Esse um guia extremamente introdutrio utilizao do
STATA. Como qualquer outro programa economtrico
sofisticado, o STATA requer frequentemente que o usurio
acesse o Help para operaes mais elaboradas que no
convm a esse manual.

Vous aimerez peut-être aussi