Vous êtes sur la page 1sur 13

UNIVERSIDAD CATLICA DEL NORTE, ECONOMIC DEPARTMENT

ECONOMETRICS: PROBLEM SET 3


Professor: Mauricio Sarrias
Student: Juan Palomino
Abril 20, 2016

1 THEORY
1. (Hipothesis Testing): Assume you have a random sample from the model:
yi = 1 xi +
E( i jxi ) = 0

2
2 xi

(1)

where yi is wages measured as Chilean pesos per hour, and xi is age. Describe
how you test the hypothesis that the expected wage for a 40-year-old worker
is $20 an hour. You do not need to derive the theory behind your procedure.
Solution:
Aplicando esperanza a yi se tiene:
E(yi jxi = 40) = 40 1 + 402 2 + E( i jxi ) = 20
= 40 1 + 1600 2 = 20
2 1 + 80 2 = 1
La hiptesis nula y alternativa seran:
H0: 2
H1: 2

+ 80
1 + 80
1

2
2

= 1
6
=
1

Ahora se considera probar la restriccin lineal establecida en la hiptesis nula empleando


el F estadistico. La hipotesis es sobre una ecuacin, entonces se tiene que el nmero de
1

restricciones #r = 1, por lo tanto R y r estn dadas por:

R =

2 80

1x2

r =

2 80

1x2

r=1
1
2

1=0
2x1

Entonces el test F estadstico es:


F =

(R b

y est distribuido como F (#r; n

r)0 [R(X 0 X) 1 R0 ] 1 (R b
b2

r)=#r

2).

2. (Restricted regressionn and F) We derive the F test in class. However, there


is a convenient alternative formula involving two dierent sum of squared
residuals: one is SSR, the minimized sum of squared residuals denoted as
SSRU , and the other is the restricted sum of squared residuals, denoted SSRR ,
obtained from:
min SSR(e) st R e = r
Finding the e that achieves this constrained minimization is called the restricted regression or restricted least squared. In this exercise I ask you to
show that the F-ratio equals:
F =

(SSRR SSRU )=#r


SSRU =(n K)

In the restricted least squares, the sum of squared residuals is minimized


subject to the constraint implied by the null hypothesis R 0 = r: Form the
Lagrangian as:
1
L = (y X e)0 (y X e) + 0 (R e r)
2

where here is the #r-dimensional vector of Lagrange multipliers (recall: R


is #r K; e is K 1; and r is #r 1). Let e be the restricted least squares
estimator of : It is the solution to the constrained minimization problem.
(a) Let b be the unrestricted OLS estimator. Show:
e = b

Solution:

(X 0 X) 1 R0 [R(X 0 X) 1 R0 ] 1 (R b
= [R(X 0 X) 1 R0 ] 1 (R b r)
2

r)

Tenemos que:
1
(y X e)0 (y X e) + 0 (R e r)
(2.1)
2
0
1 0
=
(y X 0 e )(y X e) + 0 (R e r)
2
0
0
1 0
0
=
(y y y 0 X e e X 0 y + e X 0 X e) + 0 R e
r
2
0 0
0
1 0
0
L =
(y y 2y 0 xe + e X X e) + 0 R e
r (ya que e X 0 y = (y 0 X e)0 )
2

L =

Aplico condiciones de primer orden:


@L
= 0)
@e
= X 0y

X 0 y + (X 0 X)e + R0 = 0 (ya que

R = R0 )

(X 0 X)e = R0

(2.2)

@L
= 0 ) Re = r
(2.3)
@
Entonces de (2:2) despejamos e en trminos del estimador OLS irrestrictro b =
(X 0 X) 1 X 0 y:
(X 0 X)e = X 0 y R0
e = (X 0 X) 1 X 0 y (X 0 X) 1 R0
e = b (X 0 X) 1 R0

(2.4)

Luego (2:4) reemplazo en (2:3):


R(b

(X 0 X) 1 R0 ) = r
R b r = R(X 0 X) 1 R0

Entonces queda demostrado


demostracin de e:
(b) Let e
"

e=b

= [R(X 0 X) 1 R0 ] 1 (R b

r)

(2.5)

Luego, reemplazo (2:5) en (2:4) y obtengo la

(X 0 X) 1 R0 [R(X 0 X) 1 R0 ] 1 (R b

r)

(2.6)

X e, the residuals from the restricted regression. Show:


SSRR

SSRU = (b

e)0 (X 0 X)(b

e) = e
"0 Pe
"

where P is the projection matrix. (Hint: Add and subtract X(b


e
" y X e).
3

e) to

Solution:
Denimos:

X e)0 (y

SSRR = e
"0e
" = (y

Sumandoy restando X b ambos lados, tenemos:

X e)

X e + X b X b]0 [y X e + X b X b]
= [(y X b) + X(b e)]0 [(y X b) + X(b e)]
= [(y X b)0 + (b e)0 X 0 ][(y X b) + X(b e)]

SSRR = [y

= (y X b)0 (y X b)+(y X b)0 X(b e)+(b e)0 X 0 (y X b)+(b e)0 X 0 X(b e)


= (y

X b)0 (y

X b) + 2[(b

e)0 X 0 (y

X b)] + (b

e)0 X 0 X(b

e)

(2.7)

Tener en cuenta por ecuaciones normal que X 0 (y X b) = 0 y tambin que SSRU =


(y X b)0 (y X b). Entonces, tenemos:
SSRR = SSRU + (b e)0 X 0 X(b
SSRU = (b e)0 X 0 X(b e)

SSRR

e)

(2.8)

Con esto queda demostrado la primera parte de la igualdad. Luego, de (2:6)


podemos expresar lo siguiente:
b

e = (X 0 X) 1 R0 [R(X 0 X) 1 R0 ] 1 (R b

(2.9)

r)

Entonces reemplazamos (2:9) en (2:8):

= [(X 0 X) 1 R0 [R(X 0 X) 1 R0 ] 1 (R b r)]0 X 0 X[(X 0 X) 1 R0 [R(X 0 X) 1 R0 ] 1 (R b r)]


= [(R b r)0 [R(X 0 X) 1 R0 ] 1 R(X 0 X) 1 ]X 0 X(X 0 X) 1 R0 [R(X 0 X) 1 R0 ] 1 (R b r)
|
{z
}
I

= (R b

r) [R(X X) R ] R(X X) R [R(X 0 X) 1 R0 ] 1 (R b

Sabemos que

= [R(X 0 X) 1 R0 ] 1 (R b
SSRR

r). Entonces, de (2:10) nos va quedar:

SSRU =

R(X 0 X) 1 R0

De la primera condicin (2:2) tenamos que X 0 (y


X 0e
" = R0 . Entonces de (2:11) tenamos:
SSRR

SSRR
SSRR

0
SSRU = |{z}
R (X 0 X) 1 |{z}
R0
e
"0 X
0

Xe
"0

De aqu queda demostrado que:

SSRU = (b
4

(2.11)

X e) = R0 . Esto implica

SSRU = e
" X(X X) Xe
"
0
SSRU = e
" Pe
"
donde P = X(X 0 X) 1 X

SSRR

(2.10)

r)

e)0 (X 0 X)(b

e) = e
"0 Pe
"

(2.12)

(c) Verify that you have proved in (b) that both F-ratios are equal.
Solution:
Tenemos el F-ratio alternativo:
F =

(SSRR SSRU )=#r


SSRU =(n K)

(2.13)

Y el objetivo es demostrar que este es equivalente al otro F-ratio:


F =

(R b

Entonces, ya que:

r)0 [R(X 0 X) 1 R0 ] 1 (R b
b2

r)=#r

(2.14)

b
"0b
"
SSRU
b =
=
n K
n K
2

De aqu podemos decir que los denominadores de ambos F-ratios (2:13) y (2:14)
son equivalentes. Ahora, lo que necesitamos demostrar que los numeradores sean
iguales. Entonces, necesitamos demostrar lo siguiente:
SSRR

SSRU = (R b

Entonces de (2:10) tenemos:


SSRR

SSRU = (R b

r)0 [R(X 0 X) 1 R0 ] 1 (R b

r)

(2.15)

r)0 [R(X 0 X) 1 R0 ] 1 R(X 0 X) 1 R0 [R(X 0 X) 1 R0 ] 1 (R b


{z
}
|

r)

Y obtenemos lo que necesitamos demostrar en (2:15):


SSRR

SSRU = (R b

r)0 [R(X 0 X) 1 R0 ] 1 (R b

r)

Por lo tanto queda demostrado que ambos F-ratios son equivalentes.

2 APPLIED SECTION
1. What is the main objective of this article?
Solution:
El principal objetivo de este artculo es explicar el motivo por el cual los pases que
fueron colonizados por los europeos y que eran relativamente ricos en el siglo XVI son en
la actualidad relativamente pobres. Esta reversin est argumentada bajo la hiptesis
institucional en contra de la hiptesis geogrca, la cual vincula a los factores geogrcos
como determinante del desarrollo econmico.
5

2. According to your answer in question 1, what would be the ideal population model to
be tested? Can the model you proposed be estimated?
Solution:
Mi modelo a ser estimado es el siguiente
P IB1995 = P IB1500 + F pol + F Inst + F Geo + paiscol + "
donde:
P IB1995 : es el logaritmo del producto per cpita en 1995
P IB1500: es el logaritmo del producto per cpita en 1500. Esta variable sera la original
en vez de la proxy de urbanizacin en 1500 que usanlos autores.
F pol : es el factor poltico de los pases en 1500
F Inst : es el factor institucional de los pases en 1500
F Geo : es el factor geogrco de los pases en 1500
paiscol: es una dummy de pases colonizados en 1500
No puedo estimar mi modelo debido a que no se cuenta con datos robustos del P IB1500:
3. Replicate Figure I on the article. What are the authors trying to convey with this gure?
Solution:
El cdigo para replicar la Figura I es el siguiente:
#Question 3. FIGURE 1
#Using subset function
newdata <- subset(base_hw3, baserf==1, select=c(logpgp95, sjb1500, shortnam))
#Llamo a esa nueva base para trabajar con ella
attach(newdata)
#Ploteo el grco entre log GDP per capita 1995 y urbanizacin en 1500. La opcin
type="n" es para que no me aparezca ningun punto.
plot(sjb1500, logpgp95, type="n", xlab="Urbanization in 1500",ylab="Log GDP per
capita, PPP, 1995", ylim=c(6.85,10),xlim=c(0,20))
#Add regression line (y~x)
abline(lm(logpgp95~sjb1500), col="red")
#Aqu ya agrego los nombres de los pases
for(i in 1:41){
text(sjb1500[i],logpgp95[i],labels=shortnam[i],cex=0.60,col="blue")

Los autores estn tratando de mostrar que hay una relacin negativa entre el porcentaje
de la poblacin viviendo en ciudades con ms de 5000 habitantes en 1500 (urbanizacin
en 1500 es una proxy de de desarrollo econmico) y el PIB per capita de 1995. Esto
muestra que los pases colonizados por europeos en 1500 que eran relativamente ricos
ahora son relativamente pobres tal como Per, Egipto. Adems, muestra que pases
colonizados por europeos en 1500 que eran relativamente pobres son ahora relativamente
ricos tal como Estados Unidos, Canada.
4. In the second paragraph in page 1240 the authors state that a country with 10 percentage
points higher urbanization has, on average, 46 percentage greater income per capita.
How do the authors get this number?
Solution:
Los autores obtienen este nmero aplicando la formula del cambio porcentual en el y
(logGDP per capita) predicho:
% cy = 100:[exp(b x)

1]

donde la multiplicacin por 100 es el cambio proporcional en un cambio porcentual y


x es la urbanizacin en 1500 . Como los autores sealan que un pas con 10 puntos

porcentuales de ms alta urbanizacin, entonces

x = 10:Entonces:

% cy = 100[exp(0:038 10)
% cy = 46; 22845894
% cy
46

1]

5. What is the main idea of Table III? (Hint: State your answer in terms of Strict Exogeneity Assumption)
Solution:
El autor realiza una estimacin primero entre el log GDP per capita en 1995 y la urbanizacin en 1500 (como proxy de la prosperidad de las colonias en 1500) dejando en
el error varias variables como dummies por continente, factores geogrcos y climaticos,
y otras variables, las cuales estn altamente correlacionadas con la variable de urbanizacin. Sin embargo, el autor al incluir otras variables prueba que la relacin entre log
GDP per capita y la urbanizacin en 1500 no cambia, es decir, esta relacin sigue siendo
negativa.
6. Please, replicate the estimated coe cients and their standard errors of columns 1-8 of
Table III using lm command in R. (Hint: Use subset option of lm function along with
the variable baserf = 1 for the proper selection of the data used in the article. For model
6, you must use the neoeur dummy variable for selecting the proper sample. Please
replace neoeur = 0 if the country is Argentina.)
Solution:
Para ver la tabla, ver Anexo 1. Aqu se coloca el cdigo:
#Question 6. TABLE 3 (COLUMNS 1-8)
#Aqu estimo las 8 regresiones de la tabla, hallando los coecientes y errores standard.
ols_1 <- lm(logpgp95 ~sjb1500, data=subset(base_hw3,baserf==1))
se_1 <-sqrt(diag(vcov(ols_1)))
ols_2 <- lm(logpgp95 ~sjb1500, data=subset(base_hw3,baserf==1 & nafrica!=1))
se_2 <-sqrt(diag(vcov(ols_2)))
ols_3 <- lm(logpgp95 ~sjb1500, data=subset(base_hw3,baserf==1 & america!=1))
se_3 <-sqrt(diag(vcov(ols_3)))
ols_4 <- lm(logpgp95 ~sjb1500, data=subset(base_hw3,baserf==1 & america==1))
se_4 <-sqrt(diag(vcov(ols_4)))
ols_5 <- lm(logpgp95 ~sjb1500 + asia + africa + america, data=subset(base_hw3,baserf==1))
se_5 <-sqrt(diag(vcov(ols_5)))
#En esta regresin reemplazo neouer=0 cuando el pas es Argentina.
8

#Esto lo hago primero creando un nuevo subconjunto de la base de datos solo con las
variables a usar
E<- subset(base_hw3, baserf==1, select=c(logpgp95, sjb1500, shortnam, neoeur))
#Llamo a esa nueva base de datos
attach(E)
#Creo un vector donde aparezca neoeur igual cero cuando pas es Argentina
neoeur2<-as.data.frame(replace(neoeur, shortnam=="ARG", 0))
#Reemplazo la columna 4 de mi base "E" que es neoeur por neoeur2.
#Aqu me aparecer con el nombre neoeur pero con las observacioes de neoeur2
E[1:41,4:4] <- neoeur2[1:41,1:1]
ols_6 <- lm(logpgp95 ~sjb1500, data=subset(E, neoeur!=1 ))
se_6 <-sqrt(diag(vcov(ols_6)))
ols_7 <- lm(logpgp95 ~sjb1500 + lat_abst, data=subset(base_hw3,baserf==1))
se_7 <-sqrt(diag(vcov(ols_7)))
ols_8 <- lm(logpgp95 ~sjb1500 + humid1 + humid2 + humid3 + humid4 + temp1
+ temp2 + temp3 + temp4 + temp5 + steplow + deslow + stepmid + desmid,
data=subset(base_hw3,baserf==1))
se_8 <-sqrt(diag(vcov(ols_8)))
#Make a table
library("memisc")
table_3 <- mtable("Base sample" = ols_1,
"Without North Africa" = ols_2,
"Without the Americas" = ols_3,
"Just the Americas" = ols_4,
"With continent dummies" = ols_5,
"Without neo-Europes" = ols_6,
"Controlling for latitude" = ols_7,
"Controlling for climate" = ols_8,
summary.stats = c("N", "R-squared"),
coef.style = "default")
table_3

7. Please, replicate the F-tests of column 8 in Table III using your own function. This
implies that you have to create a short function that returns the F-statistic and the
p-value. (Hint: Some functions that might help you to create your own function is coef
which extracts the estimated coe cients, and vcov which extract the variance-covariance
matrix of b.)
Solution:

A continuacin se presenta el cdigo en R:

#QUESTION 7. TABLE 3 (COLUMNS 8) - F tests


#******************************************
#Creo un nuevo subconjunto de la base de datos original pero solo con las variables
estimadas en la regresin ocho
m8 <- subset(base_hw3, baserf==1, select=c(logpgp95, sjb1500, temp1, temp2, temp3,
temp4, temp5, humid1, humid2, humid3, humid4, steplow, stepmid, deslow, desmid))
#Creo una formula con la regresin de la columna ocho
modelo8<-formula(logpgp95 ~sjb1500 + temp1 + temp2 + temp3 + temp4 + temp5 +
humid1 + humid2 + humid3 + humid4 + steplow + stepmid + deslow + desmid)
#Hago la estimacin
ols8 <- lm(modelo8, data = base_hw3, subset = (baserf == 1))
#Creo tres vectores con el n de utilizarlos en el test F
temperature<- subset(base_hw3, baserf==1, select=c(temp1, temp2, temp3, temp4,
temp5))
humidity<-subset(base_hw3, baserf==1, select=c(humid1, humid2, humid3, humid4))
soil<-subset(base_hw3, baserf==1, select=c(steplow, stepmid, deslow, desmid))
#Creo las matrices R y r for temperature
R<-matrix(0,ncol(temperature),ncol(m8))
for (i in 1:ncol(temperature)) {
R[i,i+2]<-1
}
r<-matrix(0,nrow(R),1)
#Esta funcin me da el F-estadstico y el p-value:
fandp <- function(R,r){
varcov <- as.matrix(vcov(ols8))
beta <- as.matrix(coef(ols8))
Fc <- (t((R%*%beta - r))%*%solve(R%*%varcov%*%t(R))%*%(R%*%beta - r))/ nrow(R)
10

return(c(Fc, pf(Fc,nrow(r),ols8$df.residual, lower.tail = FALSE)))


}
fandp(R,r)
[1] 1.4817163 0.2298061
#Creo las matrices R y r for humidity
R<-matrix(0,ncol(humidity),ncol(m8))
for (i in 1:ncol(humidity)) {
R[i,i+7]<-1
}
r<-matrix(0,nrow(R),1)
#Esta funcin me da el F-estadstico y el p-value:
fandp <- function(R,r){
varcov <- as.matrix(vcov(ols8))
beta <- as.matrix(coef(ols8))
Fc <- (t((R%*%beta - r))%*%solve(R%*%varcov%*%t(R))%*%(R%*%beta - r))/ nrow(R)
return(c(Fc, pf(Fc,nrow(r),ols8$df.residual, lower.tail = FALSE)))
}
fandp(R,r)
[1] 1.0463610 0.4025673
#Creo las matrices R y r for soil
R<-matrix(0,ncol(soil),ncol(m8))
for (i in 1:ncol(soil)) {
R[i,i+11]<-1
}
r<-matrix(0,nrow(R),1)
#Esta funcin me da el F-estadstico y el p-value:
fandp <- function(R,r){
varcov <- as.matrix(vcov(ols8))
beta <- as.matrix(coef(ols8))
Fc <- (t((R%*%beta - r))%*%solve(R%*%varcov%*%t(R))%*%(R%*%beta - r))/ nrow(R)
return(c(Fc, pf(Fc,nrow(r),ols8$df.residual, lower.tail = FALSE)))
}
11

fandp(R,r)
[1] 0.1577655 0.9576987
En resumen, los F estadsticos y p-values para cada caso son:
F
T emperature
Humidity
Soil quality

statistic
1:4817163
1:0463610
0:1577655

p value
0:2298061
0:4025673
0:9576987

Vale resaltar que el p-value de Temperature es diferente al que aparece en la tabla debido
a que los autores se equivocaron. Sin embargo, sigue siendo no signicativo y no varia
en nada.
8. In page 1252 the author explain the results in table V, and state that In Panel B we
separate the eects of these two components and nd that they come in with equal and
opposite signs, showing that the specication with population density is appropriate.
Explain why the authors claim this.
Solution:
En la table V se hace una regresin entre el ingreso per capita de 1995 y la densidad poblacional de 1500. Para calcular la densidad poblacional, los autores utilizan la
cantidad de poblacin total sobre la tierra cultivable, pero cuando se separa de estos
elementos, el autor se enfrenta a dos situaciones:
a) Las reas con suelos cultivables altamente productivas tienen un incremento en el
ingreso, pero al mismo tiempo se transforman en polos de atraccin, produciendose un
incremento en la poblacin (signo positivo).
b) El incremento constante de la poblacin puede ocasionar un exceso de habitantes que,
en cierta medida, produce disminuciones en el ingreso per capita (signo negativo).
Por esta razn, el autor arma que es apropiada la especicacin con densidad poblacional.
9. Explain the Institutions Hypothesis of the reversal and how the authors test this hypothesis in Econometric Terms.
Solution:
La hiptesis de institucin de la reversin sostiene que sociedades con una organizacin
social que proporcionan el estmulo para la inversin van a prosperar. Adems, los autores sealan que una buena organizacin de sociedad que corresponda a un conjunto de
instituciones (polticas, econmicas y sociales), garantiza que haya derechos de propiedad
ecaces. Esto se le conoce como instituciones de propiedad privada. Por otro lado, hay
instituciones extractivas, donde la mayora de la poblacin enfrenta un alto riesgo de
expropiacin y atraco por el gobierno, la elite gobernante, u otros agentes. Asimismo,

12

la hiptesis de las instituciones tambin sugieren que las sociedades que son prosperas
hoy deben tender a ser prosperas en un futuro.
Los autores modelan esto de la siguiente manera:
Y = X+ Z+

(II.9.1)

donde y son coecientes y son los errores. La variable Y es el ingreso per capita de
1995, X es una medida de instituciones, y Z es la densidad poblacional (o urbanizacin)
en 1500. La variable Z est incluida en la ecuacin previa ya sea porque tiene un efecto
directo sobre Y o porque tiene un efecto a travs de algunas variables que no estn
incluidas en el anlisis. La hiptesis que le interesan a los autores es = 0, es decir,
la densidad poblacional o urbanizacin en 1500 afecta el ingreso per cpita de 1995 solo
por instituciones.
Esta hiptesis requiere que exista una relacin estadstica entre X e Y: As que ellos
postulan que:
X = Z +v
Suponen que es independiente de X y Z y que v es independiente de Z: Luego, regresionan Y (ingreso per cpita de 1995) sobre Z (urbanizacin en 1500):
Y = bZ + u1
Como es bien conocido, el lmite de la probabilidad del estimador OLS de la regresin,
bb, es:
p lim bb = +

De esta manera, cualquier resultado tiene que ser consistente con = 0 mientras que 6=
0 y 6= 0: En este caso, capturan el efecto de Z (densidad poblacional o urbanizacin)
en los ingresos de trabajo nicamente a travs de las instituciones. Esta es la hiptesis
que los autores estn interesados para poner a prueba.
Bajo los supuestos a la independencia de Z a partir de v y , y de X a partir de ,
hay una manera sencilla de poner a prueba esta hiptesis, que es ejecutar una regresin
MCO de Y sobre Z y X:
Y = aX + bZ + u2
para obtener los estimadores de b
a y bb: El hecho de que en (II.9.1) es independiente
tanto de X y Z descarta el sesgo de variable omitida, as p lim b
a= y p lim bb = : Por lo
b
tanto, un simple test de si b = 0 es todo lo que se requiere para testear la hiptesis de
que el efecto de Z sobre X es independiente.
Por lo tanto, una prueba sencilla de si b = 0 es todo lo que se requiere para poner a
prueba la hiptesis de que el efecto de Z es a travs de X sola.

13

Vous aimerez peut-être aussi