Vous êtes sur la page 1sur 17

Econometría Avanzada

Taller 1
2018-II
María Alejandra Rocha Troncoso – 201514644
Complementario: Juan Camilo Yamín

Punto 1.
f. Explique la intuición de la Prueba de Hausman en este caso. ¿Qué está pasando cuando
𝜷𝑬𝑭 = 𝜷𝑬𝑨 (en términos de consistencia y eficiencia)? ¿Qué pasa cuando 𝜷𝑬𝑭 ≠ 𝜷𝑬𝑨?
¿Cuál prefiere utilizar en cada caso?
La prueba de Hausman es una prueba de chi cuadrado que nos determina si se evidencian
diferencias sistemáticas y significativas entre los coeficientes de dos estimaciones. Se emplea
con el fin de saber si un estimador es consistente y por otro lado, saber si una variable es o
no relevante.
Estimador 1 Estimador 2
Hipótesis Nula Consistente Consistente y Eficiente

Hipótesis Alterna Consistente Ineficiente

Si el 𝛽 de efectos aleatorios es igual al de efectos fijos, no se rechaza la hipótesis nula y existe


preferencia a la elegir el estimador de Efectos Aleatorios el cual es consistente y eficiente.
Una evidencia estadísticamente significativa sugiere que la hipótesis nula es falsa y por lo
tanto hay evidencia en contra del modelo de Efectos Aleatorios y se prefiere utilizar Efectos
Fijos.
Para obtener el estadístico de Hausman se plantea la siguiente ecuación:
𝐻 = (𝛽𝑐 − 𝛽𝑒 )`(𝐴𝑣𝑎𝑟(𝛽𝑐 − 𝛽𝑒 )−1 (𝛽𝑐 − 𝛽𝑒 )~𝜒𝑘 ,
𝑑𝑜𝑛𝑑𝑒 𝑘 𝑠𝑜𝑛 𝑙𝑜𝑠 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á𝑛 𝑒𝑣𝑎𝑙𝑢𝑎𝑛𝑑𝑜.
g. Utilice ahora la base de datos “Pruebas.dta” para desarrollar una prueba de Hausman.
Esta base contiene información sobre el puntaje en matemáticas obtenido por estudiantes
de 550 distritos entre los años de 1992 y 1998. Para analizar cuáles son los factores que
influyen en el desempeño escolar promedio en los distritos, se propone el siguiente modelo:
𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜𝑑𝑡 = 𝛼0 + 𝛼1 𝑔𝑎𝑠𝑡𝑜𝑑𝑡 + 𝛼2 𝑠𝑎𝑙𝑎𝑟𝑖𝑜𝑑𝑡 + 𝛼3 𝑑𝑒𝑠𝑒𝑟𝑐𝑖ó𝑛𝑑𝑡 + 𝛼4 𝑎𝑙𝑢𝑚𝑛𝑜𝑠𝑑𝑡 + 𝜔𝑑𝑡
Estime el modelo por efectos fijos y por efectos aleatorios con los comandos directos y muestre sus
resultados. ¿Cuál modelo cree usted es más adecuado para este análisis y por qué?
Efectos Fijos Efectos Aleatorios
VARIABLES Aprobado Aprobado

Gasto 0.00685*** 0.00502***


(0.000331) (0.000298)
Salario 0.000527*** 0.000668***
(3.68e-05) (3.44e-05)
Deserción 0.00415 -0.0571*
(0.0333) (0.0336)
Alumnos 0.000510 -0.000273***
(0.000406) (5.94e-05)
Constant -10.07*** -3.306***
(1.708) (1.130)

Observations 3,765 3,765


R-squared 0.491 0.4857
Number of distrito 550 550
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1.
¿Cuál modelo cree usted es más adecuado para este análisis y por qué?
Establecer cual de los dos modelos es el mejor para estimar el desempeño escolar promedio es
necesario tener en cuenta los supuestos correspondientes a Efectos Fijos y Efectos Aleatorios.
Así, para el modelo de Efectos Aleatorios asumimos que la correlación entre la heterogeneidad
individual y las variables observadas es cero: 𝐸[𝛼𝑖 , 𝑥𝑖𝑡 ] = 0. Lo anterior implica que no existe una
característica individual que no varía a lo largo del tiempo que no influya en el gasto, el salario, la
deserción y los alumnos. Este supuesto es muy difícil de cumplir, dado que intuitivamente se establece
que características del distrito como su producción, regalías, corrupción no influyen en variables tan
importantes como el gasto.
Por otro lado, el modelo de Efectos Fijos asume el supuesto de que 𝐸[𝛼𝑖 , 𝑥𝑖𝑡 ] ≠ 0, es decir, la
heterogeneidad por distrito tiene correlación con las variables observadas. Este modelo puede
identificarse como el más adecuado porque permite mayor flexibilidad de encontrar características
inherentes del distrito relacionadas con el gasto, el salario, la deserción y los alumnos. Con base en
lo obtenido en las estimaciones, se observa que para el modelo de Efectos Fijos todas las variables
presentan una significancia.
h. Realice una prueba estadística formal para comparar los estimadores de efectos fijos y
efectos aleatorios. ¿Qué implicaciones tienen los resultados de la prueba? ¿Cuál de las dos
metodologías es más adecuada?

Se realiza la prueba de Hausman para comparar los estimadores de Efectos Fijos y Efectos
Aleatorios y se obtiene lo siguiente:
𝜒42 = 245.74
𝑃𝑟𝑜𝑏 > 𝜒2 = 0.000
Así, con un p-valor menor a 0.05 se rechaza la hipótesis nula y se concluye que Efectos Fijos
es la metodología más adecuada para estimar el modelo.
¿Qué implicaciones tienen los resultados de la prueba? ¿Cuál de las dos metodologías es
más adecuada?
Los resultados de la prueba implican que el 𝛽 de Efectos Fijos es inconsistente pero eficiente.
Así, con base en la intuición realizada en el literal g, la metodología más adecuada para
estimar el modelo es la de Efectos Fijos por que es posible que existe una correlación entre
la heterogeneidad individual del distrito y las variables observadas.

Punto 2.
a. Este punto se encuentra en las hojas examen.
b. Discuta si el estimador de IV encontrado anteriormente es consistente para evaluar el
impacto del programa “Pequeños Pilos”. Justifique.
Para evaluar si el estimador de Variables Instrumentales es consistente es necesario tener en
cuenta tres factores: exogeneidad, relevancia y Monotonicidad. En este caso, se elige como
IV la elegibilidad.
El instrumento es no exógeno porque si bien no me está influyendo ni cambiando mi variable
𝑦𝑖 , en este caso, correspondiente a la medida estandarizada de habilidades cognitivas. Así,
intuitivamente conozco que no debo incluir esta variable en el modelo. Este solo me establece
la elegibilidad en el modelo si me encuentro dentro del rango del SISBEN menor o igual a
17 que me clasifica como elegible para recibir el paquete nutricional. Sin embargo, dado que
existe la decisión de tomar o no el paquete nutricional, existe una decisión endógena y se
duda de la exogeneidad del instrumento para evaluar el impacto del programa.
Por otro lado, el instrumento es relevante por su alta correlación con mi variable observable,
en este caso la variable dicótoma Di , que me indica si efectivamente el hogar recibió el
paquete nutricional y 0 si pasó lo contrario. Así, en un ambiente real, son los hogares
elegibles, identificados por el instrumento, lo que efectivamente deberían recibir el paquete
nutricional. Y sucede lo contrario con lo que se encuentran por encima del umbral los que no
deberían recibir el paquete nutricional, aunque esto no siempre sucede.
Además, se evalúa la monotinicidad del instrumento, la cual es clara al establecer que, según
el umbral de elegibilidad, su efecto sobre la variable dicótoma es definida y siempre positiva.
Finalmente, se concluye que el instrumento no es consistente para evaluar el programa de
“Pequeños Pilos”.

c. Para solucionar este problema, usted consulta a un profesor de la facultad, quien le


propone pensar la elegibilidad como si fuera aleatoria dentro de un ancho de banda muy
pequeño alrededor del umbral (Sisben=17). Esto siempre que no haya manipulación del
puntaje del Sisben en este punto de corte. Con la finalidad de comprobar esta hipótesis
realice dos cosas:
Primero, utilice el comando kdensity para mirar cómo se comporta la distribución del
puntaje alrededor del umbral. ¿Nota alguna acumulación/manipulación de este?
En la gráfica de densidad de Kernel se observa que no existe manipulación del puntaje
alrededor del umbral. Lo anterior se explica por que se debería observar una acumulación
antes del umbral y una disminución abrupta después de este. Esto se explica por que las
personas conocen el algoritmo para calcular el Sisben y por lo tanto lo manipulan con el fin
de recibir el tratamiento y los beneficios que trae estar debajo del umbral. En esta también se
observa que la muestra tiene una acumulación notable de individuos con puntaje del Sisben
de 10 y aproximadamente en 25.
Segundo, realice pruebas de medias entre elegibles y no elegibles para las variables
personas, educa_jefe, ocupado_jefe, ingresos_hogar_jefe dentro de un ancho de banda de
10 puntos del Sisben. Luego repita las pruebas, pero esta vez dentro de un ancho de banda
de 5 y 1 punto. ¿Qué encuentra? Explique cuál es la intuición detrás de esto.

 Prueba de medias en un ancho de banda de 10 y 5 puntos:


Al correr los comandos en Stata (Ver Do File) para cada variable en un ancho de banda
de 10 y 5 puntos. Se encuentra que la diferencia de medias para las variables
correspondientes a la educación del jefe de familia, si este se encuentra ocupado y los
ingresos del hogar del jefe son significativos y su p-valor corresponde a un valor cercano
a 0, por lo tanto el ancho de banda no es el adecuado. Lo anterior sucede por que hay
diferencias significativas en las características de estas variables y el ancho de banda
incluye a individuos muy heterogéneos.

 Prueba de medias en un ancho de banda de 1 punto:


Al realizar una prueba de medias para un ancho de banda de 1 punto encontramos que la
diferencia de medias no es significativa para ninguna de las variables, lo que nos indica
que es posible que el ancho de banda de 1 punto sea el correcto.

La intuición que sucede detrás de esto es que al disminuir el ancho de banda se están
evaluando individuos con características individuales muy parecidas y así, no hay
diferencias en sus medias, es decir, no hay existen diferencias sistemáticas entre
individuos. Al igual, se reduce la muestra al disminuirlo. Al ampliar el ancho de banda
estamos incluyendo individuos más diferentes en sus características individuales. Sin
embargo, estos son pruebas con anchos de bandas aleatorios y no nos indican si realmente
el ancho de banda óptimo es el de 1 punto dado que, se considera un valor relativamente
pequeño para realizar una estimación correcta del modelo.

d. Explique el trade-off que enfrenta el econometrista a la hora de escoger el ancho de banda.


Utilice el comando rdbwselect para encontrar un ancho de banda óptimo a los datos.

El economista enfrenta varios trade-off a la hora de escoger un ancho de banda óptimo para
analizar el programa.
En primer lugar, se encuentra el trade-off entre precisión y sesgo. Lo que sucede es que, al
hacer mi ancho de banda más amplio, este aborda individuos más heterogéneos, con
características diferentes e incurro en un sesgo de selección. Cuando lo hago más pequeño,
mis observaciones y la muestra que necesito para realizar la estimación se reduce y por lo
tanto pierdo precisión. Además, se debe tener en cuenta que mi efecto es local para aquellas
personas que se encuentran en el ancho de banda y no es aplicable para toda la población.

Por otro lado, se evidencia un trade-off entre consistencia y eficiencia. Como se menciona en
el literal anterior, mi instrumento es relevante y por lo tanto establece la elegibilidad en el
tratamiento, lo cual puede ser identificado como consistencia. Sin embargo, dado que el
efecto es local pierdo eficiencia, disminuyendo mis grados de liberad por que mi muestra se
reduce significativamente. Así, el trade-off entre consistencia y eficiencia se puede generar a
la hora de ampliar o disminuir mi ancho de banda.

Se utiliza el comando rdbwselect para encontrar el ancho de banda óptimo y se obtiene lo


siguiente:

Ancho de Banda (h)


Method Left of c Right of c
mserd 3.064 3.064

En la tabla se observa que el ancho de banda óptimo para estimar es de 3.06. Así, mi valor
más pequeño es de 13.936 y mi mayor valor corresponde a 20.064.

e. Suponga que antes de estimar el efecto del tratamiento, a usted le interesa estimar dentro
del ancho de banda óptimo la intención del tratamiento (ITT):

𝑰𝑻𝑻 = 𝑬[𝑻𝑽𝑰𝑷𝒊 |𝒁 = 𝟏] − 𝑬[𝑻𝑽𝑰𝑷𝒊 |𝒁 = 𝟎]

Esto lo hace estimando por MCO el siguiente modelo:

𝑻𝑽𝑰𝑷𝒊 = 𝜸𝟎 + 𝜸𝟏 𝒁𝒊 + 𝜸𝟑 𝒔𝒊𝒔𝒃𝒆𝒏 + 𝒖𝒊

Estime el modelo e interprete el estimador de interés.

VARIABLES TVIP

z 0.292***
(0.0681)
Sisben 0.0195
(0.0177)
Constant -0.194
(0.331)

Observations 768
R-squared 0.064
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

La regresión muestra el efecto de la elegibilidad y el Sisben en las habilidades cognitivas de


un niño. En este caso, nuestra variable de interés corresponde al instrumento Z que determina
la elegibilidad con base en el puntaje del Sisben.
Así, pertenecer al grupo que tiene un puntaje menor o igual a 17 tiene un efecto de 0.292
puntos en el puntaje de habilidades cognitivas en un niño. La variable es significativa al 99%
de significancia lo que nos indica que su efecto sobre el TVIP es relevante. Por otro lado, la
variable de Sisben no es significativa a ningún porcentaje de confianza y por lo tanto no es
analizada.
El 𝑅 2 de la regresión es de 0.064, lo que nos indica que la variación del puntaje de habilidades
cognitivas está explicada en un 6.4% por la variación en las variables observables.

Justifique por qué este modelo sí es el adecuado para encontrar el ITT.


𝑰𝑻𝑻 = 𝑬[𝑻𝑽𝑰𝑷𝒊 |𝒁 = 𝟏] − 𝑬[𝑻𝑽𝑰𝑷𝒊 |𝒁 = 𝟎]
Aplicando la definición de ITT al modelo planteado y realizando las diferencias se obtiene
lo siguiente:
𝐸[𝑇𝑉𝐼𝑃𝑖 |𝑍 = 1] = 𝐸[𝛾0 + 𝛾1 𝑍𝑖 + 𝛾3 𝑠𝑖𝑠𝑏𝑒𝑛 + 𝑢𝑖 |𝑍 = 1]
= 𝐸[𝛾0 |𝑍 = 1] + 𝐸[𝛾1 |𝑍 = 1] + 𝐸[𝛾3 𝑠𝑖𝑠𝑏𝑒𝑛|𝑍 = 1] + 𝐸[𝑢𝑖 |𝑍 = 1](∗)
𝐸[𝑇𝑉𝐼𝑃𝑖 |𝑍 = 0] = 𝐸[𝛾0 + 𝛾1 𝑍𝑖 + 𝛾3 𝑠𝑖𝑠𝑏𝑒𝑛 + 𝑢𝑖 |𝑍 = 0]
= 𝐸[𝛾0 |𝑍 = 0] + 𝐸[𝛾1 |𝑍 = 0] + 𝐸[𝛾3 𝑠𝑖𝑠𝑏𝑒𝑛|𝑍 = 0]𝐸[𝑢𝑖 |𝑍 = 0](∗∗)

Realizando la resta entre (*) y (**), se obtiene que:


𝐼𝑇𝑇 = 𝐸[𝛾0 |𝑍 = 1] + 𝐸[𝛾1 𝑍|𝑍 = 1] + 𝐸[𝛾3 𝑠𝑖𝑠𝑏𝑒𝑛|𝑍 = 1] + 𝐸[𝑢𝑖 |𝑍 = 1]
− (𝐸[𝛾0 |𝑍 = 0] + 𝐸[𝛾1 𝑍|𝑍 = 0] + 𝐸[𝛾3 𝑠𝑖𝑠𝑏𝑒𝑛|𝑍 = 0]𝐸[𝑢𝑖 |𝑍 = 0])
= 𝐸[𝛾1 𝑍|𝑍 = 1] = 𝐸[𝛾1 |𝑍 = 1] = 𝛾1 = 𝐼𝑇𝑇

Así, se comprueba que 𝛾1 representa la intención de tratamiento y se concluye que este


modelo sí es el adecuado para encontrar el ITT.

¿Cree usted que es importante controlar por el puntaje del sisben de forma lineal?
Sí es importante controlar por el puntaje del Sisben de forma lineal debido a que esto nos
permite un ajuste de acuerdo con el comportamiento y así, obtener el efecto real dentro del
ancho de banda óptimo sobre las personas que recibieron el paquete nutricional en
comparación a las que no. Esto se puede observar de mejor manera en el siguiente gráfico
obtenido de la clase de Adriana Camacho (2018):
Como se identifica en la gráfica, con promedios simples no observa de manera efectiva el
efecto en la variable de resultado. Mientras que, con un ajuste lineal, se añade de acuerdo con
el comportamiento antes y después del umbral y se obtiene un efecto más real del programa.
Así, lo que permite el ajuste lineal es tener en cuenta la relación entre la variable de resultado
y la variable de focalización.
Además, dado que la asignación de tratamiento y control no fue aleatoria, entonces controlar
por una tendencia lineal ayuda a reducir el sesgo de selección.

f. ¿Qué relación puede observar entre el ITT del literal (e) y el estimador de IV encontrado
en el literal (a)?
En este punto se realiza una comparación entre el ITT que se encuentra a continuación:
𝐼𝑇𝑇 = 𝐸[𝑇𝑉𝐼𝑃𝑖 |𝑍 = 1] − 𝐸[𝑇𝑉𝐼𝑃𝑖 |𝑍 = 0]
Y el estimador de Wald, correspondiente a variables instrumentales del literal a:
̅̅̅̅̅̅̅1 − 𝑇𝑉𝐼𝑃
𝑇𝑉𝐼𝑃 ̅̅̅̅̅̅̅0
𝛽̂
𝑊𝑎𝑙𝑑 = ̅1 − 𝐷
𝐷 ̅0
Lo que nos indica el ITT es mi efecto del tratamiento según elegibilidad. Así, el efecto se
estima por medio de las diferencias en el puntaje de habilidades cognitivas dado que estoy en
el grupo de elegidos con un puntaje menor o igual a 17 puntos, menos mi puntaje de
habilidades cognitivas dado que mi puntaje del Sisben es mayor a 17 puntos. Por otro lado,
el estimador de variables instrumentales me indica la diferencia de medias en puntajes de
habilidades cognitivas con base en sí efectivamente recibí el paquete nutricional del
programa.
Lo que se puede identificar como la relación entre los dos es que cada uno toma en cuenta el
efecto del tratamiento dada la elegibilidad, pero, el estimador de Wald tiene en su estimación
las personas de las elegibles que efectivamente sí decidieron recibir el tratamiento.
De esta manera, se puede intuir que el numerador del estimador de Wald corresponde al
mismo ITT.

De manera más específica, se puede observar a partir de lo siguiente:


𝐸[𝑇𝑉𝐼𝑃𝑖 |𝑍 = 1] − 𝐸[𝑇𝑉𝐼𝑃𝑖 |𝑍 = 0]
𝛽𝑊𝑎𝑙𝑑 =
𝐸[𝐷𝑖 |𝑍 = 1] − 𝐸[𝐷𝑖 |𝑍 = 0]
Cuando 𝐸[𝐷𝑖 |𝑍 = 1] = 1 y 𝐸[𝐷𝑖 |𝑍 = 0] =0 nos indica que los paquetes
nutricionales fueron distribuidos efectivamente en todos aquellos que se encuentran
en un rango del Sisben menor o igual a 17 y por lo tanto el estimador de Wald se
convierte en el mismo ITT, que es lo que se esperaría observar. Así, dado que no es
lo que sucede y 𝐸[𝐷𝑖 |𝑍 = 0] ≠ 0, entonces se tienen en cuenta a aquellos que tomaron el
programa, afectados por la variable instrumental.

Bajo el supuesto del literal (c) ¿cree usted que podría estimar de forma válida el efecto del
programa “Pequeños Pilos” sobre las habilidades cognitivas de los niños utilizando IV?
El supuesto del literal c establece que no existe manipulación en el puntaje del Sisben de
acuerdo con la gráfica de Kernel y, por otro lado, que el ancho de banda correcto según las
pruebas de medias es de un punto. Así, bajo los dos supuestos enunciados se podría estimar
de forma válida el efecto del programa sobre las habilidades cognitivas de los niños utilizando
IV. Sin embargo, en primer lugar, es necesario determinar la exogeneidad del instrumento.
Intuitivamente, de acuerdo con lo obtenido en el literal c, el instrumento es exógeno por que
se encuentra dentro de un ancho de banda óptimo que acota individuos relativamente
homogéneos. Por otro lado, es necesario tener en cuenta que el ancho de banda no
corresponde al óptimo y tomar un ancho de banda de 1 punto puede incurrir en imprecisión
dado que es una cantidad de observaciones muy pequeña para el análisis.

g. Estime este efecto con el comando ivreg2 dentro del ancho de banda óptimo y muestre
ambas etapas.
Primera Segunda
Etapa Etapa
VARIABLES D TVIP

Sisben -0.0321** 0.0376


(0.0155) (0.0236)
Z=Eligibilidad 0.517***
(0.0597)
D 0.564***
(0.145)
Constant 0.725** -0.603
(0.290) (0.461)

Observations 768 768


R-squared 0.407
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

¿Es la elegibilidad relevante para explicar el tratamiento?


La elegibilidad es relevante para explicar mi participación en el tratamiento, pero esta no me
explica ni debe influir sobre los resultados del tratamiento. Por lo anterior, es por esto que la
elegibilidad es usada como instrumento y en la primera etapa se observa que es significativa
al 1% de significancia como variable dependiente de mi variable dicótoma.
La intuición detrás de la primera etapa puede ser analizado como:
Ser parte de los elegibles que tienen un Sisben menor o igual a 17, aumenta mi probabilidad
de ser tratado significativamente.
Así, se concluye que la elegibilidad es relevante para explicar la probabilidad de participar
en el tratamiento más no para explicar como tal el tratamiento.

Interprete el estimador de interés. ¿Es este efecto local? Argumente.


El estimador de interés se evidencia en la segunda etapa como el D, instrumentado por la
elegibilidad, este me indica que al efectivamente recibir el paquete nutricional proporcionado
por el programa de “Pequeños Pilos”, mi puntaje de habilidad cognitiva aumenta en 0.564 en
aquellos que estuvieron afectados por la elegibilidad. Lo anterior sucede a que el efecto es
local. La variable instrumentada es significativa al 99% de confianza.
De acuerdo con lo anterior, al efecto sí es local dado que estamos analizando bajo un ancho
de banda óptimo limitado y al mismo tiempo estamos instrumentando, lo que se podría
interpretar como una “doble localidad”. Es decir, el ancho de banda nos permite analizar
personas con características homogéneas sin diferencias en sus medias y el instrumento afecta
entre aquellos elegibles o no elegibles. Por lo tanto, no es posible extrapolar el análisis a toda
la población que se encuentra en la muestra sino solo a aquellos que se encuentran dentro del
ancho de banda óptimo y los que muestran un resultado diferente dado el instrumento.

h. Usted le comenta su investigación a un compañero y él le explica que lo que está estimando


es una regresión discontinua borrosa. Con la finalidad de comprobar esto, utilice el
comando rdrobust para estimar el efecto del programa (asegúrese de utilizar la opción all).
Se estima la variable dependiente TVIP en función de la variable de Sisben normalizada con
base en el comando rdrobust y se obtiene lo siguiente:

VARIABLES TVIP

Convencional 0.528***
(0.169)
Bias-corrected 0.461***
(0.169)
Robust 0.461**
(0.187)

Observations 4,000
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

¿Es el estimador convencional de rdrobust cercano al encontrado en el literal anterior?


El estimado convencional de rdrobust es bastante cercano al estimador de variables
instrumentales realizado bajo el comando ivreg2. En el primer caso este toma un valor de
0.528 y es significativo al 99% de confianza y el de variables instrumentales, adopta el valor
de 0.564 con la misma confianza.

¿Cuál de los tres estimadores es el más confiable y por qué?


De los tres estimadores obtenidos en la estimación, se puede identificar como el más
confiable el correspondiente a robustos dado que corrige por ineficiencia los errores estándar
y factores no paramétricos. Mientras que, los estimadores de bias y convencional no corrigen
ineficiencia. Si bien el de Bias adopta el mismo valor que robustos, este no toma en cuenta
la corrección de errores estándar y por lo tanto es consistente pero ineficiente.
Como se observa, el estimador elegido es significativo al 5% de significancia.

i. Utilizando los comandos twoway y scatter grafique un diagrama de dispersión entre el


TVIP y el puntaje del sisben normalizado.

Además, añada un ajuste lineal para cada lado del umbral con el comando lfit.

Repita esta gráfica, pero esta vez con un ajuste cuadrático.


¿Cuál ajuste cree que es el más adecuado? ¿Qué espera que pase con el estimador de la
regresión discontinua si ya no controla por una tendencia lineal sino cuadrática del
puntaje del Sisben?
Según lo observado en las gráficas se puede concluir que el ajuste cuadrático es el más
adecuado, debido a que se encuentra más acuerdo con respecto al comportamiento de
dispersión del puntaje de habilidades cognitivas respecto al Sisben.
Lo que se espera que suceda cuando el estimador de la regresión discontinua borrosa no se
controla por una tendencia lineal sino por una cuadrática es que, a la hora de la estimación,
el coeficiente obtenido sea más ajustado a los valores reales del puntaje en habilidad cognitiva
con base en el puntaje del Sisben y así, se tome en cuenta el comportamiento de las variables.
Al estimar el modelo por una tendencia cuadrática se esperaría una disminución del
coeficiente con relación al estimado en el literal h, dado que se encuentra ajustado y es un
efecto más real.
Con base en lo obtenido en las gráficas se puede observar que la diferencia entre el ajuste
lineal entre los elegibles y los no elegibles es mayor que cuando se ajusta por una tendencia
cuadrática.

j. Dado lo encontrado en el literal anterior, utilice la opción p( ) del comando rdrobust para
estimar el efecto del programa teniendo en cuenta una función cuadrática del puntaje.

p(2)
VARIABLES TVIP

Convencional 0.437**
(0.201)
Bias-corrected 0.408**
(0.201)
Robust 0.408*
(0.225)
Observations 4,000
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

¿Sus predicciones eran correctas?


Las predicciones eran son correctas y lo que se observa es que el coeficiente de robustos
disminuye en comparación al encontrado en el literal h, debido a que la función cuadrática se
ajusta a lo observado en las gráficas de dispersión y su efecto es más real.
¿Cuál es el efecto final del programa sobre las habilidades cognitivas de los niños?
Dado que se ha seleccionado el estimados de robustos como el más confiable su coeficiente
de 0.408 se analiza como sigue:
Tener un puntaje de Sisben menor o igual a 17 puntos y haber recibido efectivamente el
paquete nutricional general un movimiento de 0.408 desviaciones estándar hacia la derecha,
lo que se puede identificar como un efecto positivo sobre el puntaje estandarizado de la
habilidad cognitiva de los niños. El estimador es significativo al 90% de confianza.

Punto 3.
a. Con el propósito de hacer una evaluación del piloto para la posterior expansión del
programa, usted se enfoca en lo que ocurre entre los momentos (1) y (2). ¿Qué posible
efecto podría estimar en este caso? Explique cuál sería un buen grupo de control y uno de
tratamiento. Especifique que condiciones debe cumplir el grupo de control para no violar
los supuestos del modelo de diferencias en diferencias.

El posible efecto que se podría estimar en este caso es la diferencia promedio entre el
momento 2 y el momento 1 en el grupo de tratamiento. Por otro lado, se podría estimar el
posible cambio esperado entre el período 2 y el período 1 del grupo de control.
Además, se puede observar que sucede con la implementación del programa con la unión de
otros factores, es decir, teniendo en cuenta la inercia de las variables.
El grupo de tratamiento se identifica como las familias elegidas en los 250 barrios
seleccionados aleatoriamente en Bacatá. Para identificar el grupo de control existen varias
opciones:
En primer lugar, se pueden escoger familias con niños menores de 5 años de los 250 barrios
restantes, con el fin de observar que sucede en un momento después cuando estas no reciben
el paquete nutricional del programa “Pequeños Pilos”. Otra opción posible como grupo de
control son aquellos niños mayores de 5 años que conocemos que no han recibido el paquete
nutricional en aquellos mismos barrios seleccionados. Lo anterior permite conocer que
sucede con los niños cuando no han recibido ningún paquete nutricional. Sin embargo, de
este grupo de control no tenemos con exactitud medidas para conocer que ocurre en el
momento (1) y así, se dificulta comprobar las tendencias paralelas entre los dos grupos.
Así, se elige a las familias con niños menores de 5 años de los 250 barrios de Bacatá restantes
que no fueron seleccionados. La aleatorización me permite controlar las características de
cada barrio.
Las condiciones que debe el cumplir el grupo de control para no violar los supuestos del
modelo de diferencias en diferencias son los siguientes:
 Tendencias paralelas: Estas nos indican que la variable de resultado evoluciona de
manera natural en el tiempo de la misma forma entre el grupo de control y tratamiento.
Para lo anterior, se necesita más de un período antes de la intervención.
 Datos antes y después: Encuestas en dos momentos del tiempo. Este también debe
suceder con el grupo de tratamiento. Estos datos pueden ser cortes transversales repetidos
o datos panel.
 Los resultados en ausencia del programa deberían ser los mismos para ambos grupos, es
decir:
[𝐸(𝑌𝑖1 |𝐷 = 1) = 𝐸(𝑌𝑖0 |𝐷 = 0)]
Y lo mismo sucede si los dos grupos tomaran el programa.
 Los factores externos tienen que afectar de la misma forma al grupo de comparación y al
de control.

b. Dado que usted ya definió los grupos de tratamiento y de control y, además, los períodos
previos y posteriores al tratamiento, escriba la ecuación que estimaría para hacer esta
evaluación de impacto. Dado que la unidad de asignación del tratamiento fue el barrio
¿cree usted que debe realizar alguna corrección sobre los estimadores o su varianza?
Dado que nos encontramos trabajando bajo datos panel, la posible estimación para realizar la
evaluación de impacto es la siguiente:
𝑌𝑖 = 𝛽0 + 𝛽1 𝐷𝑖 + 𝛽2 ∗ 𝑃𝑜𝑠𝑡 + 𝛽3 (𝐷𝑖 ∗ 𝑃𝑜𝑠𝑡) + 𝑢𝑖
Donde Post es la variable de tiempo que me indica el momento anterior o posterior a la
implementación del programa y D es una variable dicótoma que me indica si pertenece a
control o a tratamiento.
Siguiendo esta línea, de acuerdo con que la unidad de asignación del tratamiento fue el barrio
considero que se debe realizar una corrección sobre los estimadores o su varianza por que
puede existir un comportamiento similar entre las familias de los barrios, entonces esto se
puede corregir por medio de clusters de barrios para identificar el problema.
Por otro lado, también se puede hacer uso de la siguiente ecuación:
𝑌𝑖2 − 𝑌𝑖1 = 𝛽0 + 𝛽1 (𝐷𝑖2 − 𝐷𝑖1 ) + (𝑢𝑖2 − (𝑢𝑖1 )
Esta estima la primera diferencia para conocer el impacto del programa de pequeños pilos.

c. Suponga que usted tiene la siguiente información


TVIP promedio de TVIP promedio de
los niños menores a los niños menores a
5 años en los 5 años en los
barrios elegidos barrios no-elegidos
Promedio - 0.2
antes del -0.2 0
piloto
Promedio 0.1
después del 0.2 0.1
piloto
0.4 0.1 0.3

¿Cuál sería el estimador de diferencias en diferencias del programa?


Conociendo que el modelo de diferencias en diferencias es:
𝑌𝑖 = 𝛽0 + 𝛽1 𝐷𝑖 + 𝛽2 ∗ 𝑃𝑜𝑠𝑡 + 𝛽3 (𝐷𝑖 ∗ 𝑃𝑜𝑠𝑡) + 𝑢𝑖
El estimador de diferencias en diferencias corresponde al β3 , que es la interacción entre la
variable de tratamiento y lo que sucede después. En este caso en específico, el β3 tiene un
valor de 0.3.
El estimador de diferencias en diferencias nos permite un coeficiente más cercano al efecto
real del tratamiento en comparación al de diferencias que no tiene en cuentan las diferencias
sistemáticas entre los grupos de control y tratamiento.

d. ¿Cómo puede aprovechar estos datos para validar los supuestos antes de iniciar el piloto?
𝑛 𝑛

Yit = β0 + β1 Di + ∑ 𝜆𝑡 𝑇𝑡 + ∑ 𝛿𝑡 ∗ 𝐷𝑖 ∗ 𝑇𝑡 + ui
𝑡=1 𝑡=1
En este caso los n corresponden a todos aquellos meses que se encuentran en la base de datos
antes de iniciar el programa piloto. La D corresponde a 1 si el individuo i recibe el tratamiento
en el período t y o de lo contrario. T captura el efecto de tiempo para los meses antes de la
implementación del piloto.
e. ¿Cómo puede aprovechar estos datos para evaluar si hay efectos diferentes a través del
tiempo?
𝑚 𝑚

Yit = β0 + β1 Di + ∑ 𝜆𝑡 𝑇𝑡 + ∑ 𝛿𝑡 ∗ 𝐷𝑖 ∗ 𝑇𝑡 + ui
𝑡=1 𝑡=1
En este caso los m corresponden a todos aquellos meses que se encuentran en la base de datos
después de haber iniciado el programa piloto. La D corresponde a 1 si el individuo i recibe el
tratamiento en el período t y 0 de lo contrario. T captura el efecto de tiempo para los meses
posterior a la implementación del piloto.
La variable indicador D me indica las diferencias sistemáticas entre los grupos de control y
tratamiento.
La unión de las ecuaciones planteadas en los incisos d y e permiten demostrar las tendencias
paralelas entre los grupos de tratamiento y control durante los meses de antes y después de la
implementación del programa piloto. Demostrar estas tendencias paralelas permite identificar
el efecto real del tratamiento, controlando por las diferencias sistemáticas entre los dos
grupos.

ANEXOS
DO FILE
***************************************************
********************* TALLER 2 ********************
******** María Alejandra Rocha Troncoso ***********
****************************************************

cd "/Users/mariaalejandrarochatroncoso/Documents/2018-2/Econometría
Avanzada/Talleres/Taller 2"
**** PUNTO 1 ****

*g*

use pruebas.dta
tab anho
sort distrito anho
br
xtset distrito anho, yearly
xtreg aprobado gasto salario desercion alumnos, fe
outreg2 using "reg.doc"
est store fe
xtreg aprobado gasto salario desercion alumnos, re
est store re
outreg2 using "reg.doc", append

* h * Prueba de Hausman *

hausman fe re, sigmamore

**** PUNTO 2 ****


clear
use punto2.dta

*c*

* Comportamiento de la distribución alrededor del umbral *


kdensity sisben, xline(17) // No existe manipulación
* Pruebas de medias *
** 10 puntos **
ttest personas if inrange(sisben,7,27), by(D)
ttest educa_jefe if inrange(sisben,7,27), by(D)
ttest ocupado_jefe if inrange(sisben,7,27), by(D)
ttest ingresos_hogar_jefe if inrange(sisben,7,27), by(D) //Significativas, no es el ancho de banda
correcto

** 5 puntos **
ttest personas if inrange(sisben,12,2), by(D)
ttest educa_jefe if inrange(sisben,12,22), by(D)
ttest ocupado_jefe if inrange(sisben,12,22), by(D)
ttest ingresos_hogar_jefe if inrange(sisben,12,22), by(D) //Significativas, no es el ancho de banda
correcto

** 1 punto **
ttest personas if inrange(sisben,16,18), by(D)
ttest educa_jefe if inrange(sisben,16,18), by(D)
ttest ocupado_jefe if inrange(sisben,16,18), by(D)
ttest ingresos_hogar_jefe if inrange(sisben,16,18), by(D) // No significativas y por lo tanto el ancho
de banda es de un punto.

*d*
rdbwselect tvip sisben, c(17) fuzzy(D)

*e*
gen z=1 if sisben<=17
replace z=0 if z==.
reg tvip z sisben if inrange(sisben,13.936,20.064)
outreg2 using "puntoee.doc"

*g*
** Dos Etapas **
ivregress2 2sls tvip (D=z) sisben if inrange(sisben,13.936,20.064), first
est restore first
outreg2 using "estees.doc", replace
est restore second
outreg2 using "estees.doc", append

*h*
*** Normalizando la variable ***
gen sisbenp = -(sisben-17)
gen nsisben = (sisben-17)
rdrobust tvip sisbenp, fuzzy(D) h(3.064) all
outreg2 using "rdrobust.doc"

*i*
scatter tvip sisbenp
twoway (scatter tvip nsisben) (lfit tvip nsisben if z==1) (lfit tvip nsisben if z==0)
twoway (scatter tvip nsisben) (qfit tvip nsisben if z==1) (qfit tvip nsisben if z==0)

*j*
rdrobust tvip sisbenp, fuzzy(D) b(3.064) p(2) all
outreg2 using "p2.doc"

************** FIN DEL DO FILE ********************