Manual Eviews Intermedio

Eviews
Intermedio
Aplicado al Analisis
Microeconometrico
Juan Carlos Abanto Orihuela
1 de julio de 2012
2
Eviews Intermedio
Aplicado al Analisis Microeconometrico
www.giddea.com
administracion@giddea.com
Indice general
1. Microeconometra y Tecnicas de Estimaci on 5
1.1. Estimaci on y An alisis . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1. Funci on de Verosimilitud . . . . . . . . . . . . . . . . . . 5
1.1.2. Score Eciente y Matriz de Informaci on . . . . . . . . . . 6
1.1.3. Estimador MV del Modelo Lineal General . . . . . . . . 6
2. Modelos de Eleccion Discreta 11
2.1.1. Interpretacion Estructural . . . . . . . . . . . . . . . . . 11
2.1.2. Modelo de Probabilidad Lineal . . . . . . . . . . . . . . 13
2.1.3. Modelo de Probabilidad No Lineal . . . . . . . . . . . . 15
2.1.4. Analisis de Probabilidades y Cambios Marginales . . . . 19
3. Modelos de Eleccion Ordinal 23
3.1.1. Modelo de Variable Latente . . . . . . . . . . . . . . . . 24
3.1.2. Testeo de Hip otesis . . . . . . . . . . . . . . . . . . . . . 26
3.1.3. Supuesto de Paralelismo . . . . . . . . . . . . . . . . . . 27
3.1.4. Analisis de Probabilidades y Cambios Marginales . . . . 27
4. Modelos Truncados y Censurados 33
4.1. Variables Dependientes con Truncamiento No Incidental . . . . 34
4.1.1. Variable Aleatoria Truncada . . . . . . . . . . . . . . . . 34
4.1.2. Truncamiento en el Modelo de Regresion . . . . . . . . . 35
4.1.3. Estimacion del Modelo de Regresi on con Variable Trun-
cada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.1.4. Impacto Marginal en el Modelo de Regresion . . . . . . . 36
4.1.5. Variable Aleatoria Censurada . . . . . . . . . . . . . . . 37
4.1.6. Censura en el Modelo de Regresion . . . . . . . . . . . . 37
4.1.7. Estimacion del Modelo de Regresion Censurada . . . . . 38
4.1.8. Efectos Marginales y Bondad de Ajuste . . . . . . . . . . 40
4.2. Variable de Truncamiento Incidental, Sesgo de Selecci on . . . . 42
4.2.1. El modelo de Truncamiento Incidental . . . . . . . . . . 42
3
4

INDICE GENERAL
4.2.2. Estimacion del Modelo de Truncamiento Incidental . . . 44
4.2.3. Efectos Marginales . . . . . . . . . . . . . . . . . . . . . 46
5. Modelos de Panel Estatico 51
5.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.2. Estructura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.3. Heterogeneidad No Observada . . . . . . . . . . . . . . . . . . . 56
5.4. Estimaci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.4.1. Modelo MCO combinado (MCOC) - Pooled . . . . . . . 57
5.4.2. Modelo de Efectos Fijos . . . . . . . . . . . . . . . . . . 57
5.4.3. Modelo de Efectos Aleatorios . . . . . . . . . . . . . . . 58
5.4.4. Test de Hausman . . . . . . . . . . . . . . . . . . . . . . 59
6. Panel Dinamico 61
6.1. Especicaci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.2. Especicaci on del Modelo Econometrico . . . . . . . . . . . . . 62
6.3. Estimaci on del modelo . . . . . . . . . . . . . . . . . . . . . . . 64
Eviews Intermedio
www.giddea.com
Sesi on 1
Microeconometra y Tecnicas de
Estimaci on
1.1. Estimaci on y Analisis
La microeconometra es la rama de la econometra que se encarga del estu-
dio de datos microecon omicos. La microeconometra utiliza tecnicas estadsti-
cas y matem aticas para la estimaci on de diversos par ametros en modelos mi-
croecon omicos. Se divide en dos grandes grupos, principalmente: modelos de
datos de panel y modelos de elecci on cualitativa, aunque tambien estudia otras
situaciones, como por ejemplo modelos de variables acotadas.
1.1.1. Funcion de Verosimilitud
El objetivo de la verosimilitud, es el encontrar par ametros que maximicen
la probabilidad de obtener la verdadera muestra.
La tecnica necesita establecer una funci on f(y, ) y maximizar la verosimi-
litud establecida por L(y, ) =
n
i=0
f(y
i
, ) o su transformaci on monot onica
LnL(y, ) =
n
i=0
Lnf(y
i
, ).
La funcion anterior (que recibe el nombre de funcion log-verosimil) es preci-
samente aquella que se busca maximizar en terminos de . Esta transformacion
puede realizarse debido a que las funciones de probabilidad son monotonicas
crecientes y por tanto cualquier transformacion de este tipo no altera los re-
sultados de los puntos de maximizacion.
Este tipo de estimaci on, partiendo de una correcta especicacion y el cum-
plimiento de ciertas condiciones, garantiza la obtenci on de estimadores asintoti-
camente insesgados, ecientes y consistentes.
5
6 1. Microeconometra y Tecnicas de Estimacion
1.1.2. Score Eciente y Matriz de Informaci on
Existen dos matrices importantes en el analisis de las funciones de vero-
similitud. Estas matrices nos dan informacion valiosa que es muy importante
incorporar en el estudio de los estimadores de maxima verosimiltitud. La pri-
mera de ellas se conoce como el score eciente y se dene como:
LnL()
= S() = g()
Este es el vector gradiente de la funci on log-verosmil. Contiene tantos ele-
mentos como parametros a estimar contenga un modelo. El valor de la matriz
de score eciente, evaluada en el estimador de m axima verosimilitud (que re-
presenta precisamente el maximo de la funci on) es cero.
La segunda matriz se conoce como la matriz de informaci on y viene dada
por la esperanza del negativo de la segunda derivada de la funci on log-verosmil
respecto al par ametro:
E
_
2
lnL()
__
Bajo ciertas condiciones de regularidad, la varianza del estimador de maxi-
ma verosimilitud viene dada por la inversa de la matriz de informaci on:
V ar(
MV
) = [I(
)]
1
La expresion anterior se deriva del teorema de la Cota Minima de Cramer-
Rao, el cual establece que si la funcion de densidad de x satisface ciertas con-
diciones de regularidad, la varianza de un estimador insesgado del parametro
sera siempre por lo menos igual a [I()]
1
.
1.1.3. Estimador MV del Modelo Lineal General
El principio de m axima verosimilitud es muy exible y se puede aplicar to-
mando en cuenta varias formas estructurales y distintas funciones de distribu-
ci on. Consideraremos el estimador m aximo verosmil del modelo lineal general,
sabiendo que este puede expresarse de la siguiente manera: y = x + . En el
contexto de m axima verosimilitud debemos suponer que la variable aleatoria
relevante sigue una funcion de probabilidad especca. Por ello vamos a intro-
ducir el supuesto de que el vector sigue una distribucion normal manteniendo
el supuesto de que su media es igual a cero y su varianza viene dada por la
matriz I
. De esta manera la funci on de densidad del vector seria:

f() =
1
(2)
n/2
1
(
2
)
n/2
e
1
2
2
Eviews Intermedio
www.giddea.com
1.1. Estimacion y Analisis 7
La funcion de densidad anterior puede transformarse en la funci on de ve-
rosimilitud muestral si se expresa en funcion de x e y.
L(,
2
/x, y) =
1
(2)
n/2
1
(
2
)
n/2
e
1
2
2
(yx)
(yx)
Luego de realizar la transformaci on monot onica LnL(,
2
) procedemos a
optimizar en funcion a sus par ametros:
LnL
= 0
LnL
= 0
De esta forma, se verica que, bajo los supuestos de normalidad del termino
de error y forma lineal del modelo, el estimador de maxima verosimilitud de
coincide con el estimador MCO. El estimador de la varianza del termino de
error, sin embargo, diere del obtenido a traves de MCO, siendo ahora sesgado.
Sin embargo, el sesgo del estimador de maxima verosimilitud tiende a cero
al aumentar el tama no muestral y se aproxima al estimador MCO.
En Eviews podemos realizar una estimaci on de verosimilitud como sigue:
===========================================================
Aplicaci on 01: Estimador MV y Matriz de Varianza Covarianza
===========================================================
wf u 100
rndseed 123
simulaci on de datos con distribucion Normal
series x1=4+0.2*@rnorm
series x2=5+0.3*@rnorm
series x3=6+0.5*@rnorm+0.3*@trend
PGD: proceso generador de datos
series y=0.5+0.6*x1+0.32*x2+0.7*x3+0.01*@rnorm
Estimaci on MCO
equation eq1.ls y c x1 x2 x3
coef(1) inter
coef(3) beta
coef(1) sigma2
Eviews Intermedio
www.giddea.com
inter(1)=eq1.@coef(1)
for !w=2 to 4
beta(!w)=eq1.@coef(!w+1)
next
sigma2(1)=eq1.@se^2
Estimaci on MV
logl logl1
logl1.append @logl loglike
logl1.append @byeqn
logl1.append error=y-inter(1)-beta(1)*x1-beta(2)*x2-beta(3)*x3
logl1.append varianza=sigma2(1)
logl1.append loglike=log(@dnorm(error/@sqrt(varianza)))
- (1/2)*log(varianza)
logl1.ml
Estimaci on de la matriz de VarCov
matrix cmatrix =logl1.@coefcov
Estimaci on por gradientes de la matriz de informaci on
logl1.makegrads(n=gradiente) g_inter gbeta1 gbeta2 gbeta3 g_sigma2
stom(gradiente, g1)
matrix info=@transpose(g1)*g1
Comparaci on de las varianzas estimadas
matrix crao=cmatrix-@inverse(info)
Ahora podemos comparar los estimadores de la desviaci on estandar y del
par ametro asociado a un modelo AR(1) con drift.
=============================================================
Aplicaci on 02: Estimacion de la varianza y pendiente mediante
MCO y MV
=============================================================
!n=100
wf u !n
series mus
series rhos
series sigmas2
series mus1
series rhos1
series sigmas21
Eviews Intermedio
www.giddea.com
FOR !k=1 to !n
series y=0
series z=nrnd
smpl @first+1 @last
series y=0.5+0.8*y(-1)+z genero un ar(1) con intercepto
smpl @all
equation mco.ls y c ar(1)
coef(1) mu=mco.@coef(1) guardo el valor en un coeficiente
coef(1) rho=mco.@coef(2)
coef(1) sigma2=mco.@se^2
mus(!k)=mu(1)
rhos(!k)=rho(1)
sigmas2(!k)=sigma2(1)
logl logl1
logl1.append @logl loglike
logl1.append res=y-mu(1)-rho(1)*y(-1)
logl1.append var=sigma2(1)
logl1.append loglike=log(@dnorm(res/@sqrt(var)))-log(var)/2
smpl @first+1 @last
logl1.ml
mus1(!k)=mu(1)
rhos1(!k)=rho(1)
sigmas21(!k)=sigma2(1)
NEXT
group g1 rhos rhos1
g1.line
group g2 sigmas2 sigmas21
g2.line
Eviews Intermedio
www.giddea.com
Eviews Intermedio
www.giddea.com
Sesi on 2
Modelos de Eleccion Discreta
Las estimaciones lineales cl asicas permiten la modelizacion de variables de-
pendientes cuantitativas para identicar relaciones estadsticas en las que se
asume una serie de supuestos sobre la forma del error de la ecuaci on lineal
(homocedasticidad, normalidad, etc.). Sin embargo, en muchos contextos, el
fen omeno que se quiere modelizar no es continuo sino discreto, por ejemplo
cuando se quiere modelar la elecci on de compra de un bien o servicio; o la
decisi on de participar o no en el mercado laboral. Estos son los modelos cono-
cidos como modelos de respuesta cualitativa. Llamamos variables cualitativas
a aquellas que no aparecen en forma numerica, sino como categoras o atribu-
tos como por ejemplo, el sexo o la profesion de una persona. En general, se
dice que una variable es discreta cuando est a formada por un n umero nito de
alternativas que miden cualidades.
2.1.1. Interpretaci on Estructural
Existen tres enfoques para la interpretacion estructural de los modelos de
elecci on discreta. El primero hace referencia a la modelizaci on de una variable
latente a traves de una funci on ndice, que trata de modelizar una variable
inobservable o latente. El segundo de los enfoques permite interpretar los mo-
delos de elecci on discreta bajo la teora de la utilidad aleatoria, de tal manera
que la alternativa seleccionada en cada caso sera aquella que maximice la utili-
dad esperada. El tercero pasa por plantear un modelo de probabilidad no lineal.
Bajo el primero de los enfoques se trata de modelizar una variable ndice,
inobservable o latente no limitada en su rango de variacion y*. Cuando la
variable latente supera un determinado nivel, la variable discreta toma el valor
1, y si no lo supera toma el valor 0. La variable latente depende de un conjunto
de variables explicativas que generan las alternativas que se dan en la realidad
y que permiten expresar el modelo dicot omico como:
11
12 2. Modelos de Eleccion Discreta
Y =
_
1, si Y
> 0,
0, si Y
0.
Donde el supuesto sobre la distribuci on de error determina el tipo de mo-
delo a estimar. Si se supone una funcion de distribuci on uniforme, se utiliza
el Modelo Lineal de Probabilidad truncado; si se distribuye como una normal
con media cero y varianza uno, el modelo generado sera un Probit; mientras
que si se supone que se distribuye como una curva logstica, se tratara de un
modelo Logit. La hip otesis de que el umbral a superar por la variable latente
sea cero se puede modicar por cualquier otro valor sugiriendose, en determi-
nados estudios, que el valor crtico sea el denido por el termino constante.
Bajo este enfoque, el modelo probabilistico quedara:
Y
= X +
Pr(Y = 1/X) = Pr(Y
> 0/X)
Pr(Y = 1/X) = Pr( > (X)/X)
Pr(Y = 1/X) = F(X)
Con el modelo as denido, la variable end ogena del modelo dicot omico
representa la probabilidad de ocurrencia del fen omeno analizado, siendo la
probabilidad de que ocurra la opci on 1 m as elevada cuando mayor sea el valor
de Y
.
El segundo de los enfoques para la interpretaci on de los modelos de res-
puesta dicotomica es el que hace referencia a la modelizacion a traves de la
formulaci on de una utilidad aleatoria. Bajo este enfoque un individuo debe
adoptar una decision que le permita elegir entre dos alternativas excluyentes,
la 1 o la 0, lo que har a maximizando la utilidad esperada que le proporciona
cada una de las alternativas posibles sobre las que tiene que decidir. Es decir,
el individuo i-esimo elegir a una de las dos alternativas dependiendo de que la
utilidad que le proporciona dicha decision sea superior a la que le proporciona
su complementaria.
La formulaci on del modelo bajo esta teora parte del supuesto de que la
utilidad derivada de una eleccion, U
i0
o U
i1
, es funci on de las variables explica-
tivas de dicha decisi on, que son las caractersticas propias de cada una de las
alternativas de elecci on y las caractersticas personales propias del individuo,
de manera que suponiendo linealidad en las funciones, se tiene:
U
i0
=
0
+ X
i0
+
i0
U
i1
=
1
+ X
i1
+
i1
Eviews Intermedio
www.giddea.com
Donde los
ij
recogen las desviaciones que los agentes tienen respecto a
lo que sera el comportamiento del agente medio y que se debe a factores
aleatorios. El agente i elegira la opcion 1 si la utilidad de esa decision supera
la de la opcion 0 y viceversa, de manera:
Y
i
=
_
1, si U
i1
> U
i0
,
0, si U
i1
< U
i0
.
Y el modelo dicotomico quedara denido por:
Pr(Y = 1/X) = Pr(U
i1
> U
i0
/X) = Pr(
i1
i0
> (X)/X)
Pr(Y = 1/X) = F(X)
Seg un que la funci on asociada a la perturbaci on aleatoria
ij
(que ser a la
funci on de distribuci on, F(X), que se suponga siga dicha probabilidad), sea
una funci on de distribuci on uniforme, la funcion de distribucion de la normal
tipicada o la de la curva logstica, se obtienen el Modelo Lineal de Probabi-
lidad Truncado, el Probit o el Logit, respectivamente.
El tercer enfoque pasa por estructurar un modelo de probabilidad no lineal,
como lo sugiere Theil - 1970, de tal manera que:
Pr(Y = 1/X) = M
i
=
exp(X)
1+exp(X)
(x) =
Pr(Y =1/X)
Pr(Y =0/X)
=
Pr(Y =1/X)
1Pr(Y =1/X)
Ln((x)) = X +
Es decir medir que tan a menudo ocurre algo (Y=1), respecto a que tan a
menudo no ocurre (Y=0).
2.1.2. Modelo de Probabilidad Lineal
La primera alternativa te orica desarrollada para estudiar modelos con va-
riables dicotomas se plante o como una extension del modelo lineal general:
Y
t
=
t
+ X
kt
k
+
t
Donde :
Y
t
=
_
1, si ocurre una alternativa,
0, en caso contrario.
X
kt
=Variables explicativas
t
=Variable aleatoria que se distribuye N(0,
2
)
Eviews Intermedio
www.giddea.com
En general, la distribuci on de los modelos de elecci on binaria se caracteriza
por congurar una nube de puntos de tal manera que las observaciones se
dividen en dos subgrupos. Uno de ellos esta formado por las observaciones
en las que ocurrio el acontecimiento objeto de estudio (Y
i
=1), y el otro, por
los puntos muestrales en los que no ocurri o (Y
i
=0).Para el desarrollo de los
modelos de elecci on discreta se utilizar a la base de datos bdbinario.
load bdbinario
La base de datos que trabajaremos cuenta con informaci on sobre un conjun-
to de alumnos, los cuales fueron sometidos a un nuevo metodo de ense nanza,
luego de aplicado el metodo de ense nanza se busco ver si el alumno mejor o o
no, para ello la variable mejora nos da dicha informacion. Para predecir si
el alumno mejoro o no, se us o el siguiente set de variables: cm (promedio de
calicaciones pasadas del alumno), np (nota del alumno en examen previo) y
psi (variable que indica si el alumno estudio con el nuevo metodo de ense nanza
o no).
equation eqlineal.ls mejoro c np
Problemas con esta estimacion
La interpretaci on de los coecientes en los modelos de probabilidad es simi-
lar a la de los modelos de regresi on lineal, en donde el valor de los parametros
recoge el efecto de una variaci on unitaria en cada una de las variables explica-
tivas sobre la probabilidad de ocurrencia del acontecimiento objeto de estudio,
sin embargo, el MPL presenta algunas inconsistencias.
Se puede apreciar en el modelo inicial que algunos de los valores estimados
se encuentran fuera de rango, lo cual carece de logica considerando que deben
interpretarse como probabilidades.
eq1.fit mejoro_hat mejoro_se
series e1=resid
graph gph1.scat np mejoro_hat mejoro
gph1.legend position(-1,3.7)
Soluci on: Modelo de probabilidad truncada?
A traves del gr aco de la densidad de Kernel para el modelo que incluye
todas las variables, se observa que los residuos no se distribuyen de manera
normal, por lo tanto no es eciente, es decir, pueden presentarse problemas de
minimizaci on de la varianza a medida que la muestra aumenta.
e1.kdensity(k=n)
Eviews Intermedio
www.giddea.com
Invalida esto la estimacion por MCO? Los estimadores siguen siendo ME-
LI (BLUE)?
Problemas de Heterocedasticidad. A un en el caso de que se cumpliesen las
hip otesis de media y correlacion nula en la perturbacion aleatoria E(
i
) = 0
E(
i
,
j
) = 0 para todo i = j, no se cumple la hipotesis de varianza constante,
es decir, la perturbaci on aleatoria no es homoced astica.
V ar(
t
) = E[(
i
E(
i
))(
i
E(
i
))
] = E(
2
i
)
V ar(
t
) = (1 X)
2
f
i
(1) + (0 X)
2
(1 f
i
(1))
V ar(
t
) = (1 f
i
(1))
2
f
i
(1) + (f
i
(1))
2
(1 f
i
(1))
V ar(
t
) = (1 f
i
(1))f
i
(1)
Veamos ahora si el residuo presenta heterocedasticidad.
eq1.white(c)
eq1.archtest(2)
Para el presente ejemplo la hipotesis nula de varianza constante (homo-
cedasticidad) ser a rechazada debido a que el p value de la distribuci on del
estadstico chicuadrado es muy peque no, acept andose la hipotesis alterna de
varianza no homogenea.
Soluci on: MCG o MCP?
2.1.3. Modelo de Probabilidad No Lineal
Los problemas en la interpretacion y estimaci on de los par ametros del mo-
delo de probabilidad lineal han llevado a la b usqueda de modelos alternativos
que permitan estimaciones m as ables de las variables dicotomas. Es el caso
de los modelos de probabilidad no lineal, donde la funci on de especicacion
utilizada garantiza un resultado en la estimaci on comprendido en el rango 0-1.
Estos son los modelos logit y probit. Analizaremos a continuacion los datos a
traves de una regresi on logstica, la cual se formula a continuacion.
Pr(Y = 1) =
e
X
1 + e
X
= (X)
equation eqextremo.binary(d=x) mejoro c cm np psi
equation eqprobit.binary(d=n) mejoro c cm np psi
equation eqlogit.binary(d=l) mejoro c cm np psi
Eviews Intermedio
www.giddea.com
Pos-estimaci on
a. Test de efectos individuales
Si los supuestos bases del modelo se sostienen, los estimadores son dis-
tribuidos de manera asint otica y normal:
k
a
N(
k
,
2
k
)
Donde la hipotesis nula de signicancia del par ametro puede ser testeada
a partir de:
z =
k
Si la hip otesis nula es verdadera entonces z se distribuir a aproximada-
mente como una normal con media cero y varianza unitaria para muestras
grandes.
b. Test de Wald
Podemos analizar el modelo una vez estimado, mediante un testeo de
hip otesis que validen una correcta especicaci on. Para esto el test de
Wald calculado para hip otesis lineales sobre los par ametros de los mode-
los estimados nos ser a de mucha utilidad. Tambien puede usarse el test
bajo una estructura no lineal, la cual no abordaremos en esta secci on.
equation eqprobit.binary(d=n) mejoro c cm np psi
eqlogit.wald c(2)=0, c(3)=0
c. Test LR
El estadstico de verosimilitud tambien nos ser a de gran utilidad para
evaluar mediante hip otesis la signicacia de modelos. Este estadstico
compara modelos anidados.
eqlogit.binary(d=l) mejoro c cm np psi
scalar lh1=eqlogit.@logl
eqlogit.binary(d=l) mejoro c cm np
scalar ratio=-2*(lh2 - lh1)
scalar pval = 1-@cchisq(ratio, 1)
Eviews Intermedio
www.giddea.com
Donde nuestra hipotesis nula es H
0
=
psi
= 0
Muchas medidas escalares han sido desarrolladas para resumir las bonda-
des de ajuste de modelos de regresion continuo o de variables categoricas.
Sin embargo no hay evidencia convincente de seleccion de un modelo que
maximice los valores de una medida comparada con la medida de otro
modelo. Mientras las medidas de ajuste proveen informacion, esta es solo
parcial, que debera ser sostenida con una teora econ omica razonable, o
investigaciones anteriores como referencia.
A continuacion proveeremos de una breve descripci on de cada una de las
medidas que podemos encontrar en Long(1997).
Medida basada en Log-Likehood
Stata comienza su an alisis maximizando iteracciones de verosimi-
litud y calculando sus logaritmos, para determinado modelo, con
todos los parametros excepto el intercepto en un nivel de cero
L(M
intercepto
), mientras que cuando los parametros son diferentes
de cero, el logaritmo de verosimilitud calculado ser a L(M
full
)
Test Chi-Cuadrado de todos los coecientes
Un test LR donde la hip otesis nula de que todos los coecientes
excepto el intercepto son ceros puede ser calculado comparando el
logaritmo de verosimilitud LR=2[Ln(M
full
)-Ln(M
intercepto
)], a veces
a este estadistico se le designa con el valor G2.
McFaddens R
2
R
2
en MRL
Para una regresion lineal se reporta el coeciente de determinaci on
est andar:
R
2
= 1
N
1
(y
i
y
i
)
2
N
1
(y
i
y
i
)
2
=
V ar( y)
V ar( y) + V ar( e)
= 1
_
L(M
intercepto
)
L(M
full
)
_ 2
N
Y el R
2
ajustado seria:
R
2
=
_
R
2
K
N 1
__
N 1
N K 1
_
R
2
en MRNL
En modelos no lineales la medida calculada son los pseudos R
2
.
El R
2
de McFadden, tambien conocido como el ndice del ratio de
verosimilitud, compara dos modelos:
R
2
McF
= 1
_
LnL(M
full
)
LnL(M
intercepto
)
_
Eviews Intermedio
www.giddea.com
Y como el R
2
de McFadden siempre se incrementa con el numero
nuevo de variables explicativas, se ajusta su versi on con:
R
2
McF
= 1
_
LnL(M
full
) K
LnL(M
intercepto
)
_
Donde K
es el numero de variables independientes, no el numero

de parametros.
El R
2
Count y el R
2
Count Ajustado
De los valores observados y predichos, se calcula el R
2
Count
.
Denimos as el R
2
Count
como:
R
2
Count
=
1
N
j
n
jj
donde n
jj
es el numero de predicciones correctas en la tabla. Pero el
R
2
Count
puede darnos una interpretacion fallida del poder de predic-
ci on del modelo. En un modelo binario sin previo conocimiento de
las variables independientes es posible corregir las predicciones en
al menos el 50 % de los casos eligiendo una categora con el mayor
porcentaje de casos observados. El ajuste se hace de la siguiente
manera:
R
2
Count
=
j
n
jj
max
r
(n
++
)
N max
r
(n
++
)
Donde n
++
es el mayor valor marginal de la ultima la.
Medidas de Informacion
AIC
Este criterio compara modelos de diferentes tama nos de muestra o
tambien modelos no anidados. Akaike (1973) denio:
AIC =
2Ln
L(M
k
) + 2p
N
Donde p es el n umero de par ametros en el modelo (K+1 en los
modelos de regresi on binaria donde K es el n umero de regresores)
BIC
El criterio de informacion Bayesiana fue propuesto por Raftery
(1996) como una medida que compara modelos anidados como mo-
delos no anidados. Denimos BIC de la siguiente manera:
BIC
K
= D(M
K
) gl
k
Ln(N)
Donde gl
k
son los grados de libertad asociados con la desviaci on.
La segunda versi on de BIC es basada al ratio de verosimilitud del
Eviews Intermedio
www.giddea.com
Chi2 con gl
k
deniendo dichos grados de libertad, como el numero
de regresores (no par ametros) en le modelo.
BIC
K
= G
2
(M
K
) gl
k
Ln(N)
eqprobit.binary(d=n) mejoro c cm np psi
eqprobit.testfit(h,5,u)
Otra posible soluci on a las inconsistencias que presenta el modelo de pro-
babilidad lineal para explicar el comportamiento de una variable dependiente
binaria es el uso del modelo probit de la forma:
y = f(
0
+
1
x
1
+ ... +
k
x
k
) +
Donde f es la funcion de distribucion normal estandar
f(X) =
_
X
2
e
s
2
2
ds +
i
2.1.4. Analisis de Probabilidades y Cambios Marginales
Los efectos marginales suelen proporcionar una buena aproximaci on del
cambio que la presencia o no de la variable binaria o continua, originaria sobre
la probabilidad predicha de alg un modelo.
<<Efectos Marginales>>
ooooooooooooooooooooooo
Estimacion Modelo Probit
equation eqprobit.binary(d=n) mejoro c np cm psi

eqprobit.fit mejoro_hat1 mejoro_se1
graph gph2.scat np mejoro_hat1 mejoro
numero de coeficientes del modelo
!p=4
vector(!p) coef_probit
for !k=1 to !p
coef_probit(!k)=eqprobit.@coef(!k)
next
Eviews Intermedio
www.giddea.com
vector(!p) efmarg_probit
for !k=1 to !p
efmarg_probit(!k)=@dnorm(-(coef_probit(1)+coef_probit(2)*@mean(np)
+coef_probit(3)*@mean(cm)+coef_probit(4)*@mean(psi)))*coef_probit(!k)
next
Estimacion Modelo Logit
equation eqlogit.binary(d=l) mejoro c np cm psi

!p=4
vector(!p) coef_logit
for !k=1 to !p
coef_logit(!k)=eqlogit.@coef(!k)
next
vector(!p) efmarg_logit
for !k=1 to !p
efmarg_logit(!k)=@dlogistic(-(coef_logit(1)+coef_logit(2)*@mean(np)
+coef_logit(3)*@mean(cm)+coef_logit(4)*@mean(psi)))*coef_logit(!k)
next
Estimacion Modelo Valor Extremo
equation eqval.binary(d=x) mejoro c np cm psi

!p=4
vector(!p) coef_VAL
for !k=1 to !p
coef_val(!k)=eqval.@coef(!k)
next
vector(!p) efmarg_val
scalar z=coef_val(1)+coef_val(2)*@mean(np)+coef_val(3)*@mean(cm)
+coef_val(4)*@mean(psi)
for !k=1 to !p
efmarg_val(!k)=( @exp(-z)*@exp( -@exp(-z) ) )*coef_val(!k)
next
Eviews Intermedio
www.giddea.com
Si existe un cambio marginal en alguna variable discreta entonces necesi-
tamos evaluar los cambios totales:
EMg general en Logit
oooooooooooooooooooooooooooo
model m_probit
m_probit.append assign @all f
m_probit.append con_Psi = 1 - @CNORM(-(coef_probit(1)+
coef_probit(2)*CM+ coef_probit(4)*@mean(psi)))
m_probit.append sin_Psi = 1 - @CNORM(-(coef_probit(1)+
coef_probit(2)*CM))
m_probit.solve
graph gph2.scat cm con_psif sin_psif
Veamos la estimaci on va verosimilitud
logl ll1
ll1.append @logl logl1
ll1.append xb = c(1)+c(2)*CM + c(3)*NP + c(4)*psi
ll1.append logl1 = mejoro*log(@cnorm(xb))+(1-mejoro)*log(1-@cnorm(xb))
equation eq1.ls mejoro c cm np psi
ll1.ml(showopts, m=1000, c=1e-5)
Eviews Intermedio
www.giddea.com
Eviews Intermedio
www.giddea.com
Sesi on 3
Modelos de Eleccion Ordinal
Cuando la variable dependiente es discreta, pero sus valores indican un or-
den, no es correcto realizar la estimacion de la misma a traves de los modelos
presentados en el apartado anterior, ya que la inclusi on de la informaci on que
aporta el orden de las alternativas en la especicaci on del modelo permite ob-
tener unos mejores resultados.
Las variables ordinales son a menudo codicadas como enteros consecutivas
de 1 al n umero de categoras, no sera correcto el uso de un modelo de regre-
si on cl asico, ya que codicadas las posibles alternativas como 1, 2, ...(j+1), ...,
J, se estara considerando la diferencia entre (j+1) y (j+2) como la existente
entre 1 y 2, lo cual no tiene porque ser as ya que los n umeros utilizados en
la codicaci on solo representan un orden dentro de una clasicaci on. As, con
modelos de salida ordinal es mejor usar modelos que eviten el supuesto de que
las distancias entre las categoras sean iguales, ahora nos enfocaremos en un
logit y probit que consideren esta ordenacion, modelos introducidos por Mc-
Kelvey y Zavoina (1975) en terminos de una variable latente.
Cuando las salidas son ordinales o nominales la dicultad de explicar mas
de dos respuestas se incrementa. Una variable puede ser ordenada de cierta
manera cuando consideramos un tema, y ordenada de otra manera cuando
consideramos un tema diferente. Millar y Volker (1985) mostraron como dife-
rentes supuestos sobre el ordenamiento de ocupaciones, proyectan diferentes
resultados. Una variable podra reejar ordenamiento sobre m as de una dimen-
si on tal como escalas de actitudes, que reejen ambas la intensidad y direccion
de opini on. Mas a un es muy com un que encuestas incluyan la categora no
sabe, no opina, lo cual probablemente no corresponda a la categora interme-
dia en una escala, aun cuando en el an alisis uno este tentado a colocarla como
tal, sobretodo cuando la propuesta de ordenamiento es ambigua, el modelo de
salidas nominales podra ser considerado.
23
24 3. Modelos de Eleccion Ordinal
Los MRO pueden ser desarrollados de diferentes maneras, cada una de ellas
nos conduce al mismo resultado. El modelo de regresi on binaria (MRB) pueden
ser vistos como un caso especial de los MRO, en el cual la variable endogena
solo tiene dos categoras.
3.1.1. Modelo de Variable Latente
El modelo de regresi on ordinal es com unmente presentado como un modelo
de variable latente. Denida y
como una variable latente cuyo rango va desde

- a
y
i
= x
i
+
Donde la variable endogena toma los siguientes valores:
y
i
= m, si r
m1
y
i
< r
m
m = 1...J
O tambien de manera extendida:
y
i
=
_
_
1, si = r
0
y
i
< r
1
,
2, si r
1
y
i
< r
2
,
3, si r
2
y
i
< r
3
,
.
.
.
J, si r
J1
y
i
< r
J
= .
Donde los puntos de corte r
j
son estimados. Como ejemplo, podramos te-
ner la siguiente pregunta en una encuesta: Una mujer trabajadora establece
un fuerte y seguro vinculo con su hijo, as como una mujer que no trabaja?
Las posibles respuestas podran ser: 1=Desacuerdo Total, 2=Desacuerdo,
3=Acuerdo, 4=Acuerdo Total
La variable latente continua puede imaginarse como el grado de aceptaci on
a favor de que las mujeres trabajadoras son buenas madres.
y
i
=
_
_
1 = DT, si = r
0
y
i
< r
1
,
2 = D, si r
1
y
i
< r
2
,
3 = A, si r
2
y
i
< r
3
,
4 = AT, si r
3
y
i
< r
4
= .
Eviews Intermedio
www.giddea.com
La probabilidad de una variable observada dado el valor de x, corresponde
a la regi on en la que la distribuci on de y
cae entre r
m1
y r
m
Pr(y = m/x) = Pr(r
m1
y
< r
m
/x)
Sustituyendo x + por y
y usando algo de algebra obtenemos la formula

est andar que predice la probabilidad en el MRO
Pr(y = m/x) = F(r
m
x) F(r
m1
x)
Donde F es la funci on de probabilidad acumulada para . En el probit or-
dinal, F es una normal con Var()=1, en el logit ordinal, F es una logistica con
Var()=
2
3
. Notar que cuando y=1 el termino F(-x)=0 y cuando y=J el
primer termino de F(x)=1.
Comparando estas ecuaciones con las de un MRB se observa que el MRO
es identico a la regresion binaria, veamos:
load binario
equation eqprobit.binary(d=n) mejoro c np
equation eqlogit.binary(d=l) mejoro c np
equation eqoprobit.ordered(d=n) mejoro c np
equation eqologit.ordered(d=l) mejoro c np
Los coecientes y sus desviaciones est andar son los mismos pero el inter-
cepto para el logit, es reportado, mientras que para el ologit ese intercepto es
reemplazado por el punto de corte del mismo nivel pero de signo opuesto.
En Stata, la identicaci on del MRO asume que el intercepto es cero y as los
valores de los puntos de corte son estimados.
El modelo de regresion ordinal puede tambien ser desarrollado como un
modelo de probabilidad no lineal sin recurrir a la idea de variable latente.
Para mostrar esto, primero denimos el odds de que la variable explicada es
menor o igual a m vs que sea mayor que m dado las variables exogenas x:
Por ejemplo, podriamos calcular el odds de desagrado o fuerte desagrado,
versus el agrado o fuerte agrado. Asi el logaritmo del odds es igual a:
m|>m
=
Pr(y m/x)
Pr(y| > m/x)
Para una simple variable independiente y tres categoras en la explicada,
donde el intercepto fue jado en 0, tendriamos:
Ln(
Pr(y1/x)
Pr(y>1/x)
) = r
1
1
x
1
Ln(
Pr(y2/x)
Pr(y>2/x)
) = r
2
1
x
1
Eviews Intermedio
www.giddea.com
Parece confuso que el modelo substraiga xb en lugar de a nadirlo, esto es
consecuencia del calculo del logit de y m vs y > m.
Aqu un ejemplo basado en la encuesta realizada entre 1977 y 1989 de
General Social Survey, donde el tema y pregunta tratado fue: Una madre
trabajadora puede establecer una calida y segura relacion sentimental con su
hijo como una madre que no trabaja?
load warm
equation eq1.ordered(d=n) warm c yr89 male white
equation eq2.ordered(d=l) warm c yr89 male white
equation eq3.ordered(x) warm c yr89 male white
Usando los datos, nosotros estimamos el siguiente modelo:
Pr(warm = m/x
i
) = F(r
m
x) F(r
m1
x)
Donde
x =
yr89
yr89 +
male
male +
white
white +
age
age +
prst
prst
Aqu las salidas sean con ologit, oprobit, pueden ser comparadas:
equation eq2.ordered(d=l) warm c yr89 male white age ed prst
coef beta1=eq2.@coefs
equation eq2.ordered(d=n) warm c yr89 male white age ed prst
coef beta2=eq2.@coefs
Como en el analisis de los modelos de regresion binaria, la diferencia estriba
en que los coecientes tienen una razon de 1.7, es decir, solo hay diferencia en
escala, sin embargo los z-test, son los mismos y no se ven afectados por la escala.
3.1.2. Testeo de Hipotesis
Para el testeo de hip otesis podremos usar el test de wald o maxima verosi-
militud para elegir el mejor modelo.
equation eqlogit.ordered(d=l) warm c yr89 male white
eqlogit.wald c(1)=0
eqlogit.wald c(1)=0, c(2)=0 , c(3)=0
equation eqlogit.ordered(d=l) warm c yr89 male white
Eviews Intermedio
www.giddea.com
equation eqlogit.ordered(d=l) warm c yr89 male
scalar ratio=-2*(lh2 - lh1)
scalar pval = 1-@cchisq(ratio, 1)
3.1.3. Supuesto de Paralelismo
Antes de discutir la interpretaci on, es importante entender un supuesto que
esta implcito en el MRO, conocido como paralelismo de la regresi on, y para
el modelo ologit, el supuesto de odds proporcional.
Pr(y = 1/x) = F(r
m
x)
Pr(y = m/x) = F(r
m
x) F(r
m1
x), cuando : m = 2...J 1
Pr(y = J/x) = 1 F(r
m1
x)
Las ecuaciones presentadas pueden ser usadas para calcular la probabilidad
acumulada, lo cual tienen la siguiente forma:
Pr(y m/x) = F(r
m
x), cuando : m = 1...J 1
En esta ecuaci on se muestra que el MRO es equivalente para J-1 regresiones
binarias con el supuesto de que las pendientes o coecientes son identicos a lo
largo de cada regresi on.
Por ejemplo, si tenemos cuatro categoras en nuestra end ogena y una va-
riable independiente las ecuaciones serian:
Pr(y 1/x) = F(r
1
x
1
)
Pr(y 2/x) = F(r
2
x
1
)
Pr(y < 3/x) = F(r
3
x
1
)
El intercepto no se encuentra en las ecuaciones dado que se ha asumido
que
0
= 0, cada curva de probabilidad diferir a unicamente en su inclinaci on
hacia la derecha o izquierda, es decir, son paralelas como consecuencia de que
el par ametro es el mismo en cada ecuacion. De esta manera el supuesto de
paralelismo implica que,
1
=
2
= ... =
J1
. El grado de paralelismo se
asume con par ametros muy cercanos entre s.
3.1.4. Analisis de Probabilidades y Cambios Marginales
El MRO es no lineal, entonces, no hay una sola aproximacion que pueda
describir totalmente la relacion entre una variable y las probabilidades, por lo
tanto, se debera considerar cada uno de estos metodos antes de decidir que
Eviews Intermedio
www.giddea.com
aproximaci on es m as efectiva en nuestra aplicaci on.
En el MRO, y
= x + , el cambio marginal en y
con respecto a x
k
es:
Siendo y
una variable latente (cuya medida es desconocida), el cambio mar-

ginal no puede ser interpretado sin la estandarizacion, mediante la desviacion
estandar de y
.

2
y
=

V ar(x)
+ V ar()
Donde

V ar(x) es la matriz de covarianza para las explicativas, V ar()
es 1 para los probit ordenados, o
2
/3 para los logit ordenados. Entonces el
estandarizaci on y
del coeciente de x
k
es:
y
k
=

k
Por cada unidad en que se incremente x

k
, se espera que y
se incremente
en
S
y
k
desviaciones estandar, manteniendo las dem as variables constantes.
El coeciente con una total estandarizacion seria:
S
k
=

k
=
k
S
y
k
Por cada desviaci on est andar en que se incremente x
k
, se espera que y
se incremente en
S
k
desviaciones estandar, manteniendo las demas variables
constantes.
equation eq4.ordered(d=l) warm ((yr89-@MEAN(YR89))/@STDEV(YR89))
((male-@MEAN(MALE))/@STDEV(MALE)) ((white-@MEAN(WHITE))/@STDEV(WHITE))
equation eq4.ordered(d=l) ((warm - @MEAN(WARM))/@STDEV(WARM))
((yr89-@MEAN(YR89))/@STDEV(YR89)) ((male-@MEAN(MALE))/@STDEV(MALE))
((white-@MEAN(WHITE))/@STDEV(WHITE))
equation eq4.ordered(d=l) ((warm - @MEAN(WARM))/@STDEV(WARM))
c yr89 male white
Por cada desviaci on est andar en que se incremente la educaci on, se incre-
menta el apoyo para las madres que trabajan en 0.11 desviaciones estandar,
manteniendo las demas variables constantes.
Prediccion de Probabilidades
Eviews Intermedio
www.giddea.com
Predecimos las probabilidades como:
Pr(y = m/x) = F( r
m
x
) F( r
m1
x
)
Con probabilidades acumuladas:
Pr(y m/x) = F(r

m
x
)
Luego de estimar el modelo es util calcular las probabilidades, indicando una
variable nueva por cada categora estimada
eq1.makelimit gamma
coef beta=eq5.@coefs
series pwarm1
series pwarm2
series pwarm3
series pwarm4
pwarm1=@cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male +
beta(3)*white ) )
pwarm2=@cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )
- @cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )
pwarm4=1- @cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )
group g1 warm pwarm1 pwarm2 pwarm3 pwarm4
g1.scat
Las probabilidades predichas para las categoras extremas tienden a ser
menos que 0.25, la mayor cantidad de las predicciones para las categoras in-
termedias caen entre 0.25 y 0.5, solo unas cuantas tienden a ser mayores que
0.5
Predicci on de Probabilidades
La predicci on de probabilidades para individuos con un conjunto de carac-
tersticas pueden ser calculadas mediante el siguiente comando, por ejemplo,
nosotros podramos desear, examinar las probabilidades predichas para indi-
viduos con las siguientes caractersticas:
Eviews Intermedio
www.giddea.com
Hombres de la clase trabajadora en 1977 quienes estan cerca de retirarse.
Mujeres jovenes con elevada educaci on y prestigiosos trabajos.
Individuo promedio en 1977
Individuo promedio en 1989
equation eq5.ordered(d=l) warm c yr89 male white age ed prst
eq1.makelimit gamma
series pwarm1
series pwarm2
series pwarm3
series pwarm4
pwarm1=@cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male +
beta(3)*white ) )
pwarm4=1- @cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) )
Tarea generar una tabla con las probabilidades promedio en base
a estas probabilidades calculadas para cada escenario
Probabilidad Predicha
Tipo de individuo SD D A SA
Hombres de la clase trabajadora
en1997 quienes estan cerca del retiro
0.23 0.42 0.27 0.07
Mujeres j ovenes con alta educaci on en
1989 con trabajos prestigiosos
0.02 0.08 0.32 0.59
Individuo promedio en 1977 0.13 0.36 0.37 0.14
Individuo promedio en 1989 0.08 0.28 0.43 0.21
Eviews Intermedio
www.giddea.com
Cambios en las Probabilidades Predichas
El cambio marginal en la probabilidad es calculado como:
Pr(y = m/x)
x
k
=
F(r
m
x)
x
k
F(r
m1
x)
x
k
La cual es la pendiente de la curva que relaciona x
k
a Pr(y = m/x),
manteniendo las otras variables constantes. En nuestro ejemplo, nosotros con-
sideraremos el efecto marginal de la edad
Pr(y=m/x)
age
, para mujeres en 1989,
manteniendo en su media a las dem as variables.
eq1.makelimit gamma
vector(4) marginal
marginal(1)=-( @dnorm(gamma(1)- ( beta(1)*@mean(yr89) +
beta(2)*@mean(male) + beta(3)*@mean(white) ) ))*beta(1)
marginal(2)=-(@dnorm( gamma(2)- (beta(1)*@mean(yr89) +
beta(2)*@mean(male) + beta(3)*@mean(white) ) ) -
@dnorm(gamma(1)- (beta(1)*@mean(yr89) + beta(2)*@mean(male)
+ beta(3)*@mean(white) ) ))*beta(1)
marginal(3)=-(@dnorm( gamma(3)- (beta(1)*@mean(yr89) +
beta(2)*@mean(male) + beta(3)*@mean(white) ) ) -
@dnorm(gamma(2)- (beta(1)*@mean(yr89) + beta(2)*@mean(male)
+ beta(3)*@mean(white) ) ))*beta(1)
marginal(4)=(-@dnorm( gamma(3)- (beta(1)*@mean(yr89) +
beta(2)*@mean(male) + beta(3)*@mean(white) ) ) )*(-beta(1))
Eviews Intermedio
www.giddea.com
Eviews Intermedio
www.giddea.com
Sesi on 4
Modelos Truncados y
Censurados
Esta secci on
1
estudia el conjunto de modelos con soluci on de esquina. Para
el uso de los modelos, es importante el recordar el por que se usan variables
logit y probit en modelos de elecci on binaria, modelos tobit en modelos de res-
puesta de solucion de esquina o modelos tipo poison en modelos de recuento, y
es por eso que se necesitan modelos que tomen en cuenta ciertas caracteristicas
importantes de la distribuci on de y.
En e caso de la participaci on de la mujer en el mercado laboral, el proble-
ma es que una parte importante de las mujeres casadas decide no tener ningun
trabajo asalariado.
En el caso de notas que se obtinene en una evaluacion, las mismas que
seg un el sistema de calicacion pueden uctuar solo entre 0 y 20. Tambien se
presenta cuando solo podemos observar el gasto efectivo de aquellas personas
que adquieren un bien pero no su disponibilidad a pagar, mas a un si es inferior
al precio mnimo con el que es posible acceder al bien. Finalmente, tambien es
el caso de los ingresos percibidos por el trabajo remunerado, dado que no es
posible observar el ingreso potencial de una persona que no est a laborando en
el momento en que se recoge la informaci on por analizar. En cualquiera de es-
tas situaciones, las observaciones correspondientes son excluidas de la muestra
(lo que se dene como truncamiento, ya sea incidental o no ), o su incorpo-
raci on en ella es distorcionada por un valor especco que no es el real (lo cual
denimos como censura).
Podemos tener tres tipos de variables dependientes continuas limitadas: las
truncadas, las censuradas y las que poseen sesgo de selecci on (o truncamiento
incidental).
1
Basado en Introduccion a la econometra de Jerey M Wooldridge y Modelos de panel
y variables limitadas de Arlette Beltran y Juan Francisco Castro
33
34 4. Modelos Truncados y Censurados
4.1. Variables Dependientes con Truncamien-
to No Incidental
El truncamiento se produce cuando la variable dependiente (y
i
) se observa,
si y solo si esta toma un valor mayor que a, donde a es una constante
cualquiera. Lo mismo ocurre con toda la informacion referida a las posibles ex-
plicativas del modelo, el vector x
i
, asociadas con estas observaciones truncadas.
Un ejemplo podria ser el an alisis de la disponibilidad a pagar por un au-
tomovil nuevo, si es que es cierto que en el mercado el mas barato que se
puede encontrar tiene un precio de $7,000. De esta manera, cuando la persona
est a dispuesta a pagar dicho monto o mas, es probable que compre el auto y
que se registre su gasto efectivo y toda su informacion socioecon omica (x
i
). Si
la persona esta dispuesta a pagar menos de $7,000, no realiza ninguna compra
y no se cuenta con sus datos asociados; es decir est a observacion desaparece
de la muestra.
4.1.1. Variable Aleatoria Truncada
Denamos el concepto de variable aleatoria truncada. Es aquella que tiene
una tiene funci on de densidad de la forma:
f(y|y < a) =
f(y)
Pr(y > a)
Dada la condicionalidad detras de esta ecuacion se justica la necesidad de
escalar la funcion de densidad original, f(y), de tal manera que su integral sea
uno cuando solo se incluyan los valores no truncados, es decir, en este caso, los
valores mayores a a. Este procedimiento se conoce como normalizaci on de
la densidad, donde el denominador de esta ecuaci on es la constante normali-
zada que corresponde al integral del numerador en el rango entre y a.
La distribuci on de una variable truncada, tiene caractersticas especiales
que pueden resumirse como sigue:
Si y N(,
2
) y a es una constante, entonces:
E(y|truncamiento) = + (a)
V ar(y|truncamiento) =
2
[1 ()]
Donde =
a
Eviews Intermedio
www.giddea.com
4.1. Variables Dependientes con Truncamiento No Incidental 35
La funcion () es conocida como la inversa del ratio de Mills, que en
este caso, puede ser:
() =
f()
1 F()
si el truncamiento es hacia abajo (y > a)
() =
f()
F()
si el truncamiento es hacia arriba (y a)
La funci on (), por su parte, viene dada por () = ()[() ], donde
0 < () < 1,
Notese que si se truncan los valores por debajo de una constante a, la
media de la variable truncada ser a mayor que la original, mientras que si se
truncan hacia arriba, la primera ser a menor que la ultima. De otro lado, la
varianza de la variable truncada ser a siempre menor que la de la variable
original (dado que () se encuentra entre 0 y 1).
4.1.2. Truncamiento en el Modelo de Regresion
Volviendo al ejemplo de la disponibilidad a pagar por un automovil (y
i
), de-
namos el siguiente modelo para explicarla a partir de un conjunto de variables
explicativas (x
i
):
y
i
= x
i
+
i
donde
i
N(0,
2
), por lo que E(y
i
|x
i
= x
i
).
Recuerdese que solo es posible observar la variable dependiente y sus de-
terminantes cuando esta supera el precio mas bajo del mercado a.Tomando
el valor esperado de la disponibilidad pago, condicionado al truncamiento, se
tiene:
E(y
i
|y
i
> a; x
i
) = x
i
+ E(
i
|y
i
> a; x
i
) = x
i
+ E(
i
|
i
> a x
i
; x
i
)
Aplicando las caracteristicas antes descritas, se tiene:
E(y
i
|y
i
> a; x
i
) = x
i
+ (
i
)
Donde (
i
) =
f(
i
)
1F(
i
)
,
i
=
ax
i
De esta forma el modelo de variable dependiente truncada sera:

y
i
|y
i
> a = x
i
+ (
i
) +
i
el mismo que solo es posible estimar para el conjunto de observaciones no
truncadas.
Eviews Intermedio
www.giddea.com
4.1.3. Estimaci on del Modelo de Regresi on con Variable
Truncada
Si se estima linealmente y
i
en funci on solo de x
i
se estara omitiendo la
variable explicativa (), la cual, debido a la perdida de informaci on que im-
plica el truncamiento, no es posible estimar de manera alguna. Por ello no es
adecuado usar directamente MCO, y la alternativa es estimar el modelo por
m axima verosimilitud utilizando la funci on de verosimilitud truncada:
L =
N
i=1
f(
i
)
1 F(
i
)
4.1.4. Impacto Marginal en el Modelo de Regresion
Que resultado es el que interesa en el modelo de regresi on truncada?El
efecto impacto o los coecientes estimados

? Si es que solo se quiere analizar
los efectos del cambio en una variable explicativa sobre la dependiente para
aquellas observaciones no truncadas incluidas en la regresion, bastara con el
efecto impacto correspondiente. El uso de los coecientes ser a de interes si
se quiere generalizar los resultados a toda la poblaci on, este truncado o no.
Consistente con nuestro ejemplo, mostremos a continuacion como se deriva
el efecto impacto correspondiente cuando la variable dependiente est a truncada
para valores menores que a.
E(y
i
|y
i
> a; x
i
)
x
ij
=
j
+
(
i
)
i
x
ij
E(y
i
|y
i
> a; x
i
)
x
ij
=
j
+
(
i
)
E(y
i
|y
i
> a; x
i
)
x
ij
=
j
_
1
(
i
)
i
_
Para hallar el diferencial
(
i
)
i
es necesario tomar en cuenta que
F(
i
)
i
=
f(
i
) y que la funcion de densidad supuesta es la normal, por lo que
f(
i
)
i
=
i
f(
i
). Con esto, se tiene el siguiente resultado.
E(y
i
|y
i
> a; x
j
)
x
ij
= [1 (
i
)((
i
)
i
)]
La expresi on entre llaves, que se encuentra entre 0 y 1, es el factor de ajuste
del coeciente
j
(que corresponde el efecto impacto en un modelo lineal para
toda la poblaci on), que da cuenta del efecto del truncamiento. Notese que
afecta la magnitud de los efectos impacto (a traves de ) mas no la direcci on.
Eviews Intermedio
www.giddea.com
4.1.5. Variable Aleatoria Censurada
Retomando el ejemplo de la disponibilidad a pagar por el automovil y su-
pongamos que a un si la persona no compra el auto, si se registran sus datos
x
i
como cliente potencial. En este caso la variable y
i
, tomara el valor pagado
por la persona si esta compra el auto, y el de 0 si no lo compra. En cualquie-
ra de los dos casos, se habra recogido informaci on sobre el cliente. De esta
manera, podemos decir que la variable y
i
ha sido censurada en 0 para disponi-
bilidades a pagar menores que $7,000 valor que es el precio mnimo de mercado.
El modelo conceptual utilizado para el caso de variables discretas, donde
asumimos la existencia de una variable latente continua e ilimitada y cuya
media condicional puede ser modelada como una combinacion lineal de un
conjunto de explicativas, tambien puede ser modelada como una combinaci on
lineal de un conjunto de explicativas, tambien puede ser aplicado en este con-
texto. En el ejemplo anterior, la variable latente es la disponibilidad de pago
la cual puede adoptar cualquier valor. La variable observada, en este caso, co-
rresponde a la latente pero solo cuando esta ultima supera el precio mnimo
de mercado.
Otro ejemplo nos ayudara en la formalizaci on de este modelo. Supongamos
que la variable latente y
i
es el puntaje en una prueba de aptitud que incluye
puntos en contra, mientras que y
i
es el puntaje en una prueba de aptitud que
incluye puntos en contra, mientras que y
i
, se dene de tal forma que:
y
i
=
_
y
i
, si y
i
> 0,
0, si y
i
0.
En cualquiera de los dos casos se conocen los potenciales factores explica-
tivas del puntaje x
i
.
De esta manera la distribucion de la variable y
i
tiene dos componentes
claramente diferenciados: la parte continua, para las observaciones no censu-
radas, y la discreta, para aquellas a las que se asigna el puntaje de corte. En
este caso, no hay necesidad de escalar la distribuci on (como lo fue en el de las
variables truncadas) ya que la probabilidad acumulada es de 100 % si se consi-
dera que a las observaciones censuradas se les asigna la probabilidad de estarlo.
4.1.6. Censura en el Modelo de Regresion
Si trabajamos en el ambito del modelo de regresi on, tenemos que la variable
latente puede ser representada como:
Eviews Intermedio
www.giddea.com
y
i
= x
i
+
i
Para establecer el valor esperado de la variable observada (y), que consi-
dera tambien las observaciones censuradas, es necesario diferenciar entre dos
situaciones alternativas. Al igual que en el ejemplo anterior, en lo que sigue
suponemos que el valor de corte es igual a cero (a=0).
Para una observaci on tomada al azar:
E(y
i
|x
i
) = (0)Pr(y
i
= 0) + E(y
i
|y
i
> 0; x
i
)Pr(y
i
> 0)
= E(y
i
|y
i
> 0; x
i
)Pr(y
i
> 0)
= (x
i
+ (
i
))(1 F(
i
))
N otese que ahora, como la censura es en 0, se tiene que:
i
=
x
i
(
i
) =
f(x
i
/)
1 F(x
i
/)
=
f(x
i
/)
F(x
i
/)
Y su varianza sera, en cambio:
V ar(y
i
|x
i
) =
2
F(
i
)[1 (
i
) + (
i
(
i
))
2
(1 F(
i
))]
Para una observaci on no censurada
Como es la situaci on similar a la de las observaciones no truncadas, el
modelo sera el mismo que el de la ecuaci on:
E(y
i
|y
i
> 0; x) = x
i
+ (
i
)
Para este modelo aplica todo lo dicho anteriormente, la pregunta seria
ahora como estimar los modelos que contienne variables dependientes
censuradas y especicamente aquellos planteados antes.
4.1.7. Estimaci on del Modelo de Regresi on Censurada
a. Estimaci on por MCO en 2 Etapas
La estimaci on MCO se realiza mediante un procedimiento en dos etapas,
que consiste en modelar el proceso de censura previamente a la estimaci on
de la ecuaci on principal.
Eviews Intermedio
www.giddea.com
Primera Etapa
Se utiliza una variable auxiliar z
i
de la forma:
z
i
=
_
1, si y
i
> 0: No hay censura
0, si y
i
0: Hay censura
A partir de ella y de un conjunto de explicativas que den cuenta
de la censura, se estima un modelo probit para obtener el vector
/ de estimados y construir y ( ), seg un est an denidos en las
ecuaciones previas
Segunda Etapa
Se utiliza para estimar por MCO cualquiera de los dos modelos
de las ecuaciones para una observacion tomada al azar o para ob-
servaciones no censuradas:
Modelo con todas las observaciones
y
i
= (x
i
+ (
i
))F(
i
) +
i
= F(
i
)x + f(
i
) +
i
Modelo con todas las observaciones no censuradas
y
i
|y
i
> 0; y
i
= x
i
+ (
i
) +
i
El uso de uno u otro modelo depender a del objetivo de la investigacion. El
primero permitira predecir el valor promedio del total de observaciones.
En el ejemplo de la disponibilidad a pagar por un automovil, seria el
pago promedio realizado por una persona cualquiera de la muestra total,
haya comprado el auto o no (el valor promedio de compra, consirando
que auellos que no realizaron la compra pagaron un monto igual a cero).
El segundo modelo, en cambio, servir a para calcular el valor promedio
pagado por aquellas observaciones no censuradas y haria posible predecir
el valor promedio de las ventas efectivas.
b. M axima Verosimilitud: El Modelo Tobit
2
Para estimar un modelo con variable dependiente censurada mediante
el metodo de m axima verosimilitud (MV), es necesario considerar que
se tiene dos tipos de informaci on. Aquella referida a las observaciones
no censuradas, para las que se conoce la esperanza condicional de y
i
, y
2
Tobin (1956) fue el primero en vinvular el problema de censura con el analisis de re-
gresion. Relaciono este problema con el modelo probit el el sentido de que hay dos tipos de
observaciones: sobre las que se tiene el valor de la dependiente y las que tienne un valor de
cero asignado. Por dicha razon se le conoce como el modelo probit de tobin o tobit.
Eviews Intermedio
www.giddea.com
aquella referida a las observaciones censuradas, para las que se conoce la
probabilidad de estar censurada.
La funcion de verosimilitud se construye considerando ambos componen-
tes. As:
L =
y
i
>0
Pr(y
i
> 0)f(y
i
|y
i
> 0)
y
i
=0
Pr(y
i
= 0)
Si recordamos que la funcion de densidad truncada viene dada por:
f(y
i
|y
i
> 0) =
f(y
i
)
Pr(y
i
> 0)
Por lo tanto podemos establecer la funci on de verosimilitud como:
L =
y
i
>0
f(y
i
)
y
i
=0
Pr(y
i
= 0)
Note que el modelo tobit implica que los coecientes estimados prome-
dian dos tipos de efectos de las variables explicativas, aquel sobre la
probabilidad de estar censurado y dado que no lo est a, el efecto sobre el
valor esperado de y
i
.
Si no es posible garantizar que las mismas variables explicativas den
cuenta de la censura, as como del fen omeno econ omico que se quiere
analizar condicionado a dicha censura, el tobit puede no ser el modleo
m as adecuado para realizar la estimacion, ya que el procedimiento que
involucra implica restringir ambos modelos a un mismo set de variables
explicativas. Por ejemplo, saber conducir un automovil, puede ser una
explicativa importante para adquirir o no uno, pero podra no tener ma-
yor impacto sobre la cantidad que se paga por el una vez que se ha
decidido comprarlo. En este caso es mejor usar el metodo de estimaci on
en dos etapas visto previamente, en el que se da libertad para incorporar
variables explicativas distintas en cada una de ellas.
Las estimaciones por MCO sobre toda la muestra que desconocen el
problema de censura, son inconsistentes y suelen ser menores en valor
absoluto a los del modelo Tobit.
4.1.8. Efectos Marginales y Bondad de Ajuste
Si se analiza cu al es la medida de bonda de ajuste m as apropiada en el
caso de un modelo censurado, podra elegirse el cuadrado del coeciente de
Eviews Intermedio
www.giddea.com
correlaci on entre y
i
e y
i
, donde esta ultima se construye a partir del modelo
dado con todas las observaciones. El estadstico es distinto al R-cuadrado del
MCO.
La denici on basada en el coeciente de correlaci on es preferida a la del
R-cuadrado debido a que tiene la ventaja de uctuar entre 0 y 1, cosa que no
ocurre con el segundo, el que puede ser negativo en regresiones sin intercepto.
De todas formas, es necesario tener en cuenta que el R-cuadrado no es tan
importante en modelos censurados , especialmente en el caso del tobit, q que a
diferencias de MCO, no maximiza este estadistico sino la funcion log-verosimil.
En cuanto a los efectos impacto, puede ser interesante estimarlos tanto
para la muestra completa, como para las observaciones no censuradas. En
este segundo caso, el efecto impacto ser a similar al de variables truncadas,
a un cuando se observa un cambio de signo (si tomamos en cuenta que se
est a trabajando con una censura hacia abajo, con un corte igual a cero y
suponemos una distribuci on simetrica). As:
E(y
i
|y
i
> 0; x
i
)
x
ij
=
j
[1 (
i
)(
i
+ (
i
))]
Este resultado, sin embargo, tiene las mismas consecuencias vistas previa-
mente respecto del problema de truncamiento.
En el caso para el modelo de la muestra completa, se tiene el siguiente
efecto marginal:
E(y
i
|x
i
)
x
ij
=
j
F(
j
) + x
i
f(
i
)

x
i
f(
i
)
E(y
i
|x
i
)
x
ij
=
j
F(
j
)
De esta manera, en el caso de trabajar con la muestra completa, para que el
coeciente
j
reeje el efecto impacto de la variable explicativa j sobre el valor
esperado de y, es necesario multiplicarlo por la probabilidad de la no censura,
F(
i
). Si comparamos este efecto impacto con aquel asociado al de toda la
poblaci on (), notaremos que ambos se asemejar an en la medida en que F(
i
)
tiende a 1. Como es de esperarse, los resultados que toman en cuenta una
potencial censura en la muestra y aquellos referidos a la data sin censurar ser an
equivalentes en la medida en que la mayoria de observaciones se concentren en
la parte no censurada. Bajo estas circunstancias, las estimaciones que toman
en cuenta la especicaci on para la medida condicional dada en el modelo de
censura, ser an equivalentes a aquellas que se obtenian si se regresiona y
i
sobre
x
i
mediante MCO. Es decir, E(y
i
|x
i
) = (x
i
+ (
i
))(1 F(
i
)) x
i
, en
la medida en que a .
Eviews Intermedio
www.giddea.com
4.2. Variable de Truncamiento Incidental, Ses-
go de Seleccion
El problema de sesgo de selecci on se produce cuando la inclusi on de una
unidad economica en la muestra depende de una decisi on previa que no es
ex ogena, por lo que resulta ser una muestra no aleatoria, solo se presenta ses-
go de seleccion cuando la muestra no es aleatoria o la seleccion muestral no
es ex ogena. Es decir, si por ejemplo se separan observaciones de una muestra
de manera aleatoria, o se utiliza alg un criterio ex ogeno como la edad, el sexo,
la raza, no se producira un problema de sesgo de seleccion. En particular, y
tal como veremos m as adelante, el sesgo ocurre cuando el componente no ob-
servable de la decision de pertenecer a la muestra est a correlacionado con el
componente no observable del fen omeno bajo an alisis.
Por ejemplo, supongamos que se quiere analizar el rendimiento estudiantil
pero solo se cuenta con informaci on suciente sobre dicho rendimiento y sus
determinantes para el caso de escuelas privadas. Como veremos, el hecho de
trabajar solo con aquellos ni nos j ovenes cuya familias decidieron matricularlos
en un colegio particular puede tener un efecto sobre el modelo que se busca
estimar y en especial, sobre su media.
4.2.1. El modelo de Truncamiento Incidental
Analicemos primero la decisi on de asistir a determinado tipo de colegio
(ecuaci on de seleccion). Para esto, y de acuerdo con la formulaci on desarrollada
para los modelos de elecci on binaria, supongamos que la utilidad de asistar a
un colegio privado (z
i
) puede representarse como:
z
i
= w
i
+
i
Dicha ecuacion seria la ecuaci on de selecci on, la variable z
i
no es directa-
mente observable. Lo que si se observa es si el estudiante est a matriculado en
un colegio privado o no, resultado que depende de que la utilidad de hacerlo
supere determinado umbral (a). De esta manera, si z
i
> a, el alumno se ma-
tricula en un colegio privado y, por lo mismo, pertenece a la muestra de trabajo.
En lo que respecta al rendimiento, supongamos que, en general, este puede
ser representado como:
Y
i
= x
i
+
i
Que es la ecuaci on de rendimiento, donde Y
i
es la nota nal obtenida en de-
terminado a no de estudios escolares. Es necesario notar que en la muestra de
trabajo no se tienen observaciones de la distribucion completa de Y
i
, sino solo
Eviews Intermedio
www.giddea.com
4.2. Variable de Truncamiento Incidental, Sesgo de Seleccion 43
de aquellas observaciones provenientes de estudiantes matriculados en una es-
cuela privada. Es decir, la variable dependiente observada Y
i
viene dada seg un:
Y
i
= Y
i
si z
i
> a. Esto implica que si bien E[y
i
|x
i
w
i
] = x
i
, lo mismo no
ocurre para E[y
i
|x
i
w
i
]. En particular, la esperanza condicional de interes viene
dada por: E[y
i
|x
i
w
i
] = E[y
i
|z
i
> a; x
i
w
i
].
En este caso ser a necesario denir la densidad condicional de y
i
dado z
i
de la siguiente manera:
f(y
i
, z
i
|z
i
> a) =
f(y
i
, z
i
|z
i
> a)
Pr(z
i
> a)
y vericar sus propiedades a partir de lo siguiente.
Distribucion truncada conjunta
Si dos variables (y, z) tienen una distribucion normal bivariada, con medias
y
y
z
, varianzas
2
y
y
2
z
y correlacion
yz
(distinta de cero), entonces:
E[y|truncamientosobrez] =
y
+
yz
y
(
z
)
V ar[y|truncamientosobrez] =
2
y
[1
2
yz
(
z
)]
Donde
z
=
(a
z
)
z
, y (.), la inversa del ratio de Mills, viene dada seg un:
(
z
) =
f(
z
)
1F(
z
)
si el truncamiento es hacia abajo (z > a)
(
z
) =
f(
z
)
F(
z
)
si el truncamiento es hacia arriba (z a)
La funcion (.), por su parte, viene dada por (
z
) = (
z
)[(
z
)
z
],
donde 0 < (
z
) < 1.
N otese que la media de la variable truncada incidentalmente se desplaza en
igual direccion que
yz
cuando el truncamiento es hacia abajo y en direccion
opuesta cuando (z a). La varianza se reduce cualquiera sea el caso ya que
(.) y
2
yz
est an entre 0 y 1.
Si volvemos al ejemplo planteado y tomamos en cuenta los resultados as co-
mo las especicaciones para z
i
e y
i
, repectivamente tenemos que:
E[y
i
|z
i
> a; x
i
w
i
] = E[y
i
|z
i
> a; x
i
w
i
] = x
i
+
u
(
z
)
Donde:
z
=
aw
i
y (
z
) =

z
1F(
z
)
.
Vale la pena destacar varios elementos de la expresi on anterior. En primer
lugar, es claro que E[y
i
|z
i
> a; x
i
w
i
] = x
i
, excepto cuanto
= 0 o cuando
a . Es decir, no bastara con modelar la esperanza de nuestra variable
Eviews Intermedio
www.giddea.com
dependiente como una combinaci on lineal de sus determinantes si es que solo
es posible observarla efectivamente cuando el agente cumple con una carac-
terstica especial (no es cierto que a ) y dicha caracterstica inuye
sobre el resultado que estoy modelando (
= 0).
Para el ejemplo considerado, preguntarse si
= 0 equivale a preguntarse
si es que el hecho de estar matriculado en un colegio privado (la caracterstica
especial que hace que una unidad sea parte de la muestra) inuye sobre el
rendimiento del estudiante (el fen omeno que se est a modelando). Al respecto,
nuestra respuesta ser a armativa en la medida en que creamos que, adem as
de las caractersticas sociecon omicas tipicamente observables (como la impor-
tancia que da el hogar a la acumulacion del capital humano) que afecta tanto
a la decision de que tipo de colegio elegir como al rendimiento del ni no en el
colegio. Estos no observables seran capturados en
i
y
i
y el grado de direc-
ci on en el que afecten ambos fen omenos (seleccion y rendimiento) vendr a dado,
precisamente por la correlacion entre los dos terminos de error (
) y su signo.
De considerar un sistema educativo como el peruano, donde la calidad de
educaci on b asica privada es superior a la p ublica, cabria esperar una correla-
ci on positiva: m as importancia asignada a la acumulaci on de capital humano
por parte del hogar impactara positivamente tanto en la decision de matricu-
la en una escuela privada (la posibilidad de observar al agente en la muestra
considerada) como en el rendimiento en la misma. En este sentido, lo que se
plantea es corregir al alza, la esperanza del rendimiento para tomar en cuenta
que se est a trabajando con aquellos individuos que pertenecen a hogares espe-
cialmente preocupados por la educacion de sus hijos.
Tan o m as importantes que entender la correcci on introducida sobre la
esperanza de la variable de interes, es entender el riesgo que corremos de omi-
tirla. Es claro que la correcci on propuesta no es otra cosa que una variable
relevante mas, cuya inclusi on es necesaria para lograr una correcta especi-
caci on de la media condicional de la variable dependiente. No incluirla, por
tanto, conduciria a los conocidos problemas asociados a la omision de varia-
bles. En particular, tendramos estimadores sesgados o para el caso de muestras
grandes, un estimador no consistente.
4.2.2. Estimaci on del Modelo de Truncamiento Inciden-
tal
La estimacion del modelo de una variable dependiente con sesgo de seleccion
puede hacerse a traves de dos alternativas:
Eviews Intermedio
www.giddea.com
a. MCO: Modelo de Heckit
3
En este caso se usa tambien un procedimiento
de dos etapas, en la primera se estima la ecuaci on de seleccion, que
caracteriza la forma en que las observaciones son incluidas en la ecuacion
principal. La segunda etapa consiste en estimar el modelo principal con
la muestra no truncada incidentalmente.
Primera Etapa Se estima la ecuacion de seleccion utilizando una
variable auxiliar (z
i
) de la forma:
z
i
=
_
1, si z
i
> 0: Matriculado en colegio privado
0, si z
i
0: Matriculado en colegio p ublico
Para ello se estima un probit que permitira obtener los parametros
/
, con los cuales se construyen

z
y (
z
).
Segunda Etapa
En la segunda etapa se utiliza (
z
) para estimar por MCO el si-
guiente modelo:
y
i
= x
i
+
(
z
)
Es decir, regresionar y
i
sobre x
i
y (
z
).
Es necesario considerar que en la ecuaci on de seleccion se debe in-
cluir, por lo menos, una variable explicativa adicional que no este en
la ecuaci on de interes. Si bien la inversa del ratio de Mills es una
funci on no lineal de las explicativas de la ecuaci on de selecci on, fre-
cuentemente se puede aproximar a traves de una funci on lineal. Por
lo mismo, no incluir dicho regresor adicional podra llevar a que la
inversa del ratio de Mills este altamente correlacionada con las otras
explicativas de la ecuacion de interes.
b. M axima Verosimilitud
Para estimar un modelo con sesgo de selecci on a traves del metodo MV
es necesario considerar que se tiene dos tipos de informacion. Aquella
referida a las observaciones no truncadas, para las que se conoce la espe-
ranza condicional y aquella referida a las observaciones truncadas, para
las que se cuenta con la probabilidad de estarlo.
Entonces, la funci on de verosimilitud se construye considerando ambos
tipos de informaci on:
3
Heckman (1979)
Eviews Intermedio
www.giddea.com
L =
i
>0
Pr(z
i
> 0)f(y
i
|z
i
> 0)
i
=0
Pr(z
i
0)
Si tenemos en cuenta que:
f(y
i
|z
i
> 0) =
f(y
i
)
Pr(z
i
> 0)
Por lo tanto podemos establecer la funci on de verosimilitud como:
L =
i
>0
f(y
i
)
i
=0
Pr(z
i
0)
4.2.3. Efectos Marginales
Finalmente el efecto impacto de una variable explicativa que se encuentra
tanto en la ecuacion de selecci on como en la de interes, sobre una dependiente
con truncamiento incidental, teniendo:
E[y
i
|z
i
> a; x
i
, w
i
] = x
i
+
(
z
)
donde
(
z
) =
f(
z
)
1 F(
z
)
Si suponemos que a=0 tenemos adem as que
z
=
w
i
y (
z
) =
f(
z
)
F(
z
)
.
Entonces el impacto de un cambio en una variable explicativa x
i
sobre la media
de y
i
truncada incidentalmente seria:
E(y
i
|z
i
> 0; x
i
, w
i
)
x
ij
=
j
+
(
z
)
ij
=
j
+
[
z
(
z
) + (
z
)
2
]
_
_
=
j
[(
z
)
2
z
(
z
)]
Donde el ultimo corchete es igual a (
z
).
Recordando que la variable x
j
se encuentra en ambas ecuaciones, la de
selecci on y la de interes. Si
es positivo y la esperanza de y
i
es mayor pa-
ra valores positivos de z
i
, como (
z
) se encuentra entre 0 y 1, el segundo
termino que aparece restando a
j
reduce el efecto impacto. El cambio en la
Eviews Intermedio
www.giddea.com
probabilidad de que z
i
= 1 ante un cambio en x
j
afecta a la media de y
i
, ya
que en el grupo donde z
i
= 1 la media es m as alta. As el termino que resta a
j
compensa este efecto, dejando solo el efecto marginal de un cambio en x
j
sobre la media de y
i
, dado que z
i
> 0.
Al igual que en el caso del truncamiento,
j
se reere al efecto impacto
del j-esimo regresor sobre la media de la variable dependiente en toda la po-
blaci on. En otras palabras
j
se reere al efecto impacto sobre el rendimiento
estudiantil, mientras que el resultado anterior se reere al efecto impacto sobre
el rendimiento en escuelas privadas de una varianle que afecta tanto al rendi-
miento como a la probabilidad de estudiar en una escuela de este tipo.
La correccion por truncamiento incidental no es solo relevante cuando nos
interesa conocer los efectos marginales para la muestra truncada. En muchos
casos el interes se concentra en determinar el valor del vector y su estimaci on
requiere considerar la correcci on por la inversa del ratio de Mills.
Por ultimo, es necesario mencionar que en el caso de que las ecuaciones de
interes tengan especicaciones diferentes para ambos grupos. Esto equivale a
que el rendimiento de la escuela privada responda a un modelo distinto al de
la p ublica. En algunos casos ser a necesario estimar dos regresiones separadas
para cada uno, evaluando en ambas la correccion por el sesgo de seleccion
correspondiente.
===============================================================
Aplicaci on 01: Modelos de variable dependiente limitada
===============================================================
wf u 753
read(a2, sheet="Hoja1") "C:\mroz.xls" 22
Modelo Lineal para Horas
equation mco1.ls hours c nwifeinc educ exper expersq age
kidslt6 kidsge6
Modelo Censurado
equation eq1.censored(h, l=0) hours c nwifeinc educ exper
expersq age kidslt6 kidsge6
Modelo Censurado con distribucion normal del error
equation eq11.censored(d=n, h, l=0) hours c nwifeinc educ
exper expersq age kidslt6 kidsge6
Modelo Censurado con distribucion logistica del error
Eviews Intermedio
www.giddea.com
equation eq12.censored(d=l, h, l=0) hours c nwifeinc educ
Modelo Censurado con distribucion valor extremo del error
equation eq13.censored(d=x, h, l=0) hours c nwifeinc educ
Modelo Lineal para Salario
equation mco2.ls wage c educ exper exper^2
Modelo Truncado en cero
equation eq2.censored(t, l=0) wage c educ exper exper^2
Modelo Truncado en cero con distribucion normal del error
equation eq21.censored(t, d=n, l=0) wage c educ exper exper^2
Modelo Truncado en cero con distribucion logistica del error
equation eq22.censored(t, d=l, l=0) wage c educ exper exper^2
Modelo Truncado en cero con distribucion de valor extremo del error
equation eq23.censored(t, d=x, l=0) wage c educ exper exper^2
===============================================================
Aplicaci on 02: Modelo de Sesgo de Seleccion
===============================================================
Modelo de Truncamiento Incidental: Heckit
Primera Etapa
smpl @all
equation logit1.binary(d=l) inlf c nwifeinc educ exper expersq age
kidslt6 kidsge6
series e1=resid
guardamos los coeficientes para usarlos como parametros de inicio
coef(8) beta=logit1.@coefs
calculamos la inversa del ratio de mills
logit1.fit xbhat
stom(e1, e)
matrix sigma2=@transpose(e)*e/(logit1.@regobs-8)
scalar sigma=@sqrt(sigma2(1,1))
series imills=@dnorm(-xbhat/sigma)/(1-@cnorm(-xbhat/sigma))
Eviews Intermedio
www.giddea.com
series delta=imills*(imills(-xbhat/sigma))
Segunda Etapa
smpl @all
equation heckman.ls wage educ exper expersq imills
Eviews Intermedio
www.giddea.com
Eviews Intermedio
www.giddea.com
Sesi on 5
Modelos de Panel Estatico
5.1. Introduccion
Los modelos de datos de panel son versiones mas generales de los modelos
de corte tansversal y series de tiempo. En tal sentido, muchas de las conside-
raciones utilizadas para estimar estos dos tipos de modelos pueden aplicarse
al caso de data panel con algunas modicaciones. En terminos practicos un
modelo de corte transversal puede representarse como:
y
i
= + x
i
+
i
Este es un modelo donde la variabilidad de los datos es transversal o
espacial. Es decir, las observaciones son obtenidas para diferentes individuos
o grupos de individuos (empresas, ciudades, pases) en un momento dado en el
tiempo y existen de estos grupos. Por contraste un modelo de series de tiempo
se dene como:
y
t
= + x
t
+
t
La variabilidad en este caso es temporal. Es decir las observaciones son
puntos en el tiempo (das, meses, a nos) para un grupo particular (un hogar,
un pas, una empresa) y existen periodos. En el caso de un modelo de datos
de panel se combinan ambas especicaciones en un modelo m as general que
toma la forma:
y
it
= + x
it
+
it
La variabilidad del modelo es transversal y temporal. Es decir, existen
observaciones de individuos o grupos de individuos durante periodos de tiempo.
Asimismo, el supuesto sobre los errores (por el momento) es similar a los que
se hace para el caso del modelo lineal general, pero esta vez considerando tanto
la dimensi on espacial y temporal. Bajo estos supuestos iniciales se identican
una serie de ventajas de este tipo de modelos:
51
52 5. Modelos de Panel Estatico
Incrementa la eciencia econometrica de los modelos estimados. Un mo-
delo de corte transversal cuenta con N observaciones y un modelo de
series de tiempo con T . En el caso de un modelo de panel data se dis-
ponen de un total de NxT observaciones. Al incrementarse el n umero
de datos (y las fuentes de variabilidad de los mismos) se reducen las
posibles fuentes de colinearidad y la eciencia econometrica de los esti-
madores aumenta.
Por ejemplo, en el caso de un modelo de corte transversal la hetero-
geneidad de los datos esta limitada a aquella que vara de individuo a
individuo y no la que es com un a todos los individuos, pero que vara
en el tiempo. Esta nueva fuente de variabilidad es una fuente de mayor
precisi on en los estimados. En lnea con este argumento, un modelo de
panel permitir a un contexto mas conable para estudiar efectos dinami-
cos. En un contexto de corte transversal estos efectos simplemente no
pueden ser estudiados y en un modelo de series de tiempo la precision
de los resultados puede verse afectada por problemas de multicolineari-
dad. En un modelo como y
t
=
t
x
ti
+
t
, donde se intenta estudiar
un modelo de rezagos distribuidos para un unico individuo o grupos, las
explicativas x
ti
ser an altamente colineares. Sin embargo, si es que se
pudiera obtener data de las x
ti
para diferentes grupos, la colinearidad
se reducira y sera necesario imponer restricciones ad-hoc a la estructura
de rezagos.
Ampla el ambito de las preguntas econ omicas que pueden resolverse.
En el caso de series tiempo, se puede explicar la variabilidad temporal
de los datos o en otras palabras asociar los cambios entre dos variable a
lo largo del tiempo. En el caso del corte transversal ocurre lo mismo ya
que las diferencias por ser explicadas ocurren al nivel de dos individuos
diferentes.
En un modelo de corte transversal se puede identicar que el ratio de
pobreza de una region es 20 %, lo cual puede interpretarse como que exis-
te un 20 % de probabilidad de que los individuos en la muestra caigan
en situacion de pobreza. Luego, en base aun modelo de probabilidades,
se pueden identicar los factores que afectan la probabilidad de que un
individuo sea pobre. Sin embargo, el modelo de corte no permite iden-
ticar si es que esta probabilidad es constante en el tiempo o no. Por
contraste, un modelo de series tiempo permitir a identicar si es que el
ratio de pobreza de 20 % cambia cada a no. Luego a partir de esas varia-
ciones podra estudiar que factores comunes a toda regi on afectan a la
probabilidad de que cualquier individuo sea pobre.
Eviews Intermedio
www.giddea.com
5.1. Introduccion 53
Las diferencias en las recomendaciones de poltica que se derivan de cada
uno de los enfoques son diferentes. Por ejemplo, a traves de un mode-
lo de series de tiempo se puede probar la hip otesis que el crecimiento
econ omico a traves del manejo macroeconomico ordenado (una poltica
com un para toda la sociedad) es el mecanismo por el cual se reduce la
pobreza. Sin embargo, no se reconoce la existencia de polticas especcas
para grupos de individuos. Mientras tanto a partir de un modelo de corte
transversal se pueden identicar polticas especcas para un grupo de
individuos (por sector econ omico o grupos de vulnerabilidad) y dise nar
polticas sociales que intenten suplir ciertas carencias. Sin embargo, una
poltica general como el crecimiento econ omico no puede ser evaluada.
Solo a la luz de un modelo de panel data, ambas estrategias de superaci on
de la pobreza pueden ser testeadas una contra la otra (en terminos de
importancia, relevancia y efectividad). No debe caber la duda que es
justamente a partir de estos modelos de datos de panel de donde emergen
recomendaciones como el crecimiento inclusivo, donde las buena poltica
macroecon omica es importante para superar la pobreza, pero insuciente
y debe ser complementada con polticas sociales o sectoriales (en sentido
amplio) que reduzcan las vulnerabilidades particulares de cierto grupo
de individuos. Con un modelo de corte o series de tiempo no habra sido
posible llegar a una conclusion como esta.
Permite solucionar problemas econometricos importantes asociados a la
mala especicacion por variables omitidas o efectos no observables. Co-
mo se recuerda, tales problemas generan resultados sesgados e incon-
sistentes. El ejemplo tpico ocurre en modelos micro-econometricos del
mercado laboral. As, imagine que el investigador esta interesado en es-
timar una curva de salarios en Lima Metropolitana y para ello dispone
del siguiente modelo: w
i
= + x
i
+ z
i
+
i
. Claramente, esta es una
especicaci on de corte transversal donde las i corresponden a los dife-
rentes sujetos dentro de la muestra. La variable w
i
son las observaciones
de los salarios percibidos por los lime nos en el 2009, corresponde a un
vector de caractersticas observables de los individuos que potencialmen-
te inuyen en sus salarios (educacion y edad, por ejemplo) y las z
i
son
factores no observados en la muestra ya sea porque nuestra encuesta no
incluye esa informacion (por ejemplo, la calidad de la educacion recibi-
da) o informaci on simplemente no disponible (habilidad del individuo).
Bajo estas condiciones lo que realmente el investigador esta estimando
es w
i
= + x
i
+ e
i
donde e
i
= z
i
+
i
En la medida que las z
i
se
encuentren correlacionadas con las x
i
(como es de suponer). Una esti-
maci on MCO de ser a incosistente impidiendo una correcta estimaci on
del efecto de la educaci on en los salarios, por ejemplo. Una alternativa es
Eviews Intermedio
www.giddea.com
utilizar variables instrumentales, sin embargo, la real capacidad del in-
vestigador para obtener instrumentos conables puede ser limitada. Ante
esta dicultad, los modelos de datos de panel ofrecen una alternativa si
es que los factores no observados z
i
varan entre individuos (la habili-
dad o calidad educativa recibida es diferente entre dos individuos), pero
es constante en el tiempo (la habilidad de una persona que trabaja o la
calidad de la educaci on se mantiene de un a no a otro). Con ello, si es que
se disponen de datos de panel, el modelo puede plantearse de la siguiente
forma w
it
= +x
it
+z
i
+
it
. Al tomar el primer rezago de la ecuaci on
(si se dispusiera de una base de datos del a no 2008) obtenemos w
it1
=
+x
it1
+z
i
+
it1
y al restar el primer rezago de la ecuaci on original
se obtiene w
it
w
it1
= ()+(x
it
x
it1
)+(z
i
z
i
)+(
it
it1
), es
decir w
it
= x
it
+e
it
, un modelo que puede ser estimado a traves de
MCO y ofrecer estimados constantes de una vez que se toma en cuenta.
Sin embargo, la estructura de los errores ahora es de media m ovil, lo que
puede crear problemas en la estimaci on aunque posibles de ser corregi-
dos. En todo caso, la disponibilidad del panel ha permitido corregir la
presencia de variables no observables.
N otese que una alternativa de estimaci on es tomar las diferencias res-
pecto a las medias temporales y estimar la relacion: w
it
w
i
= (x
it
x
i
) +(
it

i
), con lo que se han eliminado tambien aquellos factores no
observables que son constantes a traves del tiempo, pero que varan de
individuo a individuos. Esta es una estimacion MCO en diferencias de
medias que proveer a resultados insesgados y consistentes.
Si por el contrario estos factores fueran constantes entre individuos, pero
variar an con el tiempo (la tasa de desempleo en el pas o la estructura
legal del mercado de trabajo), se tendra un modelo como: w
it
= +
x
it
+ k
t
+
it
. Sera posible realizar la misma operacion, pero esta
vez tomando las medias transversales y estimar el modelo w
it
w
t
=
( ) + (x
it
x
t
) + (k
t
k
t
) + (
it

t
) nuevamente a traves de
MCO. Con ello, el panel ofrece la posibilidad de controlar por factores
no observables que vare tanto a traves de los individuos pero constante
a traves del tiempo o que vare a traves de tiempo pero constante entre
individuos.
5.2. Estructura
El objetivo es estimar una ecuaci on de la siguiente forma:
y
it
= + x
it
+
it
Eviews Intermedio
www.giddea.com
5.2. Estructura 55
Por esta raz on el modelo recibe el nombre de panel lineal en contraste con
los paneles no lineales que seran la generalizaci on de modelos binarios (Pro-
bit), multinomiales o censurados. Asimismo, el modelo no est a considerando
un sistema de ecuaciones, sino una unica ecuaci on por estimar. Por ultimo, los
modelos por ser estudiados no toman en cuenta rezagos en su estructura ori-
ginal que es una caracterstica de los modelos din amicos donde los parametros
asociados a los x
itj
son de interes.
En este tipo de modelos, la estructura de la base de datos puede ser de
dos formas. Primero, un n umero elevado de datos transversales ( N es alto)
y un n umero peque no de datos temporales (T es bajo). Este tipo de paneles
se denomina paneles cortos y la estructura de datos m as com un en micro-
econometra donde normalmente se dispone de encuestas para muchos indi-
viduos u hogares y pocos a nos en las que se ha llevado a cabo a los mismos
individuos. Segundo, los paneles largos donde m as bien N es bajo y T alto. Es
decir, se disponen de pocos datos transversales (un n umero reducido de pases
por ejemplo), pero una gran cantidad de puntos en el tiempo (varios a nos para
realizar el an alisis). Este es el caso tpico de estudios macro-econometricos.
Del mismo modo, los paneles pueden ser balanceados o desbalanceados.
El primer caso surge cuando existen las NxT observaciones. Es decir, se tiene
datos para cada uno de los individuos u hogares en cada uno de los a nos. En
pocas palabras, no hay datos omitidos o faltantes en la base de datos que se dis-
pone. El segundo caso ocurre cuando algunas de las NxT observaciones faltan.
Este segundo caso emerge, por ejemplo, en las encuestas a hogares cuando la
encuesta se repite anualmente y existe hogares que desaparecen de la muestra
ya sea por migraci on o por disoluci on y nuevos hogares aparecen por creaci on o
subdivision. En este tipo de casos emerge el problema de atricion (attrition)
que se reere, por ejemplo, a que la proporci on de observaciones N en cada
uno de los T periodos cambia con el tiempo.
Los estimadores que se presentan a continuacion en el curso aplican de
modo general para paneles cortos y balanceados aunque pueden generalizarse
(en algunos casos) con ciertas modicaciones. Por ejemplo, en el caso de un
panel desbalanceado puede ser de interes del investigador restringir las obser-
vaciones a aquellas que efectivamente existen en la base de datos (eliminar las
observaciones faltantes). Esta es una pr actica usual en aplicaciones empricas,
pero al costo de reducir la eciencia de los estimadores (se reduce el n umero
de observaciones y por tanto hay menos informacion para estimar) e incurrir
en posibles sesgos por atricion. Este ultimo caso ocurre cuando la razon por
la que las observaciones no aparecen en el panel se encuentran correlacionadas
con el error por lo que pueden existir problemas de consistencia. Por ello, antes
de realizar una compresi on del panel debe estudiarse el costo de dicha de-
Eviews Intermedio
www.giddea.com
cisi on. Muchos paquetes estadsticos permiten controlar autom aticamente por
problemas de omision de datos y existe tambien la alternativa de construir
pseudos-paneles (a partir de informacion transversal repetida para diferentes
individuos u hogares).
5.3. Heterogeneidad No Observada
El problema de heterogeneidad no observada surge cuando ciertas carac-
tersticas de los individuos potencialmente importantes para explicar su com-
portamiento simplemente no pueden observase. Este problema es la principal
motivacion de los estimadores a ser discutidos en la siguiente nota de clase.
La heterogeneidad no observada generara cierta inuencia en la naturaleza
de los estimadores. De modo general, el modelo por estimar toma la forma
y
it
= +
it
x
it
+
it
Donde la heterogeneidad determina que los par ame-
tros varen entre individuos y a lo largo del tiempo. En este caso general, se
tendran que estimar NxTxk estimadores (siendo k el n umero de parametros,
en este caso k = 2 ) con NxT datos; lo que resulta imposible (hay menos
datos que estimadores por identicar). Por ello, es necesario imponer ciertas
restricciones. La restricci on general que se impone es que las pendientes no
varan y solo se deja abierta la posibilidad para el intercepto. As, el modelo
toma la forma y
it
= + x
it
+
it
. Para entender de donde surge la natu-
raleza del nuevo intercepto podemos considerar el siguiente modelo general
y
it
= +x
it
+z
i
+k
t
+
it
. Que es la forma que consideramos en el ejemplo
de la ecuacion de salarios, pero incluyendo los factores z
i
y k
t
. Conviene
expresar estos factores no observados como
i
= z
i
y
t
= k
t
. De este
modo, el modelo tomar a la forma y
it
=
it
+x
it
+
it
donde
it
= +
i
+
t
si es que los factores no observados son absorbidos por la constante. Este caso
general, se denomina de efectos jos y a partir de este surgen los modelos del
mismo nombre (MEF, modelos de efectos jos). Alternativamente, puede que
la estimaci on tome la forma y
it
= +x
it
+v
it
, donde v
it
=
it
+
i
+
t
si es que
los factores no observados son variables aleatorias y por lo tanto absorbidos
por el error. En este caso, normalmente hace referencia a factores que no son
importantes individualmente, pero en conjunto forman una variable aleatoria
de importancia y con consecuencias sobre las estimaciones. Este caso general,
se denomina de efectos aleatorios y a partir de este surgen los modelos del
mismo nombre (MEA, modelos de efectos aleatorios).
Los supuestos acerca de c omo se comportan los efectos no observados de-
terminar an las restriccciones por ser impuestas sobre la estructura de errores
de modo que la estimacion del modelo provea estimadores ecientes y consis-
tentes. Alternativamente, es posible introducir supuestos sobre la existencia o
no de algunos de los efectos no observables. As, surgen los siguientes casos
Eviews Intermedio
www.giddea.com
5.4. Estimacion 57
Caso 1: Interceptos homogeneos. Es decir, no existe heterogeneidad
transversal (
i
= 0 ) ni temporal (
t
= 0 ), es el modelo m as restrin-
gido y toma la forma y
it
= + x
it
+
it
.
Caso 2: Interceptos heterogeneos entre individuos (
i
= 0 ), pero ho-
mogeneos a traves del tiempo (
t
= 0 ). Este es el modelo m as popular
en datos de panel y toma la forma y
it
=
i
+ x
it
+
it
.
Caso 3: Interceptos homogeneos entre individuos (
i
= 0 ), pero hete-
rogeneos a traves del tiempo (
t
= 0 ), tambien popular en las aplica-
ciones que toma la forma y
it
=
t
+ x
it
+
it
.
Caso 4: Interceptos heterogeneos entre individuos (
i
= 0 ), y a lo largo
del tiempo (
t
= 0 ) , que es el caso mas general y toma la forma
y
it
=
i
t + x
it
+
it
.
Los supuestos sobre la naturaleza ja o aleatoria de de los factores no ob-
servados pueden aplicarse a cualquiera de los casos anteriores, con mayores o
menores consecuencias sobre el metodo de estimaci on. N otese ademas que en
el caso de los MEF es posible realizar la estimacion incorporando variables
dicot omicas que recojan los cambios en intercepto.
5.4. Estimaci on
5.4.1. Modelo MCO combinado (MCOC) - Pooled
En este modelo se ha impuesto la restricci on que los interceptos son ho-
mogeneos, es decir, no existen efectos no observados. De este modo, se considera
un modelo de la siguiente forma
y
it
= + X
it
beta +
it
o
y
it
= W
it
B +
it
5.4.2. Modelo de Efectos Fijos
Otra manera de modelar el caracter individual de cada estado es a traves
del modelo de efectos jos. Este modelo no supone que las diferencias entre
estados sean aleatorias, sino constantes o jas, y por ello debemos estimar
Eviews Intermedio
www.giddea.com
cada intercepto
i
. C omo podemos permitir que el intercepto vare con res-
pecto a cada estado? Una manera es la tecnica de las variables dicot omicas
de intersecci on diferencial, que se expresa de la siguiente manera:
Y
it
=
i
+ X
it
+ e
it
Donde
i
es un vector de variables dicot omicas para cada estado. El modelo
de efectos jos puede ejecutarse con el comando:
wf panel01 q 1997.04 2003.04
pool panel _ind1 _ind2 _ind3 _ind4 _ind5 _ind6
panel.read(c35,sheet="Hoja1") "E:\...\data.xls" su? sa? ss? el?
eu? p? rmv?
Efectos Fijos
oooooooooooooooo
panel.ls(f) log(el?) log(p?) log(ss?) log(rmv?)
5.4.3. Modelo de Efectos Aleatorios
La ecuacion del modelo Pooled supone que el intercepto de la regresion es
la misma para todas las unidades transversales. Sin embargo, es muy probable
que necesitemos controlar el car acter individual de cada estado. El modelo
de efectos aleatorios permite suponer que cada unidad transversal tiene un
intercepto diferente. Este modelo se expresa como:
Y
it
=
i
+ X
it
+ e
it
Donde
i
= +
i
. Es decir, en vez de considerar a como ja, suponemos
que es una variable aleatoria con un valor medio y una desviacion aleatoria
i
de este valor medio. Sustituyendo
i
= +
i
en la ecuaci on anterior
obtenemos:
Y
it
= +
1
X
1it
+
i
+ e
it
Efectos Aleatorios
oooooooooooooooooooooo
panel.ls(r) log(el?) log(p?) log(ss?) log(rmv?)
Eviews Intermedio
www.giddea.com
5.4. Estimacion 59
5.4.4. Test de Hausman
C omo decidir cu al de las dos especicaciones de panel usar? La respuesta
depende de la posible correlaci on entre el componente de error individual
i
y las variables X. El modelo de efectos aleatorios supone que esta correlaci on
es igual a cero. Pero supongamos que en nuestro ejemplo,
i
representa las
reglas electorales estatales que favorecen a cierto partido (por ejemplo, gerry-
mandering); entonces es muy probable que
i
se correlacione con las variables
partidarias de nuestro modelo. Si las
i
y las variables X est an correlacionadas,
entonces no incluir
i
en el modelo producir a un sesgo de variable omitida en
los coecientes de X. Hausman demostr o que la diferencia entre los coecientes
de efectos jos y aleatorios (
ef
ea
) pude ser usada para probar la hipotesis
nula de que
i
y las variables X no estan correlacionadas. As pues, la Ho
de la prueba de Hausman es que los estimadores de efectos aleatorios y de
efectos jos no dieren sustancialmente. Si se rechaza la Ho, los estimadores
s dieren, y la conclusi on es; que efectos jos es mas conveniente que efectos
aleatorios. Si no podemos rechazar Ho, no hay sesgo de que preocuparnos y
preferimos efectos aleatorios que, al no estimar tantas dummies, es un modelo
m as eciente. La prueba de Hausman se implementa en Stata despues de la
regresi on con efectos aleatorios con el comando xthausman:
Test de Hausman
oooooooooooooooooooooo
Efectos Fijos
ooooooooooooooo
panel.ls(f) log(el?) log(p?) log(ss?) log(rmv?)
vector b_fijo=@subextract(panel.@coefs,2,1,4,1)
matrix cov_fijo=@subextract(panel.@cov,2,2,4,4)
Efectos Variables
ooooooooooooooooooooo
panel.ls(r) log(el?) log(p?) log(ss?) log(rmv?)
vector beta=panel.@coefs
matrix covarianza=panel.@cov
vector b_gls=@subextract(beta,2,1,4,1)
matrix cov_gls=@subextract(covarianza, 2,2,4,4)
Calculo de la q de Hausman
oooooooooooooooooooooooooooooooooo
matrix b_dif=b_fijo - b_gls
Eviews Intermedio
www.giddea.com
matrix v_dif=cov_fijo-cov_gls
matrix q_stat=@transpose(b_dif)*@inverse(v_dif)*b_dif
scalar p_chi= 1-@cchisq(@abs(q_stat(1,1)), @rows(b_dif))
Eviews Intermedio
www.giddea.com
Sesi on 6
Panel Dinamico
La tecnica para estimar modelos de datos de panel dinamico son diversas,
cada una de las cuales diere en los supuestos estadsticos que se reali-cen.
Para la presente metodologa se usar a el metodo propuesto por Are-llano y
Bond (1991). Esto debido a que es la tecnica m as usada por los in-vestigadores
debido a las bondades de los supuestos estadsticos realiza-dos; sin embargo,
no se invalidan los resultados si se consideran otras tecnicas.
6.1. Especicacion
El modelo propuesto es:
y
it
= y
it1
+ x
it
+
i
+ v
it
Donde x
it
= (y
it1
x
it
) es Kx1 y v
it
no est a serialmente correlacionado. Su-
ponemos inicialmente que los x
it
est an correlacionados con
i
. En este contexto
la forma de la matriz optima de los instrumentos dependen si las x
it
son pre-
determinadas o estrictamente ex ogenas. Si las x
it
son predeterminadas, en el
sentido de que E(x
it
v
it
) = 0 para s < t y cero de otra manera, entonces uni-
camente x
i1
, ..., x
is1
son instrumentos validos para la ecuaci on diferenciada
para el periodo s. De esta manera el z
i
optimo es una matriz (T-2)x(T-2)x[(K-
1)x(T+1)+(T-1)]/2 de la forma z
i
= diag(y
i1
...y
is
x
i1
...x
s+1
), con (s=1,...,T-2).
De otro lado, si las x
it
son estrictamente exogenas E(x
it
v
it
) = 0 para todo t,s,
entonces todos los x
it
son instrumentos validos para todas las ecuaciones y z
i
toma la forma z
i
= diag(y
i1
...y
is
x
i1
...x
iT
). Claramente las x
it
pueden tambien
incluir una combinacion de ambos, es decir de variables predeterminadas y
estrictamente ex ogenas. En ambos casos, la forma del estimador GMM de Kx1
vector de coecientes de es:
= (XZ
A
N
Z
X)
1
X
ZA
N
Z
Y
Donde las elecciones alternativas de A
N
producen estimadores en una etapa
o en dos etapas. Combinando ahora el caso donde x
it
pueden ser particionadas
61
62 6. Panel Dinamico
en (x
1it
x
2it
) y x
1it
est an no correlacionadas con
i
, las restricciones de mo-
mento adicionales explotan esta correlaci on en las ecuaciones en niveles que
llegan a estar disponibles. Por ejemplo, si x
1it
es predeterminado y se le per-
mite que
it
=
i
+ v
it
, entonces tenemos T restricciones adicionales, es decir
E(
i2
x
1i1
) = 0 y E(
i2
x
1it
) = 0. Se observa que todas las restricciones faltantes
para las ecuaciones en niveles son redundantes debido a que previamente son
explotadas por las ecuaciones en primera diferencia.
6.2. Especicacion del Modelo Econometrico
Aplicacion 1: Especicaci on General del Modelo Econometrico para Es-
timar la Sensibilidad de los Indicadores de Riesgo Crediticio a Choques en
Variables Macroecon omicas y Microecon omicas.
El planteamiento de un modelo econometrico tiene como base las teoras
econ omicas.
Las teoras se reeren a un sistema de leyes que tratan de explicar la rea-
lidad y contienen modelos que son una abstraccion simplicada de esta. As,
las teoras econ omicas proponen modelos que explican el comporta-miento de
una o m as variables en funcion de otra u otras variables que se determinan
fuera del modelo. Consecuentemente, un modelo econ omico resulta habitual-
mente, de acuerdo con el estado actual de desarrollo de la ciencia economica,
demasiado simplicado y excesivamente general como para recoger todos los
aspectos de los sistemas generales. En este senti-do, la teora econ omica ha
desarrollado modelos especcos para su apli-cacion a sistemas reales concre-
tos: los modelos econometricos.
As, un modelo econometrico se construye para cuanticar y contrastar las
relaciones entre variables postuladas por los modelos econ omicos a partir de
la evidencia emprica proporcionada por los datos, recogiendo la natura-leza
estocastica que gobierna las relaciones entre las variables.
La evoluci on de los indicadores de riesgo crediticio de la banca peruana
est a en funcion de factores macroeconomicos y microecon omios. Para cuanti-
car esta sensibilidad a perturbaciones no esperadas de estos facto-res se plantea
el siguiente modelo econometrico general.
El modelo econometrico:
mora
it
=
i
+ mora
it1
+ x
it
+
it
Donde
i
representa la heterogeneidad no observable especca de cada
Eviews Intermedio
www.giddea.com
6.2. Especicacion del Modelo Econometrico 63
banco, es el vector Kx1 de par ametros asociados a las variables ex ogenas,
X
i
t es el vector de K variables explicativas y es un vector de jx1 parametros.
Es decir los coecientes de las variables end ogenas predeterminadas, los que
corresponden a los rezagos de la mora de cada banco,
it
es el vector de los
errores de cada uno de los bancos en cada uno de los momentos del tiempo. El
supuesto es que no estan correlacionados. As, nuestro modelo econometrico
combina datos temporales y de corte transversal, formando un modelo de datos
de panel, el cual debido a su especicacion es din amico.Esta especicacion es
consecuencia del comportamiento autorregresivo que presenta los indicadores
de morosidad.
A n de ejemplicar una de las alternativas, de uso, de nuestro modelo
planteado se propone el siguiente ejemplo:
El sistema bancario peruano se caracteriza por presentar un alto grado
de dolarizaci on en sus activos y pasivos. As, la dolarizacion de su cartera
cre-diticia genera una mayor exposici on al riesgo crediticio derivado del ries-
go cambiario de estas instituciones. Una manera indirecta de cuanticar esta
exposicion es estimando la sensibilidad de los indicadores de morosidad a cho-
ques no esperados de tipo de cambio sol-dolar.
En el siguiente ejemplo se utilizar a la mora en moneda extranjera, como
in-dicador de riesgo crediticio, del grupo denominado bancos grandes del sis-
tema bancario peruano. Sin embargo, es sabido que este indicador es tam-bien
sensible a otras variables, las cuales pueden ser de naturaleza mi-croeconomica
o macroeconomica, tales como: la actividad econ omica, la gestion de riesgos
de cada institucion nanciera, etc. A consecuencia de esto ultimo y debido a
supuestos que subyacen la modelacion de los mode-los econometricos (mejorar
la especicacion del modelo) se incorporara dos variables adicionales.
Variable Endogena
La variable endogena, es decir la variable a explicar, ser a la mora en mo-
neda extranjera del grupo de bancos grandes, siendo estos los siguientes: Banco
de Credito, Banco Continental, Banco Wiese y Banco Interbank.
Variable Exogena
Las variables explicativas ser an:
Variacion porcentual del ndice del PBI (pbi)
Depreciaci on del d olar (dev)
Inaci on (inf)
Eviews Intermedio
www.giddea.com
Perodo de Analisis
El perodo en el cual se evaluara el impacto de una devaluaci on no esperada
de tipo de cambio sera: diciembre de 1994 a septiembre de 2004.
Signos Esperados
Devaluacion: se espera un signo positivo, ante un incremento del tipo de
cambio prima el efecto hoja de balance.
Actividad Econ omica: se espera un signo negativo, una expansi on de la
actividad economica mejora los ingresos de los agentes.
Inaci on: se espera un signo negativo, si la inacion esperada es mayor
a la devaluacion, se espera que la mora en ME disminuya.
6.3. Estimaci on del modelo
Las opciones necesarias para realizar las estimaciones se encuentran dispo-
nibles en el objeto ecuaci on. Para crear este objeto se realiza lo siguiente.
Seleccionamos las variables (primero elegimos nuestra variable end ogena
seguida de las ex ogenas), y con el bot on derecho abrimos estas como una
ecuaci on: Open/as equation
Seguidamente nos aparecera la ventana de estimaci on en la cual se elegir an
las opciones pertinentes de acuerdo a los supuestos que subyacen a nuestro
Eviews Intermedio
www.giddea.com
6.3. Estimacion del modelo 65
modelo de riesgo crediticio; as tambien, se ingresar an los datos pertinentes.
Como mencionamos anteriormente en este objeto se encuentran todas las
opciones disponibles para realizar la estimaci on del modelo.
El primer paso es elegir el metodo de estimacion. En este caso, debido a con-
sideraciones te oricas, usaremos el metodo generalizados de momentos (GMM).
Para lo cual, en el set de estimaci on se elegir a lo siguiente:
GMM/DPD - Generalized Method of Moment / Dynamic Panel
Data
El segundo paso es determinar la especicaci on de nuestro modelo. Esto se
realiza teniendo como base: teoras econ omicas, estudios previos, observaci on
de la realidad entre otras consideraciones relevantes. El modelo considerado se
ha presentado en el captulo anterior, su especicaci on en este objeto se realiza
ingresando la variable endogena seguida de las ex ogenas.
El programa facilita la estimacion del panel din amico a traves del Dynamic
Panel Wizard. Opci on que se encuentra disponible, una vez que se haya elegido
el metodo GMM para trabajar.
La opci on se encuentra ubicada en la parte inferior izquierda de la ventana
Eviews Intermedio
www.giddea.com
de especicacion.
Luego de elegir tal opcion, se presentara:
Eviews Intermedio
www.giddea.com
Se presiona siguiente
El proceso a traves de este asistente es bastante facil de seguir y consta de
6 pasos.
En el primer paso se pedir a introduzca la variable dependiente(end ogena)
as como el numero de rezagos de su componente auto regresivo.
Dado que nuestro modelo a estimar es el siguiente:
CC CC(-1) tci(-1) tci(-1)*dm tci(-1)*dp tci(-1)*df tci(-1)*dl tci(-1)*dmu
tci(-1)*dru tci(-1)*de vpbi6
Donde CC es la variable cartera deteriorada ampliada que considera las
cuentas por cobrar. CC(-1), es su rezago de un periodo. VPBI6 es la variacion
del PBI de seis meses con respecto a la produccion de similar periodo del a no
anterior. TCI(-1) es el tipo de cambio neto de inaci on rezagado un periodo:
Al modelo se le introducen variables cticias con la nalidad de rescatar la
diferencia en los com-portamientos de las distintas entidades nancieras. Se
usa un variable cticia por banco, Arrendadora, Financiera, Edypyme, Caja
rural o Caja Municipal.
En este primer cuadro se introduce CC y 1. Luego de ello se procede a
presionar siguiente.
Eviews Intermedio
www.giddea.com
En el segundo cuadro se procede a introducir las variables ex ogenas al mo-
delo. Es decir, aquellas distintas a la end ogena o a sus rezagos. Tambien se
pueden colocar variables cticias o dummies. El cuadro ofrece la posibilidad
de introducir variables cticias correspondientes a cada observaci on temporal,
opcion que no se elige en este proceso todas las variables a intervenir seran
colocadas explcitamente.
Se procede a aceptar para, seguidamente, elegir que metodo de instrumen-
talizaci on usar.
Como se explico anteriormente, existen dos formas de estimar un modelo
de pa-neles dinamicos, a traves del metodo de Arellano Bond o el de Arellano
Bover. El primero de ellos hace referencia a la primera elecci on Dierences.
El segundo a Orthogonal deviations.
El metodo por el que se opta es el de Arellano Bond (Dierences), y se
procede a aceptar.
El proximo paso el elegir las variables instrumentales. Si bien se puede
realizar cambios en ella, se opta por elegir la especicaci on que por defecto.
Procedemos a aceptar.
Eviews Intermedio
www.giddea.com
Eviews Intermedio
www.giddea.com
En el siguiente cuadro se va a diferenciar entre aquellas variables que se
desee sean transformadas siguiendo el metodo elegido de aquellas que se quie-
ran introducir sin ninguna alteraci on.
Se procede a incluir en la parte de transformacion a las variables que se
encuen-tran en niveles. Es decir, la variable TCI as como todas sus cticias.
La variable VPBI6 se incluye dentro de las variables que no necesitan ser trans-
formadas. Se procede a aceptar.
Seguidamente se presenta el ultimo paso del Wizard, en el se puede relai-
zar es-pecicacion con respecto al comportamiento de la matriz de varianza
covarianza del modelo. Se opta por aceptar la especicacion que por defecto
presenta el programa.
Luego de aceptar se llega a la ultima pantalla. En este punto se puede re-
troceder a revisar lo hecho o a nalizar lo propuesto. Luego de estar conforme
con lo espe-cicado se procede a nalizar el Dynamic Wizard.
Seguidamente se reaparece en la pantalla de estimaci on y se procede a ha-
cer clic en aceptar.
Eviews Intermedio
www.giddea.com
Eviews Intermedio
www.giddea.com
Lo siguiente es esperar por los resultados.
Resultados e Interpretaci on
Eviews Intermedio
www.giddea.com
Hay dos aspectos importantes que se deben tener en cuenta.
Primero: Que las variables individuales salgan signicativas es decir que
su T-statistic sea mayor a 2 en valor absoluto o que su probabilidad sea menor
que 5 %.
Segundo: En este tipo de regresiones el R cuadrado no es relevante, pero
si lo es el Test de Sarga. Mientras mas cercano a 1 el modelo sera bueno. El
test consiste en realizar una prueba con distribuci on Chi cuadrado:
Scalar pval=@chisq(j-statistic,Intrument rank - par ametros a estimar )
En este caso particular:
scalar pval3=@chisq(74.50768,85-10)
pval=0.494330701975
Lo que nos ofrece una adecuada estimaci on
Eviews Intermedio
www.giddea.com
Eviews Intermedio
www.giddea.com
Bibliografa
[1] Moya, Runo - Estadstica Descriptiva.
[2] Moya, Runo; Saravia, Gregorio. -Probabilidad e Inferencia Estadstica.
[3] Wooldridge, Jerey M. - Introduccion a la Econometra.
[4] Gujarati, Damodar - Fundamentos de Econometra
75

Manual Eviews Intermedio

Transféré par

Informations du document

Description originale:

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Manual Eviews Intermedio

Transféré par

Droits d'auteur :

Formats disponibles

Eviews

. De esta manera la funci on de densidad del vector seria:

es el numero de variables independientes, no el numero

equation eqprobit.binary(d=n) mejoro c np cm psi

equation eqlogit.binary(d=l) mejoro c np cm psi

equation eqval.binary(d=x) mejoro c np cm psi

como una variable latente cuyo rango va desde

y usando algo de algebra obtenemos la formula

una variable latente (cuya medida es desconocida), el cambio mar-

Por cada unidad en que se incremente x

Pr(y m/x) = F(r

De esta forma el modelo de variable dependiente truncada sera:

, con los cuales se construyen

Vous aimerez peut-être aussi