Académique Documents
Professionnel Documents
Culture Documents
net/publication/303298212
CITATIONS READS
0 4,231
2 authors, including:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Julio César Alonso on 17 May 2016.
No. 40
Enero de 2014
Apuntes de Economı́a
ISSN 1794-029X
No. 40
Editor
Julio César Alonso
jcalonso@icesi.edu.co
Asistente editorial
Andrés Felipe Muñoz G.
afmunoz@icesi.edu.co
Gestión Editorial
Departamento de Economı́a - Universidad Icesi
www.icesi.edu.co
Tel: 5552334 ext: 8398. Fax: 5551441
Calle 18 # 122-135 Cali, Valle del Cauca, Colombia
Interpretación de variables Dummy en modelos log-lin
Marzo de 2014
Resumen
Este documento presenta una breve guı́a sobre interpretación de los coeficientes asociados a las varia-
bles dummy en modelos log-lin. Además se discute las implicaciones de emplear los estimadores MCO en
aplicaciones prácticas. El documento está dirigido a estudiantes de un curso de econometrı́a en últimos
semestres o en cursos introductorios de una maestrı́a en economı́a. Se supone un conocimiento básico en
econometrı́a.
Palabras clave:interpretación, variables dummy, modelos log-lin
Abstract
This document provides a brief guide to the interpretation of dummy variables’ coefficients in log-lin mo-
dels. We also discuss the consequences of using OLS estimators in applied work. The document is written
for students in undergraduate econometrics upper courses or introductory econometrics at the Masters le-
vel. We assume that the reader has a basic knowledge in econometrics.
Key Words :interpretation, dummy variables, log-lin model
* Director del centro de investigación en economı́a y finanzas (CIENFI) y director académico de la maestrı́a en Economı́a de la
Universidad Icesi
** Estudiante en práctica del CIENFI y estudiante de último semestre de Economı́a en la Universidad Icesi.
3
Apuntes de Economı́a No. 40
Objetivos de Aprendizaje
Al finalizar la lectura de este documento se espera que el lector esté en capacidad de:
Explicar en sus propias palabras el sesgo asociado al emplear estimaciones MCO para el efecto de la
variable dummy.
Estimar el efecto de la variable dummy sobre la variable dependiente en un modelo log-lin, empleando
un estimador consistente a partir de un valor estimado a partir del método de Mı́nimos Cuadrados
Ordinarios.
1. Introducción
El uso de variables dicotómicas (o dummy) en modelos econométricos es común para incorporar, por
ejemplo, alguna caracterı́stica cualitativa de los individuos de la población o para capturar algún cambio
estructural durante el periodo bajo estudio. En otras palabras, la variable dummy permite medir el efecto
de una determinada caracterı́stica de los individuos (o periodos) en la muestra; caracterı́stica que es medida
por medio de la dummy. Tı́picamente la variable dummy toma el valor de uno cuando la caracterı́stica de
interés está presente y cero en caso contrario.
Por otro lado, la sencillez en la interpretación de los coeficientes asociados a variables dummy en un modelo
lineal hace de la inclusión de estas una herramienta poderosa para los investigadores. Sin embargo, cuando
el modelo no es lineal en las variables, pero si en los parámetros, la interpretación de los coeficientes aso-
ciados a variables dummy ya no es tan sencilla.
l
X m
X
Ln(Yi ) = α + βi Xj,i + θj Dj,i + ε − i (1.1)
j=1 j=1
donde las Xi0 s son variables explicativas continuas y las Dj0 s son variables dummy. Este tipo de modelos
es denominado log-lin, pues la variable dependiente se expresa como un logaritmo y las explicativas se
expresan en forma lineal.Sin perder generalidad y por simplicidad, concentrémonos en un modelo con solo
una variable explicativa continua y una dicotómica. Es decir,
4
Apuntes de Economı́a No. 40
El resto de este documento está organizado de la siguiente manera. En la segunda parte de este documento
discutiremos la interpretación de los coeficientes de (1.2). La tercera parte presenta una reflexión sobre las
implicaciones de emplear estimaciones por medio del método de Mı́nimos Cuadrados Ordinarios (MCO)
para interpretar el efecto del factor medido por la variable dummy sobre la variable dependiente. La última
parte presenta un ejercicio.
La interpretación del coeficiente asociado a la variable continua (β) es relativamente sencilla. La interpreta-
ción es mucho más sencilla si expresamos (1.2) de la siguiente manera:
Ahora, es fácil determinar cuál es el efecto de un cambio en Xi sobre la variable dependiente. Derivando
(2.1) con respecto a Xi se obtiene:
∂Yi
= βeα+βXi +θDi +εi
∂Xi
Remplazando (2.1) en la anterior expresión, obtenemos:
∂Yi
= βYi
∂Xi
∂Yi 1
=β
∂Xi Yi
∂Yi 1
× 100 = β × 100
∂Xi Yi
∆ %Y
= β × 100
∂Xi
Lo anterior implica que β ×100 representa el cambio porcentual que experimentará Yi ante un cambio en Xi
en una unidad. Sin embargo, la anterior interpretación no puede aplicarse para la variable dummy, ya que
al no tratarse de una variable continúa no se puede derivar con respecto a ella.
El coeficiente θ puede ser interpretado de dos maneras. A continuación se discuten dos formas de encontrar
una interpretación de θ y para ser más precisos de una función de θ.
5
Apuntes de Economı́a No. 40
Esto implica que si se divide el valor que toma Yi cuando la dummy es uno ( Yi | Di = 1) por el valor que toma
Yi cuando la dummy es cero ( Yi | Di = 0), ceteris paribus, obtendremos eθ . Es decir,
Yi | Di = 1 eα+βXi +εi · eθ
= = eθ (2.4)
Yi | Di = 0 eα+βXi +εi
Por tanto, eθ corresponde a la razón entre el valor que toma la variable dependiente cuando la dummy es
uno y cuando ésta es cero. En otras palabras, el efecto sobre Yi de la presencia de la caracterı́stica medida
por la dummy es eθ veces más grande que cuando no está presente la caracterı́stica. Por ejemplo, conside-
remos el caso en el la variable dependiente en (1.2) fuese el logaritmo del consumo, la variable explicativa
continua fuese el ingreso disponible y la variable dummy tomase el valor de uno en periodos de contracción
económica y cero en caso de expansión. Es decir,
En este ejemplo, eθ seria la razón entre el consumo (ceteris paribus) entre los tiempos de contracción y
expansión económica. O en otras palabras, el consumo en tiempos de contracción es eθ veces más grande
que en tiempo de expansión (ceteris paribus). Antes de continuar es importante anotar que para interpretar
el coeficiente que acompaña la variable dummy (θ) se debe considerar una función de θ. Es decir, θ no tiene
una interpretación, pero eδ si.
Siguiendo a Halvorsen y Palmquist (1980), podemos definir el efecto relativo sobre Yi de la presencia de la
caracterı́stica medida por la dummy de la siguiente manera:
( Yi | Di = 1) − ( Yi | Di = 0)
(2.6)
( Yi | Di = 0)
Noten que esta expresión es análoga a calcular un cambio porcentual. Empleando 2.2 tenemos que el efecto
relativo sobre Yi de la presencia de la caracterı́stica medida por la dummy es:
6
Apuntes de Economı́a No. 40
En general, si queremos interpretar el coeficiente asociado a la dummy en una manera similar, pero no igual,
a la interpretación que presenta una variable continua, podemos emplear esta aproximación1 .
Pero, para nuestro caso tenemos que el correspondiente estimador MCO para g(θ) serı́a:
Por otro lado, en general se sabe que si W es una variable aleatoria y f (·) es una función no lineal, entonces:
E [f (W )] , f (E [W ])
(ver Alonso (2007) para una discusión del tema). Retornando al estimador MCO para g(θ) tendremos que
este será sesgado, pues:
h i
E g(θ̂) , g(θ) (3.2)
1 Noten que si bien β × 100 representa el cambio porcentual que experimentará Y ante un cambio en X en una unidad, serı́a
i i
incorrecto interpretar a θ por 100 como el efecto porcentual de la caracterı́stica medida por la dummy sobre la variable dependiente.
Ver a Halvorsen y Palmquist (1980) para una interesante discusión sobre unos papers que cometen este error.
7
Apuntes de Economı́a No. 40
Halvorsen y Palmquist (1980) concentran su atención en la interpretación de los coeficientes asociados a una
variable dummy en un modelo log-lin. Un año después, Kennedy (1981) contribuyen a la discusión estu-
diando el problema de estimación de g(θ). Los autores se preocupan por el sesgo generado por el estimador
(3.1) y proponen el siguiente estimador consistente para g(θ):
1d
ĝ = exp θ̂OLS − V ar(θ̂OLS ) (3.3)
2
donde V
d ar(θ̂OLS ) representa la varianza estimada del estimador MCO de θ. Si bien este estimador será ses-
gado, los autores demuestran que dicho sesgo será menor que g(θ̂) = eθ̂M CO . Posteriormente, Giles (1982)
propone otro estimador incorporando grados de libertad. El autor demuestra que si bien su estimador tiene
un buen comportamiento en muestras grandes, para muestras pequeñas es preferible el estimador de Ken-
nedy.
Por su parte Van Garderen y Shah (2002) evalúan los resultados de emplear los dos estimadores, llegando a
la conclusión que no se puede considerar un único método que se comporte mejor que otro, pues al final
no existe un estimador que minimice el Error medio cuadrático (MSE en inglés) para todos los parámetros.
4. Ejercicios
A continuación se presenta unos ejercicios que permiten al lector poner en práctica los conceptos presenta-
dos anteriormente.
Para cada uno de los siguientes modelos, interprete el coeficiente que acompaña a la variable dummy con el
método de la razón y de variación:
Ln(Mid ) = α1 + α2 Ii + α3 Ri + α4 Di + ui (4.1)
Donde:
Mid : es la cantidad demandada de dinero
Ii : es la tasa de interés
Ri : es la renta percápita en millones de pesos
Di toma el valor de uno si el paı́s está en boom y cero en caso contrario
8
Apuntes de Economı́a No. 40
Bibliografı́a
J. Alonso. APUNTES DE ESTADÍSTICA PARA UN CURSO INTRODUCTORIO DE ECONOMETRÍA. Apun-
tes de Economı́a, (12), 2007.
J. Alonso y P. Semáan. EasyReg: Aplicaciones para un curso de econometrı́a. Universidad ICESI, 2010.
D. Giles. The interpretation of dummy variables in semilogarithmic equation: Unbiased estimation. Econo-
mics Letters, 10:77–79, 1982.
R. Halvorsen y R. Palmquist. The interpretation of dummy variables in semilogarithmic equations. The
American Economic Review, 70(3):474–475, 1980.
P. Kennedy. Estimation with correctly interpreted dummy variables in semilogarithmic equations. The
American Economic Review, 71(4):801, 1981.
J. Van Garderen, K y C. Shah. Interpretation of dummy variables in semilogarithmic equations. The Econo-
metrics Journal, 4(1):149–159, 2002.
9
Apuntes de Economı́a No. 40
Ln(Mid ) = α1 + α2 Ii + α3 Ri + α4 Di + ui
Es decir:
α +α α I+α R +u
e 1 4 + e 2 3 i i Di = 1
Mid =
eα1 + eα2 I+α3 Ri +ui o.w.
Modelo 2.
Reescribiendo el modelo tenemos que:
Es decir:
α +α α2 α3 u
e 1 4 + Ii Ri e i Di = 1
Mid =
eα1 + I α2 Rα3 eui o.w.
i i
esto implica que:
α α
Mid |Di =1 eα1 +α4 + Ii 2 Ri 3 eui
e α4
= = α α = eα1 +α4 −α1
Mid |o.w. eα1 + Ii 2 Ri 3 eui
10
Apuntes de Economı́a No. 40
Por tanto, eα4 corresponde a la razón entre la demanda de dinero en tiempos de boom y tiempos de no boom.
O en otras palabras, la demanda de dinero en tiempos de boom es eα4 veces más grande que en tiempos de
no boom.
Modelo 3.
Reescribiendo el modelo tenemos que:
esto implica que α4 es la diferencia entre la demanda de dinero cuando la tasa de interés es uno y la renta
percápita es de un millón entre periodos de boom y no boom
11
View publication stats