AlonsoMuoz 2014 InterpretacindevariablesDummyenmodeloslog Lin

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/303298212
Interpretación de variables Dummy en modelos log-lin
Working Paper · January 2014
CITATIONS READS
0 4,231
2 authors, including:
Julio César Alonso

University ICESI
141 PUBLICATIONS 165 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Notas de clase View project
Integración espacial y vertical de mercados de productos agrícolas en Colombia View project
All content following this page was uploaded by Julio César Alonso on 17 May 2016.
The user has requested enhancement of the downloaded file.

Interpretación de variables Dummy
en modelos log-lin
Julio César Alonso

Andrés Felipe Muñoz
No. 40
Enero de 2014
Apuntes de Economı́a
ISSN 1794-029X
No. 40
Editor
Julio César Alonso
jcalonso@icesi.edu.co
Asistente editorial
Andrés Felipe Muñoz G.
afmunoz@icesi.edu.co
Gestión Editorial
Departamento de Economı́a - Universidad Icesi
www.icesi.edu.co
Tel: 5552334 ext: 8398. Fax: 5551441
Calle 18 # 122-135 Cali, Valle del Cauca, Colombia
Interpretación de variables Dummy en modelos log-lin
Julio César Alonso*

Andrés Muñoz **
CIENFI - Departamento de Economı́a - Universidad Icesi
Cali - Colombia
Marzo de 2014
Resumen
Este documento presenta una breve guı́a sobre interpretación de los coeficientes asociados a las varia-
bles dummy en modelos log-lin. Además se discute las implicaciones de emplear los estimadores MCO en
aplicaciones prácticas. El documento está dirigido a estudiantes de un curso de econometrı́a en últimos
semestres o en cursos introductorios de una maestrı́a en economı́a. Se supone un conocimiento básico en
econometrı́a.
Palabras clave:interpretación, variables dummy, modelos log-lin
Abstract
This document provides a brief guide to the interpretation of dummy variables’ coefficients in log-lin mo-
dels. We also discuss the consequences of using OLS estimators in applied work. The document is written
for students in undergraduate econometrics upper courses or introductory econometrics at the Masters le-
vel. We assume that the reader has a basic knowledge in econometrics.
Key Words :interpretation, dummy variables, log-lin model
* Director del centro de investigación en economı́a y finanzas (CIENFI) y director acadÃ©mico de la maestrı́a en Economı́a de la
Universidad Icesi
** Estudiante en práctica del CIENFI y estudiante de último semestre de Economı́a en la Universidad Icesi.
3
Apuntes de Economı́a No. 40
Objetivos de Aprendizaje
Al finalizar la lectura de este documento se espera que el lector esté en capacidad de:
Interpretar el coeficiente asociado a una variable dummy en un modelo log-lin.
Explicar en sus propias palabras el sesgo asociado al emplear estimaciones MCO para el efecto de la
variable dummy.
Estimar el efecto de la variable dummy sobre la variable dependiente en un modelo log-lin, empleando
un estimador consistente a partir de un valor estimado a partir del método de Mı́nimos Cuadrados
Ordinarios.
1. Introducción
El uso de variables dicotómicas (o dummy) en modelos economÃ©tricos es común para incorporar, por
ejemplo, alguna caracterı́stica cualitativa de los individuos de la población o para capturar algún cambio
estructural durante el periodo bajo estudio. En otras palabras, la variable dummy permite medir el efecto
de una determinada caracterı́stica de los individuos (o periodos) en la muestra; caracterı́stica que es medida
por medio de la dummy. Tı́picamente la variable dummy toma el valor de uno cuando la caracterı́stica de
interés está presente y cero en caso contrario.
Por otro lado, la sencillez en la interpretación de los coeficientes asociados a variables dummy en un modelo
lineal hace de la inclusión de estas una herramienta poderosa para los investigadores. Sin embargo, cuando
el modelo no es lineal en las variables, pero si en los parámetros, la interpretación de los coeficientes aso-
ciados a variables dummy ya no es tan sencilla.
Consideremos el modelo de la forma:
l
X m
X
Ln(Yi ) = α + βi Xj,i + θj Dj,i + ε − i (1.1)
j=1 j=1
donde las Xi0 s son variables explicativas continuas y las Dj0 s son variables dummy. Este tipo de modelos
es denominado log-lin, pues la variable dependiente se expresa como un logaritmo y las explicativas se
expresan en forma lineal.Sin perder generalidad y por simplicidad, concentrémonos en un modelo con solo
una variable explicativa continua y una dicotómica. Es decir,
Ln(Yi ) = α + βXi + θDi + εi (1.2)
4
El resto de este documento está organizado de la siguiente manera. En la segunda parte de este documento
discutiremos la interpretación de los coeficientes de (1.2). La tercera parte presenta una reflexión sobre las
implicaciones de emplear estimaciones por medio del mÃ©todo de Mı́nimos Cuadrados Ordinarios (MCO)
para interpretar el efecto del factor medido por la variable dummy sobre la variable dependiente. La última
parte presenta un ejercicio.
2. Interpretación de los coeficientes
2.1. Coeficiente asociado a la variable continua
La interpretación del coeficiente asociado a la variable continua (β) es relativamente sencilla. La interpreta-
ción es mucho más sencilla si expresamos (1.2) de la siguiente manera:
Yi = eα+βXi +θDi +εi (2.1)
Ahora, es fácil determinar cuál es el efecto de un cambio en Xi sobre la variable dependiente. Derivando
(2.1) con respecto a Xi se obtiene:
∂Yi
= βeα+βXi +θDi +εi
∂Xi
Remplazando (2.1) en la anterior expresión, obtenemos:
∂Yi
= βYi
∂Xi
Manipulando algebráicamente de tal manera que despejemos β se obtiene:
∂Yi 1
=β
∂Xi Yi
Multiplicando a ambos lados por 100, tenemos que:
∂Yi 1
× 100 = β × 100
∂Xi Yi
∆ %Y
= β × 100
∂Xi
Lo anterior implica que β ×100 representa el cambio porcentual que experimentará Yi ante un cambio en Xi
en una unidad. Sin embargo, la anterior interpretación no puede aplicarse para la variable dummy, ya que
al no tratarse de una variable continúa no se puede derivar con respecto a ella.
2.2. Coeficiente asociado a la variable dummy
El coeficiente θ puede ser interpretado de dos maneras. A continuación se discuten dos formas de encontrar
una interpretación de θ y para ser más precisos de una función de θ.
5
2.2.1. Aproximación 1. Interpretación como una razón
Noten que (1.2) implica que:


α+βXi +θ+εi Di = 1
 e



Yi =  (2.2)
 eα+βXi +εi o.w.


Reorganizando tÃ©rminos, obtenemos que:


α+βXi +εi · eθ Di = 1
 e



Yi =  (2.3)
 eα+βXi +εi o.w.


Esto implica que si se divide el valor que toma Yi cuando la dummy es uno ( Yi | Di = 1) por el valor que toma
Yi cuando la dummy es cero ( Yi | Di = 0), ceteris paribus, obtendremos eθ . Es decir,
Yi | Di = 1 eα+βXi +εi · eθ
= = eθ (2.4)
Yi | Di = 0 eα+βXi +εi
Por tanto, eθ corresponde a la razón entre el valor que toma la variable dependiente cuando la dummy es
uno y cuando ésta es cero. En otras palabras, el efecto sobre Yi de la presencia de la caracterı́stica medida
por la dummy es eθ veces más grande que cuando no está presente la caracterı́stica. Por ejemplo, conside-
remos el caso en el la variable dependiente en (1.2) fuese el logaritmo del consumo, la variable explicativa
continua fuese el ingreso disponible y la variable dummy tomase el valor de uno en periodos de contracción
económica y cero en caso de expansión. Es decir,
Ln(Ct ) = α + βIngresot + θDt + εt (2.5)
En este ejemplo, eθ seria la razón entre el consumo (ceteris paribus) entre los tiempos de contracción y
expansión económica. O en otras palabras, el consumo en tiempos de contracción es eθ veces más grande
que en tiempo de expansión (ceteris paribus). Antes de continuar es importante anotar que para interpretar
el coeficiente que acompaña la variable dummy (θ) se debe considerar una función de θ. Es decir, θ no tiene
una interpretación, pero eδ si.
Approximación 2. Variación porcentual
Siguiendo a Halvorsen y Palmquist (1980), podemos definir el efecto relativo sobre Yi de la presencia de la
caracterı́stica medida por la dummy de la siguiente manera:
( Yi | Di = 1) − ( Yi | Di = 0)
(2.6)
( Yi | Di = 0)
Noten que esta expresión es análoga a calcular un cambio porcentual. Empleando 2.2 tenemos que el efecto
relativo sobre Yi de la presencia de la caracterı́stica medida por la dummy es:
6
( Yi | Di = 1) − ( Yi | Di = 0) eα+βXi +εi · eθ − eα+βXi +εi

= = eθ − 1 (2.7)
( Yi | Di = 0) eα+βXi +εi
Es decir, eθ −1 representa el efecto relativo sobre Yi de la presencia de la caracterı́stica medida por la dummy.
Y por lo tanto, el efecto porcentual de la presencia del efecto de la caracterı́stica medida por la dummy sobre
Yi es
( Yi | Di = 1) − ( Yi | Di = 0)
100 · = 100 · eθ − 1 (2.8)
( Yi | Di = 0)
Regresando al ejemplo representado en (2.5), eθ − 1 representa el efecto relativo sobre el consumo de los pe-

riodos de contracción. O lo que es equivalente, 100 · eθ − 1 es el cambio porcentual en el consumo debido
a la contracción.
En general, si queremos interpretar el coeficiente asociado a la dummy en una manera similar, pero no igual,
a la interpretación que presenta una variable continua, podemos emplear esta aproximación1 .
3. Consideraciones para la estimación

Es importante resaltar que si se desea conocer el efecto de la presencia de un efecto de una caracterı́stica
medida por medio de una variable dummy en un modelo log-lin (como (1.2)), no sólo basta con estimar θ. Se

necesita estimar eθ o eθ − 1 . Es decir una función no lineal de θ. Definamos g(θ) = eθ . Ahora, supongamos
que (1.2) es estimado por medio del mÃ©todo de Mı́nimos Cuadrados Ordinarios (MCO), en este caso
sabemos que si se cumplen todos los supuestos del Teorema de Gauss-Markov el estimador de θ (θ̂MCO )
será insesgado y eficiente (Ver (Alonso y Semáan, 2010) para una discusión introductoria de este tema). Es
decir,
h i
E θ̂MCO = θ
Pero, para nuestro caso tenemos que el correspondiente estimador MCO para g(θ) serı́a:
g(θ̂) = eθ̂M CO (3.1)
Por otro lado, en general se sabe que si W es una variable aleatoria y f (·) es una función no lineal, entonces:
E [f (W )] , f (E [W ])
(ver Alonso (2007) para una discusión del tema). Retornando al estimador MCO para g(θ) tendremos que
este será sesgado, pues:
h i
E g(θ̂) , g(θ) (3.2)
1 Noten que si bien β × 100 representa el cambio porcentual que experimentará Y ante un cambio en X en una unidad, serı́a
i i
incorrecto interpretar a θ por 100 como el efecto porcentual de la caracterı́stica medida por la dummy sobre la variable dependiente.
Ver a Halvorsen y Palmquist (1980) para una interesante discusión sobre unos papers que cometen este error.
7
Halvorsen y Palmquist (1980) concentran su atención en la interpretación de los coeficientes asociados a una
variable dummy en un modelo log-lin. Un año después, Kennedy (1981) contribuyen a la discusión estu-
diando el problema de estimación de g(θ). Los autores se preocupan por el sesgo generado por el estimador
(3.1) y proponen el siguiente estimador consistente para g(θ):
1d

ĝ = exp θ̂OLS − V ar(θ̂OLS ) (3.3)
2
donde V
d ar(θ̂OLS ) representa la varianza estimada del estimador MCO de θ. Si bien este estimador será ses-
gado, los autores demuestran que dicho sesgo será menor que g(θ̂) = eθ̂M CO . Posteriormente, Giles (1982)
propone otro estimador incorporando grados de libertad. El autor demuestra que si bien su estimador tiene
un buen comportamiento en muestras grandes, para muestras pequeñas es preferible el estimador de Ken-
nedy.
Por su parte Van Garderen y Shah (2002) evalúan los resultados de emplear los dos estimadores, llegando a
la conclusión que no se puede considerar un único mÃ©todo que se comporte mejor que otro, pues al final
no existe un estimador que minimice el Error medio cuadrático (MSE en inglés) para todos los parámetros.
4. Ejercicios
A continuación se presenta unos ejercicios que permiten al lector poner en práctica los conceptos presenta-
dos anteriormente.
Para cada uno de los siguientes modelos, interprete el coeficiente que acompaña a la variable dummy con el
método de la razón y de variación:
Ln(Mid ) = α1 + α2 Ii + α3 Ri + α4 Di + ui (4.1)
Ln(Mid ) = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui (4.2)
Mid = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui (4.3)
Donde:
Mid : es la cantidad demandada de dinero
Ii : es la tasa de interés
Ri : es la renta percápita en millones de pesos
Di toma el valor de uno si el paı́s está en boom y cero en caso contrario
8
Bibliografı́a
J. Alonso. APUNTES DE ESTADÍSTICA PARA UN CURSO INTRODUCTORIO DE ECONOMETRÍA. Apun-
tes de Economı́a, (12), 2007.
J. Alonso y P. Semáan. EasyReg: Aplicaciones para un curso de econometrı́a. Universidad ICESI, 2010.
D. Giles. The interpretation of dummy variables in semilogarithmic equation: Unbiased estimation. Econo-
mics Letters, 10:77–79, 1982.
R. Halvorsen y R. Palmquist. The interpretation of dummy variables in semilogarithmic equations. The
American Economic Review, 70(3):474–475, 1980.
P. Kennedy. Estimation with correctly interpreted dummy variables in semilogarithmic equations. The
American Economic Review, 71(4):801, 1981.
J. Van Garderen, K y C. Shah. Interpretation of dummy variables in semilogarithmic equations. The Econo-
metrics Journal, 4(1):149–159, 2002.
9
Respuestas Sugeridas (Método de razón)

Modelo 1.
Reescribiendo el modelo tenemos que:
Ln(Mid ) = α1 + α2 Ii + α3 Ri + α4 Di + ui
Mid = eα1 +α2 Ii +α3 Ri +α4 Di +ui
Mid = eα1 +α4 Di + eα2 I+α3 Ri +ui
Es decir:

α +α α I+α R +u
e 1 4 + e 2 3 i i Di = 1


Mid = 

 eα1 + eα2 I+α3 Ri +ui o.w.


lo que implica que:
Mid |Di =1 eα1 +α4 + eα2 I+α3 Ri +ui

eα4 = = = eα1 +α4 −α1
Mid |o.w. eα1 + eα2 I+α3 Ri +ui
Por tanto, eα4 corresponde a la razón entre la demanda de dinero en tiempos de boom y tiempos de no boom.
O en otras palabras, la demanda de dinero en tiempos de boom es eα4 veces más grande que en tiempos de
no boom.
Modelo 2.
Ln(Mid ) = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui
Mid = eα1 +α2 Ln(Ii )+α3 Ln(Ri )+α4 Di +ui
Mid = eα1 +α4 Di + eLn(Ii )+α3 Ln(Ri )+α4 Di +ui

α α
Mid = eα1 +α4 Di + Ii 2 Ri 3 eui
Es decir:

α +α α2 α3 u
e 1 4 + Ii Ri e i Di = 1


Mid = 

 eα1 + I α2 Rα3 eui o.w.


i i
esto implica que:
α α
Mid |Di =1 eα1 +α4 + Ii 2 Ri 3 eui
e α4
= = α α = eα1 +α4 −α1
Mid |o.w. eα1 + Ii 2 Ri 3 eui
10
Por tanto, eα4 corresponde a la razón entre la demanda de dinero en tiempos de boom y tiempos de no boom.
O en otras palabras, la demanda de dinero en tiempos de boom es eα4 veces más grande que en tiempos de
no boom.
Modelo 3.
Mid = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui
Mid = α1 + α4 Di + α2 Ln(Ii ) + α3 Ln(Ri ) + ui
Entonces, tendremos que:


d
Mi = α1 + α4 + α2 Ln(Ii ) + α3 Ln(Ri ) + ui Di = 1


d

Mi = 
Mid = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + ui o.w.


esto implica que α4 es la diferencia entre la demanda de dinero cuando la tasa de interés es uno y la renta
percápita es de un millón entre periodos de boom y no boom
11
View publication stats

AlonsoMuoz 2014 InterpretacindevariablesDummyenmodeloslog Lin

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

AlonsoMuoz 2014 InterpretacindevariablesDummyenmodeloslog Lin

Transféré par

Droits d'auteur :

Formats disponibles

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

Interpretación de variables Dummy en modelos log-lin

Working Paper · January 2014

Julio César Alonso

Notas de clase View project

Integración espacial y vertical de mercados de productos agrícolas en Colombia View project

The user has requested enhancement of the downloaded file.

Julio César Alonso

Julio César Alonso*

Interpretar el coeficiente asociado a una variable dummy en un modelo log-lin.

Consideremos el modelo de la forma:

Ln(Yi ) = α + βXi + θDi + εi (1.2)

2. Interpretación de los coeficientes

2.1. Coeficiente asociado a la variable continua

Yi = eα+βXi +θDi +εi (2.1)

Manipulando algebráicamente de tal manera que despejemos β se obtiene:

Multiplicando a ambos lados por 100, tenemos que:

2.2. Coeficiente asociado a la variable dummy

2.2.1. Aproximación 1. Interpretación como una razón

Noten que (1.2) implica que:

Reorganizando tÃ©rminos, obtenemos que:

Ln(Ct ) = α + βIngresot + θDt + εt (2.5)

Approximación 2. Variación porcentual

( Yi | Di = 1) − ( Yi | Di = 0) eα+βXi +εi · eθ − eα+βXi +εi

3. Consideraciones para la estimación

g(θ̂) = eθ̂M CO (3.1)

Ln(Mid ) = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui (4.2)

Mid = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui (4.3)

Respuestas Sugeridas (Método de razón)

Mid = eα1 +α2 Ii +α3 Ri +α4 Di +ui

Mid = eα1 +α4 Di + eα2 I+α3 Ri +ui

lo que implica que:

Mid |Di =1 eα1 +α4 + eα2 I+α3 Ri +ui

Ln(Mid ) = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui

Mid = eα1 +α2 Ln(Ii )+α3 Ln(Ri )+α4 Di +ui

Mid = eα1 +α4 Di + eLn(Ii )+α3 Ln(Ri )+α4 Di +ui

Mid = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui

Mid = α1 + α4 Di + α2 Ln(Ii ) + α3 Ln(Ri ) + ui

Entonces, tendremos que:

Vous aimerez peut-être aussi