Vous êtes sur la page 1sur 12

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/303298212

Interpretación de variables Dummy en modelos log-lin

Working Paper · January 2014

CITATIONS READS
0 4,231

2 authors, including:

Julio César Alonso


University ICESI
141 PUBLICATIONS   165 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Notas de clase View project

Integración espacial y vertical de mercados de productos agrícolas en Colombia View project

All content following this page was uploaded by Julio César Alonso on 17 May 2016.

The user has requested enhancement of the downloaded file.


Interpretación de variables Dummy
en modelos log-lin

Julio César Alonso


Andrés Felipe Muñoz

No. 40
Enero de 2014
Apuntes de Economı́a

ISSN 1794-029X
No. 40

Editor
Julio César Alonso
jcalonso@icesi.edu.co

Asistente editorial
Andrés Felipe Muñoz G.
afmunoz@icesi.edu.co

Gestión Editorial
Departamento de Economı́a - Universidad Icesi

www.icesi.edu.co
Tel: 5552334 ext: 8398. Fax: 5551441
Calle 18 # 122-135 Cali, Valle del Cauca, Colombia
Interpretación de variables Dummy en modelos log-lin

Julio César Alonso*


Andrés Muñoz **
CIENFI - Departamento de Economı́a - Universidad Icesi
Cali - Colombia

Marzo de 2014

Resumen

Este documento presenta una breve guı́a sobre interpretación de los coeficientes asociados a las varia-
bles dummy en modelos log-lin. Además se discute las implicaciones de emplear los estimadores MCO en
aplicaciones prácticas. El documento está dirigido a estudiantes de un curso de econometrı́a en últimos
semestres o en cursos introductorios de una maestrı́a en economı́a. Se supone un conocimiento básico en
econometrı́a.
Palabras clave:interpretación, variables dummy, modelos log-lin

Abstract

This document provides a brief guide to the interpretation of dummy variables’ coefficients in log-lin mo-
dels. We also discuss the consequences of using OLS estimators in applied work. The document is written
for students in undergraduate econometrics upper courses or introductory econometrics at the Masters le-
vel. We assume that the reader has a basic knowledge in econometrics.
Key Words :interpretation, dummy variables, log-lin model

* Director del centro de investigación en economı́a y finanzas (CIENFI) y director académico de la maestrı́a en Economı́a de la

Universidad Icesi
** Estudiante en práctica del CIENFI y estudiante de último semestre de Economı́a en la Universidad Icesi.

3
Apuntes de Economı́a No. 40

Objetivos de Aprendizaje
Al finalizar la lectura de este documento se espera que el lector esté en capacidad de:

Interpretar el coeficiente asociado a una variable dummy en un modelo log-lin.

Explicar en sus propias palabras el sesgo asociado al emplear estimaciones MCO para el efecto de la
variable dummy.

Estimar el efecto de la variable dummy sobre la variable dependiente en un modelo log-lin, empleando
un estimador consistente a partir de un valor estimado a partir del método de Mı́nimos Cuadrados
Ordinarios.

1. Introducción
El uso de variables dicotómicas (o dummy) en modelos econométricos es común para incorporar, por
ejemplo, alguna caracterı́stica cualitativa de los individuos de la población o para capturar algún cambio
estructural durante el periodo bajo estudio. En otras palabras, la variable dummy permite medir el efecto
de una determinada caracterı́stica de los individuos (o periodos) en la muestra; caracterı́stica que es medida
por medio de la dummy. Tı́picamente la variable dummy toma el valor de uno cuando la caracterı́stica de
interés está presente y cero en caso contrario.

Por otro lado, la sencillez en la interpretación de los coeficientes asociados a variables dummy en un modelo
lineal hace de la inclusión de estas una herramienta poderosa para los investigadores. Sin embargo, cuando
el modelo no es lineal en las variables, pero si en los parámetros, la interpretación de los coeficientes aso-
ciados a variables dummy ya no es tan sencilla.

Consideremos el modelo de la forma:

l
X m
X
Ln(Yi ) = α + βi Xj,i + θj Dj,i + ε − i (1.1)
j=1 j=1

donde las Xi0 s son variables explicativas continuas y las Dj0 s son variables dummy. Este tipo de modelos
es denominado log-lin, pues la variable dependiente se expresa como un logaritmo y las explicativas se
expresan en forma lineal.Sin perder generalidad y por simplicidad, concentrémonos en un modelo con solo
una variable explicativa continua y una dicotómica. Es decir,

Ln(Yi ) = α + βXi + θDi + εi (1.2)

4
Apuntes de Economı́a No. 40

El resto de este documento está organizado de la siguiente manera. En la segunda parte de este documento
discutiremos la interpretación de los coeficientes de (1.2). La tercera parte presenta una reflexión sobre las
implicaciones de emplear estimaciones por medio del método de Mı́nimos Cuadrados Ordinarios (MCO)
para interpretar el efecto del factor medido por la variable dummy sobre la variable dependiente. La última
parte presenta un ejercicio.

2. Interpretación de los coeficientes

2.1. Coeficiente asociado a la variable continua

La interpretación del coeficiente asociado a la variable continua (β) es relativamente sencilla. La interpreta-
ción es mucho más sencilla si expresamos (1.2) de la siguiente manera:

Yi = eα+βXi +θDi +εi (2.1)

Ahora, es fácil determinar cuál es el efecto de un cambio en Xi sobre la variable dependiente. Derivando
(2.1) con respecto a Xi se obtiene:
∂Yi
= βeα+βXi +θDi +εi
∂Xi
Remplazando (2.1) en la anterior expresión, obtenemos:

∂Yi
= βYi
∂Xi

Manipulando algebráicamente de tal manera que despejemos β se obtiene:

∂Yi 1

∂Xi Yi

Multiplicando a ambos lados por 100, tenemos que:

∂Yi 1
× 100 = β × 100
∂Xi Yi
∆ %Y
= β × 100
∂Xi

Lo anterior implica que β ×100 representa el cambio porcentual que experimentará Yi ante un cambio en Xi
en una unidad. Sin embargo, la anterior interpretación no puede aplicarse para la variable dummy, ya que
al no tratarse de una variable continúa no se puede derivar con respecto a ella.

2.2. Coeficiente asociado a la variable dummy

El coeficiente θ puede ser interpretado de dos maneras. A continuación se discuten dos formas de encontrar
una interpretación de θ y para ser más precisos de una función de θ.

5
Apuntes de Economı́a No. 40

2.2.1. Aproximación 1. Interpretación como una razón

Noten que (1.2) implica que:



α+βXi +θ+εi Di = 1
 e



Yi =  (2.2)
 eα+βXi +εi o.w.

Reorganizando términos, obtenemos que:



α+βXi +εi · eθ Di = 1
 e



Yi =  (2.3)
 eα+βXi +εi o.w.

Esto implica que si se divide el valor que toma Yi cuando la dummy es uno ( Yi | Di = 1) por el valor que toma
Yi cuando la dummy es cero ( Yi | Di = 0), ceteris paribus, obtendremos eθ . Es decir,

Yi | Di = 1 eα+βXi +εi · eθ
= = eθ (2.4)
Yi | Di = 0 eα+βXi +εi

Por tanto, eθ corresponde a la razón entre el valor que toma la variable dependiente cuando la dummy es
uno y cuando ésta es cero. En otras palabras, el efecto sobre Yi de la presencia de la caracterı́stica medida
por la dummy es eθ veces más grande que cuando no está presente la caracterı́stica. Por ejemplo, conside-
remos el caso en el la variable dependiente en (1.2) fuese el logaritmo del consumo, la variable explicativa
continua fuese el ingreso disponible y la variable dummy tomase el valor de uno en periodos de contracción
económica y cero en caso de expansión. Es decir,

Ln(Ct ) = α + βIngresot + θDt + εt (2.5)

En este ejemplo, eθ seria la razón entre el consumo (ceteris paribus) entre los tiempos de contracción y
expansión económica. O en otras palabras, el consumo en tiempos de contracción es eθ veces más grande
que en tiempo de expansión (ceteris paribus). Antes de continuar es importante anotar que para interpretar
el coeficiente que acompaña la variable dummy (θ) se debe considerar una función de θ. Es decir, θ no tiene
una interpretación, pero eδ si.

Approximación 2. Variación porcentual

Siguiendo a Halvorsen y Palmquist (1980), podemos definir el efecto relativo sobre Yi de la presencia de la
caracterı́stica medida por la dummy de la siguiente manera:

( Yi | Di = 1) − ( Yi | Di = 0)
(2.6)
( Yi | Di = 0)
Noten que esta expresión es análoga a calcular un cambio porcentual. Empleando 2.2 tenemos que el efecto
relativo sobre Yi de la presencia de la caracterı́stica medida por la dummy es:

6
Apuntes de Economı́a No. 40

( Yi | Di = 1) − ( Yi | Di = 0) eα+βXi +εi · eθ − eα+βXi +εi


= = eθ − 1 (2.7)
( Yi | Di = 0) eα+βXi +εi
Es decir, eθ −1 representa el efecto relativo sobre Yi de la presencia de la caracterı́stica medida por la dummy.
Y por lo tanto, el efecto porcentual de la presencia del efecto de la caracterı́stica medida por la dummy sobre
Yi es
( Yi | Di = 1) − ( Yi | Di = 0)  
100 · = 100 · eθ − 1 (2.8)
( Yi | Di = 0)
Regresando al ejemplo representado en (2.5), eθ − 1 representa el efecto relativo sobre el consumo de los pe-
 
riodos de contracción. O lo que es equivalente, 100 · eθ − 1 es el cambio porcentual en el consumo debido
a la contracción.

En general, si queremos interpretar el coeficiente asociado a la dummy en una manera similar, pero no igual,
a la interpretación que presenta una variable continua, podemos emplear esta aproximación1 .

3. Consideraciones para la estimación


Es importante resaltar que si se desea conocer el efecto de la presencia de un efecto de una caracterı́stica
medida por medio de una variable dummy en un modelo log-lin (como (1.2)), no sólo basta con estimar θ. Se
 
necesita estimar eθ o eθ − 1 . Es decir una función no lineal de θ. Definamos g(θ) = eθ . Ahora, supongamos
que (1.2) es estimado por medio del método de Mı́nimos Cuadrados Ordinarios (MCO), en este caso
sabemos que si se cumplen todos los supuestos del Teorema de Gauss-Markov el estimador de θ (θ̂MCO )
será insesgado y eficiente (Ver (Alonso y Semáan, 2010) para una discusión introductoria de este tema). Es
decir,
h i
E θ̂MCO = θ

Pero, para nuestro caso tenemos que el correspondiente estimador MCO para g(θ) serı́a:

g(θ̂) = eθ̂M CO (3.1)

Por otro lado, en general se sabe que si W es una variable aleatoria y f (·) es una función no lineal, entonces:

E [f (W )] , f (E [W ])

(ver Alonso (2007) para una discusión del tema). Retornando al estimador MCO para g(θ) tendremos que
este será sesgado, pues:
h i
E g(θ̂) , g(θ) (3.2)
1 Noten que si bien β × 100 representa el cambio porcentual que experimentará Y ante un cambio en X en una unidad, serı́a
i i
incorrecto interpretar a θ por 100 como el efecto porcentual de la caracterı́stica medida por la dummy sobre la variable dependiente.
Ver a Halvorsen y Palmquist (1980) para una interesante discusión sobre unos papers que cometen este error.

7
Apuntes de Economı́a No. 40

Halvorsen y Palmquist (1980) concentran su atención en la interpretación de los coeficientes asociados a una
variable dummy en un modelo log-lin. Un año después, Kennedy (1981) contribuyen a la discusión estu-
diando el problema de estimación de g(θ). Los autores se preocupan por el sesgo generado por el estimador
(3.1) y proponen el siguiente estimador consistente para g(θ):

1d
 
ĝ = exp θ̂OLS − V ar(θ̂OLS ) (3.3)
2
donde V
d ar(θ̂OLS ) representa la varianza estimada del estimador MCO de θ. Si bien este estimador será ses-
gado, los autores demuestran que dicho sesgo será menor que g(θ̂) = eθ̂M CO . Posteriormente, Giles (1982)
propone otro estimador incorporando grados de libertad. El autor demuestra que si bien su estimador tiene
un buen comportamiento en muestras grandes, para muestras pequeñas es preferible el estimador de Ken-
nedy.

Por su parte Van Garderen y Shah (2002) evalúan los resultados de emplear los dos estimadores, llegando a
la conclusión que no se puede considerar un único método que se comporte mejor que otro, pues al final
no existe un estimador que minimice el Error medio cuadrático (MSE en inglés) para todos los parámetros.

4. Ejercicios
A continuación se presenta unos ejercicios que permiten al lector poner en práctica los conceptos presenta-
dos anteriormente.

Para cada uno de los siguientes modelos, interprete el coeficiente que acompaña a la variable dummy con el
método de la razón y de variación:

Ln(Mid ) = α1 + α2 Ii + α3 Ri + α4 Di + ui (4.1)

Ln(Mid ) = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui (4.2)

Mid = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui (4.3)

Donde:
Mid : es la cantidad demandada de dinero
Ii : es la tasa de interés
Ri : es la renta percápita en millones de pesos
Di toma el valor de uno si el paı́s está en boom y cero en caso contrario

8
Apuntes de Economı́a No. 40

Bibliografı́a
J. Alonso. APUNTES DE ESTADÍSTICA PARA UN CURSO INTRODUCTORIO DE ECONOMETRÍA. Apun-
tes de Economı́a, (12), 2007.
J. Alonso y P. Semáan. EasyReg: Aplicaciones para un curso de econometrı́a. Universidad ICESI, 2010.
D. Giles. The interpretation of dummy variables in semilogarithmic equation: Unbiased estimation. Econo-
mics Letters, 10:77–79, 1982.
R. Halvorsen y R. Palmquist. The interpretation of dummy variables in semilogarithmic equations. The
American Economic Review, 70(3):474–475, 1980.
P. Kennedy. Estimation with correctly interpreted dummy variables in semilogarithmic equations. The
American Economic Review, 71(4):801, 1981.
J. Van Garderen, K y C. Shah. Interpretation of dummy variables in semilogarithmic equations. The Econo-
metrics Journal, 4(1):149–159, 2002.

9
Apuntes de Economı́a No. 40

Respuestas Sugeridas (Método de razón)


Modelo 1.
Reescribiendo el modelo tenemos que:

Ln(Mid ) = α1 + α2 Ii + α3 Ri + α4 Di + ui

Mid = eα1 +α2 Ii +α3 Ri +α4 Di +ui

Mid = eα1 +α4 Di + eα2 I+α3 Ri +ui

Es decir:

α +α α I+α R +u
e 1 4 + e 2 3 i i Di = 1


Mid = 

 eα1 + eα2 I+α3 Ri +ui o.w.

lo que implica que:

Mid |Di =1 eα1 +α4 + eα2 I+α3 Ri +ui


eα4 = = = eα1 +α4 −α1
Mid |o.w. eα1 + eα2 I+α3 Ri +ui
Por tanto, eα4 corresponde a la razón entre la demanda de dinero en tiempos de boom y tiempos de no boom.
O en otras palabras, la demanda de dinero en tiempos de boom es eα4 veces más grande que en tiempos de
no boom.

Modelo 2.
Reescribiendo el modelo tenemos que:

Ln(Mid ) = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui

Mid = eα1 +α2 Ln(Ii )+α3 Ln(Ri )+α4 Di +ui

Mid = eα1 +α4 Di + eLn(Ii )+α3 Ln(Ri )+α4 Di +ui


α α
Mid = eα1 +α4 Di + Ii 2 Ri 3 eui

Es decir:

α +α α2 α3 u
e 1 4 + Ii Ri e i Di = 1


Mid = 

 eα1 + I α2 Rα3 eui o.w.


i i
esto implica que:

α α
Mid |Di =1 eα1 +α4 + Ii 2 Ri 3 eui
e α4
= = α α = eα1 +α4 −α1
Mid |o.w. eα1 + Ii 2 Ri 3 eui

10
Apuntes de Economı́a No. 40

Por tanto, eα4 corresponde a la razón entre la demanda de dinero en tiempos de boom y tiempos de no boom.
O en otras palabras, la demanda de dinero en tiempos de boom es eα4 veces más grande que en tiempos de
no boom.

Modelo 3.
Reescribiendo el modelo tenemos que:

Mid = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + α4 Di + ui

Mid = α1 + α4 Di + α2 Ln(Ii ) + α3 Ln(Ri ) + ui

Entonces, tendremos que:



d
Mi = α1 + α4 + α2 Ln(Ii ) + α3 Ln(Ri ) + ui Di = 1


d

Mi = 
Mid = α1 + α2 Ln(Ii ) + α3 Ln(Ri ) + ui o.w.

esto implica que α4 es la diferencia entre la demanda de dinero cuando la tasa de interés es uno y la renta
percápita es de un millón entre periodos de boom y no boom

11
View publication stats

Vous aimerez peut-être aussi