Académique Documents
Professionnel Documents
Culture Documents
APUNTES DE CLASE
CEDE
Centro de Estudios
sobre Desarrollo Econmico
Facultad de Economa
ISSN 1909-4442
! ""#!$! %%%$$%
$&
INTRODUCCIN A LA ECONOMETRA
3
OCTUBRE
DE
2006
CEDE
CEDE
ISSN 1909-4442
Introduccin a la econometra
2006
OCTUBRE DE
CEDE
Centro de Estudios
sobre Desarrollo Econmico
Facultad de Economa
Universidad de los Andes
APUNTES DE CLASE
CEDE
ISSN 1909-4442
INTRODUCCIN A LA ECONOMETRA
OCTUBRE
DE
2006
CEDE
INTRODUCCIN A LA ECONOMETRA
Este documento hace parte de las notas de clase del curso Mtodos Cuantitativos para las
especializaciones de Economa, Economa Social, Economa del Riesgo y la Informacin, y de
Evaluacin Social de Proyectos de la Facultad de Economa Universidad de Los Andes.
**
Ph. D. en Economa Agrcola, Profesor Asociado de la Facultad de Economa de la
Universidad de Los Andes. Bogot, Colombia. Correo electrnico: rrosales@uniandes.edu.co.
***
Magster en Economa y Magster en Economa del Medio Ambiente y de los Recursos
Naturales, Profesor Instructor de la Facultad de Economa. Universidad de Los Andes. Bogot,
Colombia. Correo electrnico: jobonill@uniandes.edu.co.
INTRODUCTION TO ECONOMETRICS
Abstract
Econometrics is one of the most important applications to the
mathematical statistics and a fundamental tool in the economic research
and in the design and analysis of economic policy. The present
document develops the basic theory concepts of the econometric
modeling for those that begin the study of economics. The specification,
assumptions, estimation, hypothesis testing and predictions for the
classical regression model are the principal topics presented in this text.
The concepts, the tools and their applications developed in this
document are relevant for tackling many practical problems in todays
world and for the introduction in advanced econometric courses.
Key words: correlation analysis, least squares estimation, econometric
model, hypothesis tests.
JEL classification: C01, C10 y C20
TABLA DE CONTENIDO
1. LA MODELACIN Y LA ECONOMETRA ........................................................................................... 5
1.1.
Mtodos Cuantitativos de la Economa...................................................................................... 5
1.2.
Definiciones de la Econometra.................................................................................................. 6
1.3.
Objetivo de la Econometra ........................................................................................................ 7
1.4.
El Procedimiento Economtrico................................................................................................. 7
1.5.
El Modelo ................................................................................................................................... 8
1.6.
El Modelo Econmico ................................................................................................................ 8
1.7.
El Modelo Economtrico .......................................................................................................... 10
1.8.
Elementos que componen el Modelo ........................................................................................ 12
1.9.
Clasificacin de las Variables .................................................................................................. 13
1.10.
Clasificacin de las Ecuaciones ............................................................................................... 13
1.11.
Clasificacin de los Modelos.................................................................................................... 14
2. ORGANIZACIN DE DATOS Y ESTADSTICA DESCRIPTIVA ...................................................... 15
2.1. Objetivos de la Estadstica.............................................................................................................. 15
2.2. Divisiones de la Estadstica ............................................................................................................. 16
2.4. Poblacin y Muestra ........................................................................................................................ 17
2.5. Parmetros Poblacionales y Estadsticos Muestrales ..................................................................... 18
2.6. Medidas de Tendencia Central y de Dispersin .............................................................................. 18
2.7. Mtodos y Diagnsticos Grficos. ................................................................................................... 18
2.8 Ejercicios de computador ................................................................................................................. 21
3. ANALISIS DE CORRELACION ............................................................................................................ 22
3.1. Diagrama de Dispersin.................................................................................................................. 22
3.2. Coeficiente de Correlacin Lineal................................................................................................... 23
3.3. Pruebas de Hiptesis ....................................................................................................................... 25
3.4. Ejercicios de computador ................................................................................................................ 28
4. REGRESION SIMPLE LINEAL Y NO LINEAL.................................................................................... 29
4.1. Objetivo del anlisis de regresin ................................................................................................... 29
4.2. Funcin de regresin muestral y poblacional ................................................................................. 30
4.3. Supuestos del modelo de regresin .................................................................................................. 32
4.4. Mtodo de estimacin de mnimos cuadrados ordinarios................................................................ 35
4.5. Varianzas y errores estndar de los estimadores ............................................................................ 36
4.6. Intervalos de confianza .................................................................................................................... 37
4.7. Pruebas de hiptesis ........................................................................................................................ 37
4.8. Prediccin........................................................................................................................................ 40
4.9. El Coeficiente de Determinacin ..................................................................................................... 40
4.10. Modelos de regresin simple no lineal en las variables ................................................................ 41
4.11. Ejercicios de Computador ............................................................................................................. 42
5. REGRESION MULTIPLE LINEAL Y NO LINEAL .............................................................................. 45
5.1. Expresin del modelo en forma matricial........................................................................................ 45
5.2. Supuestos del modelo....................................................................................................................... 46
5.3. Mtodo de estimacin de mnimos cuadrados ordinarios................................................................ 46
5.4. Matriz de varianzas y covarianzas de los estimadores .................................................................... 46
5.5. Pruebas de hiptesis ........................................................................................................................ 47
5.6. Coeficiente de determinacin ajustado R 2 .................................................................................. 48
5.7. Intervalos de confianza. ................................................................................................................... 49
5.8. Modelos de regresin mltiple no lineal en las variables................................................................ 49
5.9. Ejercicios de Computador. .............................................................................................................. 50
6. INCUMPLIMIENTO DE LOS SUPUESTOS DEL MODELO............................................................... 56
6.1. Multicolinealidad............................................................................................................................. 56
( )
6.2. Heteroscedasticidad......................................................................................................................... 61
6.3. Autocorrelacin ............................................................................................................................... 66
6.4. Error de especificacin.................................................................................................................... 70
6.5. No Normalidad de los errores ......................................................................................................... 73
6.6. Ejercicios de computador. ............................................................................................................... 75
7. INTRODUCCIN A VARIABLES CUALITATIVAS .......................................................................... 83
7.1. Regresin con variables independientes cualitativas ...................................................................... 83
7.2. Regresin con variable dependiente cualitativa .............................................................................. 89
INTRODUCCIN
El curso de Econometra hace parte del rea de mtodos cuantitativos en economa
y se constituye en una herramienta importante en la investigacin econmica, el
diseo y anlisis de poltica. El contenido y el desarrollo del curso son a nivel
introductorio y su inters es la aplicacin de los conceptos tericos. El curso busca
proporcionarle al estudiante las bases iniciales para el manejo de los mtodos y
modelos economtricos, los elementos necesarios para el manejo de la informacin,
anlisis de resultados e interpretacin de las salidas del computador, y familiarizarlo
en sus aplicaciones, tales como la investigacin y la evaluacin de medidas de
poltica.
El documento se encuentra dividido en siete secciones. La primera presenta la
definicin de la econometra, sus objetivos, el concepto del modelo y su
caracterizacin. La segunda trata de la organizacin de datos y la estadstica
descriptiva. La seccin tres aborda los aspectos bsicos del anlisis de
correlacin. La seccin cuatro presenta el modelo formal de regresin lineal
simple. La quinta seccin muestra el modelo de regresin lineal mltiple. La sexta
seccin presenta la teora relacionada con el incumplimiento de los supuestos del
modelo. La seccin siete efecta una introduccin al anlisis transversal de
regresin con variables independientes cualitativas y de variable dependiente
cualitativa. Al final del documento se incluye un anexo que desarrolla el
procedimiento general de manipulacin de datos en el paquete economtrico
Eviews 4.1.
1. LA MODELACIN Y LA ECONOMETRA
1.1.
Definiciones de la Econometra
Estas tres definiciones nos indican que la econometra es cuantitativa y que est
en estrecho contacto con la realidad.
R. Frisch: la econometra a pesar de nutrirse de la Teora Econmica, de las
Matemticas y de la Teora Estadstica, no es ni "Estadstica Econmica", ni
"Teora Econmica", ni "Economa Matemtica".
O. Lange: la econometra es la ciencia que trata de la determinacin, por mtodos
estadsticos, de leyes cuantitativas concretas que rigen la vida econmica. Esta
combina la Teora Econmica con la Estadstica Econmica y trata de dar, por
mtodos matemticos y de inferencia, una expresin concreta a las leyes
generales establecidas por la teora.
1.3.
Objetivo de la Econometra
El Procedimiento Economtrico
El Modelo
El Modelo Econmico
(1)
(2)
Est relacin puede ser correcta. Sin embargo, cuando no se conoce si el insumo X2
es determinante en forma lineal sobre Y, puede ocurrir error de especificacin.
Tambin se debe resaltar que este modelo hace nfasis en un nmero relativamente
pequeo de
variables
se
puede
expresar
1.7.
El Modelo Economtrico
(3)
10
Existen diferentes razones por las cuales los modelos economtricos deben
considerar el trmino de error, destacndose como las ms importantes las
siguientes:
a) Datos: en muchos casos el grado de control que se puede tener sobre las
variables de inters es bajo. Adicionalmente, aunque se desea obtener los
verdaderos valores de las variables, se debe aceptar que puede existir cierto
error en la medicin.
Un ejemplo tpico ocurre cuando las personas encuestadas por diferentes
motivos revelan un ingreso diferente al real y dicha variable se incorpora al
modelo. Otro caso semejante sucede cuando se le pregunta al agricultor sobre
la cantidad de fertilizante que aplic por hectrea a su cultivo en la cosecha
pasada; ste dado que no se acuerda de dicha magnitud, provee un dato que
diverge del real.
b) Nmero de variables: el investigador siempre tiene restricciones para incluir
todas las variables que explican un fenmeno. Por un lado, no cuenta con
completa informacin, y por otro, aunque disponga de demasiada informacin
su formulacin es extremadamente compleja que dificulta su interpretacin. Por
lo tanto, el procedimiento se basa en incluir aquellas variables ms relevantes,
dejando fuera del modelo aquellas poco significativas.
No obstante, el
11
Los elementos que componen el modelo son: las variables, las ecuaciones y los
parmetros.
Una variable es una caracterstica de una poblacin que puede tomar diferentes
valores. Solo son de inters aquellos valores de la variable que tienen un significado
econmico. Por ejemplo las variables: precio, produccin, ingreso, y cantidad de
insumo utilizado tienen regin econmicamente factible en los nmeros reales
positivos.
Una ecuacin es una igualdad conformada por una expresin matemtica que
establece relaciones entre variables. La ecuacin contiene no solo las variables de
inters sino tambin los coeficientes que afectan estas mismas. A estas ltimas
magnitudes se les denomina parmetros desde el enfoque estadstico, los cuales en
un modelo lineal actan como factores de ponderacin de cada variable explicativa y
12
Desde el punto de vista econmico las variables se pueden clasificar como variables
endgenas y exgenas. Las variables endgenas son aquellas cuyos valores se
determinan o calculan dentro del modelo. En contraste, las variables exgenas se
caracterizan por que sus valores estn determinados fuera del modelo.
Tambin existen otras clasificaciones de las variables; desde el enfoque de
inferencia estadstica: variables aleatorias discretas y continuas, y de acuerdo con su
rol en expresin matemtica: variables dependientes e independientes, explicadas o
explicativas. Otro grupo de variables lo constituyen las variables predeterminadas. A
este pertenecen las variables exgenas con o sin rezago (o retardo) y las endgenas
rezagadas. Una denominacin adicional son las variables esperadas o de
expectativas, las cuales son gran utilidad en la formulacin de modelos dinmicos.
1.10. Clasificacin de las Ecuaciones
13
14
15
16
infinito) y pueden arreglarse en una secuencia que corresponde uno a uno con los
enteros positivos; mientras las segundas toman valores dentro de un intervalo de
recta de los nmeros reales. Si se tienen dos variables aleatorias, por ejemplo: el
nmero de hijos por familia y el consumo de energa elctrica; la primera, se
encuentra dentro del grupo de variables aleatorias discretas, y la segunda, dentro del
conjunto de variables aleatorias continuas.
2.4. Poblacin y Muestra
El concepto de poblacin y muestra es muy importante en la inferencia estadstica,
por lo que es conveniente presentar su definicin:
una
caracterstica
en
comn.
La
poblacin
debe
definirse
17
Bogot. Para este caso, la poblacin corresponde a todos los hogares de la ciudad,
mientras que la muestra estar constituida por aquellos hogares que pueden ser
seleccionados de manera aleatoria, como un grupo representativo de todos los que
habitan en Bogot.
2.5. Parmetros Poblacionales y Estadsticos Muestrales
El trmino parmetro es utilizado para referirse a una caracterstica desconocida de
la poblacin, que desea estimarse o evaluarse a travs de una prueba de hiptesis, y
que describe total o parcialmente su funcin de probabilidad o funcin de densidad
de probabilidad. Por otro lado, el estadstico es una medida numrica de una
caracterstica poblacional obtenida a partir de una muestra. Cabe anotar que los
estadsticos son fundamentales en la realizacin de inferencias. El valor promedio y
la varianza son ejemplos de tales medidas.
2.6. Medidas de Tendencia Central y de Dispersin
Las medidas de tendencia central se encuentran dentro de las medidas numricas
que se emplean comnmente para describir conjuntos de datos. La tendencia central
de un conjunto de datos es la disposicin de stos para agruparse, ya sea alrededor
del centro o de ciertos valores numricos. A este grupo de medidas pertenecen la
media, la mediana y la moda.
Existen otro tipo de medidas numricas denominadas medidas de dispersin, cuyo
objetivo es explorar la variabilidad de los datos, es decir qu tan dispersas son las
observaciones en un conjunto de datos. Dentro de estas medidas se encuentran: la
varianza, la desviacin estndar, el recorrido o rango, entre otras.
2.7. Mtodos y Diagnsticos Grficos.
Los datos en los experimentos son recopilados inicialmente sin agrupar, para
18
19
Datos agrupados
k
Media
x=
xi
i =1
x=!
f i xi
i =1
, donde n =
! fi
i =1
Mediana
Mediana = L + c( j f m )
Valor central de la
distribucin (el 50% de los
datos se encuentran por
encima de este valor).
Moda
Valor ms frecuente
Medida Numrica
Varianza
s = ! ( x i x ) ( n 1)
2
Datos agrupados
i =1
' n
$
% ! xi "
n
xi2 & i =1 #
!
n
2
i =1
s =
n 1
Desviacin Estndar
s=
s2 =
! (x x)
i =1
s2 =
'
$
% ! xi "
i =1
&
#
x
!
n
2
i =1
s= s =
n 1
n
s = s2 =
2
i
Recorrido o Rango
Max-min.
20
i =1
(n 1)
' k
$
% ! f i xi "
%
"
#
f i xi2 & i =1
n
n 1
!
i =1
$
' k
% ! f i xi "
#
f i xi2 & i =1
n
n 1
DX
PX
PZ
PW
37
38
18
50
22
55
42
29
63
13
60
62
36
7
6
10
4
9
2
8
8
2
12
3
3
6
5
7
3
9
3
12
5
5
18
2
9
10
5
7
5
13
4
11
3
8
9
3
15
5
5
6
6
8
3
18
3
21
2
19
20
6
12
5
26
Donde:
DX: es la demanda del bien X
PX: es el precio del bien X
PZ: es el precio del bien Z
PW: es el precio del bien W
I:
es el ingreso
ESTADSTICAS DESCRIPTIVAS
Mean
Median
Maximum
Minimum
Std. Dev.
Sum
Observations
DX
40.38462
38.00000
63.00000
13.00000
16.89940
525.0000
13
PX
6.153846
6.000000
12.00000
2.000000
3.210560
80.00000
13
PZ
7.153846
5.000000
18.00000
2.000000
4.431820
93.00000
13
21
PW
7.230769
6.000000
15.00000
3.000000
3.811252
94.00000
13
I
11.46154
8.000000
26.00000
2.000000
8.272599
149.0000
13
3. ANALISIS DE CORRELACION
3.1. Diagrama de Dispersin
Una primera aproximacin con el fin de detectar algn tipo de relacin entre dos
variables (X y Y), consiste en ubicar los pares de valores de en un plano cartesiano
hasta conformar la nube de puntos. Un diagrama de dispersin es la representacin
grfica de todos los pares de valores en sistema de ejes de coordenadas.
El diagrama de dispersin no es un mtodo estadstico como tal, ms bien estara
dentro de los llamados mtodos de "inspeccin preliminar", sin embargo, es una
manera simple de visualizar si existe alguna posible relacin entre las variables. El
diagrama de dispersin puede presentar diferentes formas, tales como las que se
presentan en las figuras siguientes:
La figura a) muestra una posible relacin lineal directa entre las variables; mientras,
22
la figura b) seala una relacin lineal de tipo inversa. Las figura c) y d) revelaran
posibles relaciones cuadrticas entre las variables, exhibiendo un mximo y un
mnimo para la primera y segunda de estas figuras, respectivamente. La figura e)
mostrara una tendencia de tipo cbico entre las variables. La figura f) es un ejemplo
en el cul no puede identificarse por inspeccin algn tipo de relacin entre las
variables, pues aparentemente ella no existe.
3.2. Coeficiente de Correlacin Lineal
Si bien es cierto que el diagrama de dispersin permite visualizar la existencia o no
de una posible relacin lineal entre las variables, el investigador debe soportar sus
conclusiones en trminos de alguna medida estadstica. El coeficiente de correlacin
lineal es un estadstico que mide el tipo de relacin (signo) y la fuerza (magnitud del
coeficiente) de asociacin lineal entre dos variables. Usualmente el coeficiente de
correlacin lineal, representado por la letra r, bajo las condiciones de un muestreo
aleatorio ideal se considera una buena representacin del coeficiente de correlacin
poblacional ( ). La frmula para calcular r es la siguiente:
^
rXY
rXY =
Cov( X , Y )
=
S X SY
! (x x )( y y )
! (x x ) ! ( y y )
i
rXY =
!x y
(! x )
i
+! x i 2
+,
(! x )(! y )
i
2
*(
yi ) *
!
2
( +! y i
(
n
() +,
()
[! x
!x y
i
2
i
n( x y )
n(x )
][! y
2
i
n( y )
( 1 rXY
23
24
25
Paso 1:
Paso 2:
Planteamiento de la hiptesis:
Ho:
=0
Ha:
Paso 3:
tC =
(r
n 2
1 r2
~. t
2, n 2
26
puede
Paso 4:
Paso 5:
tabulado t
2, n 2
(tC )
contra el estadstico
27
28
MATRIZ DE COVARIANZAS
VARIABLE
DX
PX
PZ
PW
I
DX
263.6213
-47.98225
60.01775
-53.78107
47.89941
PX
-47.98225
9.514793
-11.63905
10.73373
-12.99408
PZ
60.01775
-11.63905
18.13018
-12.65089
16.69822
PW
-53.78107
10.73373
-12.65089
13.40828
-16.18343
I
47.89941
-12.99408
16.69822
-16.18343
63.17160
PW
-0.904592
0.950308
-0.811397
1.000000
-0.556062
I
0.371175
-0.530011
0.493410
-0.556062
1.000000
MATRIZ DE CORRELACION
VARIABLE
DX
PX
PZ
PW
I
DX
1.000000
-0.958056
0.868137
-0.904592
0.371175
PX
-0.958056
1.000000
-0.886170
0.950308
-0.530011
PZ
0.868137
-0.886170
1.000000
-0.811397
0.493410
29
1.
2.
3.
4.
30
Por otro lado, cuando la lnea de regresin es construida con los datos muestrales
recibe el nombre de funcin de regresin muestral. Como todo procedimiento de
inferencia estadstica, lo que se pretende es que la muestra sea una buena
representacin de la poblacin. En este sentido, la funcin de regresin muestral
constituye una representacin de la funcin de regresin poblacional. A s mismo,
en la prctica, las muestras de variables aleatorias son usadas para inferir sobre
las caractersticas de la poblacin.
La siguiente grfica presenta un ejemplo de dos lneas de regresin muestral para
el gasto en consumo semanal de un hogar versus el ingreso.
31
32
Por lo tanto los factores que no estn incluidos en el modelo y que por
consiguiente, estn incorporados en ui , no afectan sistemticamente el valor de la
media de Y.
Supuesto 4: Homoscedasticidad o varianza constante de ui . Dado el valor de X ,
la varianza de ui es constante para todas las observaciones. Esto es, las
varianzas condicionales de ui son idnticas.
Yi
Var[Yi / X i ] = 2 .
33
E[u i ] = 0
E[ X i ] _ no _ estocastica
E[u i ] = 0
Cov[u i , X i ] = 0
Supuesto7: El nmero de observaciones n debe ser mayor que el nmero de
parmetros por estimar.
Supuesto 8: Variabilidad en los valores de X . Se requiere que no todos los
valores de X en una muestra dada sean iguales. As la Var[ X ] es un nmero finito
positivo.
Supuesto 9: El modelo de regresin esta correctamente especificado. La omisin
de variables importantes del modelo o la escogencia de una forma funcional
equivocada afectan la validez de la interpretacin de la regresin estimada.
Supuesto 10: No hay correlacin lineal perfecta entre variables explicativas.
34
Yi = 1 + 2 X i + e i
Yi = Yi + e i
La suma del cuadrado de los errores puede expresarse como sigue:
! e i2 = ! (Y i Yi ) = ! (Y i 1 2 X i )
35
! e i2 = min ! (Y i 1 2 X i )
2 =
n ! X i Yi (! X i )(! Yi )
n ! X i (! X i )
Cov ( X , Y )
Var ( X )
1 = Y 2 X
4.5. Varianzas y errores estndar de los estimadores
As como existen medidas de dispersin para las variables tambin las hay para
los estimadores, por lo tanto, es necesario siempre presentar una medida de
precisin de los estimadores de los parmetros del modelo. Esta medida es el
error estndar e indica la confiabilidad de las estimaciones (si son pequeas dejan
ver que los parmetros muestrales van a ser muy parecidos a los poblacionales).
La principal utilidad de los errores estndar de los estimadores es la construccin
de intervalos de confianza y la prueba de hiptesis. A continuacin se presenta la
forma de calcular la varianza y error estndar de cada estimador del modelo de
regresin lineal simple:
( )
Var 1 =
*
X i2
!
(
+
se 1 =
2
+, n ! ( X i X ) ()
! X i2 2
2
n ! (X i X )
( )
Var 2 =
( )
( )
se 2 =
! (X i X )
36
! (X i X )
( )]
( )
Pr 2 t 2 se 2 2 2 + t 2 se 2 = 1
( )
Pr 1 t
( )
( )
se 1 1 1 + t
( )
( )]
se 1 = 1
1 t 2 se 1
( )
el intervalo 2 t 2 se 2 , 2 + t 2 se 2
2.
37
Prueba
de
relevancia:
la
prueba
de
relevancia
consiste
en
evaluar
Paso 1:
Planteamiento de la hiptesis.
Ho:
i = 0
Ha:
i 0
Paso 2:
Nivel de significancia ( ) :
Paso 3:
tC =
Paso 4:
i
~. t
se ( i )
2, n 2
38
Paso 5:
2, n 2
se
39
4.8. Prediccin
Una aplicacin del modelo de regresin es la prediccin o el pronstico de la
variable dependiente, de acuerdo con valores dados de las variables
independientes. Hay dos tipos de predicciones: la prediccin media y la prediccin
individual. A continuacin se presentan estos dos casos:
Prediccin media: es la prediccin del valor medio condicional de Y,
correspondiente a un determinado valor de X, denotado como X0, el cual
representa un punto sobre la lnea de regresin poblacional.
Si se desea predecir E (Y / X 0 ) , la estimacin puntual de la prediccin media es
2
(
X0 X ) *
2 1
(.
Y0 = 1 + 2 X 0 y la varianza de Y0 : Var Y0 = + +
2
+, n ! (X i X ) ()
( )
40
respecto a que tan bien la lnea de regresin muestral se ajusta a los datos. Para
el caso de un modelo de regresin lineal simple se denota como r 2 y se calcula:
e ui
41
42
Dependent Variable: DX
Method: Least Squares
Date: 10/03/06 Time: 16:38
Sample: 1 13
Included observations: 13
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
71.41791
-5.042910
3.130854
0.454825
22.81100
-11.08759
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.917870
0.910404
5.058427
281.4646
-38.43407
2.267643
40.38462
16.89940
6.220627
6.307542
122.9346
0.000000
Los resultados del modelo lineal muestran que la variable precio cuenta con el
signo esperado y es relevante al 1%, 5% y 10% de significancia. El valor del R2 es
0.918, es decir, el 92% de la variacin de la demanda del bien X esta explicada
por la variable precio. Adicionalmente se observa la existencia de dependencia
conjunta en el modelo al 1%, 5% y 10% de significancia (Fc=122.935). El
coeficiente de la variable PX es interpretado como un efecto marginal, por lo tanto,
un incremento en una unidad del precio de X disminuye en promedio su demanda
en 5.04 unidades, manteniendo todos los dems factores constantes.
C
9.802248
-1.273019
43
PX
-1.273019
0.206866
Coefficient
Std. Error
t-Statistic
Prob.
C
LOG(PX)
4.799536
-0.722024
0.208899
0.118417
22.97538
-6.097307
0.0000
0.0001
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.771676
0.750919
0.249094
0.682526
0.708676
2.124425
3.597486
0.499106
0.198665
0.285581
37.17715
0.000078
COEFICIENTE
C
LOG(PX)
C
0.043639
-0.023345
44
LOG(PX)
-0.023345
0.014023
- y1 *
+ (
y
Y = + 2(
+ #(
+ (
, yn )
- x11
+
x
, X = + 21
+ #
+
+, xn1
- 1 *
+ (
, ! = + 2(
+ # (
+ (
,k )
-1 *
+ (
" = + 2(
+ #(
+ (
, n )
Por lo tanto las n ecuaciones que representan y i como funcin de las x i j , los y
45
Y = X" + !
2.
3.
E (! X) = 0 .
4.
E (!!' ) = 2 I . Cov( i j ) = 0 , i j .
5.
X es no estocstica.
6.
(" X )
E (Y / X) = X"
~. N (0, 2 I)
! MCO = (X ' X )
(X ' Y )
46
1. Suma
de
cuadrados
de
los
errores.
Puede
ser
calculada
as:
Matriz
47
siguiente manera: F = ("' X' Y nY 2 )(n k ) [(Y' Y "' X' Y)(k 1)] .
2. p valor. Arroja el nivel mnimo de significancia para rechazar la hiptesis
nula. En el procedimiento se requiere el valor obtenido de F, los grados de
libertad del numerador (k 1) y grados de libertad del denominador (n k ) .
5.6. Coeficiente de determinacin ajustado (R 2 )
El trmino ajustado se refiere a que es corregido por los correspondientes grados
de libertad. El R 2 mide la bondad de ajuste del modelo de regresin (porcentaje
de explicacin de la variable dependiente por las variables independientes), as
como lo hace el R 2 convencional, sin embargo el R 2 tiene la particularidad de
que permite comparar modelos de regresin mltiple en los que se incluyen
variables adicionales. No obstante, se debe considerar que la comparacin tiene
validez cuando en cada modelo la variable dependiente y el tamao de la muestra
sean iguales. La forma de calcular el R 2 se presenta a continuacin:
R 2 = 1 1 R2
48
) nn k1
( )
( )]
Pr k t 2 se k k k + t 2 se k = 1
( )
k t 2 se k
( )
( )
( )
49
Bajo el esquema matricial los coeficientes del modelo transformado pueden ser
obtenidos a travs del mtodo de mnimos cuadrados ordinarios usando la frmula
de clculo presentada en el numeral 5.3. El coeficiente k , k = 2,3, ! , K
representa la elasticidad de Y respecto a Xk y tiene la misma interpretacin que en
el caso del modelo de regresin simple doblemente logartmico del captulo
anterior. Por lo tanto, se tendrn k 1 elasticidades en regresin mltiple al
estimarse una funcin tipo Cobb-Douglas. Por otro lado, cabe destacar que
ejercicios de estimacin diferentes al modelo Cobb-Douglas no permiten obtener
directamente elasticidades constantes. Por ello es necesario tener en cuenta la
forma que toman las variables en el modelo transformado antes de efectuar
interpretaciones de los coeficientes.
50
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PW
PZ
I
72.73351
-4.588739
-0.386460
0.471929
-0.409388
10.83288
1.778623
1.214240
0.688867
0.201019
6.714142
-2.579939
-0.318273
0.685080
-2.036558
0.0002
0.0326
0.7584
0.5127
0.0761
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.947105
0.920657
4.760208
181.2767
-35.57419
1.436480
40.38462
16.89940
6.242183
6.459471
35.81046
0.000037
Los resultados del modelo lineal muestran que la variable precio cuenta con el
signo esperado y es relevante al 5% y 10% de significancia. El valor del R2 es
0.947, es decir, el 95% de la variacin de la demanda del bien X esta explicada
por las variables independientes. Adicionalmente se observa la existencia de
dependencia conjunta en el modelo al 1%, 5% y 10% de significancia (Fc=35.810).
El coeficiente de la variable PX es interpretado como un efecto marginal, por lo
tanto, un incremento en una unidad del precio de X disminuye en promedio su
demanda en 4.59 unidades, manteniendo todos los dems factores constantes.
Vale la pena aclarar que la variable ingreso an cuando es relevante al 10% de
significancia, el signo de su coeficiente no es consistente con la teora economa
relacionada con un bien normal.
51
COEFICIENTE
C
PX
PW
PZ
I
C
117.3513
-11.56233
1.349073
-6.616478
-0.600013
PX
-11.56233
3.163501
-1.826424
0.777287
-0.022642
PW
1.349073
-1.826424
1.474379
-0.192430
0.052888
PZ
-6.616478
0.777287
-0.192430
0.474538
-0.014848
I
-0.600013
-0.022642
0.052888
-0.014848
0.040409
obs
1
2
3
4
5
6
7
8
9
10
11
12
13
Actual
37.0000
38.0000
18.0000
50.0000
22.0000
55.0000
42.0000
29.0000
63.0000
13.0000
60.0000
62.0000
36.0000
Fitted
37.8104
43.2972
22.0098
49.7111
27.3714
59.4627
34.4728
27.1267
62.7036
10.3593
56.3697
59.7074
34.5979
Residual
-0.81044
-5.29718
-4.00977
0.28890
-5.37143
-4.46267
7.52721
1.87326
0.29637
2.64072
3.63029
2.29265
1.40211
52
Residual Plot
| . *|
. |
| *.
|
. |
| .* |
. |
| .
*
. |
| *.
|
. |
| *
|
. |
| .
|
. *
| .
| * . |
| .
*
. |
| .
| * . |
| .
| *. |
| .
| * . |
| .
|* . |
Coefficient
Std. Error
t-Statistic
Prob.
C
LOG(PX)
LOG(PW)
LOG(PZ)
LOG(I)
3.042978
0.115482
-0.336166
0.671764
-0.103431
1.646616
0.301528
0.436617
0.400484
0.084847
1.848020
0.382991
-0.769933
1.677382
-1.219025
0.1018
0.7117
0.4635
0.1320
0.2576
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.902417
0.853626
0.190953
0.291703
6.234096
1.510399
3.597486
0.499106
-0.189861
0.027427
18.49542
0.000418
Los resultados del modelo doblemente logaritmo no son satisfactorios, dado que
ninguna de las variables incorporadas como regresores son significativas.
Asimismo, las variable LOG(PX) y LOG(I) no presentan los signos esperados,
limitando la validez terica del modelo.
MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES DEL MODELO
DOBLEMMENTE LOGARTMICO
COEFICIENTE
C
LOG(PX)
LOG(PW)
LOG(PZ)
LOG(I)
C
2.711343
-0.229656
-0.565544
-0.638982
-0.061003
LOG(PX)
-0.229656
0.090919
-0.022785
0.064962
0.001807
LOG(PW)
-0.565544
-0.022785
0.190634
0.121451
0.014976
53
LOG(PZ)
-0.638982
0.064962
0.121451
0.160387
0.008270
LOG(I)
-0.061003
0.001807
0.014976
0.008270
0.007199
obs
1
2
3
4
5
6
7
8
9
10
11
12
13
Actual
3.61092
3.63759
2.89037
3.91202
3.09104
4.00733
3.73767
3.36730
4.14313
2.56495
4.09434
4.12713
3.58352
Fitted
3.50939
3.80097
3.07102
3.91411
3.11501
4.10808
3.59355
3.32110
4.38551
2.69990
3.84781
4.00914
3.39174
Residual
0.10153
-0.16339
-0.18064
-0.00209
-0.02396
-0.10075
0.14412
0.04619
-0.24237
-0.13495
0.24653
0.11799
0.19178
Residual Plot
| .
| * . |
| .*
|
. |
| .*
|
. |
| .
*
. |
| .
*|
. |
| . * |
. |
| .
|
*. |
| .
|*
. |
|*.
|
. |
| . * |
. |
| .
|
. *
| .
| * . |
| .
|
* |
Ejemplo 2.
Ahora considere la siguiente informacin de una firma sobre los costos de
produccin y la cantidad producida de un bien para estimar una funcin de costos
cbica:
TABLA No. 3. COSTOS SEGN EL NIVEL DE PRODUCCIN
Obs.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Q
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
54
CT
5
14
23
28
33
36
41
45
48
50
55
61
66
72
77
86
97
110
127
147
169
Donde:
CT:
Q:
Mean
Median
Maximum
Minimum
Std. Dev.
Observations
Q
10
10
20
0
6.204837
21
Q2
136.6667
100
400
0
128.5365
21
Q3
2100
1000
8000
0
2488.431
21
CT
66.19048
55
169
5
43.49899
21
Prob.
0.000200
0.000000
0.000000
0.000000
66.19048
43.49899
3.538952
3.737908
7408,618
0
Q
Q2
Q3
C
0.925616
-0.336905
0.032823
-0.000934
Q
-0.336905
0.182340
-0.020705
0.000640
55
Q2
0.032823
-0.020705
0.002534
-0.000082
Q3
-0.000934
0.000640
-0.000082
0.000003
describen
de
manera
general
los
conceptos
de
multicolinealidad,
Cualquier relacin lineal entre las variables independientes de este modelo, por
ejemplo X2 con X3, o X2 con X5 y X4 puede generar problemas de
multicolinealidad. Por lo general, existen dos tipos de multicolinealidad:
1. Multicolinealidad Perfecta: Para entender el concepto de multicolinealidad
perfecta es necesario expresar las variables independientes del modelo en
trminos de una combinacin lineal cuya suma algebraica sea igual a cero.
Para el modelo presentado la combinacin lineal sera:
56
problema
de
multicolinealidad
es
un
problema
ocasionado
por
las
! = (X' X )1 (X' Y )
57
estndar de ! , por lo que el valor de los estadsticos "t" para cada uno de los
parmetros
del
modelo
sern
mucho
menores
que
en
ausencia
de
X' X ; si el valor obtenido de X' X es muy cercano a cero, puede concluirse que
es muy probable la existencia de multicolinealidad alta.
No obstante, se encuentran otras pruebas mucho ms formales en trminos
estadsticos. Una de ellas es estimar coeficientes de correlacin entre pares de
variables independientes y formular pruebas de hiptesis sobre los coeficientes de
correlacin estimados para comprobar la significancia de la relacin lineal en
trminos estadsticos. Por ejemplo, una vez calculado el coeficiente de correlacin
lineal entre X2 y X3, puede proponerse la siguiente prueba de hiptesis cuya
formulacin es idntica a la presentada en el captulo 2:
Ho: X 2 , X 3 = 0 (No existe relacin lineal entre X2 y X3)
58
tC =
(r
X 2,X 3
n 2
1 (rX 2 , X 3 )
~. t
2, n2
2, n2
dado
que
permite
evaluar
la
multicolinealidad
ocasionada
59
60
Donde !t* = t - t-1. Debe tenerse en cuenta que al estimar este nuevo
modelo, la interpretacin de los coeficientes estimados no es la misma que
en el modelo original, debido a que estos ahora representan cambios o
diferencias de las variables entre los periodos t y t-1.
4. Aumentar el tamao de la muestra: Este mtodo consiste en ampliar la
muestra o conjunto de datos utilizados para estimar el modelo. Esta es una
solucin plausible dado que el problema de multicolinealidad es ocasionado
fundamentalmente por las observaciones en la muestra. Cuando se
incrementa el nmero de observaciones se piensa que es ms difcil
reproducir el componente de colinealidad entre los regresores. Sin
embargo, en muchos casos no es posible adquirir ms informacin u
observaciones de las variables debido a restricciones fsicas, tcnicas y
econmicas.
Finalmente, se recomienda que el investigador una vez utilice alguno de estos
mtodos verifique si el problema de multicolinealidad fue corregido.
6.2. Heteroscedasticidad
El problema de heteroscedasticidad se presenta cuando es violado el supuesto de
varianza
constante
de
los
errores
de
la
funcin
de
regresin.
La
heteroscedasticidad tiene que ver con la relacin entre una o ms de las variables
independientes del modelo y el cuadrado de los errores estimados a partir de la
regresin. Este problema se manifiesta en un crecimiento o decrecimiento de la
varianza del modelo.
61
de
heteroscedasticidad.
En
este
sentido,
la
presencia
de
62
t2 = Yt Y
t
t2 = 0 + 1 X 1t + 2 X 2t + 3 X 1t 2 + 4 X 2t 2 + 5 X 1t X 2t + t
La prueba de hiptesis relacionada con el modelo anterior es:
Ho:
1 = 2 = 3 = 4 = 5 = 0
Ha:
1 2 3 4 5 0
63
64
que
el
nuevo
modelo
cumpla
con
el
supuesto
de
( )=
EUt
X t2
Donde vt =
Ut
. Puede verificarse que:
Xt
E (v t ) = E (U t X t ) = (1 X t ) E (U t ) = 0
65
( ) = E[(U
E vt
] (
) ( ) = (1 X )
X t ) = 1 X t2 E U t
2
2
t
X t2 = 2 .
66
generada en casos donde se usa una forma funcional incorrecta del modelo, esto
hace que los datos se ajusten a una forma funcional que no es la ms adecuada.
Se argumenta, que la manipulacin de informacin puede llegar a generar tambin
autocorrelacin. Un caso tpico se presenta en la cuentas nacionales, donde
muchos datos son obtenidos a partir de otros, aplicando tcnicas de interpolacin
o extrapolacin. Por ejemplo, cuando se convierten datos diarios a semanales.
Finalmente, modelos especiales como los de rezagos distribuidos y los
autoregresivos pueden originar autocorrelacin.
Entre las consecuencias de la autocorrelacin se tiene la sobreestimacin o
subestimacin de los estadsticos t que juzgan la significancia de las variables
independientes en el modelo. Aunque los estimadores siguen siendo insesgados y
consistentes son ineficientes. En este sentido se afecta la validez estadstica de
las pruebas de hiptesis.
67
Ho:
Ha:
t 1
t 1
68
de
autocorrelacin
para
averiguar
si
el
problema
de
69
el
valor
de
las
variables
son
transformadas
para
70
medidas empricas son tiles para probar si un modelo cuenta con error de
especificacin.
Existen cuatro tipos de fuentes o razones que generan error de especificacin:
1. Omisin de una variable relevante en el modelo. Si una variable que afecta
de manera importante la variable dependiente del modelo es omitida, se
incurre en error de especificacin. Esta situacin hace que los estimadores
sean sesgados.
2. Inclusin de una variable irrelevante. En algunos casos los investigadores
en su proceso de exploracin con el deseo de encontrar un mejor modelo
que se ajuste a los datos, incorporan variables explicativas adicionales. Si
estas no afectan significativamente a la variable dependiente se comete
error de especificacin. No obstante, los efectos sobre los coeficientes
estimados son menos fuertes que en el caso de la omisin de una variable
relevante; los estimadores sern insesgados, pero se obtienen de manera
imprecisa. De esta manera, incluir variables irrelevantes afecta los errores
estndares de los coeficientes, haciendo que los intervalos de confianza
sean ms anchos.
71
(R
R 2o ) j
F=
(1 R 2 aux ) (n g )
2
aux
~. f j , n g
72
73
22 gl
E(X )
A=
[Var ( X )]
3
2
y K=
E ( X )4
[Var ( X )]2
74
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PW
PZ
I
72.73351
-4.588739
-0.386460
0.471929
-0.409388
10.83288
1.778623
1.214240
0.688867
0.201019
6.714142
-2.579939
-0.318273
0.685080
-2.036558
0.0002
0.0326
0.7584
0.5127
0.0761
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.947105
0.920657
4.760208
181.2767
-35.57419
1.436480
40.38462
16.89940
6.242183
6.459471
35.81046
0.000037
A. Prueba de Multicolinealidad
A continuacin se presentan la matriz de correlaciones y cuatro regresiones
auxiliares con el objeto de identificar la posible existencia de asociacin lineal
simultnea entre las variables independientes PX, PZ, PW e I:
75
MATRIZ DE CORRELACION
VARIABLE
PX
PZ
PW
I
PX
1.000000
-0.886170
0.950308
-0.530011
PZ
-0.886170
1.000000
-0.811397
0.493410
PW
0.950308
-0.811397
1.000000
-0.556062
I
-0.530011
0.493410
-0.556062
1.000000
Dependent Variable: PX
Method: Least Squares
Date: 10/05/06 Time: 09:48
Sample: 1 13
Included observations: 13
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PZ
PW
I
3.654915
-0.245705
0.577343
0.007157
1.624021
0.099796
0.121443
0.037598
2.250535
-2.462068
4.754039
0.190365
0.0510
0.0360
0.0010
0.8532
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.942092
0.922789
0.892115
7.162817
-14.57190
1.511932
76
6.153846
3.210560
2.857216
3.031046
48.80600
0.000007
Coefficient
Std. Error
t-Statistic
Prob.
C
PW
PX
PZ
14.84857
-1.308833
0.560323
0.367451
17.26790
1.965637
2.943420
1.135704
0.859894
-0.665857
0.190365
0.323545
0.4122
0.5222
0.8532
0.7537
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.317173
0.089564
7.893449
560.7588
-42.91442
2.341199
11.46154
8.272599
7.217603
7.391434
1.393498
0.306773
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PZ
I
-0.915011
1.238775
0.130516
-0.035872
2.958162
0.260573
0.184036
0.053873
-0.309317
4.754039
0.709189
-0.665857
0.7641
0.0010
0.4962
0.5222
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.911829
0.882439
1.306773
15.36890
-19.53428
1.807371
77
7.230769
3.811252
3.620658
3.794489
31.02476
0.000045
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PW
I
13.94298
-1.637987
0.405510
0.031290
2.424163
0.665289
0.571794
0.096710
5.751669
-2.462068
0.709189
0.323545
0.0003
0.0360
0.4962
0.7537
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.797402
0.729869
2.303399
47.75081
-26.90300
1.468360
7.153846
4.431820
4.754308
4.928139
11.80764
0.001791
respectivamente.
Estas
2
salidas
economtricas
presentan
Lo
78
B. Prueba de Heteroscedasticidad
Con el objeto de verificar si los errores del modelo tienen varianza constante se
desarrolla la prueba de Heteroscedasticidad de White (sin trminos cruzados):
PRUEBA DE WHITE
White Heteroskedasticity Test:
F-statistic
Obs*R-squared
0.714607
7.648476
Probability
Probability
0.682884
0.468539
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 10/05/06 Time: 09:43
Sample: 1 13
Included observations: 13
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PX^2
PZ
PZ^2
PW
PW^2
I
I^2
-35.46343
-8.022919
1.668258
12.89670
-0.473441
6.476469
-0.834719
-5.747052
0.175578
183.3230
26.87381
2.339704
20.37802
0.701913
18.61942
1.273948
4.094526
0.151639
-0.193448
-0.298540
0.713021
0.632873
-0.674500
0.347834
-0.655222
-1.403594
1.157870
0.8560
0.7802
0.5152
0.5612
0.5370
0.7455
0.5481
0.2331
0.3113
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.588344
-0.234967
18.21512
1327.162
-48.51422
1.980651
13.94436
16.39096
8.848341
9.239460
0.714607
0.682884
79
0.641758
1.091746
Probability
Probability
0.449407
0.296085
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 10/05/06 Time: 09:26
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PZ
PW
I
RESID(-1)
0.348096
0.196375
0.037411
-0.171777
-0.047910
0.305911
11.09241
1.836272
0.706375
1.260744
0.214196
0.381864
0.031381
0.106942
0.052962
-0.136250
-0.223672
0.801098
0.9758
0.9178
0.9592
0.8955
0.8294
0.4494
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.083980
-0.570319
4.870508
166.0530
-35.00402
1.837887
-1.01E-14
3.886694
6.308311
6.569057
0.128352
0.980963
80
81
0.240234
0.438664
Probability
Probability
0.639025
0.507768
Test Equation:
Dependent Variable: DX
Method: Least Squares
Date: 10/05/06 Time: 09:42
Sample: 1 13
Included observations: 13
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PZ
PW
I
FITTED^2
52.50613
-2.010581
-0.058048
-1.026028
-0.245060
0.005793
42.81102
5.582463
1.301350
1.825321
0.396301
0.011819
1.226463
-0.360160
-0.044606
-0.562108
-0.618368
0.490137
0.2597
0.7293
0.9657
0.5916
0.5559
0.6390
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.948860
0.912331
5.003739
175.2618
-35.35486
1.543094
40.38462
16.89940
6.362286
6.623031
25.97566
0.000221
82
D. Prueba de Normalidad
Para probar si los residuos del modelo de demanda siguen distribucin normal a
se realiza el histograma de los errores y la prueba Jarque Bera. Los resultados de
estos procedimientos son los siguientes:
83
GENERO
11
= 0
/0
Si es hom bre
Si es mujer
Si
Si
Si
Si
el
el
el
el
hogar pertenece
hogar pertenece
hogar pertenece
hogar pertenece
Si el hogar
Si el hogar
al
al
al
al
estrato
estrato
estrato
estrato
1
2
3
4
pertenece al estrato 5
pertenece al estrato 6
84
SALARIO:
Ingreso laboral
GENERO:
11
22
22
Re gin = 03
24
2
/25
Oriental
Pacfica
Central
Atlntica
El resto
85
86
W blanco
= e 0, 26
W otra raza
W blanco = 1.297 W otra raza
Lo anterior que quiere decir que el salario de una persona de raza blanca es
29.7% ms alto que el de otra raza. Cuando la variable dependiente del modelo
esta transformada en logaritmo este procedimiento resulta til, el cual se resume
1 , donde j es el coeficiente de la
E (Y X , D1 = 0, D2 = 0 ) = 0 + 1 X
E (Y X , D1 = 1, D2 = 0) = 0 + 1 X + 1
E (Y X , D1 = 0, D2 = 1) = + 1 X + 2
87
E (Y X , D1 = 0, D2 = 0) = 0 + 1 X
E (Y X , D1 = 1, D2 = 0) = 0 + 1 X + 1
E (Y X , D1 = 0, D2 = 1) = 0 + 1 X + 2
E (Y X , D1 = 1, D2 = 1) = 0 + 1 X + 1 + 2 + 3
De nuevo este esquema generan solo cambios en intercepto, dado que 1 , 2 y
E (Y X , D = 0 ) = 0 + 1 X
E (Y X , D = 1) = 0 + 1 X + 1 + 2 X
88
E (Y X , D = 1) = ( 0 + 1 ) + ( 1 + 2 )X
Esta ecuacin es til para mostrar si existe cambio estructural en intercepto y/o
pendiente, dependiendo de la significancia de los coeficientes 1 y 2 . Por ejemplo
si 1 = 2 = 0 el resultado sugiere la no ocurrencia de cambio en pendiente e
intercepto en la regresin.
7.2. Regresin con variable dependiente cualitativa
Existen otra clase de modelos en econometra llamados modelos de variable
dependiente cualitativa. Estos se dividen en dos clases: los modelos de
probabilidad y los modelos de eleccin discreta para ms de dos alternativas.
En los modelos de probabilidad, la variable dependiente solo puede tomar dos
valores cero o uno. Por ejemplo, si el jefe de familia tiene empleo o no, as la
variable ESTA EMPLEADO? toma el valor de uno si tiene trabajo o cero en
caso contrario. Existen tres formas generales de estimar este tipo de modelos: 1)
mnimos cuadrados ordinarios, el cual es conocido como el modelo de
probabilidad lineal, siendo el menos utilizado por no cumplir en la mayora de los
casos con los axiomas de la probabilidad; 2) el modelo logit, donde la funcin de
distribucin que siguen los errores es logstica; y 3) el modelo probit, cuando las
perturbaciones se asumen con distribucin normal.
Dentro de los modelos de eleccin discreta con ms de dos alternativas, se
encuentran: el modelo logit multinomial, el modelo probit multinomial y el modelo
89
puede interesar el tipo de transporte que las personas utilizan para llegar a su
lugar de trabajo: bus, automvil, taxi, transmilenio, bicicleta, etc.; cada una de
estas alternativas es distinta.
La forma funcional de los modelos con variable dependiente cualitativa y su
interpretacin, resulta ser ms compleja que la de los modelos con variables
independientes cualitativas. Todos los modelos de este tipo, a excepcin del
modelo de probabilidad lineal no son lineales en los parmetros y se estiman por
el mtodo de mxima verosimilitud.
90
BIBLIOGRAFA
1. Canavos, G. (1991), Probabilidad y Estadstica. Aplicaciones y Mtodos.
McGraw Hill. Mxico.
2. Freund, J; Miller, I. y Miller M. (2000), Estadstica Matemtica con
Aplicaciones. Prentice Hall. Pearson Educacin. Sexta edicin. Mxico.
3. Greene, W. (1998), Anlisis Economtrico. Prentice Hall. Tercera Edicin.
4. Gujarati, D. (2003), Basic Econometrics, McGraw Hill. Fourth edition.
5. Hamilton, J. (1994), Times Series Analysis. Princeton: Princeton University
Press.
6. Judge, G.; Carter Hill, R.; Griffiths, W., Ltkepohl, H. and Lee, T. (1988),
Introduction to the Theory and Practice of Econometrics. John Wiley and
Sons. Second edition.
7. Novales, Alfonso . 1997. Econometra, McGraw Hill, Bogot.
8. Maddala, G.S. (1983), Limited-Dependent and Qualitative Variables in
Econometrics, Cambridge University Press.
9. Mason y Lind. 2001. Estadstica para Administracin y Economa. Editorial
Alfaomega.
10. Mendenhall, W.; Wackerly, D. y Scheaffer R. (1994), Estadstica
Matemtica con Aplicaciones. Grupo Editorial Iberoamrica S.A. Segunda
edicin.
11. William E. Griffiths, R. Carter Hill, George G. Judge (1993), Learning and
Practicing Econometrics. John Wiley & Sons, New York.
12. Wooldridge, Jeffrey M. (2002), Introductory Econometrics: a modern
approach, South-Western College Publishing. Second edition.
13. Wooldridge, Jeffrey M. (2002), Econometric Analysis of Cross Section and
Panel Data, MIT Press.
91
ANEXOS
92
ANEXO 1.
REGRESIN LINEAL MLTIPLE EN EL PAQUETE
ESTADSTICO EVIEWS 4.1
Ejemplo
De acuerdo con la siguiente base de datos:
TABLA No. 4. VARIABLES PARA LA ESTIMACIN DE LA DEMANDA LINEAL DEL BIEN X.
Obs.
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
DX
22
20
19
18
16
14
13
11
9
7
6
5
I
10
11
13
14
16
17
18
19
20
21
23
25
PW
8
9
12
13
15
17
19
21
23
24
25
27
PX
3
5
6
8
9
10
11
13
15
17
18
20
PZ
9
9
8
7
6
5
4
3
2
2
1
1
Dx = 0 + 1 I + 2 Pw + 3 Px + 4 Pz + U
Donde:
Dx:
I:
Pw:
Px:
Pz:
U:
93
Desarrollo
Este ejercicio ser desarrollado en el paquete estadstico Econometrics Views 4.1.
A continuacin se muestra todo el procedimiento para estimar el modelo de
demanda lineal siguiendo los supuestos del modelo clsico de regresin lineal
normal.
A. Importar la base de datos.
Este paquete estadstico puede importar datos en hoja electrnica guardados
con extensin wks, wk1 y Excel. Una vez se inicia la sesin en E-views se
debe generar un nuevo archivo de trabajo.
94
Se selecciona el archivo a
importar; en este caso
corresponde a dem1.xls
del subdirectorio donde se
haya almacenado.
95
96
97
APUNTES DE CLASE
APUNTES DE CLASE
CEDE
Centro de Estudios
sobre Desarrollo Econmico
Facultad de Economa
ISSN 1909-4442
! ""#!$! %%%$$%
$&
INTRODUCCIN A LA ECONOMETRA
3
OCTUBRE
DE
2006
CEDE
CEDE
ISSN 1909-4442
Introduccin a la econometra
2006
OCTUBRE DE
CEDE
Centro de Estudios
sobre Desarrollo Econmico
Facultad de Economa
Universidad de los Andes