Académique Documents
Professionnel Documents
Culture Documents
ECONOMETRA
y x
Variable dependiente Variable independiente
Variable explicada Variable explicativa
Variable respuesta Variable de control
Variable predicha Variable predictor
Regresando Regresor
2. Variables no observacionales: Son aquellas que no se pueden medir por estar contenidas
en el trmino de error.
Los Parmetros: Si estn contenidos en la ecuacin del modelo, se llamarn parmetros
estructurales.
Los Datos:
1. Datos de Seccin Cruzada o Corte Transversal:
a) Definicin: Son conjuntos de observaciones de una o ms variables medidas en
distintas unidades econmicas.
b) Ejemplo: Salario de un grupo de trabajadores de una empresa; Ventas de un
conjunto de empresas en 2009, etc.
2. Datos de Serie Temporal:
a) Definicin: Son conjuntos de observaciones de una o ms variables medidas a lo
largo del tiempo en perodos regulares.
b) Ejemplos: El IPC mensual, el crecimiento del PIB trimestral,etc.
3. Datos de Panel:
Propiedades de
las
Covarianzas
Propiedades de La suma del producto de una constante por una variable, es igual a k veces la sumatoria de la
los Sumatorios variable.
El lmite probabilstico de una suma o resta de dos variables es igual a la suma o resta de lmites
probabilsticos de las dos variables.
El lmite probabilstico de un producto entre dos variables es igual al producto de los lmites
probabilsticos de las dos variables.
El lmite probabilstico de un cociente entre dos variables es igual al cociente de los lmites
probabilsticos de las dos variables.
Como el error de prediccin (u) puede ser positivo, negativo o nulo, para asegurarnos de que
siempre obtengamos magnitudes positivas, definimos el Error Cuadrtico Medio de la Prediccin
ECM (u):
Nuestro objetivo es encontrar la prediccin c(X) que haga que el ECM (u) sea mnimo.
Tipos de Mejor Prediccin Constante:
Prediccin a) Supuesto: No conocemos la informacin de la variable X y la funcin c(X)=c
La Mejor Prediccin:
a) Supuesto: Conocemos la variable X antes de hacer la prediccin de la variable Y. En este caso,
la funcin c(X) puede ser lineal o no lineal, pero en general es desconocida.
POBLACIONAL MUESTRAL
Condiciones de Las condiciones de primer orden para las estimaciones MCO es una expresin que viene del
Primer Orden clculo de optimizacin.
para las La expresin Mnimos Cuadrados Ordinarios viene del hecho de que estos valores estimados
Estimaciones minimizan la suma de los cuadrados de los residuos.
MCO Minimizar la Suma de los Cuadrados de los Residuos:
Dado que , por lo que
Nuestro objetivo es minimizar la suma de los residuos al cuadrado, es decir:
Una condicin necesaria para que y sean soluciones del problema de minimizacin es
Por lo tanto observamos que para que sea un estimador ptimo, la condicin es que
, y para que sea un estimador ptimo, la condicin es que .
Y estas dos condiciones son las dos implicaciones de uno de los supuestos del MRLS:
y .
Propiedades La suma, y por lo tanto, la media muestral de los residuos MCO es nula:
Algebraicas de
los
Estimadores
MCO Esta propiedad deriva directamente de la condicin de primer orden de los MCO.
La Covarianza muestral entre los regresores y los residuos MCO es nula:
Sin embargo, este estimador tiene un sesgo, porque no considera las restricciones que los residuos
MCO deben satisfacer. Estas restricciones vienen dadas por las dos condiciones de primer orden
del estimador MCO: y .
Un estimador insesgado de sera:
Insesgadez Decimos que un estimador es insesgado o centrado cuando su esperanza es igual al parmetro que
estimamos.
Varianza Puede demostrarse que y de MCO tienen mnima varianza, y por tanto, sern los
mnima estimadores ms eficientes.
Consistencia Los estimadores y son estimadores consistentes si a medida que se incrementa el tamao
muestral, su valor se aproxima al verdadero parmetro poblacional. En trminos economtricos,
la consistencia equivale a convergencia en probabilidad.
Variacin Relativa:
Variacin Porcentual:
unidades en Y.
Si la variable independiente (X) se divide o se multiplica por una constante no nula, c , entonces
el coeficiente de la pendiente MCO se multiplica o se divide por c, respectivamente. El cambio
slo en las unidades de medida de la variable independiente no afecta al trmino constante.
Bondad de Ajuste
Suma de Suma de Cuadrados Total (SCT): SCT=SCM+SCE
Cuadrados
Homocedasticidad:
Supone que la Varianza Condicionada del Error es Constante e igual a .
Modelo con
dos variables
explicativas
Una condicin necesaria para que y sean soluciones del problema de minimizacin es
que las dedivadas parciales de la funcin sea igual a 0.
independientes
Cuando se mantiene fijo, de forma que , entonces:
Interpretar la
ecuacin de la Escrito en trminos de cambios:
regresin
MCO para El coeficiente de mide el cambio en por cada incremento en una unidad de ,
ms de 2 manteniendo fijas las restantes variables independientes.
variables
independientes La utilidad del anlisis de regresin mltiple reside en que nos proporciona una interpretacin
ceteris paribus aun cuando los datos no hayan sido recogidos de una forma ceteris paribus.
La utilidad del anlisis de regresin mltiple reside en que nos permite hacer en un medio no
experimental lo que los cient ficos hacen en el medio controlado de un laboratorio: mantener
fijos el resto de los factores.
Formas Cuando planteamos el modelo de regresin, el primer supuesto que realizamos es la linealidad en
Cuadrticas los parmetros. Sin embargo, las variables no tienen porquser lineales.
Puede ocurrir que al plantear un modelo de regresin para recoger el efecto de alguna variable
explicativa, no baste con incluirla en forma lineal, sino que tengamos que incluir un trmino
cuadrtico.
Para obtener en este caso el efecto parcial ceteris paribus de , habrque plantear la siguiente
derivada:
Varianza Se puede demostrar que los estimadores MCO tienen la menor varianza de entre todos los
Mnima estimadores lineales e insesgados.
3. Para grados de libertad mayores que 120, se pueden usar los valores crticos de la normal
tipificada.
1. Bajo esta alternativa, tiene un efecto ceteris paribus en Y, sin especificar si el efecto es
positivo o negativo.
Clculo de p-valores:
El p-valor es el nivel de significatividad ms pequeo al que se rechazara la hiptesis nula.
Intervalo de Confianza:
Clculo de :
Modelo no restringido:
Modelo restingido:
Estad
stico de Contraste:
Notacin:
q= nmero de restricciones de exclusin de .
k= nmero de variables explicativas del modelo no restringido.
O bien,
Modelo no restringido:
Modelo restingido:
Estad
stico de Contraste:
Modelo no restringido:
Modelo restingido:
Estad
stico de Contraste:
En este caso, el modelo restringido es un modelo con un trmino constante, pero con una variable
dependiente diferente de la del modelo no restingido. Por lo tanto, no podemos utilizar la forma
R-cuadrado del estad stico F.
Como Regla General, debera usarse la forma SCE del estadstico F si la regresin restringida
presenta una variable dependiente distinta a la de la regresin no restringida.
Variables Binarias
Introduccin En la investigacin economtrica suelen aparecer fenmenos de discriminacin por razn de
sexo, raza, nivel de estudios, lugar de residencia, etc, que no pueden analizarse utilizando
nicamente variables cuantitativas.
Para analizar estos fenmenos discriminatorios, necesitaremos introducir informacin cualitativa
en los modelos.
Concepto Las variables cualitativas se introducen en los modelos mediante variables binarias, ficticias o
dummies.
Se trata de variables que toman nicamente dos valores:
1. Valor 1: Cuando el individuo o el elemento analizado cumpla una determinada
caracterstica.
2. Valor 0: Cuando el elemento o individuo analizado no cumple la citada caracterstica.
Siempre se cumplirque podamos definir tantas variables ficticias como niveles o categoras que
tenga la variable cualitativa.
Siempre se cumplirque la suma de las variables binarias de una variable cualitativa es igual a 1.
Mtodo de Si el modelo tiene trmino constante ( ), tendremos que eliminar una variable binaria por cada
Introduccin variable cualitativa, porque de lo contrario aparecera un problema de multicolinealidad perfecta,
de las y el modelo no podra estimarse.
Variables Si el modelo no tiene trmino constante, podemos introducir todas las variables binarias.
Binarias en el El objetivo de las variables binarias es comparar regresiones de distintos colectivos y para ello, se
Modelo pueden introduir las variables binarias de dos formas:
1. En forma aditiva: Cuando queramos analizar las posibles diferencias en los trminos
constantes de las regresiones de los distintos colectivos.
2. En forma de interaccin: Cuando queramos analizar posibles diferencias en las
pendientes de las regresiones de los distintos colectivos.
Modelos Bsicos que utilizan Variables Binarias
Modelo 1 Para explicar la variable dependiente Y (Salario), utilizamos nicamente la variable cualitativa
(Sexo) con variables binarias nicamente en forma aditiva.
En primer lugar, tendremos que definir las variables binarias correspondientes a las 2 categor as
del sexo:
distintos colectivos.
Tomando las esperanzas condicionadas de la ecuacin anterior, vamos a obtener las
ecuaciones salariables de mujeres y hombres:
Salario Medio de Mujer:
Interpretacin de Coeficientes:
: Salario Medio de los Hombres.
: La diferencia salarial media entre mujeres y hombres.
Contraste:
Para contrastar si existe discriminacin salarial entre mujeres y hombres:
Conclusin:
1. Comparando el modelo con trmino constante y el modelo sin trmino constante,
deducimos que en los modelos con trmino constante, el coeficiente de la variable binaria
mide los EFECTOS DIFERENCIALES, mientras que en los modelos sin trmino
constante, los coeficientes de las variables binarias miden EFECTOS ABSOLUTOS.
Modelo 2 Para explicar la variable dependiente Y (Salario), utilizamos la variable cuantitativa aos de
estudio ( ) y la variable cualitativa sexo, con variables binarias nicamente en forma aditiva.
En primer lugar, definimos las dos variables binarias correspondientes al sexo:
Vamos a centrarnos en el modelo con trmino constante y para plantearlo, eliminamos una de las
variables binarias, por ejemplo, .
La ecuacin del modelo sera la siguiente:
Modelo 3 Para explicar la variable dependiente Y (Salario), utilizamos la variable cuantitativa aos de
estudio ( ) y la variable cualitativa sexo, con variables binarias nicamente en forma aditiva.
En primer lugar, definimos las dos variables binarias correspondientes al sexo:
Vamos a centrarnos en el modelo con trmino constante y para plantearlo, eliminamos una de las
variables binarias, por ejemplo, .
La ecuacin del modelo sera la siguiente:
Al incluir la variable binaria en forma aditiva y de interaccin con , este modelo permite
analizar diferencias en el trmino constante y la pendiente de las regresiones de mujeres y
hombres.
Tomando esperanzas condicionadas en la ecuacin anterior, obtenemos las ecuaciones salariales
de mujeres y hombres.
1. Salario Medio de Mujeres:
Observaciones Adems de estos 3 modelos bsicos, se pueden plantear modelos ms complejos que incluyan 2 o
ms variables cualitativas e incluso podrn aparecer trminos de interaccin entre 2 variables
binarias.
En cualquier caso, siempre tendremos en cuenta que si el modelo tiene trmino constante,
tendremos que eliminar una variable binaria por cada variable cualitativa para evitar la
multicolinealidad.
Una vez planteado el modelo, calcularemos las diferencias entre colectivos tomando esperanzas
condicionadas en el modelo poblacional.
Vamos a demostrar que la omisin de la variable relevante hace que en el modelo segundo la
.
Teniendo en cuenta que el error:
El incumplimiento del supuesto provoca que los estimadores de MCO del modelo
segundo sean SESGADOS e INCONSISTENTES.
Sesgo por Para obtener el sesgo, necesitamos una expresin que relacione los parmetros de los dos
Omisin de modelos anteriores.
Variable Para ello, partimos de la expresin de y en ella, sustituimos la variable Y por el verdadero
modelo:
(Sobreestimacin) (Infraestimacin)
Sesgo Negativo Sesgo Positivo
(Infraestimacin) (Sobreestimacin)
Nuestro objetivo es poder estimar el modelo, y para ello, despejamos en la ecuacin anterior
y lo sustituimos en la ecuacin primera:
Llamamos a , luego:
A continuacin, vamos a comprobar los efectos del error de medicin en Y y para ello, realizamos
dos supuestos adicionales:
1.
2. Supuesto clsico del Error de Medida en la Variable Dependiente: Suponemos que las
variables explicativas y estn incorrelacionadas con el error de medida v. Es
decir: y .
Efectos de Error de Medida en la Variable Dependiente:
1. Se puede demostrar que si estimamos por MCO,
obtendremos estimadores INSESGADOS y CONSISTENTES.
2. Aparentemente, el error de medida en la variable dependiente no tendra consecuencias
graves, pero no es as,porque el error del modelo ha aumentado, ha pasado de a .
Adems, la varianza de dicho error ha aumentado:
Este incremento en la varianza del error provoca un incremento en las varianzas de los
estimadores, lo que supone una Prdida de Eficiencia, y como consecuencia, la inferencia
sigue siendo vlida pero poco fiable.
3. Estos efectos son idnticos a los de la inclusin de variables irrelevantes.
Caso especial en el error de medida en la variable dependiente:
1. Supongamos que , entonces se incumple el supuesto clsico de error de
medida en la variable dependiente.
2. Lgicamente, v va a formar parte de u, por lo que .
3. Por lo tanto, la consecuencia serque
Error de Supongamos en el siguiente modelo:
Medida en la
Variable Como no es observable, el modelo no se puede estimar, y en su lugar, observamos X que
Independiente cumple la siguiente ecuacin:
Adems, antes de analizar los efectos de este error de medida, efectuamos los siguientes
supuestos:
1.
2. Supuesto Clsico del error de medida en la variable independiente: Suponemos que la
variable medida con error estincorrelacionada con el error de medida v:
Si estimamor la ecuacin anterior por MCO, se produce un incremento en la varianza del error
que provoca que aumenten tambin las varianzas de los estimadores.
Sin embargo, el efecto realmente importante, es el SESGO e INCONSISTENCIA de los
estimadores de MCO.
Para demostrar este sesgo, partimos de la expresin de :
Insesgadez:
Consistencia:
variables instrumentales.
3. Bajo endogeneidad, utilizaremos el estimador de variables instrumentales.
1Etapa:
Estimamos por MCO la ecuacin:
El objetivo de esta etapa es determinar si existe relacin o no entre la variale endgena externa o
posible instrumento.
Entonces planteamos el contraste de identificacin:
Si estimamos la ecuacin anterior por MCO, obtenemos los estimadores de mnimos cuadrados
bietpicos, .
1Etapa:
Estimamos por MCO la ecuacin:
Si estimamos la ecuacin anterior por MCO, obtenemos los estimadores de M nimos Cuadrados
Bietpicos o en 2 etapas, que sern consistentes y asintticamente normales, siempre que los
instrumentos y sean vlidos.
Conclusin En general, si los instrumentos no son vlidos por incumplir alguna de las condiciones de
instrumento, los estimadores de Mnimos Cuadrados Bietpicos o en 2 etapas sern
INCONSISTENTES y peores que los de MCO, puesto que los estimadores de MCO tambin
son inconsistentes, sin embargo, tienen mnima varianza.
Contraste de Sobreidentificacin de SARGAN
Contraste de Planteamos una regresin de los residuos de Mnimos Cuadrados Bietpicos o en 2 etapas,
Sobreidentifica llamados frente a todas las variables exgenas internas y externas.
cin de
SARGAN Las hiptesis del contraste de Sargan son:
Si todos los instrumentos estn incorrelacionados con el error, entonces seran instrumentos
vlidos.
Si algn instrumento estcorrelacionado con el error, entonces no ser a vlido.
Sin embargo, el contraste de Sargan no dice quinstrumento es no vlido.