Académique Documents
Professionnel Documents
Culture Documents
Visión general
“En econometría, el que construye el modelo a menudo se enfrenta a datos provenientes de las
observación más que de la experimentación. Esto tiene dos implicaciones importantes para la
creación empírica de modelos de econometría. Primero, se requiere que quien elabore modelos
domine muy distintas habilidades en comparación con las que se necesitan para analizar los datos
experimentales… Segundo, la separación de quien recopila los datos y el analista exige que quien
elabora modelos se familiarice por completo con la naturaleza y la estructura de los datos en
cuestión.”1
Visión general
Terminología2:
Visión general
Tipos de datos:
Corte transversal
Series de tiempo
Combinación de cortes transversales (pooled data)
Panel
Visión general
2. Modelo matemático
3. Modelo econométrico
4. Datos
5. Estimación
Vaguedad de la teoría
Parsimonia
Lineales
Insesgados
• Consistentes
• La exclusión de variables relevantes –subespecificación del modelo- hace que los estimadores de
MCO sean sesgados (si la variable omitida y las presentes en modelo están correlacionadas)
Especificación del modelo de regresión
• Modelo estimado:
Fundamentos para la estimación y análisis de datos panel
• Modelo estimado:
Interpretación pendientes bajo logaritmos
INFERENCIA ESTADÍSTICA
Inferencia estadística: Pruebas de hipótesis sobre los parámetros
Pruebas individuales:
Prueba t
Nivel de significancia exacto (valor probable o p-value)
Intervalos de confianza
Pruebas múltiples:
Prueba F
Hipótesis estadísticas
()
()
Propiedades importantes de una prueba de hipótesis1
Los errores tipo I y tipo II están relacionados. Por lo general una disminución en la
probabilidad de cometer uno da como resultado un incremento en la probabilidad de cometer
otro.
Prueba t
𝛽−𝛽 ∗
t calc.=
𝑆𝐸(𝛽)
Donde:
መ parámetro estimado
𝛽:
𝛽 ∗ : valor de prueba del parámetro
SE(𝛽): መ error estándar del parámetro estimado
Inferencia estadística: Pruebas de hipótesis sobre los parámetros
Intervalos de confianza.
Prueba F
𝑆𝐶𝑅𝑟 −𝑆𝐶𝑅𝑛𝑟
𝑞
F calc. = 𝑆𝐶𝑅𝑛𝑟
𝑛−𝑘−1
Donde:
R2 = 1-SCR/SCT = SCE/SCT
𝑅ത 2 = 1-[SCR/(n-k-1)] / [SCT/(n-1)]
Bondad de ajuste
Inferencia estadística: Pruebas de hipótesis sobre los parámetros
Prueba F: forma R2
𝑅2𝑛𝑟 −𝑅2𝑟
𝑞
F calc. = 1−𝑅2𝑛𝑟
𝑛−𝑘−1
VALIDACIÓN DE LOS SUPUESTOS
Validación de supuestos
1. Los datos son una muestra simple aleatoria de una población bien definida.
3. Cada variable explicativa no es una función lineal de las otras y tampoco es constante.
5. El error tiene varianza constante dado cualquier valor de las variables explicativas
6. El error no está correlacionado entre dos unidades t y s (para todo t ≠ s) dado un valor de las
variables explicativas
7. El error está normalmente distribuido con media 0 y varianza 2, N(0, 2)
Si se cumple el supuesto 4, los estimadores del modelos son insesgados. Si se cumplen los supuestos
5 y 6 son eficientes. Si se cumplen los supuestos 4, 5 y 6 los estimadores son MELI.
MODELOS DE REGRESIÓN CON INFORMACIÓN CUALITATIVA
Información cualitativa. Modelación con variables dummy.
• Pueden ubicarse del lado de las variable dependiente (modelos de respuesta cualitativa) o
del lado de las variables independientes (modelos con información cualitativa)
Información cualitativa. Modelación con variables dummy.
Salario = f(educación)
Salario = βo + β1educación + u
• Y si ahora…
• ¿Por qué utilizar sólo una dummy para incorporar la variable género al modelo y no dos
(hombre y mujer)?
• Archivo: salario.wf1
Salario = f(género)
• ¿Cuál es «mejor»?
Análisis de políticas (evaluación de un programa)
• Archivo: gpa.wf1
• Ejemplo 3: ¿Existe discriminación salarial entre hombres y mujeres según su estado civil?
• Archivo: salario.wf1
• ¿En promedio gana más una mujer soltera que una casada? ¿Cuánto?
• ¿Existe discriminación salarial entre las mujeres solteras y las casadas? (¿es significativo
β3)
• Luego, ¿la discriminación salarial entre hombres y mujeres depende de el estado civil de
éstas últimas?
INCORPORACIÓN DE VARIAS VARIABLES EXPLICATIVAS BINARIAS
Incorporación de varias variable explicativas binarias
• En el caso anterior, las variables que interactuaban eran todas dummys. Sin embargo,
también puede existir interacción entre variables binarias y no binarias.
• Archivo: salario.wf1
Modelo de regresión:
Algunos métodos para crear modelos de probabilidad para variables de respuesta binaria:
La mayor diferencia entre el Modelo Lineal de Probabilidad y los modelos Logit y Probit es que
el MLP supone efectos marginales constantes en la interpretación de sus pendientes mientras
que los otros implican magnitudes decrecientes de los efectos parciales.
Elección entre modelos Logit y Probit
Para la mayoría de los casos, los modelos Logit y Probit caracterizan de forma muy
similar la información dado que sus densidades son muy similares.
Es posible calcular una medida de bondad de ajuste tradicional en términos de SCR, R2, o R2
ajustado, pero en el caso de los modelos de variable de respuesta limitada, ésta deja de tener
una interpretación real. El objetivo de la máxima verosimilitud es maximizar el valor de la
función log-verosimilitud, no la de minimizar la suma de cuadrados de los residuos. (No de
olvidarse que los valores estimados solo serán 0 y 1.)
Notas al pie y referencias
Brooks, C. (2008). Introductory Econometrics for Finance, second edition, Cambridge University
Press, New York
1Spanos, A. (1999) Probability Theory and Statistical Inference: Econometric Modeling with
observational Data. Cambridge University Press, Reino Unido, p.21. (Tomado de Gujarati)