Académique Documents
Professionnel Documents
Culture Documents
Econometra
Combinacin de estadstica y economa
Busca cuantificar fenmenos econmicos, por medio de mtodos estadsticos.
Permite utilizar la Teora econmica de manera real y confiable.
Escalas de medidas o determinacin
1) Escala nominal los valores representan clases con nombre y sin orden, solo
representan una clasificacin y no se pueden manipular aritmticamente.
2) Ordinal Los valores representan una jerarqua, permite la construccin de
rboles jerrquicos y no se pueden manipular aritmticamente.
3) Intervalos Los valores son numricos y pueden compararse en trminos de
intervalos pero no de razones o cuocientes. Se denomina de intervalos porque las
proporciones entre intervalos de valores se mantienen constantes.
4) De razn Los valores se pueden comparar por cuociente, existe una unidad
de medida nica en todo el universo.
Objetivos de la econometra
1.- Simplificar la relacin estructural determinar un modelo con el menor nmero
posible de variables, con el fin de simplificar la interpretacin.
2.- Estudiar la dependencia entre variables.
3.- Predecir, construir una relacin de dependencia funcional entre dos o ms variables.
4.- Docimar (prueba o tests) crear hiptesis sobre parmetros del modelo
economtrico, para probar conjeturas o verificar supuestos.
Metodologa de la econometra
1.- Formular la teora o hiptesis econmica.
2.- Especificar el modelo Matemtico / Economtrico.
3.- Obtener datos A travs de experimentos controlados en lo posible.
4.- Estimar el modelo Parmetros.
5.- Validar estadsticamente el modelo.
6.- Validar econmicamente el modelo
7.- Pronosticar resultados.
8.- Usar el modelo para fines de control o poltica.
Notacin
Los datos son valores numricos o no, registrados para una variable. Se representan
mediante una matriz X de n filas (una por cada medicin u observacin) y p variables
(columnas). Entonces Xij corresponde al dato registrado en la observacin i y la variable
j.
1
S
xk x
k 1 n 1
2
x
Error estndar
S x S x2
Covarianza
n
1
xk x y k y S xy
k 1 n 1
Cov( x, y)
Coeficiente de Correlacin
1.- Correlacin lineal de Pearson Pensado para relaciones rectilneas entre dos
variables. Suponiendo variables continas y muestras grandes. Ambas variables deben
ser cuantitativas. Este coeficiente es simtrico, es decir, rxy = ryx
Corr ( x, y)
S xy
Sx Sy
Cov( x, y )
rxy
x y
; -1 < r < +1
2.- Correlacin rangos Spearman Se aplica a variables Y con X en escala ordinal (al
menos una) y sirve para muestras pequeas.
d i2
rs 1 6
n n2 1
; -1 < rs < +1
Modelacin economtrica
- Modelo de regresin
Ecuacin matemtica que representa un hecho o situacin real.
Asocia la media de una variable Y (la respuesta esperada o variable que se quiere
conocer su valor o comportamiento) en funcin de variables X, exgenas al sistema.
1.- Modelo uniecuacional Modelo con una sola respuesta Y
2.- Sistema de ecuaciones o regresiones Modelo con dos o mas variables
endgenas.
3.- Modelo de regresin simple Modelo con una sola variable exgena X,
mas un X0 o intercepto que siempre vale 1.
EY Y 0 X 0 1 X 1
EY Y 1 X 1
- Tipos de modelos
Modelo matemtico Seala cuales son las variables que afectan a la variable
endgena Y.
Y 0 1 X 1 ... p X p
Y 0 1 X 1
Polinomial
Y 0 1 X 2 X 2 ... k X k
Log-lineal
Log log
Modelo economtrico
Los modelos economtricos son lineales en los parmetros, es decir, los parmetros
que los definen estn en primer grado.
Se les considera invariantes en el tiempo, es decir, se supone que los parmetros
no cambien durante el tiempo, as como las variables.
a) Poblacional Utiliza en general el promedio
y / x xT
b) Muestral El modelo anterior al ser aplicado a personas, o a una muestra de tamao
n, no es exacto, esta inexactitud, se incorpora al modelo como una perturbacin o error
estocstica. La condicin de estocsticos implica que la observacin real de Y varia de
objeto a objeto, lo que considera al formular un modelo para los observaciones
realmente efectuadas.
Yi x i i
T
y X Xb
v) Debe existir estabilidad temporal, esto quiere decir que el modelo poblacional no
cambia en el tiempo si se toman datos mensuales para los ltimos 30 aos, el modelo
debe ser el mismo para cualquier sub. Muestra de los 360 meses involucrados.
Estimacin por mnimos cuadrados ordinarios (MCO)
Tiene por objetivo minimizar la suma de los cuadrados de los errores, i 2 lo que
genera una recta estimada que pasa lo ms cerca posible de todos los puntos de
respuesta Y, en relacin a las distancias verticales entre los Y y los valores efectivos de
Y.
Los requisitos son los anteriormente nombrados (arriba de i a vi), siendo el ms
importante que los i sean v.a. idnticamente distribuidas, incorrelacionados,
Var ( i ) 2 , E i 0 para todo i .
El mtodo consiste en:
1) Minimizar la funcin
i2
i 1
n
Yi Yi
i 1
n
Yi 0 1 X i 2
i 1
2 Yi 0 1 X i 0
0
i 1
n
2 Yi 0 1 X i 0
1
i 1
b0 Y b1 X 0
X
n
b1
i 1
X
X Y
i i
X
i 1
2
i
i 1
b1
X Yi Y
i
nXY
nX
2 S 2
e
i 1
2
i
Grados de
libertad
Suma de
cuadrados
Cuadrados
medios
E[CM]
Y Y
SCR
= CMR
p
2 12 xi2
SCE
=CME
n p 1
i 1
Residual
n-p-1
Y Y
n-1
i 1
Total
- CME
F. calculada
(E)
CMR
CME
SCE
2 Estimador insesgado de la varianza residual
n p 1
CMR = CME
E=1
Corr ( x, y)
S xy
Sx Sy
Cov( x, y)
rxy b1
x y
H 0 : 1 0
H a : 1 0
- F calculada es el Estadgrafo (E), por lo tanto:
Se rechaza H0 si
E Fp ,n p 1,1
Dcimas individuales
H 0 : j0 0 ;
Se rechaza H0 si
Donde E
bi i 0
Var bi
H a : j0 0
E t
n p 1,1
bi 0
Var bi
Con:
CME X i2
Var (b0 0 )
n Xi X
CME
Var (b1 1 )
Si se rechaza H0, entonces se dice que existe evidencia emprica suficiente para
determinar que j es distinto de cero, por lo que entrega informacin relevante a la
variacin total de Y.
Intervalos de confianza
j b j Var b j t
n p 1,1
De donde:
CME X i2
Var (b0 0 )
2
n Xi X
Var (b1 1 )
CME
Var (b j ) S
Yi Yi t
( n p 1,1 )
2
Var Yi
Donde:
2
1
Xi X
2
1
X
i
Var (Yi ) CME 1
n
Xi X
Coeficiente de determinacin
Determina la calidad de la estimacin.
Corresponde a la correlacin mltiple al cuadrado, de todas las variables predictoras
tomadas en conjunto, con la respuesta
Se denota por R 2
En el anlisis de regresin lineal simple el coeficiente de determinacin corresponde
a la correlacin simple entre X e Y, elevada al cuadrado y tambin asociado al
coeficiente 1 .
Correlacin Mltiple (rxy) Mide el grado de asociacin lineal entre las
variables, (predichas y todas las predictoras tomadas en conjunto). Su valor
oscila entre [-1 , 1].
rxy
x y
x y
rxy b1
x
y
2
2
R 2 rxy
R2
SCR
SCE
1
SCT
SCT
Un alto valor de este coeficiente indica que las variables exgenas son buenas
explicadoras de la variabilidad de la respuesta Y, siempre que la relacin entre las
variables sea lineal. Este valor debe ser cercano a 1, implica que la estimacin es muy
buena.
Puede ocurrir que se tenga un excelente ajuste con un psimo modelo.
Est afectado por problemas en la regresin como la colinealidad entre las variables
X. (basta formular un modelo con un nmero suficiente de variables X y datos para
obtener un valor prximo a 1)
2
Coeficiente de determinacin ajustado ( Rajustado
) Permite comparar
regresiones con diferentes nmeros de variables, referidos a la misma variable
endgena Y, debido a que se trata de un valor ajustado por los grados de
libertad.
2
Rajustado
1
n 11 R 2
n p 1
1 x11
1 x
21
X . .
. .
1 x n1
x12
x 22
.
.
xn 2
... x1 p
... x 2 p
... .
... .
... x np
n 1 .
y X
y X Xb
La suma de los cuadrados de los residuales se define como:
2
i
'
Variables aleatorias
Media cero, E i 0 , para todo i = 1, 2, , n; si los parmetros
son estimados, al calcular los errores y sumarlos, el resultado debe ser
cero. Si no son cero:
Significa que los errores producen un efecto constante
sobre la respuesta Y, y dicho valor se debera agregar
al 0
O el modelo est mal especificado o se ha definido
mal el intercepto.
La varianza de todos los residuales es constante e igual para todos
Homocedasticidad Var ( i ) 2 , si lo anterior no se cumple,
entonces la estimacin de los parmetros es menos confiable.
Los residuales i correspondiente a cada observacin i, deben estar
incorrelacionados Cov( i , j ) 0
La distribucin de los i debe ser Normal. i ~ N (0, 2 )
v) Debe existir estabilidad temporal, esto quiere decir que el modelo poblacional no
cambia en el tiempo si se toman datos mensuales para los ltimos 30 aos, el modelo
debe ser el mismo para cualquier sub. Muestra de los 360 meses involucrados.
vi) Ausencia de colinealidad entre los predictores Xj, es decir, que sus correlaciones de
a pares sean todas diferentes de 1 .
i2
'
y X y XB
2) Derivando con respecto a ' se obtiene el estimador:
b
b X ' X X ' y
1
X ' X b X ' y
Caractersticas propias del MCO:
-
Var b 2 X ' X
2
i
2
i
'
y' y b X ' y
De donde:
Suma de cuadrados de la regresin:
SC (regresin) b' X ' y
SC (Total ) y' y n y
Tabla ANOVA:
Fuente de
variacin
Regresin
Grados de
libertad
Suma de
cuadrados
b' X ' y n y
Residual
n-p-1
Total
n-1
y' y n y
Cuadrados
medios
E[CM]
SCR
= CMR
p
2 12 xi2
SCE
=CME
n p 1
F. calculada
(E)
CMR
CME
Dcima global
De la tabla ANOVA se puede docimar si el modelo es globalmente significativo:
H0 : j 0
Ha : j 0
Si no se rechaza la hiptesis nula, quiere decir que todos los coeficientes son nulos,
esto se puede deber a un problema de multicolinealidad.
Si se rechaza la hiptesis nula, entonces quiere decir, que al menos uno de los
coeficientes, es significativo para el modelo, por lo que es necesario determinar
individualmente cuales son los que difieres de cero.
Dcimas individuales para los
La Dcima es de la siguiente forma:
H0 : 0
Ha : 0
E t
n p 1,1
Con E igual a:
E
b j j0
Var (b j )
Donde:
; de donde resulta una matriz, en donde la diagonal
Var b CME X ' X
corresponde a las varianzas de los estimadores.
1
Covb0 , b1
Var b0
Covb , b
Var b1
1
0
Var b
.
.
.
.
Covbn , b0 Covbn , b1
... Covb0 , bn
... Covb1 , bn
...
.
...
.
... Var bn
Intervalos de confianza
Rango de valores, donde se pueden encontrar los verdaderos valores de j :
j b j Var (b j ) t
n p 1,1
Predicciones
Los intervalos de confianza para determinar el valor de Y estimada pueden ser para:
Valor promedio
n p 1,1
Valor individual
1
Donde: Var Yx 0 | x'0 2 1 x'0 X ' X x 0
n p 1,1
Coeficiente de determinacin
Cuando se escribe:
R 2 RY212... p 1
SCE
SCT
b' X ' y n y
y' y n y
2
R R
2
2
Y 12...P
nn 1p
2
Rajustado
1 1 R2
Correlaciones parciales
Permite calcular el efecto que tiene cada predictor X, por si mismo, sobre la
respuesta Y, sin considerar al resto de las variables del modelo. Su valor oscila entre
[-1 , 1], dependiendo del signo que posea el parmetro i correspondiente.
2
YX j .resto
E 2j
E 2j n p 1