Vous êtes sur la page 1sur 19

Resumen Econometra 1 Certamen

Econometra
Combinacin de estadstica y economa
Busca cuantificar fenmenos econmicos, por medio de mtodos estadsticos.
Permite utilizar la Teora econmica de manera real y confiable.
Escalas de medidas o determinacin
1) Escala nominal los valores representan clases con nombre y sin orden, solo
representan una clasificacin y no se pueden manipular aritmticamente.
2) Ordinal Los valores representan una jerarqua, permite la construccin de
rboles jerrquicos y no se pueden manipular aritmticamente.
3) Intervalos Los valores son numricos y pueden compararse en trminos de
intervalos pero no de razones o cuocientes. Se denomina de intervalos porque las
proporciones entre intervalos de valores se mantienen constantes.
4) De razn Los valores se pueden comparar por cuociente, existe una unidad
de medida nica en todo el universo.
Objetivos de la econometra
1.- Simplificar la relacin estructural determinar un modelo con el menor nmero
posible de variables, con el fin de simplificar la interpretacin.
2.- Estudiar la dependencia entre variables.
3.- Predecir, construir una relacin de dependencia funcional entre dos o ms variables.
4.- Docimar (prueba o tests) crear hiptesis sobre parmetros del modelo
economtrico, para probar conjeturas o verificar supuestos.
Metodologa de la econometra
1.- Formular la teora o hiptesis econmica.
2.- Especificar el modelo Matemtico / Economtrico.
3.- Obtener datos A travs de experimentos controlados en lo posible.
4.- Estimar el modelo Parmetros.
5.- Validar estadsticamente el modelo.
6.- Validar econmicamente el modelo
7.- Pronosticar resultados.
8.- Usar el modelo para fines de control o poltica.
Notacin
Los datos son valores numricos o no, registrados para una variable. Se representan
mediante una matriz X de n filas (una por cada medicin u observacin) y p variables
(columnas). Entonces Xij corresponde al dato registrado en la observacin i y la variable
j.

x corresponde a un vector columna.


Los parmetros o variables aleatorias se representan mediante una letra griega.
Donde es una matriz y en minscula un vector.
Asociacin entre variables
Varianza

1
S
xk x
k 1 n 1
2
x

Error estndar

S x S x2
Covarianza
n

1
xk x y k y S xy
k 1 n 1

Cov( x, y)

Coeficiente de Correlacin
1.- Correlacin lineal de Pearson Pensado para relaciones rectilneas entre dos
variables. Suponiendo variables continas y muestras grandes. Ambas variables deben
ser cuantitativas. Este coeficiente es simtrico, es decir, rxy = ryx

Corr ( x, y)

S xy
Sx Sy

Cov( x, y )
rxy
x y

; -1 < r < +1

2.- Correlacin rangos Spearman Se aplica a variables Y con X en escala ordinal (al
menos una) y sirve para muestras pequeas.

d i2

rs 1 6
n n2 1

; -1 < rs < +1

3.- Coeficiente de correlacin mltiple Y con {x1, x2, , xp}, variables


cuantitativas, algunos x pueden ser cdigos. Si este coeficiente es alto, implica que
explica el modelo, pero solo indica que al menos una de las variables x esta relacionada
con Y. El modelo pasa a ser bueno cuando el error o desviacin en bajo.
Si existen varios modelos que son buenos, el principio de parsimonia, indica que se
elige el que posea menos variables.
0< R<1

Modelacin economtrica
- Modelo de regresin
Ecuacin matemtica que representa un hecho o situacin real.
Asocia la media de una variable Y (la respuesta esperada o variable que se quiere
conocer su valor o comportamiento) en funcin de variables X, exgenas al sistema.
1.- Modelo uniecuacional Modelo con una sola respuesta Y
2.- Sistema de ecuaciones o regresiones Modelo con dos o mas variables
endgenas.
3.- Modelo de regresin simple Modelo con una sola variable exgena X,
mas un X0 o intercepto que siempre vale 1.
EY Y 0 X 0 1 X 1

EY Y 1 X 1

4.- Modelo de regresin mltiple Modelo con dos o ms variables exgenas o


predictoras.
EY Y 0 X 0 1 X 1 ... p X p

- Tipos de modelos
Modelo matemtico Seala cuales son las variables que afectan a la variable
endgena Y.
Y 0 1 X 1 ... p X p

Algunos modelos matemticos:


Lineal

Y 0 1 X 1

Polinomial

Y 0 1 X 2 X 2 ... k X k

Log-lineal

log Y 0 1 X 1 ; 1 representa el cambio relativo en


Y cuando hay un cambio absoluto
en X1.

Log log

log Y 0 1 log X 1 ; 1 representa el cambio relativo


en Y, debido a un cambio
relativo en X1

; 1 representa el cambio absoluto


en Y cuando hay un cambio
absoluto en X1

Modelo economtrico
Los modelos economtricos son lineales en los parmetros, es decir, los parmetros
que los definen estn en primer grado.
Se les considera invariantes en el tiempo, es decir, se supone que los parmetros
no cambien durante el tiempo, as como las variables.
a) Poblacional Utiliza en general el promedio

y / x xT
b) Muestral El modelo anterior al ser aplicado a personas, o a una muestra de tamao
n, no es exacto, esta inexactitud, se incorpora al modelo como una perturbacin o error
estocstica. La condicin de estocsticos implica que la observacin real de Y varia de
objeto a objeto, lo que considera al formular un modelo para los observaciones
realmente efectuadas.

Yi x i i
T

El sub-ndice i es la identificacin de la observacin.


c) Estimado Promedios con distintos nmeros de participantes o circunstancias. Con
los datos de la muestra, es posible obtener los parmetros , los cuales son solo
aproximados, ya que se est considerando una muestra, y son estimaciones de estos
parmetros. Obtenindose as el modelo estimado:
T
Yi x i i

Matricialmente el modelo estimado se escribe como:

y X Xb

Regresin lineal simple

Estimacin del modelo de regresin lineal simple


La relacin entre la variable Y con la variable X, se puede representar en forma
general por:
Y f (x)
Donde corresponde a la variable aleatoria residual, que se estima Y Y
i

Estadsticamente se consideran tres modelos economtricos:


1.- Poblacional representa un modelo de la realidad en trminos de
promedios, este modelo representa la realidad econmica, dado que los
comportamientos econmicos son promedios y no absolutos.
EY / X x 0 1 X
2.- Muestral representa los datos reales, dado que en la realidad las respuestas
Y a cierto estado X no son exactamente iguales al promedio, sino que varan en torno a
este.
Yi 0 1 X i i

3.- Estimado Modelo cuando se han estimado los , e Y representa una


estimacin del promedio Y / X

Requisitos para la estimacin de los parmetros :

i) Y variable aleatoria sujeta a error.


ii) X variable fijada sin error
iii) Solo se podr estimar el modelo si es lineal en los parmetros.
iv) Los residuales deben ser:
- Variables aleatorias
- Media cero, E i 0 , para todo i = 1, 2, , n; si los parmetros
son estimados, al calcular los errores y sumarlos, el resultado debe ser
cero. Si no son cero:
Significa que los errores producen un efecto constante
sobre la respuesta Y, y dicho valor se debera agregar
al 0
O el modelo est mal especificado o se ha definido
mal el intercepto.
- La varianza de todos los residuales es constante e igual para todos
Homocedasticidad Var ( i ) 2 , si lo anterior no se cumple,
entonces la estimacin de los parmetros es menos confiable.
- Los residuales i correspondiente a cada observacin i, deben estar
incorrelacionados Cov( i , j ) 0

La distribucin de los i debe ser Normal. i ~ N (0, 2 )

v) Debe existir estabilidad temporal, esto quiere decir que el modelo poblacional no
cambia en el tiempo si se toman datos mensuales para los ltimos 30 aos, el modelo
debe ser el mismo para cualquier sub. Muestra de los 360 meses involucrados.
Estimacin por mnimos cuadrados ordinarios (MCO)
Tiene por objetivo minimizar la suma de los cuadrados de los errores, i 2 lo que
genera una recta estimada que pasa lo ms cerca posible de todos los puntos de
respuesta Y, en relacin a las distancias verticales entre los Y y los valores efectivos de
Y.
Los requisitos son los anteriormente nombrados (arriba de i a vi), siendo el ms
importante que los i sean v.a. idnticamente distribuidas, incorrelacionados,
Var ( i ) 2 , E i 0 para todo i .
El mtodo consiste en:

1) Minimizar la funcin

i2
i 1
n

Yi Yi
i 1
n

Yi 0 1 X i 2
i 1

2) Derivar en funcin a cada


3) Igualar a cero cada derivada y remplazar cada por su

2 Yi 0 1 X i 0
0
i 1
n

2 Yi 0 1 X i 0
1
i 1

b0 Y b1 X 0

X
n

b1

i 1

X
X Y

i i

X
i 1

2
i

i 1

b1

X Yi Y
i

nXY
nX

En la practica primero se postula un modelo (poblacional) Luego se toma una


muestra aleatoria de n observaciones, donde se supone que el modelo (muestral)
representa los datos luego se estiman los parmetros y se define la recta
estimada con esta recta se realizan inferencias respecto de la calidad del modelo si
esta sta es satisfactoria se establecen inferencias sobre la poblacin de la que se
tomaron los datos.
Las principales propiedades de los estimadores son:
-

Son funciones lineales de las respuestas


Son insesgados y de varianza minima
Son los mejores estimadores lineales insesgados de los parmetros.

Estimacin por mxima verosimilitud (MV)


Posee los mismos requisitos que MCO, ms:
Los errores deben tener una distribucin Normal i ~ N (0, 2 )
adems de ser v.a. incorrelacionados e idnticamente distribuida.
Este mtodo estima los mismos que por MCO, sin embargo tambin provee un
estimador de la varianza de los residuales:
-

2 S 2

e
i 1

2
i

Anlisis de varianza (ANOVA)


Se busca determinar un estimador insesgados de la varianza residual aplicable tanto a
MCO como a MV.
Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor
esperado) del estimador y el verdadero valor del parmetro a estimar. Es deseable que
un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su
esperanza igual al parmetro que se desea estimar.
De la expresin:
ei Yi Yi
ei Yi Y Yi Y
e Y Y Y Y

Se obtiene la siguiente tabla ANOVA :


Fuente de
variacin
Regresin

Grados de
libertad

Suma de
cuadrados

Cuadrados
medios

E[CM]

Y Y

SCR
= CMR
p

2 12 xi2

SCE
=CME
n p 1

i 1

Residual

n-p-1

Y Y

n-1

i 1

Total

- CME

F. calculada
(E)

CMR
CME

SCE
2 Estimador insesgado de la varianza residual
n p 1

- 2 12 xi2 CMR Estima la varianza residual del error ms un componente


que representa la dispersin a lo largo de la recta de regresin.
- Si la dispersin debida a la regresin pura es cero ( 1 0 )

CMR = CME

E=1

Las variables exgenas no explican la variacin de la variable


endgena El modelo es incorrecto En regresin lineal
simple la recta estimada es horizontal.

- Si la SCR es significativa la pendiente es proporcional a la correlacin entre X e Y

Corr ( x, y)

S xy
Sx Sy

Cov( x, y)
rxy b1
x y

- La hiptesis global de la tabla ANOVA es:

H 0 : 1 0
H a : 1 0
- F calculada es el Estadgrafo (E), por lo tanto:

Se rechaza H0 si

E Fp ,n p 1,1

Si se rechaza la H0, entonces se afirma que 1 0 , lo que implica que


X explica las variaciones de Y.
Dcimas e intervalos confidenciales para cada
-

Dcimas individuales

Trata de determinar si cada pendiente j es cero o no, es decir independiente o


individualmente para lo cual se necesita obtener las varianzas de los estimadores bj y de
estas se obtendrn las desviaciones estndar.
Determina si cada pendiente es significativa o no en el modelo.

H 0 : j0 0 ;

Se rechaza H0 si

Donde E

bi i 0

Var bi

H a : j0 0

E t

n p 1,1

bi 0

Var bi

Con:

CME X i2

Var (b0 0 )

n Xi X

CME

Var (b1 1 )

Si se rechaza H0, entonces se dice que existe evidencia emprica suficiente para
determinar que j es distinto de cero, por lo que entrega informacin relevante a la
variacin total de Y.

Intervalos de confianza

Corresponden a un rango de valores donde se pueden encontrar los verdaderos


valores de j
A mayor error estndar del estimador, entonces mayor ser el intervalo de confianza
A mayor error, entonces mayor ser la incertidumbre al estimar el verdadero valor
del parmetro desconocido.
Intervalo

j b j Var b j t

n p 1,1

De donde:
CME X i2

Var (b0 0 )
2
n Xi X

Var (b1 1 )

Error estndar de los estimadores:

CME

Var (b j ) S

Prediccin por bandas de confianza


Las bandas son fronteras, con una confianza dada, donde se encuentra la recta de
regresin, por lo que cualquier recta dentro de esta banda es vlida como modelo
estimado.
Las bandas quedan definidas por intervalos de confianza para las respuestas Y.

Yi Yi t

( n p 1,1 )
2

Var Yi

Donde:

2
1
Xi X

Var (Yi ) CME


n
Xi X

Lo anterior es para cuando se quiere estimar el promedio poblacional EYi | X xi ,


de lo contrario, cuando se quiere hacer un pronstico puntual para el valor de Yi o
realmente observado ( Yi Yi i ), se debe agregar una varianza del error:

2
1
X

i
Var (Yi ) CME 1
n
Xi X

Coeficiente de determinacin
Determina la calidad de la estimacin.
Corresponde a la correlacin mltiple al cuadrado, de todas las variables predictoras
tomadas en conjunto, con la respuesta
Se denota por R 2
En el anlisis de regresin lineal simple el coeficiente de determinacin corresponde
a la correlacin simple entre X e Y, elevada al cuadrado y tambin asociado al
coeficiente 1 .
Correlacin Mltiple (rxy) Mide el grado de asociacin lineal entre las
variables, (predichas y todas las predictoras tomadas en conjunto). Su valor
oscila entre [-1 , 1].

rxy

x y
x y

rxy b1

x
y

2
2

Coeficiente de determinacin (R2) Es nico para cada modelo estimado.


Indica que tan bien las variables del modelo explican la variabilidad dela
endgena Y.

R 2 rxy

R2

SCR
SCE
1
SCT
SCT

Un alto valor de este coeficiente indica que las variables exgenas son buenas
explicadoras de la variabilidad de la respuesta Y, siempre que la relacin entre las
variables sea lineal. Este valor debe ser cercano a 1, implica que la estimacin es muy
buena.
Puede ocurrir que se tenga un excelente ajuste con un psimo modelo.
Est afectado por problemas en la regresin como la colinealidad entre las variables
X. (basta formular un modelo con un nmero suficiente de variables X y datos para
obtener un valor prximo a 1)
2
Coeficiente de determinacin ajustado ( Rajustado
) Permite comparar
regresiones con diferentes nmeros de variables, referidos a la misma variable
endgena Y, debido a que se trata de un valor ajustado por los grados de
libertad.

2
Rajustado
1

n 11 R 2
n p 1

Regresin lineal mltiple


Usualmente se dispone de un conjunto de variables predictoras, X 1 , X 2 ,..., X p y
formular un modelo poblacional mltiple:
Yi 0 1 X i1 ... p X ip i

Subndice representa la observacin i-sima, (i= 1, 2, , n)


Existen p + 1 variables predictoras, incluyendo a X0
Vector y de orden n 1 , constituido por mas n observaciones.
La matriz de orden n p 1 contiene todos los valores de las
variables predictoras fijas, incluida X0 :

1 x11
1 x
21

X . .

. .
1 x n1

x12
x 22
.
.
xn 2

... x1 p
... x 2 p
... .

... .
... x np

Xij, de la matriz X, corresponde a un dato de la fila u observacin i y


a la columna o variable j
corresponde al vector de los n residuales o errores
x corresponde al vector de las variables predictoras
x X 0 , X 1 ,..., X P

Si x lleva un sub-ndice, representa entonces una observacin.


y corresponde a un vector de las observaciones estimadas, de orden

n 1 .

corresponde al vector de los parmetros j , de orden p 1 y se


estima por b
Los coeficientes corresponden a las pendientes del modelo
Miden el efecto que tendra sobre la respuesta Y, una variacin
unitaria en el predictor Xj , si todos los dems predictores se
mantuviesen sin cambiar.

El modelo muestral mltiple puede escribirse matricialmente como:


y X

El nmero o cantidad de variables predictoras es importante:


- Sin son demasiadas, es necesario reducirlas al menor nmero de
variables relevantes posible.
- Si se omite una variable relevante en el modelo y ste se estima, los
estimadores MCO de sern sesgados.

Estimacin del modelo por mnimos cuadrados ordinarios (MCO)


El modelo a estimar es:

y X

Y se espera llegar al modelo:

y X Xb
La suma de los cuadrados de los residuales se define como:

2
i

'

Los requisitos para estimar son:


i) Y variable aleatoria sujeta a error.
ii) X variable fijada sin error
iii) Solo se podr estimar el modelo si es lineal en los parmetros.
iv) Los residuales deben ser:
-

Variables aleatorias
Media cero, E i 0 , para todo i = 1, 2, , n; si los parmetros
son estimados, al calcular los errores y sumarlos, el resultado debe ser
cero. Si no son cero:
Significa que los errores producen un efecto constante
sobre la respuesta Y, y dicho valor se debera agregar
al 0
O el modelo est mal especificado o se ha definido
mal el intercepto.
La varianza de todos los residuales es constante e igual para todos
Homocedasticidad Var ( i ) 2 , si lo anterior no se cumple,
entonces la estimacin de los parmetros es menos confiable.
Los residuales i correspondiente a cada observacin i, deben estar
incorrelacionados Cov( i , j ) 0
La distribucin de los i debe ser Normal. i ~ N (0, 2 )

v) Debe existir estabilidad temporal, esto quiere decir que el modelo poblacional no
cambia en el tiempo si se toman datos mensuales para los ltimos 30 aos, el modelo
debe ser el mismo para cualquier sub. Muestra de los 360 meses involucrados.
vi) Ausencia de colinealidad entre los predictores Xj, es decir, que sus correlaciones de
a pares sean todas diferentes de 1 .

1) La funcin a minimizar es:

i2
'
y X y XB
2) Derivando con respecto a ' se obtiene el estimador:

b
b X ' X X ' y
1

Lo anterior se puede resolver solo si X ' X es invertible, de lo contrario se debe


encontrar b resolviendo las ecuaciones normales:

X ' X b X ' y
Caractersticas propias del MCO:
-

Los errores ij estn incorrelacionados con las X ij

Propiedades de los estimadores


1.- El vector b es combinacin lineal de las Yi y se distribuye normal.
2.- El estimador b de es insesgado
3.- La varianza del estimador es:

Var b 2 X ' X

Lo resultante es una matriz, en donde la diagonal corresponde a las varianzas de los


estimadores.

Anlisis de varianza ANOVA


La definicin de la sumatoria de los cuadrados de los residuales es:

2
i

2
i

'

y' y b X ' y

De donde:
Suma de cuadrados de la regresin:
SC (regresin) b' X ' y

Sin correccin, con p + 1 grados de


Libertad.

SC (regresin) b' X ' y n y

Con correccin, y p grados de libertad.

Suma de cuadrados total:


SC (Total ) y' y

Sin correccin, con n grados de libertad.

SC (Total ) y' y n y

Con correccin, y n 1 grados de


Libertad.

Suma de cuadrados de los residuales:


SC (residual ) y' y b' X ' y

Con y sin correccin, siempre hay


n p 1 grados de libertad.

Tabla ANOVA:
Fuente de
variacin
Regresin

Grados de
libertad

Suma de
cuadrados

b' X ' y n y

Residual

n-p-1

y' y b' X ' y

Total

n-1

y' y n y

Cuadrados
medios

E[CM]

SCR
= CMR
p

2 12 xi2

SCE
=CME
n p 1

F. calculada
(E)

CMR
CME

Dcima global
De la tabla ANOVA se puede docimar si el modelo es globalmente significativo:
H0 : j 0
Ha : j 0

Se pretende rechazar la Hiptesis nula, si el estadgrafo E cumple con:


E Fp ,n p 1,1

Si no se rechaza la hiptesis nula, quiere decir que todos los coeficientes son nulos,
esto se puede deber a un problema de multicolinealidad.
Si se rechaza la hiptesis nula, entonces quiere decir, que al menos uno de los
coeficientes, es significativo para el modelo, por lo que es necesario determinar
individualmente cuales son los que difieres de cero.
Dcimas individuales para los
La Dcima es de la siguiente forma:
H0 : 0
Ha : 0

Como la varianza se estima, y no es conocida, se utiliza una distribucin t de Student


con n p 1 grados de libertad.
Se pretende rechazar la hiptesis nula si:

E t

n p 1,1

Con E igual a:
E

b j j0
Var (b j )

Donde:
; de donde resulta una matriz, en donde la diagonal
Var b CME X ' X
corresponde a las varianzas de los estimadores.
1

Covb0 , b1
Var b0
Covb , b
Var b1
1
0

Var b
.
.

.
.

Covbn , b0 Covbn , b1

... Covb0 , bn
... Covb1 , bn

...
.

...
.

... Var bn

Dcimas de combinaciones lineales de varios coeficientes

Intervalos de confianza
Rango de valores, donde se pueden encontrar los verdaderos valores de j :

j b j Var (b j ) t

n p 1,1

Predicciones
Los intervalos de confianza para determinar el valor de Y estimada pueden ser para:
Valor promedio

Yx 0 Yx 0 Var (Yx 0 | x' 0 t

n p 1,1

Donde: Var Yx 0 | x'0 2 x'0 X ' X x 0


1

Valor individual

Yx 0 Yx 0 Var (Yx 0 | x' 0 t

1
Donde: Var Yx 0 | x'0 2 1 x'0 X ' X x 0

n p 1,1

Coeficiente de determinacin
Cuando se escribe:

SC error SCEY 12... p SY212... p S Se trata de una SC cuando se explica la variable


endgena Y mediante las exgenas X1, X2,, Xp
La SCE corresponde a una varianza cuando se han eliminado las variables que
explican la respuesta, es decir, a una varianza cuando la respuesta Y se explica o modela
por las variables que se anotan despus del punto. Es el cuadrado de la correlacin
mltiple de Y con todas las variables exgenas X en grupo. Donde:
- Correlacin mltiple grado de asociacin lineal existente en un modelo de
regresin mltiple, entre la variable Y con todas las predictoras tomadas en conjunto.
Coeficiente de determinacin:

R 2 RY212... p 1

SCE
SCT

b' X ' y n y

y' y n y
2

R R
2

Coeficiente de determinacin ajustado:

2
Y 12...P

nn 1p

2
Rajustado
1 1 R2

Correlaciones parciales
Permite calcular el efecto que tiene cada predictor X, por si mismo, sobre la
respuesta Y, sin considerar al resto de las variables del modelo. Su valor oscila entre
[-1 , 1], dependiendo del signo que posea el parmetro i correspondiente.
2
YX j .resto

E 2j
E 2j n p 1

; Donde resto corresponde a la lista de subndices que no


incluyen a j.

Por lo tanto la Correlacin parcial corresponde a:


2
rYX j .resto signo _ j RYX
j .resto

Vous aimerez peut-être aussi