Vous êtes sur la page 1sur 68

Variables Dummy (8/5/2017)

o Modelos de regresin lineal incluyen informacin cualitativa, como


los atributos de una persona, por ejemplo: sexo
(femenino/masculino), contextura, estado civil, situacin laboral
(empleado/desempleado), etc.

o Variables cualitativas expresadas en variables binarias (dummy).


Por ejemplo, el sexo o gnero de una persona:

Sexo: S1, S2

S1 = 1 , si es mujer; S1 = 0, si es hombre
S2 = 1, si es hombre; S2 = 0 si es mujer

o Atributos pueden explicar comportamiento de las variables, como


diferencias salariales entre hombres y mujeres, diferencias de
ingreso entre grupos de trabajadores, diferencias de ventas entre
empresas (grandes y medianas, medianas y pequeas).
2
Estudio de Hammermesh y Biddle (1994)
Efecto de la apariencia fsica en los salarios: Importa el
aspecto?

o Regresin: W = bX + qAF + U

o Datos: Egresados de Derecho en EEUU (1.100 observaciones)

Resultados?
3
Resultados?
o Hombres y mujeres mejor parecidos pueden ganar hasta un
10% mas que los menos atractivos.

o Trabajadores (as) menos atractivos accederan a trabajos de


menor desarrollo profesional.

o Mayor participacin laboral en trabajadores mas atractivos

Discriminacin Laboral?

4
Funcin de Regresin Lineal con Variables Dummy
1. Diferencias del valor medio de la variable dependiente
(constante) segn grupos o atributos. Ejemplo: salario por hora
(W) para hombres y mujeres en funcin del nivel educacional.

W = b0 + g0 S1 + b1Educacin + u (1)

2. Diferencias de la pendiente de la regresin segn grupos o


atributos (retorno de la educacin).

W = b0 + b1Educacin + 1 S1Educacin + u (2)

3. Diferencias en el valor medio y en la pendiente de la


regresin.

W = b0 + g0 S1 + b1Educacin + 1 S1Educacin + u (3)


5
Efectos del Modelo de Regresin Lineal
En todos los casos, la o las variables explicativas incluyen una o
mas variables dummy. En trminos matriciales, esto significa:

Y = [X D]b* + U
E(Y/X, Atributos) = Xb*

En que:

X es la matriz de variables explicativas


D es el conjunto de variables dummy, esto es, D = 1 (si el atributo se
cumple), D = 0 (si no se cumple).
b* es el vector de coeficientes, incluyendo el (o los coeficientes) de la
variable dummy (b* = b + g)
U es el vector de errores de la funcin de regresin de la poblacin.

6
Test de Chow Test de Cambio Estructural
o Modelo con restricciones: parmetros no cambian entre
grupos. La funcin de regresin:
Y = Xb + U
SCRr = SCT - SCE

o Modelo sin restricciones: parmetros pueden ser distintos


entre los grupos. La funcin de regresin:

Y = [X D]b* + U
SCRsr = SCTsr - SCEsr

Prueba:
F-Chow = [(SCRr - SCRsr)/k]/[SCRsr/(n 2k)] ~ F(k, n 2k)

Si F-Chow > F-tabla, se rechaza H0 (hay cambio estructural)


7
Supuestos de Comportamiento Test de Chow

1. Los errores son normales y se distribuyen


independientemente. Por ejemplo, en la regresin de dos
grupos 1 y 2, se tiene:

u1 ~ N(0, s2)
u2 ~ N(0, s2)
Cov(u1, u2) = 0

2. La varianza de los errores es la misma (homocedasticidad).

Var(u11) = Var(u2) = s2

8
Ejercicios Variables Dummy
1. Se desea estudiar la relacin entre los ingresos de las
personas, su nivel educacional, el sexo y la experiencia laboral.
Para esto, se plantea la siguiente funcin de regresin:

Y = b0 + b1Exp + a0S1 + a1S1Exp + g2E2 + g3E3 + g4E4 + g5E5 + u

En que: Y es el ingreso, Exp es la experiencia laboral (en aos),


S1 y Ei son variables dummy.
S1 = 1 si el sexo es femenino y 0 si es masculino.
E1 = 1 si la persona tiene escolaridad incompleta (< 12 aos), 0 en
otro caso.
E2 = 1 si tiene 12 aos de escolaridad (enseanza media completa), 0
en otro caso.
E3 = 1 si tiene estudios tcnicos o universitarios incompletos, 0 en
otro caso.
E4 = 1, si tiene estudios universitarios completos, 0 en otro caso.
E5 = 1, si tiene estudios de post-grado, 0 en otro caso.
9
Ejercicios Variables Dummy

Con esta informacin, se pide:

a. Encontrar el ingreso medio de los hombres y el ingreso


medio de las mujeres con escolaridad incompleta (ambos
independiente de su experiencia laboral).

b. Determine el ingreso medio de los hombres graduados de


universidad, con 2 aos de experiencia laboral.

c. Determine el ingreso medio de las mujeres graduadas de


universidad con 3 aos de experiencia laboral.

d. Determine el ingreso medio de hombres y mujeres con


estudios de postgrado y sin experiencia laboral.

10
Ejercicios Variables Dummy (Respuesta)

a. Ingreso medio de los hombres:

E(Y/S1 = 0) = b0
Ingreso medio de las mujeres:

E(Y/S1 = 1) = b0 + a0
Diferencia de ingreso:

E(Y/S1 = 0) - E(Y/S1 = 1) = -a0

b. Ingreso medio de hombres graduados de universidad con 2


aos de experiencia laboral:

E(Y/S1 = 0, E4 = 1, Exp = 2) = b0 + g2 + g3 + g4 + 2b1


11
Ejercicios Variables Dummy (Respuesta)
c. Ingreso medio de mujeres graduadas de universidad con 3
aos de experiencia laboral:

E(Y/S1 = 1, E4 = 1, Exp =3) = b0 + a0 + g2 + g3 + g4 + 3(b1 + a1)

d. Ingreso medio de graduados (postgrado) sin experiencia


laboral:

Hombres:

E(Y/S1 = 0, E5 = 1, Exp =0) = b0 + g2 + g3 + g4 + g5

Mujeres:

E(Y/S1 = 1, E5 = 1, Exp = 0) = b0 + a0 + g2 + g3 + g4 + g5
12
Ejercicios Variables Dummy - Cambio Estructural
2. En un estudio de ahorro privado en funcin del ingreso disponible,
para dos periodos (post guerra y tiempos de paz), se obtuvo:

Periodo 1 (post guerra):

= -0,262 + 0,047Ingreso Disponible


Periodo 2 (tiempos de paz):

= -1,750 + 0,150Ingreso Disponible


a. Determine el ahorro medio de cada periodo, compare y grafique.


b. Calcule el ahorro de cada periodo, si el ingreso disponible es 100.
c. Determine la diferencia entre el ahorro promedio y el ahorro total
de cada periodo. Porque el ahorro puede diferir entre los dos
periodos?

13
Ejercicios Variables Dummy (Test de Chow)

3. Para una muestra de 15 observaciones tomadas de dos


grupos, se obtuvieron las siguientes regresiones:

i. Regresin con restricciones:

Y = -0,0625 + 0,4375 (SCRr = 6,5561)

ii. Regresin sin restricciones:

Y = 0,4000 + 0,5091 (SCRcr = 3,1602)

El analista desea saber si sus resultados son suficientemente


robustos para afirmar que existe cambio estructural. Aplicando
el test de Chow, que le dira usted?

14
Variable Dependiente Dicotmica (18/5/2017)
o En el modelo:
Y = Xb + U

Y = 1, si se cumple una condicin, 0 si no se cumple.

Ejemplo: Consumo de drogas en adolescentes (15 a 19 aos)

Y = b0 + b1Ingreso Familiar + b2NEM + u

X1: Ingreso Familiar


X2: Notas Enseanza Media

o Probabilidad de Respuesta:

Prob(Y= 1/X) = E(Y/X) = b0 + b1 X1 + b2X2


15
El Modelo de Probabilidad Lineal- Propiedades
1. Probabilidad de respuesta es lineal en los parmetros.

Y = Prob(Y/X) = Xb
Prob(Y/X) = E(Y/X) = b0 + b1 X1 + b2X2

La funcin de regresin muestral:

= X
= (XX)-1XY
El estimador de MCO es lineal.

2. El estimador de MCO es insesgado:

= (XX)-1XY
= (XX)-1X(Xb + U) = b + (XX)-1XU
E( ) = b
16
3. Varianza

La probabilidad lineal:
Prob(Y = 1/X) = Xb

Y = Xb + U

Haciendo: p(X) = Prob(Y = 1/X)

Y = p(X) + (Y p(X)
La varianza:

Var(U/X) = p(X)(1 p(X))

Varianza de los errores ya no es constante, es heterocedastica!!!

17
Solucin?

1) Propiedades de consistencia:

Lim Prob (Y = 1) = 1
Xb +
Lim Prob (Y = 1) = 0
Xb -

2) Modelo Probit (basado en una distribucin normal):


Prob( Y = 1) =

f(t): distribucin normal

18
Laboratorio 18 de Mayo (Pasos Bsicos)

1. Abrir el archivo de datos:

use C:\Users\udp\econometria 2017\laboratorio 18 de


mayo.dta

2. Abrir una hoja de clculo:

log using "C:\Users\udp\econometria 2017\Jueves


18 Mayo.smcl

3. Transformar variable ingresso en logaritmos:

gen ling = ln(ingreso)

19
Laboratorio 18 de Mayo (Variables Dummy)

1. Variable dummy sexo femenino:

gen s1 = 0
replace s1 = 1 if sexo == 0

2. Variable dummy hijos:

gen dhijo = 0
replace dhijo = 1 if hijos > 0

3. Regresin con variables dummy (modelo restringido)

regress ling edad esc jhogar dhijo


est store mo1
20
Laboratorio 18 de Mayo (continuacin var. dummy)

4. Regresin con variables dummy (modelo sin restricciones):

regress ling edad esc jhogar dhijo if s1 == 1


est store mo2

regress ling edad esc jhogar dhijo if s1 ==0


est store mo3

Alternativamente:

regress ling edad esc jhogar dhijo s1


est store mo4

21
Estimacin Modelo Probit

regress trabaja esc edad jhogar dhijo s1


est store mo1

probit trabaja esc edad jhogar dhijo s1


est store mo2

log close

print

22
Test de Chow Test de Cambio Estructural
o Modelo con restricciones: parmetros no cambian entre
grupos. La funcin de regresin:
Y = Xb + U
SCRr = SCT - SCE

o Modelo sin restricciones: parmetros pueden ser distintos


entre los grupos. La funcin de regresin:

Y = [X D]b* + U
SCRsr = SCTsr - SCEsr

Prueba:
F-Chow = [(SCRr - SCRsr)/k]/[SCRsr/(n 2k)] ~ F(k, n 2k)

Si F-Chow > F-tabla, se rechaza H0 (hay cambio estructural)


23
Relaciones No lineales

Existen relaciones que no son lineales, pero pueden ser


transformadas para estimar una relacin lineal. Tres casos:

1. Transformacin logartmica

Y = A Xb

lnY = lnA + blnX + u

Ejemplo: Funcin de Cobb-Douglas

lnY = a0 + a1 t + a2 lnK + a3 lnL + u

2. Transformacin semi logartmica

lnY = a + bX + u

24
Transformaciones recprocas

Sea el modelo no lineal:

(Y a1)(X a2) = a3

Y = a1 + a3 /(X a2)

Si a2 = 0
Y = a + b /X

Si a1 = 0
1/Y = a + bX

25
2. Multicolinealidad - Naturaleza

o Ragnar Frisch: Relacin lineal perfecta o exacta entre


variables explicativas. En el modelo de regresin lineal:

Y = b0 + b1 X1 + b2 X2 + + bk Xk + u

o Existe una relacin lineal entre las variables explicativas si:

l1 X1 + l2 X2 + + lk Xk = 0

o Una definicin menos estricta: las variables pueden estar


relacionadas pero no perfectamente.

26
2. Multicolinealidad - Consecuencias

o Cuando la multicolinealidad es extrema, el estimador de


MCO queda indeterminado.

o Cuando no es extrema:

1. Estimadores MCO siguen siendo MELI, pero tienen mayor


varianzas y covarianzas.
2. Intervalos de confianza ms amplios, menor certeza de
prediccin y mayor probabilidad de aceptar la hiptesis
nula.
3. Pruebas t tienden a ser pequeas para algunos
estimadores a pesar de que R2 puede ser alto.
4. Los parmetros estimados (b y s2) pueden ser ms sensibles
a pequeos cambios en los datos.

27
2. Multicolinealidad Deteccin
1. Valores altos para R2 pero pruebas t pequeas.

2. Alta correlacin entre las variables explicativas, por ejemplo


correlacin mayor que 0,5. Esto puede ser una condicin
suficiente para un modelo de dos variables explicativas, pero no
suficiente para uno de ms de dos variables explicativas. Existen
casos en que una correlacin positiva mayor que 0,5 puede estar
compensada por una correlacin negativa del mismo valor.

3. Valores (races) caractersticos y condicin de ndice:

i) Condicin del numero k

k = valor mximo / valor mnimo (100 < k < 1.000)

ii) Condicin de ndice (CI)


CI = k1/2
(10 < CI < 30)
28
Ejemplo: Funcin de Cobb Douglas

ln Y = -3,3384 + 1,4988 ln X1 + 0,4899 ln X2


t = (-1,3629) (2,776) (4,8005)
ta/2 = 2,179
R2 = 0,889

Races caractersticas:

l1 = 3,00; l2 = 0,000375; l3 = 0,0000242

k = 3/0,0000242 = 123.966
CI = 352

Existe multicolinealidad severa!!!!

29
2. Deteccin de Multicolinealidad Factor de Inflacin
de Varianza (VIF)
o Dado el modelo:
Y = b0 + b1 X1 + b2 X2 + + bk Xk + u

Con: = 0 + 1 X1 + 2 X2 + + kXk

Var ( j ) = (s2/Sx j 2 )(1/1- R2 j)

En que R2 j es el coeficiente de correlacin entre X j y el resto


de las variables explicativas. La prueba de inflacin de
varianza:
Inflacin de varianza: VIF = 1/(1 R2 j)

Tolerancia: TOL = (1 R2 j)

Si VIF > 1; TOL < 1, existe multicolinealidad. 30


2. Multicolinealidad Solucin

i. Informacin a priori: si se conoce la naturaleza de la


multicolinealidad.

ii. Combinacin de datos de seccin cruzada con series de tiempo.

iii. Eliminar variables: problema? Sesgo de estimacin.

iv. Agregar nuevos datos.

v. Transformacin de variables.

vi. Estimacin de polinomios.

vii. Estimador de ridge.


31
Informacin a Priori - Ejemplo

Dada la regresin:

Consumo = b0 + b1Ingreso + b2Riqueza + u

En que, Riqueza = 0,1Ingreso

Se estima:

Consumo = b0 + b1Ingreso + 0,1b1Riqueza + u

Consumo = b0 + b1Renta + u

Renta = Ingreso + 0,1Riqueza


b2 = 0,1b1
32
Eliminar Variables: Sesgo de estimacin

Consumo = b0 + b1Ingreso + b2Riqueza + u

La regresin estimada:

= 0 + 1Ingreso

E( 1) = ?

33
Endogeneidad

Variable explicativa ya no es exgena. Por ejemplo en el


modelo:

Consumo = b0 + b1 Ingreso Disponible + b2 Tasa Inters + u

A su vez el Ingreso Disponible depende del consumo agregado,


esto, desde el punto de vista de la demanda agregada. Por lo
tanto, esta variable ya no es completamente exgena. La
relacin sera:

Ingreso Disponible = g(Consumo)

Cual es el efecto en el estimador de MCO?

34
Endogeneidad

La funcin de regresin lineal:

Y = Xb + U
X = g(Y)

E(Y) = E(Xb + U) = bE(g(Y)) + E(U) Xb

En este caso se requiere:

o Detectar la endogeneidad: podemos usar un test como el de


Granger.

o Corregir la endogeneidad utilizando variables instrumentales


y/o Mnimos Cuadrados en Dos Etapas (MC2E).
35
Estimacin del Modelo de Regresin Lineal con Errores no Esfricos

o Cuando algn componente de la matriz X es estocstico, se dice que


los errores son no esfricos, es decir, no cumplen con algunos de los
supuestos bsicos del modelo de regresin lineal. El modelo:

Y = Xb + u

En que u ~ N(0, s2W), con W matriz definida positiva de orden n.


Este modelo se conoce como uno de errores no esfricos, comparado
con el caso de Var(u) = s2I, cuando los errores son esfricos. Por
ejemplo si la varianza de los errores es proporcional al cuadrado de
una de las variables explicativas como X2, se tiene:

Var(ui) = s2X2i2

El estimador MCO en este caso podra ser sesgado, inconsistente, y


la varianza no seria constante.
36
Estimador de Variables Instrumentales (VI)

o Cuando X es estocstica y el supuesto de independencia entre


X y el error u ya no se cumple, podemos encontrar una
variable Z que este relacionada con X pero no con el error.

o En el modelo anterior, el estimador de variables


instrumentales queda definido como:

bVI = (ZX) -1 ZY

Var(bVI ) = s2(ZX) -1(ZZ) (XZ) -1

En que: Cov (ZX) > 0, Cov(Zu) = 0

37
Calculo de la Varianza

El estimador de variables instrumentales:


bVI = (ZX) -1 ZY
bVI = (ZX) -1 Z(Xb + u)
bVI = (ZX) -1(ZX)b + (ZX) -1 Zu
bVI = b + (ZX) -1Zu
Haciendo (bVI b) y elevando al cuadrado:

(bVI b)(bVI b) = (ZX) -1ZuuZ(ZX) -1


Tomando esperanza, esto queda:

Var(bVI ) = E[(bVI b)(bVI b)] = E[(ZX) -1ZuuZ(ZX) -1]


Var(bVI ) = (ZX) -1ZE(uu)Z(ZX) -1
Var(bVI ) = s2(ZX) -1(ZZ) (XZ) ) -1
38
Ejemplo Variables Instrumentales con Endogeneidad
o Demanda por Verduras:

Qt = a0 + a1Pt + a2Yt + ut

o Oferta Inversa:
Pt = b0 + b1Qt + vt

Instrumento: Precio de la fruta (Z)

= (ZX)-1(ZQ)
X = [ 1 Z Y]

39
Propiedades del Estimador de Variables Instrumentales
o El estimador de variables instrumentales es un estimador
consistente y de varianza mnima si se cumplen las
siguientes propiedades:
1) Las variables en Z estn correlacionadas con las variables
en X y en el limite:

plim(ZX/n) = SZX < , es una matriz finita de rango completo.

2) En el limite las variables de Z no estn correlacionadas con


el termino de error u, tal que:
plim(Zu/n) = 0

o Condicin (necesaria): deben haber al menos tantos


instrumentos como columnas de X. Si esta condicin no fuera
satisfecha la matriz (ZX/n) podra ser singular. 40
Demostracin de Consistencia
El estimador: bVI = (ZX) -1 ZY
bVI = (ZX) -1 Z(Xb + u)
bVI = (ZX) -1(ZX)b + (ZX) -1 Zu
bVI = b + (ZX) -1Zu

Tomando limite en probabilidad:


plimbVI = b + plim[(ZX) -1Zu]
plimbVI = b + plim(ZX) -1 + plim(Zu)

En muestras grandes se tiene que el primer termino debe


converger a cero si: plim(ZX) -1 <
El segundo converge a cero ya que E(Zu) = 0 y E(u) = 0, luego:
plimbVI = b
El estimador es consistente. 41
El estimador de VI en notacin escalar
o Sea el modelo:
Y = b0 + b1X + u
o En que X es endgena y se debe instrumentalizar. Para esto,
se encuentra una variable Z que esta correlacionada con X,
pero no esta correlacionada con el error u.
o Como se relaciona Z con Y? Tomando covarianza entre Z e Y,
se tiene:
Cov(Z,Y) = b1Cov(Z,X) + Cov(Z,u)
o Como Z no esta correlacionado con u, Cov(Z,u) = 0, luego:
Cov(Z,Y) = b1Cov(Z,X)
b1 = Cov(Z,Y)/Cov(Z,X)
b1 = [E(Z,Y) E(Z)E(Y)]/[E(Z,X) E(Z)E(X)]
1 = [S(Z,Y) ]/[S(Z,X)
]

1 = Szy/Szx
42
La varianza del estimador de VI en notacin escalar
1 = Szy/Szx
1 = Sz(b1x + u)/Szx
1 = b1Szx/Szx + Szu/Szx
1 = b1 + Szu/Szx
Haciendo 1 - b1 y elevando al cuadrado, se tiene:
( 1 - b1)2 =(Szu/Szx) 2
Tomando esperanza se obtiene:

Var( 1) = E[( 1 - b1)2 ] = E(Szu/Szx)2


Var( 1) = E[( 1 - b1)2 ] = s2/nsx2 rx,z2

sx2 = Sx2
rx,z = corr(z,x)
43
Estimador de Mnimos Cuadrados en dos Etapas

o El estimador de variables instrumentales tambin puede ser


visto como el resultado de una doble estimacin de MCO. Las
dos etapas:

Etapa 1: se estima la regresin de X como variable


dependiente, en funcin de Z como variable explicativa.

= Z(ZZ)-1ZX
Etapa 2: se estima la regresin de Y como variable
dependiente en funcin de X estimada, para obtener b.

bMC2E = (
)-1 Y

o De esta forma, el estimador MC2E coincide con el estimador


de variables instrumentales
44
Ejemplo MC2E con Endogeneidad
o Demanda por Verduras: forma estructural

Qt = a0 + a1Pt + a2Yt + ut

o Oferta Inversa:
Pt = b0 + b1Qt + vt

o Ecuaciones en forma reducida:

Qt = g0 + g1Yt + wt

Pt = l0 + l1Yt + et

45
Demostracin (1)
o Demanda por Verduras: forma estructural
Qt = a0 + a1Pt + a2Yt + ut
o Oferta Inversa:
Pt = b0 + b1Qt + vt
Reemplazando P = P(Q) en la ecuacin principal:

Qt = a0 + a1(b0 + b1Qt + vt) + a2Yt + ut


Qt(1 - a1b1) = a0 + a1b0 + a2Yt + ut + a1vt
Qt = (a0 + a1b0 )/(1 - a1b1) + (a2 /(1 - a1b1))Yt + (ut + a1vt )/(1 -
a1b1)
Qt = g0 + g1Yt + wt
g0 = (a0 + a1b0 )/(1 - a1b1)
g1 = (a2 /(1 - a1b1))
w = (ut + a1vt )/(1 - a1b1) 46
Demostracin (2)
Reemplazando Q = Q(Y) en la ecuacin de P:

Qt = g0 + g1Yt + wt

Pt = b0 + b1Qt + vt
Pt = b0 + b1(g0 + g1Yt + wt) + vt
Pt = b0 + b1g0 + b1g1Yt + vt + b1wt
Pt = l0 + l1Yt + et

l0 = (b0 + b1g0 )
l1 = (b1g1)
e = (vt + b1wt )

47
Eleccin de Instrumento

o Cuales son los mejores instrumentos? Muchas veces algunos


instrumentos van a ser variables de la misma matriz X.
Cualquier variable que sea exgena e independiente del error
puede servir como instrumento, siempre y cuando este
relacionada con la variable que queremos instrumentalizar.

o En anlisis dinmico, en series temporales, muchas veces las


variables rezagadas pueden servir de instrumento de la
variable en el periodo corriente. Por ejemplo, el PIB del ao
anterior es un instrumento del PIB del periodo corriente.

o Otros instrumentos, pueden ser variables no incluidas en la


matriz X, como el precio de la fruta en el ejemplo.

o En general para que se cumplan las propiedades de


consistencia el numero de instrumentos debe ser al menos
igual al numero de variables instrumentalizadas.
48
Heterocedasticiad

o Naturaleza

o Causas?

o Consecuencias en el estimador de MCO?

o Como detectarla?

o Soluciones

49
Naturaleza: Que es la heterocedasticidad?

o La heterocedasticidad se produce cuando la varianza de los


errores cambia con las observaciones muestrales (o
poblacionales).

o Por ejemplo, si estamos analizando las utilidades de las


empresas en relacin a sus ventas, podemos encontrar que la
varianza de los errores aumenta con el tamao de la
empresa. Entonces, en el modelo:

Y = Xb + u
Con,
E(u) = 0
E(ui, uj) = 0, para i j
Se tiene:

Var(u) = si2
50
Causas de la heterocedasticidad

1. A medida que las personas aprenden de sus errores, estos


disminuyen en el tiempo, por lo tanto, la varianza
disminuye.
2. A la vez que el ingreso de las personas aumenta, las fuentes
del ingreso tienden a diferir y se hacen ms variables. Por
lo tanto, la varianza aumenta con el ingreso. En el caso de
las ventas de las empresas, a medida que las empresas son
ms grandes hay mayor diversidad y por lo tanto la
varianza aumenta.
3. En la medida que hay mejores tcnicas de recoleccin de
datos, disminuyen los errores de la informacin, esto hace
que la varianza se reduzca.
4. Situaciones excepcionales como una crisis econmica o una
guerra tambin haran aumentar la varianza en las
observaciones de series temporales.
5. Errores de omisin o especificacin de modelos.
51
Consecuencias en el estimador de MCO?

En el modelo :
Y = b0 + b1X + u
En que Y es el ahorro, X es el ingreso de las familias, se tiene
que la varianza de los errores aumenta con el ingreso:

Var(u) = si2 = s2 Xi2

Var( 1) = si2 /Sxi2 = s2 Xi2/Sxi2

Como consecuencia, el estimador de MCO ser lineal e


insesgado, pero la varianza ya no ser mnima.
El estimador es MELI solo si se cumple el supuesto de
homocedasticidad, pero con heterocedasticidad, el estimador
ya no es el mejor estimador ni tiene varianza mnima.
52
Deteccin de la heterocedasticidad

1. Conociendo la naturaleza del problema. Por ejemplo, si


la varianza aumenta con el ingreso de las personas o
las ventas de una empresa.

2. Mtodo grafico: cuando no existe informacin a priori,


una forma de detectarla es graficando los residuos del
modelo estimado en funcin de la variable dependiente
estimada. Cuando vemos que existe un patrn
determinado, por ejemplo, una relacin lineal,
cuadrtica o de otro tipo, podemos sospechar que
existe heterocedasticidad.

3. Test de Heterocedasticidad: test de Park, test de


Glejser, test de Goldfeld-Quandt, test de Breusch-
Pagan y test de White.

53
Deteccin de Heterocedasticidad Test White

1. Test asinttico que no requiere especificar una


variable en particular que causa la heterocedasticidad.
2. La idea es probar la hiptesis nula de
homocedasticidad en base al comportamiento de los
residuos al cuadrado.
3. El modelo de regresin lineal:

Y = Xb + u

u ~ N(0, V); Var(u) = V

Homocedasticidad: V = s 2I
Heterocedasticidad: V = s 2W

54
Test de White

1. Estimar b del modelo de regresin lineal y obtener el vector


de residuos. Ejemplo:
Y = b0 + b1X1 + b2X2 + u

e = Y -
2. Estimar la regresin:
e2 = a0 + a1X1 + a2X2 + a3X12 + a4X22 + a5X1X2 + v
calcular R2,
3. Testear la hiptesis:
H0: si2 = sj2 vs H1: si2 sj2

Si nR2 > c2(q), se rechaza H0

q: numero de variables en regresin de residuos menos 1.


55
MINIMOS CUADRADOS GENERALIZADOS (MCG)

o Una vez detectada la heterocedasticidad y conocida su


naturaleza, el problema se puede corregir utilizando MCG.

o Este mtodo consiste en ponderar el MLR por la inversa del


componente de la varianza que causa la heterocedasticidad.

o En el modelo:
Y = Xb + u
u ~ N(0, V), con V = s2W

= (XW-1X)-1XW-1Y

= s2(XW-1X)-1
Var()
56
MINIMOS CUADRADOS GENERALIZADOS (MCG)

o Una vez detectada la heterocedasticidad y conocida su


naturaleza, el problema se puede corregir utilizando MCG.

o Este mtodo consiste en ponderar el MLR por la inversa del


componente de la varianza que causa la heterocedasticidad.

o En el modelo:
Y = Xb + u
u ~ N(0, V), con V = s2W

= (XW-1X)-1XW-1Y

= s2(XW-1X)-1
Var()
57
MINIMOS CUADRADOS GENERALIZADOS (MCG)

o Una vez detectada la heterocedasticidad y conocida su


naturaleza, el problema se puede corregir utilizando MCG.

o Este mtodo consiste en ponderar el MLR por la inversa del


componente de la varianza que causa la heterocedasticidad.

o En el modelo:
Y = Xb + u
u ~ N(0, V), con V = s2W

= (XW-1X)-1XW-1Y

= s2(XW-1X)-1
Var()
58
MINIMOS CUADRADOS GENERALIZADOS (MCG)

o Una vez detectada la heterocedasticidad y conocida su


naturaleza, el problema se puede corregir utilizando MCG.

o Este mtodo consiste en ponderar el MLR por la inversa del


componente de la varianza que causa la heterocedasticidad.

o En el modelo:
Y = Xb + u
u ~ N(0, V), con V = s2W

= (XW-1X)-1XW-1Y

= s2(XW-1X)-1
Var()
59
Deteccin de Heterocedasticidad Test de Park

1. Formalizacin del mtodo grafico para detectar


heterocedasticidad.
2. Se sospecha que la heterocedasticidad es generada por
alguna de las variables explicativas Xi.
3. El modelo de regresin lineal:
Y = Xb + u
u ~ N( 0, V); Var(ui) = s2Xbievi

lnsi2 = lns2 + blnXi + vi

En el modelo:
ln ei2 = a + b lnXi + vi

Si b es significativo, se rechaza H0.


60
Deteccin de Heterocedasticidad Test de Glejser
1. Se asume que la heterocedasticidad es generada por una de
las variables explicativas Xi.
2. El modelo de regresin lineal:
Y = Xb + u
u ~ N( 0, V)
3. Formas funcionales (posibles) de la heterocedasticidad:

|ei|= b1 + b2Xi + vi
|ei|= b1 + b2 Xi + vi
|ei|= b1 + b21/Xi + vi
|ei|= b1 + b21/ Xi + vi
|ei|= b1 + b2Xi + vi
Si b es significativo, se rechaza H0.
61
Test de Goldfeld - Quandt

1. Se asume que la varianza de los errores aumenta con la


variables explicativa Xi (por ejemplo, el ingreso). En el
modelo:
Yi = b1 + b2Xi + ui
si2 = s2X2i
2. El mtodo consiste en examinar el comportamiento de los
residuos en la muestra de datos.
3. Para esto, se ordena la muestra en forma ascendente, se
elimina una cantidad de observaciones del centro y se divide la
muestra restante en dos.

i. Muestra 1: n1 = (n c)/2

ii. Muestra 2: n2 = (n c)/2


62
Prueba de Goldfeld - Quandt

1. Para cada submuestra, se estima la funcin de regresin


lineal usando MCO:
Yi = b1 + b2Xi + ui
2. En cada caso, se obtiene la suma de cuadrados residuales
SCR1 y SCR2 y el cociente:

l = [SCR2 /(n2 - k)]/ [SCR1 /(n1 - k)] ~ F(n2 k, n1 k)

Bajo:
H0: si2 = sj2 vs H1: si2 sj2

Si l > F (tabla), se rechaza H0

63
Test de Goldfeld - Quandt

1. Se asume que la varianza de los errores aumenta con la


variables explicativa Xi (por ejemplo, el ingreso). En el
modelo:
Yi = b1 + b2Xi + ui
si2 = s2X2i
2. El mtodo consiste en examinar el comportamiento de los
residuos en la muestra de datos.
3. Para esto, se ordena la muestra en forma ascendente, se
elimina una cantidad de observaciones del centro y se divide la
muestra restante en dos.

i. Muestra 1: n1 = (n c)/2

ii. Muestra 2: n2 = (n c)/2


64
Test de Breusch Pagan (1)

1. El problema de los test anteriores, es que en general se


asume que la variable explicativa Xi que causa la
heterocedasticidad es conocida. Pero, esto no siempre es as.
Como solucin, el test de Bresch-Pagan propone una forma
mas general. En el modelo:
Y= Xb + u
si2 = f(Z)
Z puede incluir o no las variables explicativas, por ejemplo,
en la funcin:
si2 = a1 + a2Z2i + a3Z3i ++ amZmi
Z2 = X2
2. La hiptesis nula y alternativa:

H0: a1 = a2 = a3= am = 0 vs H1: ai 0


65
Prueba de Breusch Pagan (2)

Estimando la regresin Y = Xb + u por MCO, se obtienen los


residuos, ei2.
A partir de los residuos, se estima la varianza de los errores y
se construye la variable:
pi = ei2/ 2
Con esta variable p, se estima la regresin:

pi = a1 + a2Z2i + a3Z3i ++ amZmi

Calculando SCE del modelo, se obtiene:

Q = SCE/2 ~ c2(m -1).

Si Q = SCE/2 > c2 (tabla), se rechaza H0


66
MINIMOS CUADRADOS FACTIBLES (MCF)

1. Cuando la forma de la heterocedasticidad es desconocida, el


estimador de MCG se transforma en el estimador de MCF.
En el modelo:
Y= Xb + u
Se asume:
Var(ui) = si2 = s2eXb
(Var(u) = s2W)

2. La regresin:
lnsi2 = lns2 + b1Xi1 + b2Xi2 + +bklnXik + vi

Se estima por MCO y se obtiene:

= eXb

67
El estimador de MCF

Habiendo encontrado
, el estimador queda:

= (X
-1X)-1X
-1 Y

= s2(X
Var() -1X)-1

Ejemplos:

1) Heterocedasticidad conocida
2) Heterocedasticidad desconocida

68