Vous êtes sur la page 1sur 48

Econometra

Captulo II

Marcela Perticara
Ingeniera Comercial

2016

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

1 / 48

Estructura del captulo

Introduccin: Definicin del modelo de regresin simple

Estimador de Mnimos Cuadros Ordinarios (MCO): derivacin,


interpretacin

Propiedades estadsticas de los estimadores MCO

Valores ajustados y residuos. Bondad de ajuste

Formas funcionales y cambios de escala.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

2 / 48

1. Definicin del modelo de regresin simple


El modelo de regresin simple es el modelo de regresin lineal ms
sencillo. Cuando existe una nica variable regresora, el modelo se
escribe como:
(1)

yi = o + 1 xi + ui

0 : es el intercepto o constante. Se interpreta como el valor medio de


y cuando la variable x toma el valor cero, aunque en algunos casos no
tiene interpretacin econmica.
1 . 1: mide el efecto que la variable explicativa x tiene sobre la
variable explicada y.
Si un aumento de la variable explicativa x produce un aumento de la
variable explicada y entonces 1 ser positivo.
Si un aumento de la variable explicativa x produce una disminucin de
la variable explicada y entonces 1 ser negativo.
Marcela Perticara (Ingeniera Comercial)

Econometra

2016

3 / 48

1. Definicin del modelo de regresin simple


El valor de 1 es desconocido.
El estimador Mnimo Cuadrados Ordinarios (MCO) nos proporciona
una estimacin (valor aproximado) del coeficiente 1 .
PROBLEMA: dado que el modelo de regresin simple slo tiene en
cuenta una variable explicativa x podemos estar sobre-estimando o
sub-estimando el efecto que una variacin en la variable x causa en la
variable explicada y.
Ejemplo:
Una empresa quiere conocer el efecto que un incremento en los precios
de un producto causa en el volumen de ventas.
Para ello toma los datos de los precios y las ventas del producto en los
ltimos 10 aos:
(2)

ventasi = o + 1 precio i + ui
1 : mide el efecto que un aumento en el precio del producto tiene
sobre el volumen de ventas.
Marcela Perticara (Ingeniera Comercial)

Econometra

2016

4 / 48

1. Definicin del modelo de regresin simple

Cul es nuestro problema: dado que no estamos incluyendo otras


variables que afectan al volumen de ventas, cuando estimemos el valor
de 1 , el valor obtenido puede no ser correcto.
Ha cambiado el precio de la competencia en estos 10 aos de tal
forma que haya provocado un cambio en las ventas no debido a un
cambio del precio del producto? Si es as, este hecho no lo estamos
teniendo en cuenta en el modelo de regresin simple.
En la prctica rara vez encontraremos un modelo de regresin simple,
ya que el modelo de regresin debe incluir todas las variables que
creamos que su variacin puede causar una variacin en la variable
explicada.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

5 / 48

2. Estimador MCO: funcionamiento e interpretacin


En el modelo de regresin simple:
(3)

yi = o + 1 xi + ui
para i=1, 2, ..., N

El objetivo es estimar los valores de los coeficientes, y en especial el de


1 .
Para ello tomamos una muestra de los datos de las variables x e y :
(xi , yi ) para i = 1, , N.
Ejemplo:
Queremos analizar si trabajar ms hace que las personas duerman
menos.
Tenemos datos de 706 individuos, minutos que duermen y trabajan.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

6 / 48

2. Estimador MCO: funcionamiento e interpretacin

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

7 / 48

2. Estimador MCO: funcionamiento e interpretacin


Vamos a representar ahora los datos en un grfico denominado nube
de puntos o scatter plot.
El comando es scatter sleep totwrk. Cada punto representa una
observacin.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

8 / 48

2. Estimador MCO: funcionamiento e interpretacin


El estimador MCO es un procedimiento para determinar
aproximadamente los valores reales de los coeficientes del modelo de
regresin simple 0 y 1 a partir de los datos de una muestra de las
variables.
El estimador MCO se basa en una frmula que aplicada a los datos de
la muestra proporciona estimaciones de los coeficientes del modelo de
regresin.
El estimador MCO busca dos valores b0 y b1 tales que la recta dada
por b0 + b1 x hace mnima la suma total del cuadrado de las distancias
entre los valores de la variable yi y los valores de la recta b0 + b1 xi .
Esto es, se encuetran aquellos valores que

Min

b0 ,b1

Marcela Perticara (Ingeniera Comercial)

N
X
(yi b0 b1 xi )2

(4)

i=1
Econometra

2016

9 / 48

2. Estimador MCO: funcionamiento e interpretacin

El valor b0 es el valor estimado para 0 . Escribiremos, 0 = b0 .


El valor b1 es el valor estimado para 1 . Escribiremos, 1 = b1 .
Si por ejemplo, incluimos la recta de regresin estimada en el grfico
anterior.
Comando Stata twoway (scatter min_sleep min_trab) (lfit min_sleep
min_trab)

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

10 / 48

2. Estimador MCO: funcionamiento e interpretacin

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

11 / 48

2. Estimador MCO: funcionamiento e interpretacin

Si resolvemos Min

PN

b0 ,b1

0 = y 1 x

i=1 (yi

b0 b1 xi )2 , las soluciones sern


1 =

PN
y )(xi
x)
i=1 (yi
PN
x )2
i=1 (xi

Tanto a 1 como a 0 los denominados los estimadores MCO de los


parmetros 1 y0 respectivamente.
Veamos la mecnica de esta estimacin con el ejemplo anterior (del
grfico)

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

12 / 48

2. Estimador MCO: funcionamiento e interpretacin

Supongamos que en vez de la muestra de 702 individuos, tenemos una


muestra de slo 14. Estos son los datos

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

13 / 48

2. Estimador MCO: funcionamiento e interpretacin

Graficamente, estos puntos se ven

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

14 / 48

2. Estimador MCO: funcionamiento e interpretacin


Queremos encontrar
la linea que ajusta estos puntos, mediante la
P
2
frmula Min N
(y
i=1 i b0 b1 xi ) .
b0 ,b1

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

15 / 48

2. Estimador MCO: funcionamiento e interpretacin

Apliquemos
las frmulas encontradas, 0 = y 1 xy
PN
(yi
y )(xi
x)
PN
1 = i=1
.
x )2
i=1 (xi

Fijense
las distintas cosas
que calular: y,
x,
PN
PNque tenemos
2.
(y

)(x

),
(x

)
i
i=1 i
i=1 i
Si calculamos estos valores, obtenemos las siguientes estimaciones
para los coeficientes del modelo.
0 = 3570,234 y 1 = ,0624186.
Veamos en una planilla excel... y encontraremos estos valores.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

16 / 48

2. Estimador MCO: funcionamiento e interpretacin


Interpretacin de las estimaciones: 1 = ,0624186.
Por cada minuto adicional de trabajo a la semana, una persona reduce
su sueo en 0.06 minutos.

En Stata, cmo calculamos esto? Hagamoslo con las 14 observaciones


y luego, ms realisticamente, con la base de datos original.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

17 / 48

2. Estimador MCO: funcionamiento e interpretacin

Con los datos originales.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

18 / 48

3. Propiedades de los estimadores MCO


Antes de establecer sus propiedades, debemos hacer algunos supuestos.
MLS1. Linealidad. Existe una relacin lineal entre la variable explicada y la
variable explicativa.
Supuesto con respecto a los parmetros y no a las variables
Ejemplos de modelos lineales
yi = o + 1 xi + ui
log yi = o + 1 xi + ui
yi = o + 1 xi2 + ui

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

19 / 48

3. Propiedades de los estimadores MCO

Ejemplos de modelos no lineales


yi = o + xi1 + ui
yi =

Marcela Perticara (Ingeniera Comercial)

o
+ ui
1 xi2

Econometra

2016

20 / 48

3. Propiedades de los estimadores MCO

MLS2. La muestra tomada de las variables (xi , yi ), i = 1, ..., N, debe ser


una muestra aleatoria que sigue el modelo de regresin lineal definido por
yi = o + 1 xi + ui .
MLS3. Los valores de la variable explicativa xi , i = 1, ..., N, no pueden ser
constantes. Esto es, tienen que tener varianza.
MLS4. E (ui |xi ) = 0, para todo i = 1, ..., N. O equivalentemente
E (yi |xi ) = 0 + 1 xi . A la expresin E (yi |xi ) = 0 + 1 xi se la denomina
recta de regresin poblacional.
MLS5. Homocedasticidad: la varianza del error es constante pra todas las
observaciones de la muesetra. Esto se escribe como V (ui |xi ) = 2 , para
todo i = 1, ..., N.
Tambin asumiremos ausencia de correlacin serial: Cov (ui , uj |xi ) = 0
para todo i=1, ...,N.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

21 / 48

3. Propiedades de los estimadores MCO


Las propiedades estadsticas de los estimadores MCO se derivan de la
manera en que este estimador se obtiene (su frmula) y los supuestos
que hemos hecho acerca de la estructura del modelo.
1. El estimador MCO es una variable aleatoria
Notar que que es funcin de variables aleatorias.
El estimador es la formula; la funcin de las variables; pero una vez
que lo hemos calculado con los datos disponibles, tenemos una
estimacin.
2. El estimador MCO ser insesgado. Se escribe
E (1 |x1 , x2, ..., xN ) = 1
E (0 |x1 , x2, ..., xN ) = 0
Para esta propiedad necesitamos los supuestos 1-4; noten que si el
supuesto 3 no se cumple, el estimador MCO no puede calcularse.
El supuesto 4 es importante para poder establecer que el estimador
MCO es insesgado.
Marcela Perticara (Ingeniera Comercial)

Econometra

2016

22 / 48

3. Propiedades de los estimadores MCO


3. La varianza de los estimadores MCO sern
V (1 |xi ) = PN

2
(N 1)Si2

x)2
PN
2
2

i=1 xi
V (0 |xi ) =
P
N N
)2
i=1 (xi x
i=1 (xi

Cuando mayor es la varianza del trmino de error 2 , mayor ser la


varianza de los estimadores.
Cuando mayor es la varianza de las xi , menor es la varianza de los
estimadores.
Mientras mayor sea N, menor ser la varianza tambin.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

23 / 48

3. Propiedades de los estimadores MCO

Las varianzas de 0 y 1 depende de los valores muestrales de xi y de


yi pero tambin del parmetro desconocido 2 .
Necesitamos un estimador para este parmetro desconocido; y puesto
que este parmetro es la varianza de ui podramos usar la varianza
muestral del error (o la media muestral de los errores al cuadrado ya
que la media es cero, segn el supuesto 4.
Pero no conocemos los errores... ya volveremos a esto ms adelante...

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

24 / 48

4. Valores Ajustados y residuos


Considere el modelo de regresin simple: yi = o + 1 xi + ui
Llamamos valores observados de la variable explicada a la variable
original: yi .
Llamamos valores ajustados de la variable explicada a los que
obtenemos al estimar el modelo: yi = 0 + 1 xi
La diferencia entre el valor observado y el valor ajustado de la variable
lo denominamos residuo de la regresin.
ui = yi yi = yi (0 + 1 xi )
Podemos ubicar a los valores observados, ajustados y residuos en un
grfico.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

25 / 48

4. Valores Ajustados y residuos

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

26 / 48

4. Valores Ajustados y residuos


Si volvemos al problema de la varianza del estimador MCO
2
2
V (1 |xi ) = PN
=
(N 1)Si2
)2
i=1 (xi x
Tenemos que estimar el parmetro descocido 2 . En principio dado
que V (u) = 2 , podramos usar la varianza muestral si el error fuera
observado.
Pero no son observados y slo podemos calcular la varianza muestral
de los residuos estimados. Esto es,
2

PN

V (ui ) =
=

i2
i=1 u

N 2

La divisin por N-2 es para hacer al estimador de la varianza insesgado.


Usando este valor estimado, se obtienen las varianzas de los
estimadores.
Marcela Perticara (Ingeniera Comercial)

Econometra

2016

27 / 48

4. Valores Ajustados y residuos

Las varianzas sern


V (1 |xi ) = PN

i=1 (xi

V (0 |xi ) =

x)2

2 N
xi 2
PN i=1
N i=1 (xi x)2

Se define el error estndar de la regresin como


=

Marcela Perticara (Ingeniera Comercial)

Econometra

2.

2016

28 / 48

4. Valores Ajustados y residuos

Para cada uno de los coeficientes estimados, se define el error estandar


como la raz cuadrada de la varianza de cada estimador.
Esto es,

SE (1 |xi ) = qP
N
)2
i=1 (xi x
qP
N
2

i=1 xi

SE (0 |xi ) = q P
N N
)2
i=1 (xi x
Volvamos al excel.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

29 / 48

4. Valores Ajustados y residuos


PROPIEDADES ALGEBRAICAS DE LOS ESTIMADORES MCO

Estas propiedades se derivan de la manera de calcular los estimadores,


no de los supuestos del modelo de regresin
P
La suma de los residuos estimados es siempre cero: N
i = 0
i=1 u

La covarianza
muestral entre la variable regresora x y los residuos ues

PN
cero: i=1 xi ui = 0

La recta de regresin pasa por el punto (


x , y).

La media de los valores ajustados coincide con la media de los valores


observados

La covarianza
muestral entre los valores ajustados y los residuos es
PN
cero: i=1 yi ui = 0
P
P
P
Se satisface que: N
yi2 = N
yi2 + N
i2 o alternativamente
i=1
i=1
i=1 u
PN
P
P
)2 = N
yi y)2 + N
i2
i=1 (yi y
i=1 (
i=1 u

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

30 / 48

4. Bondad de Ajuste

El punto (6) ya visto nos permitir definir una medida de bondad de


ajuste, qu tan bien lo estamos haciendo al explicar la variable de
inters.
La vamos a llamar R 2 o coeficiente de determinacin.
PN
Definamos la suma total de cuadrados como: STC = i=1 (yi y)2 .
PN
Definamos la suma cuadratica explicada como: SCE = i=1 (
y y)2
PN 2 i
Definamos la suma cuadratica residual como: SCR = i=1 ui

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

31 / 48

4. Bondad de Ajuste
Recuerden que habiamos dicho que la siguiente igualdad siempre se
cumplia: .
N
N
N
X
X
X
(yi y)2 =
(
yi y)2 +
ui2
i=1

i=1

i=1

Tenemos entonces que STC = SCE + SCR


Si dividimos por STC, nos queda:
STC
SCE
SCR
=
+
STC
STC
STC
1=

Marcela Perticara (Ingeniera Comercial)

SCR
SCE
+
STC
STC
Econometra

2016

32 / 48

4. Bondad de Ajuste

Definimos entonces el coeficiente de determinacin como:


SCE
SCR
R 2 = STC
= 1 STC
.
SCE
SCR
Si el R 2 = 0, es porque STC
= 0 o lo que es lo mismo, STC
=1
(SCR = SCT ). Esto es, la variable independiente no explica nada de la
variable dependiente.
SCE
SCR
Si el R 2 = 1, es porque STC
= 1 o lo que es lo mismo, STC
=0
(SCE = SCT ). Esto es, existe una relacin exacta entre la variable
dependiente y la independiente.

Voviendo al excel, veamos como calcular este estadstico.


R 2 = 0,014..., muy bajo! Esto es, las horas de trabajo explican muy
poco de la variacin en las horas de sueo.
Veamos todo en Stata pero con la base original.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

33 / 48

4. Bondad de Ajuste

Con los datos originales.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

34 / 48

5. Algunos temas de especificacin. Cambios de escala


En algunos contextos queremos cambiar la escala de las variables
dependientes e independientes, por que creemos que es mas facil
interpretar los coeficientes.
Ejemplo: en el modelo que tenemos en la transparencia anterior, el
sueo y el trabajo, estn en minutos, qu pasa si queremos
interpretarlos en horas...

No es necesario reestimar el modelo, los coeficientes pueden calcularse


de forma muy sencilla.
Consideremos el ejemplo del sueo; el modelo es
sue noi = 0 + 1 trabajoi + ui
Tanto sueo como trabajo estn medidos en minutos, qu pasa si
queremos medirlos en horas?
Marcela Perticara (Ingeniera Comercial)

Econometra

2016

35 / 48

5. Algunos temas de especificacin. Cambios de escala

Dividamos el modelo por 60 (para pasar de minutos a horas).


sue noi = 0 + 1 trabajoi + ui
Tanto sueo como trabajo estn medidos en minutos, qu pasa si
queremos medirlos en horas?
0
trabajoi
ui
sue noi
=
+ 1
+
60
60
60
60
sue no horasi = 0 + 1 trabajo horasi + ui

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

36 / 48

5. Algunos temas de especificacin. Cambios de escala

De la formula que nos queda, debiera ser evidente que


La ordenada al origen tiene que cambiar: recordemos que nos dice
cundo duerme alguien con cero trabajo. Si ahora el sueo est medido
en horas, nos debe decir cuntas horas duerme alguien con cero
trabajo. Entonces, la nueva ordenada al origen es la anterior, dividida
por 60. Esto es, 0 = 0 /60. Su error estndar tambin cambia de
igual manera.
La pendiente no cambia: me sigue diciendo en cuantas unidades
cambia el sueo por cada unidad de cambio de trabajo; es lo mismo.
Todas las variables estan divididas por 60, y tambien el error. Las
sumas totales quedan divididas por la misma constante (602 ), pero el
coerficiente de determinacin, permanece igual.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

37 / 48

5. Algunos temas de especificacin. Cambios de escala

Para resumir
Cuando multiplico o divido las variables dependiente y explicativa por
la misma constante, cambia la ordenada al origien, su error estndar,
pero no cambia ni la pendiente ni el coeficiente de determinacin.
En la pizarra podemos ver esto en las mismas frmulas.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

38 / 48

5. Algunos temas de especificacin. Cambios de escala


Ahora veamos el caso que solo cambiamos la variable explicativa;
veamoslo con otro ejemplo. Supogamos que tenemos un modelo en el
que los salarios son funcin de los meses de experiencia laboral
(cunto ha trabajado este individuo).
El modelo sera: salarioi = 0 + 1 experi + ui
Si multiplicamos y dividimos por 12 el trmino de experiencia:
salarioi = 0 + 12 1 experi /12 + ui
Nos queda: salarioi = 0 + 1 experi + ui
Debiera ser evidente que cambia la variable que dividimos
(experiencia), y cambia la pendiente.
La nueva pendiente ahora ser la antigua multiplicada por 12!. Su error
estndar tambin quedar multiplicado por 12. Todo el resto se
mantiene!

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

39 / 48

5. Algunos temas de especificacin. Cambios de escala

Veamoslo con datos...

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

40 / 48

5. Algunos temas de especificacin. Cambios de escala


Si ahora hacemos lo mismo pero con la variable dependiente
solamente. Ej. tenemos salario por hora, lo queremos por da.
Multiplicamos por 8 (tiempo completo) la variable dependiente.
salarioi 8 = 0 8 + 1 8 experi + 8 ui
Razonemos.
Antes la ordenanda al origen nos deca cuanto por hora ganaba alguien
sin experiencia, ahora nos dice cunto gana por da... Queda
multiplicada por 8
La pendiente nos deca cuanto ms por hora ganaba alguien con un
ao adicional de experiencia, ahora nos dice cunto ms por cada da.
Queda tambin multiplicada por 8.
Los errores estandares de ambas quedan multiplicados por 82 (por
qu?). Como la SCR queda multiplicada y la SCT tambin, el
coeficiente de determinacin queda igual.
Marcela Perticara (Ingeniera Comercial)

Econometra

2016

41 / 48

5. Algunos temas de especificacin. Cambios de escala

Veamoslo con el mismo ejemploVeamoslo con el mismo ejemplo

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

42 / 48

5. Algunos temas de especificacin. Uso de logaritmos


Se pueden aplicar a las variables dependientes e independientes.
CASO 1. TODAS LAS VARIABLESL EN NIVELES (es lo que
hemos estado viendo)
sue noi = 0 + 1 trabajoi + ui
Interpretacin de 1 : en cuantas unidades cambia la variable
dependiente ante un cambio de una unidad en la variable explicativa.
CASO 2. LA VARIABLE DEPENDIENTE EN LOGARITMOS
log (sue no)i = 0 + 1 trabajoi + ui
Interpretacin de 1 : si la variable explicativa aumenta en una unidad,
la variable dependiente aumenta en un 1 %.
Marcela Perticara (Ingeniera Comercial)

Econometra

2016

43 / 48

5. Algunos temas de especificacin. Uso de logaritmos


CASO 3. La variable explicativa aparece en logaritmos
sue noi = 0 + 1 log (trabajoi ) + ui
Interpretacin de 1 : si la variable explicativa se incrementa en un 1 %,
la variable dependiente aumenta en un 1 /100 unidades.
CASO 4. Ambas variables en logaritmos
log (sue noi ) = 0 + 1 log (trabajoi ) + ui
Interpretacin de 1 : si la variable explicativa se incrementa en un 1 %,
la variable dependiente aumenta en 1 %. unidades.
Veamos un ejemplo con Stata.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

44 / 48

5. Algunos temas de especificacin. Cambios de escala

Modelo en niveles (caso I)

Interpretacin: Por cada ao adicional de educacin, el salario horario


aumenta en 0.35 dlares.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

45 / 48

5. Algunos temas de especificacin. Cambios de escala

Modelo log-nivel (caso 2)

Interpretacin: Por cada ao adicional de educacin, el salario horario


aumenta en un 6 %.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

46 / 48

5. Algunos temas de especificacin. Cambios de escala

Modelo nivel-log (caso 3)

Interpretacin: Cuando la educacin aumenta en 1 %, el salario horario


aumenta en 0.034 dlares. O uno puede decir, si la educacin
aumentara en 10 % el salario horario aumentara en 0.34 dlares.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

47 / 48

5. Algunos temas de especificacin. Cambios de escala

Modelo log-log (caso 4)

Interpretacin: Cuando la educacin aumenta en 1 %, el salario horario


aumenta en 0.66 %.

Marcela Perticara (Ingeniera Comercial)

Econometra

2016

48 / 48

Vous aimerez peut-être aussi