Vous êtes sur la page 1sur 23

Pregunta 1

Parte i
y= + x+ e

De acuerdo al modelo de regresin lineal simple:


Si =0 la regresin queda expresada como:

y=x +e

Parte ii
Sabemos que corresponde al trmino constante e intercepto de la recta de regresin, por
lo tanto, si =0 la recta de regresin se inicia en el origen del grfico, donde y es la
variable dependiente y x la variable independiente.

-5

Fitted values
5
10

15

20

Grficamente:

-1

Parte iii
Primero desarrollamos la suma de cuadrados:
N

S ( ) = ( y i x i)

i=1

( y 2 xi y i+ x ) = y 2 x i y i +
i=1

2
i

Ahora, tomando los valores


cada sumatoria obtenemos:
N

Para

2
i

i=1

x={1,2,3,4,5,6 }

y 2i =42+62+72+72+92+112=352
i=1

2
i

i=1

x 2i
i=!

y={4,6,7,7,9,11 } y reemplazando en

Para 2 x i y i=2 (14+ 26+37+ 47+59+611)=352


i=1

Para

2 x 2i =12+22+32+42+52+62=91 2
i=1

S ( )=352352 + 91 2
Para encontrar el mnimo valor aproximado, minimizaremos S ( ) c.r a
min S( )=352352 +91 2
S( )
=352+182 =0

^= 352 =1,9340
182
Grficamente:

Parte iv
Con =0 sabemos que
N

S ( ) = ( y i x 2i )2
i=1

S( )
2
=2 ( y i x i ) xi =0 x i = x i y i

i=1
i=1
i =1
N

xi y i

= i=1N

x 2i
i=1

Reemplazando los valores que obtuvimos anteriormente:


^= 176 =1,9340
91
Vemos que mediante el mtodo de MCO minimizamos el cuadrado de los errores c.r al
valor de , que es exactamente lo que hicimos en el ejercicio anterior mediante el
desarrollo de la sumatoria y el posterior reemplazo de los valores entregados por enunciado.
Parte v
Para ubicar el punto ( x , y ) , calculamos el promedio de los datos de
forma:
x={1,2,3,4,5,6 } x=1+2+3+4 +5+66=3,5
y={4,6,7,7,9,11 } y =4 +6+7+ 7+9+116=7,33
Tenemos que

y i=x i , entonces:

y 1=1,9341=1,934 ; y 2 =1,9342=3,868 ; y 3=1,9343=5,802


y 4 =1,9344=7,736 ; y 5=1,9345=9,67 ; y 6=1,9346=11,604

Grficamente:

x e

y , de la

Donde la lnea roja vertical corresponde a x =3,5 y la lnea roja horizontal es


y =7,33 . Del grfico vemos que los promedios de las variables estn sobreestimados,
pues el modelo de regresin lineal simple para minimizar los errores no pasa por el punto
( x , y ) , ya que =0 , donde la recta graficada en la parte ii no coincide con el punto
( x , y ) , por lo que podemos concluir tambin que E(e ) 0.
Parte vi
N

e^i= ( y i^y i)
El residuo de mnimos cuadrados corresponde a:

i=1
N

es decir, restando al

i=1

del tem anterior, el

del conjunto

y={4,6,7,7,9,11 } .

e^ 1=41,934=2,066 ; e^ 2=63,868=2,132; e^ 3=75,802=1,198


e^ 4=77,736=0,736 ; e^ 5 =99,67=0,67 ; e^ 6=1111,604=0,604
e^i= 2,066+2,132+1,1980,7360,670,604=3,386
N


i=1

Parte vii
Tenemos que:

x i e^ i=12,066+22,132+31,19840,73650,6760,604=
N

0,006

i=1

Pregunta 2
a) Conocemos el valor de , entonces para

y= + x+ e

Despejando e , aplicando sumatoria y elevando al cuadrado:


i
y i x

e =
2
i

i=1

i=1

e2i
i=1

=2 ( y i x i ) x i=0
i=1

i =1

i =1

x i = x i y i x i
2

i=1

xi y i xi

^= i=1

i=1

xi2
i=1

xi ( + x i +e ) xi

^= i=1

i=1

xi2
i=1

i=1

i=1

xi + x 2i + x i e i xi

^= i=1

i=!

x2i
i=1

^=

n xi + x 2i + xi e in x i
i=1

i=1

x2i
i=1

xi ei

^= + i =1
N

x2i
i=1

Ahora, aplicamos varianza de la siguiente forma:


N

x i ei

var ( ^ ) =var ( )+ var ( i=1N

2
i

i=1

var ( ^ ) =0+

1
N

( )

var ( x i e i)
2

x 2i

i =1

i=1

ei
N

i=1

var ( ^ ) =

1
N

( )
x 2i
i=1

ei
N

i=1

var
var ( ^ ) =

x 2i var
i=1

b) No conocemos el valor de , entonces para


estimador de , de la forma:
xi x

i=1

( x i x )( y i y )

^= i=1

x i x

i=1
N

(x i x ) e I

^= + i =1

Aplicando varianza:
2
var ( ^ ) =E [ ^E ( ^ ) ]
Asumiendo
2
var ( ^)= [ ^ ]

x i x

2
N

2
i=1

(x ix )e I
i=1

var ( ^ ) =

insesgado:

y= + x+ e , trabajamos con el

x ix

i=1
N

(x i x )2 ei2

var ( ^ ) = i=1

x ix

i=1

(x i x )2 E [ e 2i xi ]

var ( ^ ) = i=1

Dado que por propiedad de MCO se cumple que


N

2
E [ e x i ]= [ ( ei e i) x i ]
2
i

i=1

Por lo tanto,
xi x

i=1
N

[ ( e iei )2x i ]

var ( ^ ) = i=1

Realizando la comparacin:
2e
N

2e
2
2 x

xi
i=1

E [ ei xi ] =0 podemos definir entonces

x x i
2

i=1

Tenemos que

x ix

siempre ser menor que

=
2
x

x 2i
i=1

, por lo tanto, podemos

i=1

no conocido es mayor, mientras que con conocido


^
resulta menor. Esto se explica porque al no depender de otro estimador no incluye el
concluir que la varianza con

riesgo de ste, contribuyendo a una varianza menor. Sin embargo, si depende de otro
estimador resulta ms voltil su valor, generando una mayor varianza.

Pregunta 3
Calculando la frmula de
residuo podemos expresar

R2 , tenemos que de las definiciones de valor esperado y el


y i como:

y i=^ + ^ x i + ^
i=E [ ^
y ix i ] + ^
i = ^
y i + ^i
Luego,
y i y i= ^
yi y i+ ^i
y i y i

Elevando al cuadrado,

Aplicando sumatoria

y i y i

i=!

y i y i

i=!

y i y i

y i y i

i=!

( ^y i yi )2

1= i=1

Donde tenemos

SE= ( ^
y i y i )2 , la suma explicada, que corresponde a la suma de las
i=1

y i respecto de su media.
desviaciones al cuadrado de los valores de prediccin de y i , ^
y i y i

En tanto que
, la suma total correspondiente a la suma de los cuadrados de las
N
ST =
i=!

desviaciones de

y i respecto a su media. Finalmente,

suma de los cuadrados de los residuos. Luego,


1=

SE SR
+
ST ST

R 2=

SE
ST

SR= ^i
i=!

entonces:

, suma residual, la

y i y i

i=!

R 2=1

^i2

SR
=1 i=!

ST

Parte i
Por definicin sabemos que:
^y i= ^ 1 + ^ 2 x i (1)
Adems,

y = ^ 1 + ^ 2 x (2)

Restando ( 2 )( 1 )

^y i y = ^2 ( x i x )

Elevando al cuadrado

2
2
2
( ^y i y ) = ^ 2 ( x ix )
N

Aplicando sumatoria
Del clculo para la frmula de

( ^y i y ) = ^ 22 ( xi x ) 2
2

i=1

i =1

R2 sabemos que
y i y i

y i y i

i=!
N

( ^y i yi ) 2

R2= i=1

^
2 una forma alternativa de expresarlo1 es:

Como no conocemos
N

( x ix )( y i y )
i=1

( xi x )2

S xy
S2x

i=1

^2=
Entonces,

1 Stock & Watson, Introduccin a la Econometra. 3ra edicin. Pg. 83

y i y i

y i y i

( x ix )( y i y )
N

i=1

y i y i

( x ix )( y i y )
N

i=1

y i y i

i=!
N

( ^y i yi ) 2

R2= i=1

R 2=r 2xy
Parte ii
a)

x sobre

y :

Calculamos la varianza de los valores estimados de

x:

1
SE= ( ^
xi ^x )2
N I=1
Donde encontramos que

x i= ^x pues
^

x= 0 + 1 y i +e , ya que

0+ 1 y i=^
x i , por lo

tanto,
x i=^
x i+ e
N

x i = ^
x i+ ei
i=1

i=1

i=!

Asumiendo que se cumple,

e i=0
i=1

entonces,

xi ^
x
= i xi = ^
xi
n n

Luego,
x^i ^x

N
1
SE=
n i=1
Y sabemos que:
0= ^x y

S xy
S

2
y

1=

S xy
S 2y

Reemplazando
2

N
n
S xy S xy
S
S
1
1
1 S
^
^
R = x y 2 + 2 y x = 2 xy 2 ( y i y )2= n 2 xy 2 S 2y = xy2
n i =1
n i =1 S y S y
n Sy Sy
Sy Sy
Sy

R 2x =r 2
b)

sobre

x:

Calculamos la varianza de los valores estimados de

x:

SE=

1
( ^y ^y )2
N I=1 i

^
y i= ^y

Donde

pues

y= 0 + 1 x i +e , ya que

0+ 1 x i=^
y i , por lo tanto,

y i=^
y i +e
N

y i= ^
y i + e i
i=1

i=1

i=!

Asumiendo que se cumple,

e i=0
i=1

entonces,

yi ^
y
= i y i= ^
yi
n n

Luego,
^
y i ^y

N
1
SE=
n i=1
Y sabemos que:
S
S
0= ^y x yx2 1= yx2
Sx
Sx
Reemplazando
2
2
2
N
n
S yx S yx
S 2yx
1
1
1 S yx 2 S yx
2
^
^
R = y x 2 + 2 x y = 2 2 ( x i x ) = n 2 2 S x = 2
n i =1
n i=1 S x S x
n Sx Sx
Sx Sx
Sx

En efecto, la regresin de

x sobre

R 2y =r 2
y , y viceversa, resulta en el mismo

R2

Pregunta 4
Parte i
Mediante el comando tabstat height,s(median) encontramos que en el percentil 50 se
encuentra la mediana y corresponde a 67 pulgadas.

Parte ii
1. Para estimar las ganancias promedio condicionado a una altura mxima de 67
pulgadas, usamos el comando sum earnings if height<=67, donde el promedio
resulta en $44488,44 dlares.

2. Realizamos esta estimacin condicionado a una altura superior a 67 pulgadas,


mediante el comando sum earnings if height>67, donde el promedio resulta en
$49987,88 dlares.

3. Mediante el comando ttest earnings, by(may67) resulta la siguiente tabla, los


trabajadores altos ganan 49987,88 dlares, mientras que los bajos ganan 44488,44
donde podemos concluir una diferencia de 5499,44 menos para los trabajadores
bajos. Respecto al intervalo de confianza, obtuvimos [ 4707,007 ; 6291,873 ] .

Parte iii
Para construir el grfico de dispersin usamos el comando tw (scatter earnings height),
considerando que en la nota de documentacin del estudio se enuncia que los ingresos
laborales estn presentados en 23 soportes para los que se estimaron un valor de los
ingresos medios basados en la informacin obtenida de la poblacin actual, valores que
luego se asignaron a los trabajadores de acuerdo a su soporte.

Parte iv
1. Mediante el comando reg earnings height obtuvimos la regresin, donde la
pendiente estimada es 707,6716.

2. Dado el modelo de regresin y= + x+ e asumiendo que E(e )=0


encontrado en la tabla, =512,7336 y =707,6716 . Entonces:
Para 65 pulgadas

y=512,7336+707,671665=45485,92

Para 67 pulgadas

y=512,7336+707,671667=46901,264

Para 70 pulgadas

y=512,7336+707,671670=49024,28

y con lo

Parte v
Sabemos que 1 pulgada equivale a 0,0254 metros, entonces usamos el comando gen
centmetros=height*0.0254 para convertir la estatura y luego reg earnings centmetros para
obtener la siguiente regresin:

1. La pendiente estimada corresponde a 27861,09

2. El intercepto estimado es -512,7365


3. El coeficiente de determinacin R2=0,0109
4. El error estndar resulta 1987,765

Parte vi
Corremos la regresin con el comando reg earnings height if sex==0 obteniendo:

1) La pendiente estimada corresponde a 511,2222


2) De acuerdo a la tabla superior, podemos predecir que en una submuestra de
mujeres que presenten una pulgada ms alta su ganancia ir en la misma
direccin, pues la pendiente resulta positiva, dando cuenta que el aumento
de una pulgada incrementara el ingreso en 511,2222 dlares.
Parte vii
Corremos la regresin mediante el comando reg earnings height if sex==1, con lo que
obtenemos:

1. La pendiente estimada corresponde a 1306,86


2. Nuevamente, acorde a la tabla superior, podemos predecir que en una submuestra de
hombres que presenten una pulgada ms alta, su ganancia ira tambin en la misma
direccin, pues la pendiente resulta positiva. Por lo tanto, el aumento marginal de
una pulgada, incrementa el ingreso en 1306, 86 dlares.
Parte viii
De acuerdo a la descripcin del documento sobre Earnings and Height, podramos pensar
que la altura efectivamente est correlacionada a otros factores distintos de ingresos, por
ejemplo, la clase de trabajador en cuanto al sector donde se desenvuelve, el tipo de
ocupacin, zona geogrfica donde reside, pertenencia con alguna etnia, e incluso factores
como alimentacin, nivel educativo, entorno familiar, entre otros. En el error expresado en
la regresin podramos encontrar estos factores y otros ms, que por motivos del objetivo
de la investigacin no fueron controlados, ni estudiados.

Pregunta 52
Entre las propiedades de MCO se considera que la consistencia es una condicin mnima
que debe cumplir el estimador. Intuitivamente, lo anterior significa que a medida que
n la funcin de densidad del estimador converge al valor del parmetro. Es decir,
para :
p lim ^2= 2
n

Para las simulaciones ocupamos un n suficientemente grande lo que nos permite generar
una normal para los componentes de la regresin lineal, luego mediante comandos vistos en
clases pudimos simular para 10.000 observaciones la consistencia para y .
Luego, mediante el comando matrix construimos una matriz con 100 medias para cada
tamao de muestra, y con el comando svmat que toma las columnas como variables
construimos el grfico para distintos , obteniendo grficamente:

2 El procedimiento se encuentre en el Do File.

10

20

30

40

Consistencia Alfa

2.9

3.1

3.2

kdensity Alfa1
kdensity Alfa3

3.3

3.4

kdensity Alfa2

10

20

30

40

Consistencia Beta

4.7

4.8

4.9

kdensity Beta1
kdensity Beta31

5.1

5.2

kdensity Beta21

Pregunta 6
De acuerdo al enunciado con probabilidad

p = 1

entonces para un modelo de regresin lineal simple


N

i=1

i=1

e 2i = [ yi x i 1 p 2 ( 1 p ) ]

y con probabilidad

( 1 p ) = 2 ,

y i= + x i +e , tenemos que:

e2i

=2 ( y i x i 1 p 2 ( 1p ) ) x i=0

i=1

i=1

x i 2 ( 1 p ) x i
i=1

x = x i y i 1 p
i=1

2
i

i =1

i=1

Luego,
p+ 2 ( 1 p ) ) x i
^= xi y i ( 1
x 2i
x 2i
Para simplificar la notacin diremos que

R=( 1 p + 2 ( 1 p ) ) , lo que resulta

^= xi y i R x i
x 2i x 2i
y i=R+ xi + ei , con lo que

Con esto nos queda que

queda expresado como:

x i ( R+ xi + ei ) R x
i=1
i

2
2
xi
xi
^=

R x i x i xi e i
R xi
^= i =1 + i=1 + i =!

2
2
2
x i x i x i x 2i
N

xi ei

^= + i=!

x2i

Trmino que por definicin es insesgado, por lo cual:

E [ ^ ] =E +

xi ei
x2i

[ ]
N

Ya que por propiedades de MCO

E [ ui|x i ] =0 , es decir,

xi e i

i=!

x 2i

=0

Con lo anterior, ahora podemos calcular la varianza,

x 2i

var ( ^ ) =var +

x i ei

x 2i

x 2i var (ei )

Tal como encontramos en la pregunta 2, a medida que


menor, y para un
var (e i)
var ( ^ ) =
x 2i

x 2i

crece la varianza resulta

suficientemente grande encontramos que la expresin

posee la mnima varianza.

Vous aimerez peut-être aussi