Académique Documents
Professionnel Documents
Culture Documents
Parte i
y= + x+ e
y=x +e
Parte ii
Sabemos que corresponde al trmino constante e intercepto de la recta de regresin, por
lo tanto, si =0 la recta de regresin se inicia en el origen del grfico, donde y es la
variable dependiente y x la variable independiente.
-5
Fitted values
5
10
15
20
Grficamente:
-1
Parte iii
Primero desarrollamos la suma de cuadrados:
N
S ( ) = ( y i x i)
i=1
( y 2 xi y i+ x ) = y 2 x i y i +
i=1
2
i
Para
2
i
i=1
x={1,2,3,4,5,6 }
y 2i =42+62+72+72+92+112=352
i=1
2
i
i=1
x 2i
i=!
y={4,6,7,7,9,11 } y reemplazando en
Para
2 x 2i =12+22+32+42+52+62=91 2
i=1
S ( )=352352 + 91 2
Para encontrar el mnimo valor aproximado, minimizaremos S ( ) c.r a
min S( )=352352 +91 2
S( )
=352+182 =0
^= 352 =1,9340
182
Grficamente:
Parte iv
Con =0 sabemos que
N
S ( ) = ( y i x 2i )2
i=1
S( )
2
=2 ( y i x i ) xi =0 x i = x i y i
i=1
i=1
i =1
N
xi y i
= i=1N
x 2i
i=1
y i=x i , entonces:
Grficamente:
x e
y , de la
e^i= ( y i^y i)
El residuo de mnimos cuadrados corresponde a:
i=1
N
es decir, restando al
i=1
del conjunto
y={4,6,7,7,9,11 } .
i=1
Parte vii
Tenemos que:
x i e^ i=12,066+22,132+31,19840,73650,6760,604=
N
0,006
i=1
Pregunta 2
a) Conocemos el valor de , entonces para
y= + x+ e
e =
2
i
i=1
i=1
e2i
i=1
=2 ( y i x i ) x i=0
i=1
i =1
i =1
x i = x i y i x i
2
i=1
xi y i xi
^= i=1
i=1
xi2
i=1
xi ( + x i +e ) xi
^= i=1
i=1
xi2
i=1
i=1
i=1
xi + x 2i + x i e i xi
^= i=1
i=!
x2i
i=1
^=
n xi + x 2i + xi e in x i
i=1
i=1
x2i
i=1
xi ei
^= + i =1
N
x2i
i=1
x i ei
2
i
i=1
var ( ^ ) =0+
1
N
( )
var ( x i e i)
2
x 2i
i =1
i=1
ei
N
i=1
var ( ^ ) =
1
N
( )
x 2i
i=1
ei
N
i=1
var
var ( ^ ) =
x 2i var
i=1
i=1
( x i x )( y i y )
^= i=1
x i x
i=1
N
(x i x ) e I
^= + i =1
Aplicando varianza:
2
var ( ^ ) =E [ ^E ( ^ ) ]
Asumiendo
2
var ( ^)= [ ^ ]
x i x
2
N
2
i=1
(x ix )e I
i=1
var ( ^ ) =
insesgado:
y= + x+ e , trabajamos con el
x ix
i=1
N
(x i x )2 ei2
var ( ^ ) = i=1
x ix
i=1
(x i x )2 E [ e 2i xi ]
var ( ^ ) = i=1
2
E [ e x i ]= [ ( ei e i) x i ]
2
i
i=1
Por lo tanto,
xi x
i=1
N
[ ( e iei )2x i ]
var ( ^ ) = i=1
Realizando la comparacin:
2e
N
2e
2
2 x
xi
i=1
x x i
2
i=1
Tenemos que
x ix
=
2
x
x 2i
i=1
i=1
riesgo de ste, contribuyendo a una varianza menor. Sin embargo, si depende de otro
estimador resulta ms voltil su valor, generando una mayor varianza.
Pregunta 3
Calculando la frmula de
residuo podemos expresar
y i=^ + ^ x i + ^
i=E [ ^
y ix i ] + ^
i = ^
y i + ^i
Luego,
y i y i= ^
yi y i+ ^i
y i y i
Elevando al cuadrado,
Aplicando sumatoria
y i y i
i=!
y i y i
i=!
y i y i
y i y i
i=!
( ^y i yi )2
1= i=1
Donde tenemos
SE= ( ^
y i y i )2 , la suma explicada, que corresponde a la suma de las
i=1
y i respecto de su media.
desviaciones al cuadrado de los valores de prediccin de y i , ^
y i y i
En tanto que
, la suma total correspondiente a la suma de los cuadrados de las
N
ST =
i=!
desviaciones de
SE SR
+
ST ST
R 2=
SE
ST
SR= ^i
i=!
entonces:
, suma residual, la
y i y i
i=!
R 2=1
^i2
SR
=1 i=!
ST
Parte i
Por definicin sabemos que:
^y i= ^ 1 + ^ 2 x i (1)
Adems,
y = ^ 1 + ^ 2 x (2)
Restando ( 2 )( 1 )
^y i y = ^2 ( x i x )
Elevando al cuadrado
2
2
2
( ^y i y ) = ^ 2 ( x ix )
N
Aplicando sumatoria
Del clculo para la frmula de
( ^y i y ) = ^ 22 ( xi x ) 2
2
i=1
i =1
R2 sabemos que
y i y i
y i y i
i=!
N
( ^y i yi ) 2
R2= i=1
^
2 una forma alternativa de expresarlo1 es:
Como no conocemos
N
( x ix )( y i y )
i=1
( xi x )2
S xy
S2x
i=1
^2=
Entonces,
y i y i
y i y i
( x ix )( y i y )
N
i=1
y i y i
( x ix )( y i y )
N
i=1
y i y i
i=!
N
( ^y i yi ) 2
R2= i=1
R 2=r 2xy
Parte ii
a)
x sobre
y :
x:
1
SE= ( ^
xi ^x )2
N I=1
Donde encontramos que
x i= ^x pues
^
x= 0 + 1 y i +e , ya que
0+ 1 y i=^
x i , por lo
tanto,
x i=^
x i+ e
N
x i = ^
x i+ ei
i=1
i=1
i=!
e i=0
i=1
entonces,
xi ^
x
= i xi = ^
xi
n n
Luego,
x^i ^x
N
1
SE=
n i=1
Y sabemos que:
0= ^x y
S xy
S
2
y
1=
S xy
S 2y
Reemplazando
2
N
n
S xy S xy
S
S
1
1
1 S
^
^
R = x y 2 + 2 y x = 2 xy 2 ( y i y )2= n 2 xy 2 S 2y = xy2
n i =1
n i =1 S y S y
n Sy Sy
Sy Sy
Sy
R 2x =r 2
b)
sobre
x:
x:
SE=
1
( ^y ^y )2
N I=1 i
^
y i= ^y
Donde
pues
y= 0 + 1 x i +e , ya que
0+ 1 x i=^
y i , por lo tanto,
y i=^
y i +e
N
y i= ^
y i + e i
i=1
i=1
i=!
e i=0
i=1
entonces,
yi ^
y
= i y i= ^
yi
n n
Luego,
^
y i ^y
N
1
SE=
n i=1
Y sabemos que:
S
S
0= ^y x yx2 1= yx2
Sx
Sx
Reemplazando
2
2
2
N
n
S yx S yx
S 2yx
1
1
1 S yx 2 S yx
2
^
^
R = y x 2 + 2 x y = 2 2 ( x i x ) = n 2 2 S x = 2
n i =1
n i=1 S x S x
n Sx Sx
Sx Sx
Sx
En efecto, la regresin de
x sobre
R 2y =r 2
y , y viceversa, resulta en el mismo
R2
Pregunta 4
Parte i
Mediante el comando tabstat height,s(median) encontramos que en el percentil 50 se
encuentra la mediana y corresponde a 67 pulgadas.
Parte ii
1. Para estimar las ganancias promedio condicionado a una altura mxima de 67
pulgadas, usamos el comando sum earnings if height<=67, donde el promedio
resulta en $44488,44 dlares.
Parte iii
Para construir el grfico de dispersin usamos el comando tw (scatter earnings height),
considerando que en la nota de documentacin del estudio se enuncia que los ingresos
laborales estn presentados en 23 soportes para los que se estimaron un valor de los
ingresos medios basados en la informacin obtenida de la poblacin actual, valores que
luego se asignaron a los trabajadores de acuerdo a su soporte.
Parte iv
1. Mediante el comando reg earnings height obtuvimos la regresin, donde la
pendiente estimada es 707,6716.
y=512,7336+707,671665=45485,92
Para 67 pulgadas
y=512,7336+707,671667=46901,264
Para 70 pulgadas
y=512,7336+707,671670=49024,28
y con lo
Parte v
Sabemos que 1 pulgada equivale a 0,0254 metros, entonces usamos el comando gen
centmetros=height*0.0254 para convertir la estatura y luego reg earnings centmetros para
obtener la siguiente regresin:
Parte vi
Corremos la regresin con el comando reg earnings height if sex==0 obteniendo:
Pregunta 52
Entre las propiedades de MCO se considera que la consistencia es una condicin mnima
que debe cumplir el estimador. Intuitivamente, lo anterior significa que a medida que
n la funcin de densidad del estimador converge al valor del parmetro. Es decir,
para :
p lim ^2= 2
n
Para las simulaciones ocupamos un n suficientemente grande lo que nos permite generar
una normal para los componentes de la regresin lineal, luego mediante comandos vistos en
clases pudimos simular para 10.000 observaciones la consistencia para y .
Luego, mediante el comando matrix construimos una matriz con 100 medias para cada
tamao de muestra, y con el comando svmat que toma las columnas como variables
construimos el grfico para distintos , obteniendo grficamente:
10
20
30
40
Consistencia Alfa
2.9
3.1
3.2
kdensity Alfa1
kdensity Alfa3
3.3
3.4
kdensity Alfa2
10
20
30
40
Consistencia Beta
4.7
4.8
4.9
kdensity Beta1
kdensity Beta31
5.1
5.2
kdensity Beta21
Pregunta 6
De acuerdo al enunciado con probabilidad
p = 1
i=1
i=1
e 2i = [ yi x i 1 p 2 ( 1 p ) ]
y con probabilidad
( 1 p ) = 2 ,
y i= + x i +e , tenemos que:
e2i
=2 ( y i x i 1 p 2 ( 1p ) ) x i=0
i=1
i=1
x i 2 ( 1 p ) x i
i=1
x = x i y i 1 p
i=1
2
i
i =1
i=1
Luego,
p+ 2 ( 1 p ) ) x i
^= xi y i ( 1
x 2i
x 2i
Para simplificar la notacin diremos que
^= xi y i R x i
x 2i x 2i
y i=R+ xi + ei , con lo que
x i ( R+ xi + ei ) R x
i=1
i
2
2
xi
xi
^=
R x i x i xi e i
R xi
^= i =1 + i=1 + i =!
2
2
2
x i x i x i x 2i
N
xi ei
^= + i=!
x2i
E [ ^ ] =E +
xi ei
x2i
[ ]
N
E [ ui|x i ] =0 , es decir,
xi e i
i=!
x 2i
=0
x 2i
var ( ^ ) =var +
x i ei
x 2i
x 2i var (ei )
x 2i