Vous êtes sur la page 1sur 11

ESCUELA COLOMBIANA DE INGENIERÍA JULIO GARAVITO.

ECONOMETRIA 1
PRESENTADO A: Alvaro Chaves.
PRESENTADO POR: Sergio Alejandro Angulo, Ivan Andres Hernandez

TALLER 1

1. Utilizando la base de datos eaef21 sobre ingresos y escolaridad:


a. Encuentre el ingreso promedio por hora (EARNINGS) y la experiencia laboral promedio (EXP) de
la muestra.

El ingreso promedio por hora (EARNINGS) de la muestra es de 19.63$.

La experiencia laboral promedio (EXP) de la muestra es de 16.90 años.

b. Cuantas personas presentan una experiencia laboral menor a 5 años?. Cuál es la mayor
experiencia laboral en la muestra?

La máxima experiencia laboral de la muestra es 23.55 años, y son 8 personas de 540 las que
presentan una experiencia laboral menor a 5 años.
c. Estime por M.C.O los siguientes modelos de regresión simple:

1. 𝑆𝑖 = 𝛽0 + 𝛽1 𝐸𝑋𝑃𝑖 + 𝑢𝑖

̂1 nos dice que un incremento de un año de la experiencia laboral


En este modelo el parámetro 𝛽
̂0 me indica que si los años de experiencia
disminuye 0,119 años de escolaridad, mientras que 𝛽
laboral fueran 0, los años de escolaridad de los individuos serian 15.69 años.

2. 𝑆𝑖 = 𝛽0 + 𝛽1 ln⁡(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖

Para hacer la regresión simple de este modelo, se debe generar una nueva variable llamada LNEXP
que corresponde al logaritmo natural de la experiencia laboral.
El parámetro 𝛽 ̂1 nos dice que un aumento porcentual del 1% de la experiencia laboral disminuye
0,964 años de escolaridad, además 𝛽 ̂0 me dice que si el porcentaje de los años de experiencia
laboral fuera 0%, los años de escolaridad de los individuos serian 16.35 años.

3. ln⁡(𝑆𝑖 ) = 𝛽0 + 𝛽1 ⁡(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖

El parámetro 𝛽̂1 nos dice que los años de escolaridad disminuyen en un 0.77% por un aumento de
̂0 me dice que el porcentaje de los años de escolaridad
un año de Experiencia laboral, por otra parte 𝛽
serian de 2,73%, si los años de experiencia laboral de los individuos fueran 0 años

4. ln⁡(𝑆𝑖 ) = 𝛽0 + 𝛽1 ln⁡(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖
̂1 nos dice que los años de escolaridad disminuyen en un 0,05% por un aumento del
El parámetro 𝛽
̂0 me dice que el porcentaje de los años de
1% en los años de experiencia laboral, por otra parte 𝛽
escolaridad serian de 2,76%, si el porcentaje de los años de experiencia laboral de los individuos
fuera 0%.

Estime por Mínimos Cuadrados Ordinarios (M.C.O) los anteriores modelos e interprete los
parámetros estimados. Adicionalmente, verifique si el modelo tiene un buen ajuste y lleve a cabo
una prueba de significancia estadística a partir de la distribución t de Student para la pendiente
estimada del modelo. Comente sobre el resultado.

1. 𝑆𝑖 = 15.69767 − 0.11𝐸𝑋𝑃𝑖 + 𝑢𝑖
2. 𝑆𝑖 = 16.35 − 0.9646ln⁡(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖
3. ln(𝑆𝑖 ) = 2.73 − 0.0077(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖
4. ln⁡(𝑆𝑖 ) = 2.74 − 0.0591ln⁡(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖

De acuerdo al ajuste de bondad el 4.75% de la variable S esta explicada por la varianza de EXP.

El 2.01% de la varianza de S esta explicada por la varianza de LNEXP

El 4.74% de la varianza de LNS esta explicada por EXP

El 1.43% de la varianza de LNS esta explicada por LNEXP

En todos los casos el valor de t está dentro del intervalo de confianza, por lo tanto EXP explica S.

d. En cada modelo estimado encuentre el valor esperado condicionado del empleo si 𝐸𝑋𝑃𝑖 = 2.
e. Lleve a cabo paso a paso la prueba F de significancia de la pendiente estimada.

1. 𝑆𝑖 = 𝛽0 + 𝛽1 𝐸𝑋𝑃𝑖 + 𝑢𝑖
Prueba de Hipotesis

H0: 𝛽1 = 0 , Experiencia Laboral no significativa y diferente de cero. EXP no ayuda a explicar S

H1: 𝛽1 ≠ 0

A hora calcularemos F

𝑅 2 /(𝑘 − 1) 0,0475
𝐹= 2 = = 26,82
(1 − 𝑅 )/(𝑛 − 𝑘) (1 − 0,0475)/(540 − 2)

𝑉1 = 1, Grados de libertad del numerador

𝑉2 = 538, Grados de libertad del denominador

𝐹𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜 ≅ 3,86

Dado que
𝐹𝑐𝑎𝑙𝑐 > 𝐹𝑐𝑟𝑖𝑡

26,82 > 3,86

Se rechaza H0.

2. 𝑆𝑖 = 𝛽0 + 𝛽1 ln⁡(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖
Prueba de Hipotesis

H0: 𝛽1 = 0 , Experiencia Laboral no significativa y diferente de cero. EXP no ayuda a explicar S

H1: 𝛽1 ≠ 0

A hora calcularemos F

𝑅 2 /(𝑘 − 1) 0,0201
𝐹= 2 = = 11,03
(1 − 𝑅 )/(𝑛 − 𝑘) (1 − 0,0201)/(540 − 2)

𝑉1 = 1, Grados de libertad del numerador

𝑉2 = 538, Grados de libertad del denominador

𝐹𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜 ≅ 3,86

Dado que

𝐹𝑐𝑎𝑙𝑐 > 𝐹𝑐𝑟𝑖𝑡

11,03 > 3,86

Se rechaza H0

3. ln⁡(𝑆𝑖 ) = 𝛽0 + 𝛽1 n⁡(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖
Prueba de Hipotesis

H0: 𝛽1 = 0 , Experiencia Laboral no significativa y diferente de cero. EXP no ayuda a explicar S

H1: 𝛽1 ≠ 0

A hora calcularemos F

𝑅 2 /(𝑘 − 1) 0,0374
𝐹= 2
= = 20,90
(1 − 𝑅 )/(𝑛 − 𝑘) (1 − 0,0374)/(540 − 2)

𝑉1 = 1, Grados de libertad del numerador

𝑉2 = 538, Grados de libertad del denominador

𝐹𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜 ≅ 3,86
Dado que

𝐹𝑐𝑎𝑙𝑐 > 𝐹𝑐𝑟𝑖𝑡

20,90 > 3,86

Se rechaza H0

4. ln⁡(𝑆𝑖 ) = 𝛽0 + 𝛽1 ln⁡(𝐸𝑋𝑃𝑖 ) + 𝑢𝑖

Prueba de Hipotesis

H0: 𝛽1 = 0 , Experiencia Laboral no significativa y diferente de cero. EXP no ayuda a explicar S

H1: 𝛽1 ≠ 0

A hora calcularemos F

𝑅 2 /(𝑘 − 1) 0,0143
𝐹= 2 = = 7,80
(1 − 𝑅 )/(𝑛 − 𝑘) (1 − 0,0143)/(540 − 2)

𝑉1 = 1, Grados de libertad del numerador

𝑉2 = 538, Grados de libertad del denominador

𝐹𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜 ≅ 3,86

Dado que

𝐹𝑐𝑎𝑙𝑐 > 𝐹𝑐𝑟𝑖𝑡

7,80 > 3,86

Se rechaza H0

2. Suponga que la variable 𝑌 se puede relacionar de manera lineal con la variable 𝑋 de la forma
𝑌 = 𝜆 + 𝜇𝑋. Donde 𝜆 y 𝜇 son constantes. Demuestre que la correlación entre X y Y puede ser
igual a 1 o -1, dependiendo del signo que tome 𝜇.
Demostración:

Supongamos que 𝑌 = 𝜆 + 𝜇𝑋

𝐶𝑜𝑣(𝑋,𝑌)
Sabemos que 𝜌= , entonces primero calculamos 𝐶𝑜𝑣(𝑋, 𝑌).
𝜎𝑋 𝜎𝑌

𝐶𝑜𝑣 (𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸 (𝑋)𝐸(𝑌)

⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡= 𝐸 (𝑋(𝜆 + 𝜇𝑋)) − 𝐸 (𝑋)𝐸(𝜆 + 𝜇𝑋)

= 𝐸(𝑋𝜆 + 𝜇𝑋 2 ) − 𝐸 (𝑋)(𝜆 + 𝜇𝐸(𝑋))

⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡= ⁡𝜆𝐸 (𝑋) + ⁡𝜇𝐸 (𝑋 2 ) − 𝜆𝐸(𝑋) − 𝜇𝐸(𝑋)2

⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡= ⁡⁡𝜇𝐸 (𝑋 2 ) − 𝜇𝐸(𝑋)2

⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡⁡= ⁡⁡𝜇(𝐸 (𝑋 2 ) − 𝐸(𝑋)2 )

= 𝜇𝜎𝑥2

Ahora calculamos 𝜎𝑦2 ,

𝜎𝑦2 = 𝑉𝑎𝑟(𝑌) = 𝑉𝑎𝑟(𝜆 + 𝜇𝑋) = 𝑉𝑎𝑟(𝜇𝑋) = 𝜇2 𝜎𝑥2


Finalmente,

𝐶𝑜𝑣(𝑋, 𝑌) 𝜇𝜎2𝑥 𝜇𝜎2𝑥 𝜇


𝜌= = = = = ±1
𝜎𝑋 𝜎𝑌 |𝜇|
√ 𝜎2 2 2
𝑥 √𝜇 𝜎𝑥 𝜎2𝑥 √𝜇2

Dependiendo del valor de 𝜇.

3. Un investigador está evaluando el efecto de un aumento en el salario por hora sobre el empleo
en la industria manufacturera para los tres meses siguientes. Al tomar una muestra de 25
empresas, que podría concluir el investigador si:
a. La reducción promedio en el empleo es 9% y el error estándar del promedio es 5%

La reducción en el desempleo puede no ser tan significativa teniendo en cuenta que el error estándar es el 5%,
o que la variación puede ser asimétrica para cada una de las empresas.

b. La reducción promedio en el empleo es 12% y el error estándar es 5%

La reducción en el desempleo puede no varía tanto con respeto al caso anterior ya que son solo 3 puntos
porcentuales y la muestra es de tan solo 25 personas por lo tanto la reducción no es tan significativa teniendo
en cuenta que el error estándar es el mismo.

c. La reducción promedio en el empleo es 20% y el error estándar es 5%


En este caso la reducción es mucho más alta y se podría dar una mayor significancia al efecto del aumento del
salario por hora sobre la reducción del empleo ya que en este caso está afectando el 20% de la población
encuestada, con un error estándar más bajo en relación con la reducción.

d. Existe un incremento promedio en el empleo de 10% y el error estándar es 5%

En este caso tenemos un incremento del 10% que también es poco significativo ya que el error estándar es del
5% entonces no se podría estimar una relación significativa.

4. Muestre que el intervalo de confianza al 95% definido por

𝑋̅ − 𝑡𝑐𝑟𝑖𝑡,5% ∗ 𝑠. 𝑒(𝑋̅) ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝑐𝑟𝑖𝑡,5% ∗ 𝑠. 𝑒(𝑋̅)

Tiene una probabilidad de confianza de capturar 𝜇0 si 𝐻0 : 𝜇 = 𝜇0 es cierto. Donde 𝑡𝑐𝑟𝑖𝑡,5% es el


valor crítico de t al 5% de significancia, dado el número de grados de libertad, 𝑋̅ es el promedio
muestra y 𝜇 es la media poblacional.

Demostración:
𝑋̅ − 𝑡𝑐𝑟𝑖𝑡,5% ∗ 𝑠. 𝑒(𝑋̅) ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝑐𝑟𝑖𝑡,5% ∗ 𝑠. 𝑒(𝑋̅)

−𝑡𝑐𝑟𝑖𝑡,5% ∗ 𝑠. 𝑒(𝑋̅) ≤ 𝜇 − 𝑋̅

𝜇 − 𝑋̅
−𝑡𝑐𝑟𝑖𝑡,5% ≤
𝑠. 𝑒(𝑋̅)

𝑋̅ − 𝜇 𝑋̅ − 𝜇
𝑡𝑐𝑟𝑖𝑡,5% ≥ = = 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜
𝑠. 𝑒(𝑋̅) 𝑆𝑥
√𝑛

Es decir 𝑡𝑐𝑟𝑖𝑡,5% ≥ 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 por lo tanto 𝐻0 , la hipótesis nula se acepta.

5. A partir de los datos hprice1.dta estime el impacto de las variables tamaño de la casa (sqrft)
medida en metros cuadrados y el número de habitaciones (bdrms) sobre el precio de la vivienda
(price), es decir la relación de causalidad se puede representar por el modelo:

𝑝𝑟𝑖𝑐𝑒𝑖 = 𝛽0 + 𝛽1 𝑠𝑞𝑟𝑓𝑡𝑖 + 𝛽2 𝑏𝑑𝑟𝑚𝑠𝑖 + 𝑢𝑖

a. Interprete los parámetros estimados del modelo y lleve a cabo una prueba de significancia
conjunta e individual de los parámetros estimados. Que tan bien ajustado se encuentra el
modelo?. Comente.
Los coeficientes para el tamaño de la vivienda y el número de habitaciones resultan ser, 8.79 y
12864.67 respectivamente, si miramos la prueba de significancia, en los dos casos es mayo a 0.05,
es decir no se explican necesariamente el impacto de las variables, por lo tanto se debe aumentar
el número de datos de muestro o tomar otras variables.

b. Cuál es el aumento estimado en el precio de una casa con más de una habitación,
manteniendo constante (ceteris paribus) los pies cuadrados?
El aumento estimado en el precio de una casa con más de una habitación es de 15531.1 unidades
monetarias.

c. Qué porcentaje de la variación en el precio de la casa se explica por la cantidad de pies


cuadrados y el número de habitaciones.

El porcentaje de variación en el precio es de 0.04% de aumento con respecto a la cantidad de metros


cuadrados, y de 23.3% de aumento con respecto a la cantidad de habitaciones.

d. Estime la elasticidad del precio de la vivienda con respecto al tamaño de la casa y al número
de habitaciones e interprete los resultados. Explique y comente
La elasticidad con respecto al tamaño de la casa es de 1.13 es decir que por cada punto porcentual
de aumento en el tamaño el precio aumentara en 1.13 porciento, en cuanto a la cantidad de
habitaciones la elasticidad resulta ser de 0.6, es decir, que por cada punto porcentual en el que
aumenta la cantidad de habitaciones el precio aumentara en 0.67 porciento.

6. Demuestre que el valor estimado de la variable dependiente (𝑌̂ ) no están correlacionados con
los residuos en un modelo simple de regresión lineal. Pista: Utilice la expresión para el
coeficiente de correlación y utilice el hecho que el promedio de los residuos es igual a cero (𝑒̅)

Demostración:

La correlación del valor estimado de la variable dependiente (𝑌̂) y los residuos en un modelo simple
de regresión lineal, está dada por:

𝐶𝑜𝑣(𝑌̂, 𝑒̂ )
𝜌𝑌,̂𝑒̂ =
𝜎𝑌̂ 𝜎𝑒̂

𝐸[(𝑌̂ − 𝑌̅ )(𝑒̂ − 𝑒̅ )]
=
√𝐸[(𝑌̂ − ̅̅̅ ̅2
𝑌)2 √𝐸[(𝑒̂ − 𝑒)

Teniendo en cuenta que 𝑒̅ = 0, entonces

𝐸[(𝑌̂ − 𝑌̅ )(𝑒̂ )]
𝜌𝑌,̂𝑒̂ =
̅̅̅2 √𝐸[(𝑒̂ )2
√𝐸[(𝑌̂ − 𝑌)

𝑒̂ 𝐸 [(𝑌̂ − 𝑌̅)]
=
√𝐸[(𝑌̂ − ̅̅̅
𝑌)2 √𝐸[(𝑒̂ )2

̂ 𝐸[𝑌̂] − 𝐸 [𝑌̅ ])
𝑒(
=
√𝐸[(𝑌̂ − ̅̅̅
𝑌)2 √𝐸[(𝑒̂ )2

̂ 𝑌̅ − 𝑌̅)
𝑒(
=
√𝐸[(𝑌̂ − ̅̅̅
𝑌)2 √𝐸[(𝑒̂ )2

0
= =0
̅̅̅2 √𝐸[(𝑒̂ )2
√𝐸[(𝑌̂ − 𝑌)

Por lo tanto no hay correlación del valor estimado de la variable dependiente (𝑌̂) y los residuos
en un modelo simple de regresión lineal.

Vous aimerez peut-être aussi