Vous êtes sur la page 1sur 8

Regresión Lineal

Johanna Machuca V.

Estadísticas

Instituto IACC

23 de julio de 2018
Desarrollo

a) Realice un gráfico de dispersión e indique el tipo de relación entre las variables edad del trabajador y horas
conectadas a internet.
R: Al realizar el grafico de dispersión las variables nos señalan que a mayor edad del trabajador menor son las
horas de estar conectados a internet y a menor edad mayor es el tiempo conectados a internet.

y = -0.3488x + 27.39
Horas conectado a Internet
R² = 0.7502 (semanal)
25

20

15

10

0
0 10 20 30 40 50 60 70

b) Con respecto a las mismas variables de la letra a), construya un modelo de regresión e interprete el valor de
la pendiente.

MODELO REGRESIÓN
Promedio de edad (x) 46
Promedio de horas (y) 11
Covarianza -11,6465
Varianza edad 33,39416667
Formula b=Sxy/S2x
-
Coeficiente b 0,348758516
Formula a=Y - b * X=
Coeficiente a 27,39032965

R: El valor de la pendiente es negativo, ya que a mayor edad menor es el tiempo de conexión a internet, además
podemos indicar que al aumentar un año más de edad del trabajador el uso de internet decrece en un 0,3488
calculado en horas.
c) Estime el número de horas que un trabajador está conectado a internet, si tiene 62 años

Resumen

Estadísticas de la
regresión
Coeficiente de correlación
múltiple 0,866131075
Coeficiente de
determinación R^2 0,750183039
R^2 ajustado 0,749344727
Error típico 1,166916984
Observaciones 300

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 1218,544816 1218,544816 894,87337 9,3771E-92
Residuos 298 405,785184 1,361695248
Total 299 1624,33

Superior Inferior Superior


Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 95,0% 95,0%
Intercepción 27,39032965 0,541086305 50,62099964 2,17E-148 26,3254953 28,455164 26,325495 28,45516396
Edad (años) -0,34875852 0,011658536 -29,91443414 9,377E-92 -0,371702 -0,325815 -0,371702 -0,32581502

y= 27,3903296 +
(-0,34875852)* x

x= 62 > y=?
5,767301674

R: Un trabajador de 62 años de edad, está conectado en internet aproximadamente 6 horas.


d) Si un trabajador está conectado 18 horas a internet, ¿qué edad se puede estimar que tiene el trabajador?

Resumen

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,86613108
Coeficiente de determinación
R^2 0,75018304
R^2 ajustado 0,74934473
Error típico 2,89800253
Observaciones 300

ANÁLISIS DE VARIANZA
Suma de Promedio de
Grados de cuadrad los Valor crítico
libertad os cuadrados F de F
Regresión 1 7515,521232 7515,521232 894,87337 9,37712E-92
Residuos 298 2502,728768 8,398418685
Total 299 10018,25

Superior Inferior Superior


Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 95,0% 95,0%
Intercepción 70,4209428 0,831692211 84,67187961 1,7E-210 68,78420869 72,0576769 68,78420869 72,0576769
Horas conectado a Internet - - -
(semanal) -2,15101 0,07190542 29,91443414 9,377E-92 2,292516694 -2,0095032 -2,29251669 2,00950322

31,7027636
R: De acuerdo a los datos analizados podemos determinar que el trabajador que esta conectado 18 horas en

internet tiene aproxidamente 31,7 años.

e) Desde la gerencia se requiere establecer un modelo de regresión para las variables: sueldo mensual y

antigüedad de los trabajadores, para realizar estimaciones respecto a esas variables. Entonces:

e.1) Construya el modelo lineal y exponencial.


y = 0.0099x + 1.7324
R² = 0.7678
Antigüedad Laboral (años) y = 3.5081e0.0012x
R² = 0.6239
20
18
16
14
12
10
8
6
4
2
0
0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 1400.0 1600.0

e.2) Estime qué modelo se ajusta mejor a los datos. Justifique su respuesta.

y = 0.0099x + 1.7324
R² = 0.7678
Antigüedad Laboral (años) y = 3.5081e0.0012x
R² = 0.6239
20
18
16
14
12
10
8
6
4
2
0
0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 1400.0 1600.0

R: De acuerdo al grafico realizado podemos determinar que el mejor modelo es el lineal, ya que su R2 es mayor

que el exponencial.

e.3) Utilizando el modelo más adecuado, determine el sueldo mensual de un trabajador, si lleva 15 años en la

empresa.

Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,8762235
Coeficiente de determinación
R^2 0,76776762
R^2 ajustado 0,76698832
Error típico 90,4402499
Observaciones 300

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de Valor crítico de
libertad cuadrados los cuadrados F F
Regresión 1 8058362,29 8058362,29 985,197455 1,75351E-96
Residuos 298 2437472,76 8179,438804
Total 299 10495835,1

Superior Inferior Superior


Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 95,0% 95,0%
Intercepción 48,6700843 24,1110577 2,018579395 0,04442645 1,220571379 96,1195973 1,22057138 96,1195973
Antigüedad Laboral (años) 77,4730425 2,46824901 31,38785521 1,7535E-96 72,61563584 82,3304492 72,6156358 82,3304492

1210,765722
R: El sueldo mensual de un trabajador que lleva 15 años en la empresa es aproximadamente de 1210,7

e.4) Utilizando el mismo modelo anterior estime la antigüedad de un trabajador, con un sueldo mensual de

$750.000.

Resumen

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,8762235
Coeficiente de determinación
R^2 0,76776762
R^2 ajustado 0,76698832
Error típico 1,02288318
Observaciones 300

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 1030,80225 1030,802246 985,197455 1,75351E-96
Residuos 298 311,79442 1,046290001
Total 299 1342,59667
Superior Inferior Superior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 95,0% 95,0%
Intercepción 1,73239613 0,25555702 6,778902504 6,4921E-11 1,22947103 2,23532124 1,22947103 2,23532124
Sueldo Mensual (miles de $) 0,00991013 0,00031573 31,38785521 1,7535E-96 0,009288781 0,01053147 0,00928878 0,01053147

9,164990692
R: La antigüedad laboral de un trabajador que tiene un sueldo mensual de 750.000.- es aproximadamente de 9

años.
Bibliografía

IACC 2018. Regresión Lineal. Estadísticas. Semana 6.

Vous aimerez peut-être aussi