Vous êtes sur la page 1sur 11

“Año del Dialogo y la Reconciliación Nacional”

Regresión Lineal

Integrantes:
Soncco Paucar, Mary Luz
Escalante Alcala, Josselyn
Tenorio Moreno, Verónica
Martínez Soto, Fernando
Docente:
Galvariño Bustamante
Ciclo:
III CICLO
Sección:
F
Turno:
Tarde

2018-07-18
Regresión lineal.

Es una técnica estadística utilizada para estudiar la relación entre variables. Se adapta a una
amplia variedad de situaciones. En la investigación social, el análisis de regresión se utiliza
para predecir un amplio rango de fenómenos, desde medidas económicas hasta diferentes
aspectos del comportamiento humano.
Permite determinar el grado de dependencia de las series de valores X e Y, prediciendo el
valor y estimado que se obtendría para un valor x que no esté en la distribución.

Tipos de modelos de regresión lineal


Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:

 Regresión lineal simple


La regresión lineal simple se basa en estudiar los cambios en una variable, no aleatoria,
afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas
variables que puede ser establecida por una expresión lineal, es decir, su representación
gráfica es una línea recta. Es decir, se esta en presencia de una regresión lineal simple
cuando una variable independiente ejerce influencia sobre otra variable dependiente.
Ejemplo: Y = f(x)

 Regresión lineal múltiple


La regresión lineal permite trabajar con una variable a nivel de intervalo o razón, así
también se puede comprender la relación de dos o más variables y permitirá relacionar
mediante ecuaciones, una variable en relación a otras variables llamándose Regresión
múltiple. O sea, la regresión lineal múltiple es cuando dos o más variables independientes
influyen sobre una variable dependiente.
Ejemplo: Y = f(x, w, z).

Página 2
Objetivos
 Saber construir un modelo de regresión lineal simple que describa como influye
una variable X sobre otra variable Y
 Saber obtener estimaciones puntuales de los parámetros de dicho modelo
 Saber construir intervalos de confianza y resolver contrastes sobre dichos
parámetros
 Saber estimar el valor promedio de Y para un valor de X
 Saber predecir futuros de la variable respuesta, Y

Aplicaciones de la regresión lineal

 Líneas de tendencia
Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través de
un largo período. Este tipo de líneas puede decir si un conjunto de datos en particular
(como por ejemplo, el PBI, el precio del petróleo o el valor de las acciones) han aumentado
o decrementado en un determinado período. Las líneas de tendencia son generalmente
líneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo
de la curvatura deseada en la línea.

 Medicina
En Medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco
vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran
cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que
pudieran producir correlaciones espurias.
En el caso del Tabaquismo, los investigadores incluyeron el estado socio-económico para
asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación
o posición económica. No obstante, es imposible incluir todas las variables posibles en un
estudio de regresión.
En el ejemplo del tabaquismo, un hipotético gen podría aumentar la Mortalidad y aumentar
la propensión a adquirir enfermedades relacionadas con el consumo de tabaco.

Página 3
 Industria
En la industria tiene aplicación para investigar la relación entre el rendimiento de la
producción y uno o más factores del (o de los) que depende, como la Temperatura, la
humedad ambiental, la presión, la cantidad de insumos, etc; con base en este análisis se
puede pronosticar el comportamiento de una variable que se desea estimar.

TIPOS DE RELACIÓN

 Determinista: Conocido el valor de X, el valor de Y queda perfectamente


establecido. Son del Tipo: y = f (x)
Ejemplo: La relación existente entre la temperatura en grados centígrados (X) y grados
Fahrenheit

(Y) es: y = 1,8x + 32

 No determinista: Conocido el valor de X, el valor de Y no queda perfectamente


establecido. Son del tipo: y = f (x) + u
Donde u es una perturbación desconocida (variable aleatoria).
Ejemplo: Se tiene una muestra del volumen de producción (X) y el costo total (Y) asociado
a un producto en un grupo de empresas.

Existe relación pero no es exacta.

Página 4
Lineal: Cuando la función f (x) es lineal,
f (x) = β0 + β1x
Si β1 > 0 hay relación lineal positiva.
Si β1 < 0 hay relación lineal negativa.

No lineal: Cuando la función f (x) no es lineal. Por ejemplo,


f (x) = log(x), f (x) = x 2 + 3, . . .

Los datos no tienen un aspecto recto


Ausencia de relación: Cuando f (x) = 0

Página 5
PROBLEMAS AL AJUSTAR UN MODELO DE REGRESIÓN SIMPLE

Al ajustar un modelo de regresión lineal simple se pueden presentar diferentes problemas


bien porque no existe una relación lineal entre las variables o porque no se verifican las
hipótesis estructurales que se asumen en el ajuste del modelo. Estos problemas son los
siguientes:
Falta de Linealidad, porque la relación entre las dos variables no es lineal o porque
variables explicativas relevantes no han sido incluídas en el modelo.
Existencia de valores atípicos e influyentes, existen datos atípicos que se separan de
la nube de datos muestréales e influyen en la estimación del modelo.
Falta de Normalidad, los residuos del modelo no se ajustan a una distribución normal.
Heterocedasticidad, la varianza de los residuos no es constante.
Dependencia (auto correlación), existe dependencia entre las observaciones.

 La nube de puntos muestrales


bidimensionales parece ajustarse bien a
una recta

 El ajuste lineal no parece adecuado para


esta muestra.

 No existe relación lineal entre las dos


variables

Página 6
 Claros indicios de heterocedasticidad.

 Existen puntos atipicos que


probablemente influyan en la
estimacion de la recta ajustada

 Existe una variable regresora binaria


que se debe de incluir en el modelo
de regresión.

MÉTODO DE MÍNIMOS CUADRADOS


Gauss propuso en 1809 el método de mínimos cuadrados para obtener los valores βˆ 0 y βˆ
1 que mejor se ajustan a los datos:
y = βˆ 0 + βˆ 1xi
El método consiste en minimizar la suma de los cuadrados de las distancias verticales entre
los datos y las estimaciones, es decir, minimizar la suma de los residuos al cuadrado,

Página 7
Ejercicio 1

Dado los datos:

X 2 3 5 7 9 10
y 1 3 7 11 15 17
x.y 2 9 35 77 135 170
𝑥2 4 9 25 49 81 100

a) Construir su diagrama de dispersión


b) Proponer una curva de mejor ajuste
c) Encontrar el modelo matemático
d) Estimar y para x=20

Solución:

Gráfico de Disperción
18
16
14
12
10
8
6
4
2
0
0 2 4 6 8 10 12

c. Se propone un modelo matemático.

Y=ax+b

a=?
b=?

*formando el sistema de ecuaciones normalizadas.

Página 8
∑ 𝑦 = 𝑎 ∑ 𝑥 + 𝑛𝑏
{ }
∑ 𝑥𝑦 = 𝑎 ∑ 𝑥 2 + 𝑏 ∑ 𝑥

*Datos:

∑ 𝑦 =54 ∑ 𝑥 = 36
𝑛 =6 ∑ 𝑥𝑦 = 428 ∑ 𝑥 2 = 268

36𝑎 + 6𝑏 = 54
{
268𝑎 + 36𝑏 = 428

54−6𝑏 428−36𝑏
𝑎= 𝑎=
36 268

*Igualando:
54−6𝑏 428−36𝑏
=
36 268

14472 - 1608b = 15408 - 1296b


-1608b + 1296 = 15408 – 14472
-312b=936
936
b =−312

b = -3

36𝑎 + 6𝑏 = 54
36𝑎 + 6(−3) = 54
36𝑎 = 54 + 18
36𝑎 = 72
72
a =36
a= -3
c. Se propone el modelo matemático:

𝑦̂ = 𝑎𝑥 + 𝑏
d. sustituyendo:

𝑦̂ = 2𝑥 − 3

Si x= 20

Página 9
𝑦̂ = 2(20) − 3
𝑦̂ = 40 − 3
𝑦̂ = 37

Ejercicio 2
Aplicar el método de mínimos cuadrados para determinar el costo de una jornada de trabajo
de 52 horas, conociendo la siguiente información:

Página 10
y=mx+b

Página 11