Vous êtes sur la page 1sur 11

IES Vigilada por:

SEDE : SIBUNDOY
PROGRAMA : Tecnología en obras civiles.
SEMESTRE : IV
MATERIA : Estadística y probabilidades.
PROFESOR : Julián Burbano

TEMA 6: REGRESIÓN LINEAL.

El análisis de regresión se utiliza para fines de predicción. A menudo existen relaciones entre 2 ó más
variables, por ejemplo, entre el peso y la estatura de una persona, las horas de estudio y la calificación
obtenida, etc. Suele ser deseable expresar tales relaciones en forma matemática determinando una
ecuación que conecte a las variables. Para hallar una ecuación que relacione las variables, el primer paso
es recoger datos que muestran valores correspondientes de las variables bajo consideración.

Así por ejemplo, la siguiente tabla muestra las alturas y peso de una muestra de 10 personas:

Tabla 1: Relación de altura y pesos

En la tabla vemos la relación que existe entre altura y peso de 10 personas, para la primera, mide 1,66
m y pesas 60 kg, y así para cada una de ellas.

El próximo paso es marcar los puntos en un sistema de coordenadas, graficar X vs Y a partir de la


tabla, obtendremos un diagrama de dispersión como se muestra a continuación.

1 de 11
Página

Grafico 1: Diagrama de dispersión.

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

En el grafico 1 podemos ver la representación gráfica de la tabla 1.

A partir del Diagrama de Dispersión es posible (a veces), visualizar una curva que aproxima los datos.
Tal curva se denomina Curva de aproximación. En la figura 1, podemos ver un diagrama de dispersión
y una curva de dispersión (curva azul), esta curva de se caracteriza por ajustarse a la trayectoria de la
mayoría de datos, y tener una mínima dispersión con ellos.

Figura 1: Curva de aproximación.

Esta curva puede ser lineal o no lineal, en este caso estaremos tratando la curva lineal, o la recta, las
cuales poseen una relación lineal, en si la regresión lineal consiste en encontrar la ecuación de esa recta
que se ajuste a la mayoría de puntos con un mínimo error.

A continuación se muestra unos ejemplos gráficos con relación lineal y no lineal

2 de 11
Página

Grafico 2: Relación lineal

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

Grafico 3: Relación no lineal.

En los gráficos 2 y 3 se muestra una relación lineal, y una relación no lineal respectivamente.

El problema general de hallar ecuaciones de curvas de aproximación que se ajusten a un conjunto de


Datos se denomina ajuste de curvas.
Uno de los propósitos principales de la curva de ajuste es estimar una de las variables (la variable
Dependiente Y) conocida otra (la variable independiente X). El proceso de estimación se conoce como
Regresión.

Los tipos más comunes de curvas aproximación y sus ecuaciones se representan en la siguiente lista:

Línea recta ------- 𝒚 = 𝒂 + 𝒃𝒙


Parábola-----------𝑦 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐
Curva cubica----- 𝑦 = 𝑎𝑥 3 + 𝑏𝑥 2 + 𝑐𝑥 + 𝑑

Donde a, b, c y d son constantes, la variable x es la variable independiente, y Y es la variable


dependiente.

Para decidir que curva usar es útil observar el diagrama de dispersión. Con el diagrama de dispersión se
puede tener una idea aproximada de la relación entre las variables. La relación más sencilla es la lineal.
3 de 11

A menudo se recurre a la intuición personal para dibujar una curva que se ajuste a un conjunto de datos.
Este método tiene la desventaja de que diferentes observadores obtendrán distintas curvas y ecuaciones.

Para evitar juicios subjetivos al construir rectas, parábolas u otras curvas de aproximación de ajuste
Página

de datos se utiliza el Método de Mínimos Cuadrados.

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

Método de los mínimos cuadrados.

Dado el diagrama de dispersión (figura 2)

Figura 2: Diagrama de dispersión.

En la figura 2 tenemos una curva y unos puntos cerca de ella con sus coordenadas (Xn, Yn).
D1, D2, Dn es la distancia del punto cercano a la curva.

Una medida de la bondad o calidad del ajuste de la curva a los datos dados está proporcionada por la
cantidad.

Definición: De todas las curvas que aproximan un conjunto de datos, la que tiene la propiedad de que
𝐷12 + 𝐷22 + ⋯ + 𝐷𝑛2 𝑒𝑠 Mínimo se llama una Curva de Ajuste Optimo.

Una curva que cumpla con la condición de que 𝐷12 + 𝐷22 + ⋯ + 𝐷𝑛2 sea mínimo se denomina Curva
de Mínimos Cuadrados, esta curva puede ser: una recta, una parábola, una parábola, o una parábola
cúbica, etc. 4 de 11
Página

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

La recta de los mínimos cuadrados

El análisis de regresión lineal simple tiene por objeto encontrar la línea recta que mejor se ajuste a los
datos, esto significa que se desea encontrar la línea recta para la cual las diferencias entre los valores
reales de y los valores estimados 𝑦̂ sean lo más pequeñas posible.

Este sistema de ecuaciones se puede reducir a las siguientes ecuaciones, n es el número de datos o
puntos en el gráfico.

Con esto obtendremos la recta de regresión.

Para medir el grado de relación existente entre la variable independiente y la variable dependiente, lo que
más se utiliza es el Coeficiente de Correlación Lineal (r de Pearson), cuyo método abreviado de cálculo
está dado por la siguiente fórmula:
5 de 11
Página

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

A partir del r de acuerdo a la siguiente tabla podemos decir:

r tipo de correlación
entre variables
0 no hay relación
-1 perfecta y negativa
1 perfecta y positiva
0 a 0,5 mala
0 a -0,5 mala
0,5 a 1 buena
-0,5 a -1 buena

EJEMPLO:

Determine la ecuación de la recta de regresión de la siguiente tabla de datos y el valor r.

x 1 3 4 6 8 9 11 14
y 1 2 4 4 5 7 8 9

En la tabla vemos cada valor de x con su respectivo y, ejemplo (1,1), (3,2)…….. (14,9), en total hay 8
coordenadas, que será el n para la formula
Solución.

Para este tipo de problemas donde se requiere la ecuación de la regresión es necesario graficar los puntos
para saber qué tipo de curva se ajusta a los datos, en este caso ya de entrada nos dice que es una recta
por lo que no sería necesario graficar, pero igual haremos la gráfica para comprobar que una recta es la
que mejor se ajusta a los datos como se muestra a continuación.

6 de 11
Página

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

Para la solucion del problema necesitamos encontrar los parametros a1 y a0 con las siguientes
ecuaciones

Para ello primero completaremos la siguiente tabla.

n= 8

A x 1 3 4 6 8 9 11 14
B y 1 2 4 4 5 7 8 9
C x.y
D 𝑥2
E 𝑦2

1) Para en encontrar los valores de la fila C, multiplicamos los valores de la fila A y fila B
respectivamente:

Así 1 x 1 = 1
3x2=6 y así para el resto de valores.

Obteniendo los siguientes resultados valores en rojo.

A x 1 3 4 6 8 9 11 14
B y 1 2 4 4 5 7 8 9
C x.y 1 6 16 24 40 63 88 126
7 de 11

2) Para encontrar los valores de la fila D debemos elevar al cuadrado cada valor de la fila A al cuadrado.

Así 12 = 1

32 = 9
Página

Y así para el resto.


Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

Obtenemos los siguientes resultados

A x 1 3 4 6 8 9 11 14
B y 1 2 4 4 5 7 8 9
C x.y 1 6 16 24 40 63 88 126
D 𝑥2 1 9 16 36 64 81 121 196

3) Para encontrar los valores de la fila E debemos elevar al cuadrado cada valor de la fila B al cuadrado.

Así 12 = 1

22 = 4

Y así para el resto.

Obtenemos los siguientes resultados.

A x 1 3 4 6 8 9 11 14
B y 1 2 4 4 5 7 8 9
C x.y 1 6 16 24 40 63 88 126
D 𝑥2 1 9 16 36 64 81 121 196
E 𝑦2 1 4 16 16 25 49 64 81

Y ya tenemos completa la tabla.

4) Para la formula debemos encontrar las sumatorias que nos pide, sumando los valores de las respectivas
filas, y los promedios de los valores de la variable X y Y.

∑ 𝑋 = 1 + 3 + 4 + 6 + 8 + 9 + 11 + 14
8 de 11

∑ 𝑿 = 𝟓𝟔
Página

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

∑𝑌 = 1 + 2 + 4 + 4 + 5 + 7 + 8 + 9

∑ 𝒀 = 𝟒𝟎

∑ 𝑋. 𝑌 = 1 + 6 + 16 + 24 + 40 + 63 + 88 + 126

∑ 𝑿. 𝒀 = 𝟑𝟔𝟒

∑ 𝑋 2 = 1 + 9 + 16 + 36 + 64 + 81 + 121 + 196

∑ 𝑿𝟐 = 𝟓𝟐𝟒

∑ 𝑌 2 = 1 + 4 + 16 + 16 + 25 + 49 + 64 + 81

∑ 𝒀𝟐 = 𝟐𝟓𝟔

Promedios.

1+2+4+4+5+7+8+9
𝑌̅ =
8
̅=𝟓
𝒀

1 + 3 + 4 + 6 + 8 + 9 + 11 + 14
𝑋̅ =
8
̅=𝟕
𝑿
9 de 11
Página

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

Ya tenemos todos los datos para aplicar las formulas, ahora solo remplazamos y obtenemos los
resultados.

n=8

𝟖. (𝟑𝟔𝟒) − (𝟓𝟔)(𝟒𝟎)
𝒂𝟏 = = 𝟎, 𝟔𝟑
𝟖(𝟓𝟐𝟒) − (𝟓𝟔)𝟐

𝒂𝟎 = 𝟓 − (𝟎, 𝟔𝟑)(𝟕) = 𝟎, 𝟓𝟗

Encontramos a1= 0,63 y a0 = 0,59, solo nos queda remplazarlos en la ecuación general de la recta

𝑌 = 𝑎0 + 𝑎1𝑋

Obteniendo la ecuación de la recta de regresión

𝒀 = 𝟎, 𝟓𝟗 + 𝟎, 𝟔𝟑𝑿

Ahora nos falta solo el encontrar el valor r

8(364) − (56)(40)
𝑟= = 0,97
√[8(524) − (56)2 ] [8(256) − (40)2 ]
10 de

Y Según la tabla 0,97 es una correlación buena.


Página

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:

Fuentes:

-G. Aaron Estuardo. Estadística y probabilidades. Chile 2012

11 de
Página

Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116

Vous aimerez peut-être aussi