Académique Documents
Professionnel Documents
Culture Documents
SEDE : SIBUNDOY
PROGRAMA : Tecnología en obras civiles.
SEMESTRE : IV
MATERIA : Estadística y probabilidades.
PROFESOR : Julián Burbano
El análisis de regresión se utiliza para fines de predicción. A menudo existen relaciones entre 2 ó más
variables, por ejemplo, entre el peso y la estatura de una persona, las horas de estudio y la calificación
obtenida, etc. Suele ser deseable expresar tales relaciones en forma matemática determinando una
ecuación que conecte a las variables. Para hallar una ecuación que relacione las variables, el primer paso
es recoger datos que muestran valores correspondientes de las variables bajo consideración.
Así por ejemplo, la siguiente tabla muestra las alturas y peso de una muestra de 10 personas:
En la tabla vemos la relación que existe entre altura y peso de 10 personas, para la primera, mide 1,66
m y pesas 60 kg, y así para cada una de ellas.
1 de 11
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
A partir del Diagrama de Dispersión es posible (a veces), visualizar una curva que aproxima los datos.
Tal curva se denomina Curva de aproximación. En la figura 1, podemos ver un diagrama de dispersión
y una curva de dispersión (curva azul), esta curva de se caracteriza por ajustarse a la trayectoria de la
mayoría de datos, y tener una mínima dispersión con ellos.
Esta curva puede ser lineal o no lineal, en este caso estaremos tratando la curva lineal, o la recta, las
cuales poseen una relación lineal, en si la regresión lineal consiste en encontrar la ecuación de esa recta
que se ajuste a la mayoría de puntos con un mínimo error.
2 de 11
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
En los gráficos 2 y 3 se muestra una relación lineal, y una relación no lineal respectivamente.
Los tipos más comunes de curvas aproximación y sus ecuaciones se representan en la siguiente lista:
Para decidir que curva usar es útil observar el diagrama de dispersión. Con el diagrama de dispersión se
puede tener una idea aproximada de la relación entre las variables. La relación más sencilla es la lineal.
3 de 11
A menudo se recurre a la intuición personal para dibujar una curva que se ajuste a un conjunto de datos.
Este método tiene la desventaja de que diferentes observadores obtendrán distintas curvas y ecuaciones.
Para evitar juicios subjetivos al construir rectas, parábolas u otras curvas de aproximación de ajuste
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
En la figura 2 tenemos una curva y unos puntos cerca de ella con sus coordenadas (Xn, Yn).
D1, D2, Dn es la distancia del punto cercano a la curva.
Una medida de la bondad o calidad del ajuste de la curva a los datos dados está proporcionada por la
cantidad.
Definición: De todas las curvas que aproximan un conjunto de datos, la que tiene la propiedad de que
𝐷12 + 𝐷22 + ⋯ + 𝐷𝑛2 𝑒𝑠 Mínimo se llama una Curva de Ajuste Optimo.
Una curva que cumpla con la condición de que 𝐷12 + 𝐷22 + ⋯ + 𝐷𝑛2 sea mínimo se denomina Curva
de Mínimos Cuadrados, esta curva puede ser: una recta, una parábola, una parábola, o una parábola
cúbica, etc. 4 de 11
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
El análisis de regresión lineal simple tiene por objeto encontrar la línea recta que mejor se ajuste a los
datos, esto significa que se desea encontrar la línea recta para la cual las diferencias entre los valores
reales de y los valores estimados 𝑦̂ sean lo más pequeñas posible.
Este sistema de ecuaciones se puede reducir a las siguientes ecuaciones, n es el número de datos o
puntos en el gráfico.
Para medir el grado de relación existente entre la variable independiente y la variable dependiente, lo que
más se utiliza es el Coeficiente de Correlación Lineal (r de Pearson), cuyo método abreviado de cálculo
está dado por la siguiente fórmula:
5 de 11
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
r tipo de correlación
entre variables
0 no hay relación
-1 perfecta y negativa
1 perfecta y positiva
0 a 0,5 mala
0 a -0,5 mala
0,5 a 1 buena
-0,5 a -1 buena
EJEMPLO:
x 1 3 4 6 8 9 11 14
y 1 2 4 4 5 7 8 9
En la tabla vemos cada valor de x con su respectivo y, ejemplo (1,1), (3,2)…….. (14,9), en total hay 8
coordenadas, que será el n para la formula
Solución.
Para este tipo de problemas donde se requiere la ecuación de la regresión es necesario graficar los puntos
para saber qué tipo de curva se ajusta a los datos, en este caso ya de entrada nos dice que es una recta
por lo que no sería necesario graficar, pero igual haremos la gráfica para comprobar que una recta es la
que mejor se ajusta a los datos como se muestra a continuación.
6 de 11
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
Para la solucion del problema necesitamos encontrar los parametros a1 y a0 con las siguientes
ecuaciones
n= 8
A x 1 3 4 6 8 9 11 14
B y 1 2 4 4 5 7 8 9
C x.y
D 𝑥2
E 𝑦2
1) Para en encontrar los valores de la fila C, multiplicamos los valores de la fila A y fila B
respectivamente:
Así 1 x 1 = 1
3x2=6 y así para el resto de valores.
A x 1 3 4 6 8 9 11 14
B y 1 2 4 4 5 7 8 9
C x.y 1 6 16 24 40 63 88 126
7 de 11
2) Para encontrar los valores de la fila D debemos elevar al cuadrado cada valor de la fila A al cuadrado.
Así 12 = 1
32 = 9
Página
A x 1 3 4 6 8 9 11 14
B y 1 2 4 4 5 7 8 9
C x.y 1 6 16 24 40 63 88 126
D 𝑥2 1 9 16 36 64 81 121 196
3) Para encontrar los valores de la fila E debemos elevar al cuadrado cada valor de la fila B al cuadrado.
Así 12 = 1
22 = 4
A x 1 3 4 6 8 9 11 14
B y 1 2 4 4 5 7 8 9
C x.y 1 6 16 24 40 63 88 126
D 𝑥2 1 9 16 36 64 81 121 196
E 𝑦2 1 4 16 16 25 49 64 81
4) Para la formula debemos encontrar las sumatorias que nos pide, sumando los valores de las respectivas
filas, y los promedios de los valores de la variable X y Y.
∑ 𝑋 = 1 + 3 + 4 + 6 + 8 + 9 + 11 + 14
8 de 11
∑ 𝑿 = 𝟓𝟔
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
∑𝑌 = 1 + 2 + 4 + 4 + 5 + 7 + 8 + 9
∑ 𝒀 = 𝟒𝟎
∑ 𝑋. 𝑌 = 1 + 6 + 16 + 24 + 40 + 63 + 88 + 126
∑ 𝑿. 𝒀 = 𝟑𝟔𝟒
∑ 𝑋 2 = 1 + 9 + 16 + 36 + 64 + 81 + 121 + 196
∑ 𝑿𝟐 = 𝟓𝟐𝟒
∑ 𝑌 2 = 1 + 4 + 16 + 16 + 25 + 49 + 64 + 81
∑ 𝒀𝟐 = 𝟐𝟓𝟔
Promedios.
1+2+4+4+5+7+8+9
𝑌̅ =
8
̅=𝟓
𝒀
1 + 3 + 4 + 6 + 8 + 9 + 11 + 14
𝑋̅ =
8
̅=𝟕
𝑿
9 de 11
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
Ya tenemos todos los datos para aplicar las formulas, ahora solo remplazamos y obtenemos los
resultados.
n=8
𝟖. (𝟑𝟔𝟒) − (𝟓𝟔)(𝟒𝟎)
𝒂𝟏 = = 𝟎, 𝟔𝟑
𝟖(𝟓𝟐𝟒) − (𝟓𝟔)𝟐
𝒂𝟎 = 𝟓 − (𝟎, 𝟔𝟑)(𝟕) = 𝟎, 𝟓𝟗
Encontramos a1= 0,63 y a0 = 0,59, solo nos queda remplazarlos en la ecuación general de la recta
𝑌 = 𝑎0 + 𝑎1𝑋
𝒀 = 𝟎, 𝟓𝟗 + 𝟎, 𝟔𝟑𝑿
8(364) − (56)(40)
𝑟= = 0,97
√[8(524) − (56)2 ] [8(256) − (40)2 ]
10 de
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116
IES Vigilada por:
Fuentes:
11 de
Página
Sede Mocoa - Subsede Sibundoy - Extensiones: Valle del Guamuez – Puerto Asís – Colón
Teléfonos: 4296105 - 313 805 2807 – 310 331 0083 Email: atencionalusuario@itp.edu.co Website: www.itp.edu.co
Nit. 800.247.940-1 Código IES 3115 - 3116