Académique Documents
Professionnel Documents
Culture Documents
Análisis de Datos
Alumno:
Profesor:
Actividad:
#2
Considerando la información revisada a lo largo del curso, desarrollarás un Proyecto
Integrador en el que deberás resumir y describir las principales herramientas estudiadas:
regresión simple, ANOVA, series de tiempo y estadística no paramétrica.
Tiene por objetivo describir la relación lineal existente entre dos variables
cuantitativas mediante la ecuación de la recta que mejor se ajusta a los datos y usar
esta ecuación para realizar una predicción de los valores de una variable usando la
información aportada por la otra en el análisis de regresión lineal es simple cuando
intervienen solo dos variables.
Una de ellas es llamada variable independiente y es denotada por la letra X. la otra
variable es llamada variable dependiente, denotada por la letra Y.
Los valores de la variable dependiente son los que deseamos predecir, usando para
ello la información aportada por la variable independiente X.
Si en el análisis de regresión intervienen más de dos variables (una dependiente y
las demás independientes) este es llamado análisis de regresión lineal múltiple.
En el caso de una relación lineal, el objetivo es obtener la ecuación de la recta que
mejor se ajuste a los datos que mejor represente la relación entre las variables esta
ecuación es llamada ecuación de regresión lineal simple.
Ecuación de regresión lineal simple
Y=A+B*X
Cuanto más cerca estén los coeficientes de +1,0 y -1,0, mayor será la fuerza de la relación
entre las variables.
Como norma general, las siguientes directrices sobre la fuerza de la relación son útiles
(aunque muchos expertos podrían disentir con la elección de los límites).
Paso 1.- Recolectar n parejas de datos de la forma (Xi, Yi), con i = 1, 2, 3,…n donde Xi y
Yi representan los valores respectivos de las dos variables. Los datos se suelen representar
en una tabla
.
Paso 2.- Diseñar las escalas apropiadas para los ejes X y Y.
Paso 3.- Graficar las parejas de datos. Si hay puntos repetidos, se mostrarán como círculos
concéntricos.
Paso 4.- Documentar el diagrama.
La lectura se hace en base al tipo de relación entre los datos; lo fuerte o débil de la relación,
la forma de la relación y la posible presencia de punto anómalos.
b) Regresión lineal
c) coeficiente de determinación
d) coeficiente de correlación
Imagina que una litográfica está abriendo una nueva área de producción para la impresión
de posters, y en este momento se encuentra haciendo todos los ensayos y pruebas para
determinar la cantidad de tinta de cada color que deberían tener las maquinas.
Como prueba inicial, han decidido establecer la relación de errores de impresión según el
grado de llenado de los recipientes de tinta de la máquina.
Cantidad de tinta
(Litros) Números de errores
x y XY
0.47 16 0.2209 256 7.52
0.48 14 0.2304 196 6.72
0.69 30 0.4761 900 20.7
0.7 31 0.49 961 21.7
0.59 15 0.3481 225 8.85
0.59 17 0.3481 289 10.03
0.37 10 0.1369 100 3.7
0.62 21 0.3844 441 13.02
0.39 11 0.1521 121 4.29
0.35 13 0.1225 169 4.55
5.25 178 2.9095 3658 101.08
5.25 178
X́ = =0.525 Ý = = 17.8
10 10
2.9095 3658
σ x 2❑= −0.5252 = 0.015325 σ Y 2❑= −17.82 = 48.96
10 10
c) Aplicaciones
Para aplicar los modelos de regresión al ajuste de los datos de las mediciones de campo en
la carga minera, se utilizó el software de distribución libre R [10]. Utilizando el paquete
Rcmdr se obtuvieron las gráficas de dispersión de las variables de respuesta y regresoras y
los resultados analíticos de los modelos. La figura 3, muestra el comportamiento gráfico de
los modelos de regresión lineal simple, polinomial de orden 2 y polinomial de orden 3,
mientras que la tabla 2, describe el desempeño de cada modelo de regresión.
Dado los resultados de la tabla 2, el valor más alto de R2 y el valor más bajo del AIC
(criterio de información de Akaike) se logra con el modelo de regresión lineal múltiple, por
lo tanto, este modelo es el que se selecciona como el más adecuado para el ajuste de los
datos de distorsión armónica individual de tensión y corriente. La ecuación (14), muestra el
modelo seleccionado.
Usando el software R [10], se obtienen los intervalos de confianza para cada parámetro del
modelo de regresión lineal múltiple, estos resultados se muestran en la tabla 4.
CONCLUSIONES
En este trabajo, se probaron los modelos de regresión lineal simple, regresión polinomial de
orden 2, regresión polinomial de orden 3 y regresión lineal múltiple para describir la
relación entre la distorsión armónica individual de tensión y la distorsión armónica
individual de corriente en un proceso minero, siendo el modelo de regresión lineal múltiple
el que mejor ajustó los datos de las mediciones del proceso, con mejor coeficiente de
determinación R2 (0,8124) y menor criterio de información de Akaike (459,25).
Los pronósticos realizados con el modelo de regresión lineal múltiple, permiten estimar la
distorsión armónica individual de tensión y corriente del sistema eléctrico y direccionar
medidas correctivas para el control del contenido armónico del proceso. Cuando se analizan
las armónicas de un sistema eléctrico con carga homogénea, el modelo de regresión lineal
múltiple describe adecuadamente la distorsión armónica individual de tensión como
función de la distorsión armónica individual de corriente.
1. WU, C.J.; et al., "Application of regression models to predict harmonic voltage and
current growth trend from measurement data at secondary substations". IEEE Transactions
on Power Delivery, 1998, vol.13, n.3, p. 793-799, [Consultado: junio 2013], Disponible
en: http://ieeexplore.ieee.org/iel4/61/15033/00686976.pdf, ISSN 0885-8977.
Para esta actividad me apoye del programa estadístico Minitab primero ingrese datos
estadístico en la hoja de cálculo de Minitab
Pablo Vinuesa, C. (2018). Tema 9 - Regresión lineal simple y polinomial: teoría y práctica.
Retrieved from
http://www.ccg.unam.mx/~vinuesa/R4biosciences/docs/Tema9_regresion.html
WU, C.J.; et al., "Application of regression models to predict harmonic voltage and current
growth trend from measurement data at secondary substations". IEEE Transactions on
Power Delivery, 1998, vol.13, n.3, p. 793-799, [Consultado: junio 2013], Disponible
en: http://ieeexplore.ieee.org/iel4/61/15033/00686976.pdf, ISSN 0885-8977.
SANKARAN, C., "Power quality". Florida: CRC Press, 2001, 216 p., ISBN: 0-8493-1040-7