Académique Documents
Professionnel Documents
Culture Documents
Si nos encontramos ante el analisis de dos variables cuantitativas somos capaces de determinar la
relación o algun tipo de patron que rige entre ellas mediante ciertas tecnicas estadisticas tales
como la correlación y la regresión. Si bien a la hora de aplicar dichas tecnicas, los calculos de
ambas pueden ser similares en determinados aspectos e incluso dar resultados casi identicos, no
deben confundirse pues son totalmente distintos ya que estan basados en diferentes supuestos.
La correlacion influye en cierto grado la apreciacion del analista que esta realizando el estudio de
relacion entre variable ya que necesita determinar el grado de fueraz con el que influye una
variable con el comportamiento de la segunda, es decir determinar la importancion de una
cariable y que tanto influye sobre la otra.
Objetivos
Este trabajo tiene com finalidad el de explicar el marco teorico, asi como tambien la aplicacion de
las tecnicas estadisticas de correlacion y regresion lineal multiple que se han visto durante este
ciclo en el curso dictado.
CAPITULO I: CORRELACIÓN
El análisis de regresión múltiple es una técnica estadística que consiste en la extensión del
análisis de regresión simple a una forma donde se aplican dos o mas variables independientes;
X1, X2,…, Xk.; siendo: K>=2, para pronosticar el valor de la variable dependiente Y.
La variable que mide ambos parámetros es conocida como “coeficiente de correlación” y su valor
oscila entre -1 y +1, de tal manera que:
CORRELACIÓN LINEAL
En este punto haremos referencia a la correlación lineal, advirtiéndose que existen variables que
puedan estar relacionadas, pero no de forma lineal. El coeficiente de correlación de Pearson para
variables cuantitativas es un índice que mide el grado de variación entre distintas variables
relacionadas linealmente, y que, como ya se ha mencionado antes, sus valores absolutos oscilan
entre 0 y 1.
0≤r≤1
Para calcular el valor del coeficiente de correlación de Pearson es necesario primero calcular el
valor de la varianza y de la covarianza. (Vinuesa, 14 de octubre de 2016) Entonces:
La varianza de una muestra representa el promedio de la desviación de los datos con respecto a la
media y se calcula aplicando la siguiente fórmula:
Varianza (s2)=(xi-x)2N-1
La covarianza entre dos variables es una medida de la relación promedio de estas. Es la desviación
promedio del producto cruzado entre ellas. Se calcula aplicando la siguiente fórmula:
Covarianza(x;y)=(xi-x)(yi-y)N-1
r=cov(x;y)sxsy
r=Nxiyi-xiyi[Nxi2-(xi2)][Nyi2-(yi2)]
Se dirá entonces, que la correlación entre dos variables X e Y es perfectamente positiva cuando
exactamente en la medida que aumenta una aumenta la otra. Un ejemplo de este suceso es la
relación espacio tiempo para un móvil que se desplaza a velocidad constante. Para este caso el
valor de r será de +1 y todos los valores de Y caerán sobre la prolongación de la misma línea
imaginaria trazada con pendiente positiva y ángulo de 45°. (COEFICIENTE DE CORRELACIÓN LINEAL
DE PEARSON)
Fuente: https://personal.us.es/vararey/adatos2/correlacion.pdf
Para el caso de una correlación perfectamente negativa el valor de r será de -1 y significará que tan
exactamente en la medida que aumenta una variable disminuye la otra. Un ejemplo de este suceso
es la relación entre presión y volumen, mostrándose en la siguiente figura. (COEFICIENTE DE
CORRELACIÓN LINEAL DE PEARSON)
Fuente: https://personal.us.es/vararey/adatos2/correlacion.pdf
Fuente: https://personal.us.es/vararey/adatos2/correlacion.pdf
Pero +1, -1 y 0 no son los únicos valores que puede tomar el coeficiente de correlación; entre estos
límites existen n valores que podría tomar la variable y de acuerdo al sentido podría ser negativa o
positiva, pero en función de la magnitud podremos decir si es fuerte o débil. El siguiente diagrama
resume el análisis del coeficiente de correlación:
Fuente: https://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf
De la misma manera que la formula antes descrita para calcular el valor del coeficiente de
correlación de Pearson (r), existe otra que utiliza el concepto de suma de cuadrados.
r=SSxySSxSSy
Donde:
Además del coeficiente de correlación (r) existe también el coeficiente de determinación que nos
ayuda a medir la bondad del ajuste de la recta de regresión. Básicamente nos indica el porcentaje
de la variación de Y que se explica a través del modelo lineal que se ha estimado, es decir a través
del comportamiento de X. (Vila, Sedano, López, & Juan, 2016)
El existo de las predicciones de una variable dependen en gran medida del coeficiente de
determinación (bondad de la predicción). Si dos variables no covarían no será posible obtener
predicciones validas, y si la intensidad de la covariación es moderada a débil, las predicciones no
serán muy buenas.
Cuanto mayor sea la proporción, mejor será la predicción. Si el coeficiente de determinación fuese
igual a 1 significaría que la variable independiente (X) es capaz de “predecir” con exactitud a la
variable dependiente (Y) y que las predicciones no tendrían ningún margen de error. Si el
coeficiente de determinación fuese igual a cero significaría que la variable X tiene nula capacidad
predictiva de la variable a predecir (Y). (Universidad de Valencia, 2016)
Regresión Múltiple
El análisis de regresión múltiple es una técnica estadística que consiste en la extensión del análisis
de regresión simple a una forma donde se aplican dos o mas variables independientes; X1, X2,…,
Xk.; siendo: K>=2, para pronosticar el valor de la variable dependiente Y.