Vous êtes sur la page 1sur 5

Introducción

Si nos encontramos ante el analisis de dos variables cuantitativas somos capaces de determinar la
relación o algun tipo de patron que rige entre ellas mediante ciertas tecnicas estadisticas tales
como la correlación y la regresión. Si bien a la hora de aplicar dichas tecnicas, los calculos de
ambas pueden ser similares en determinados aspectos e incluso dar resultados casi identicos, no
deben confundirse pues son totalmente distintos ya que estan basados en diferentes supuestos.

El concepto de Correlacion se basa unicamente en la medida de la direccion y fuerza de asociacion


en la cual se relacionan dos variables diferentes.Mientras que la Regresion es una forma mas
compleja que esta basada en una ecuacion matematica que intenta aproximar el comportamiento
de dos variables que tienen cierta relacion entre si.

La correlacion influye en cierto grado la apreciacion del analista que esta realizando el estudio de
relacion entre variable ya que necesita determinar el grado de fueraz con el que influye una
variable con el comportamiento de la segunda, es decir determinar la importancion de una
cariable y que tanto influye sobre la otra.

En cambio la Regresion se basa segun su definicion en la construccion de una ecuacion matematica


que permita intuir el coportamiento de dos variables a partir de datos mustrales capturados a
traves de encuestas.Esto quiere decir que la regresion toma importacia aplicarla si es que requieres
determinar una cierta prediccion del resultado en base a un valor que resultantonces,ser la
variable de la ecuacion calculada por medio de la regresion de datos.

Objetivos

Este trabajo tiene com finalidad el de explicar el marco teorico, asi como tambien la aplicacion de
las tecnicas estadisticas de correlacion y regresion lineal multiple que se han visto durante este
ciclo en el curso dictado.

CAPITULO I: CORRELACIÓN

El análisis de regresión múltiple es una técnica estadística que consiste en la extensión del
análisis de regresión simple a una forma donde se aplican dos o mas variables independientes;
X1, X2,…, Xk.; siendo: K>=2, para pronosticar el valor de la variable dependiente Y.

ü La estimación de la ecuación de regresión poblacional es la ecuación de regresión lineal


múltiple muestral.
Donde:
v a, b1, b2,…, bk. : Son Coeficientes de Correlación Muestral

De acuerdo a la definición brindada por la Real Academia de la Lengua Española, correlación es la


correspondencia o relación recíproca entre dos o más cosas. En el ámbito de la estadística esto
sería la medida de la dependencia existente entre varias variables aleatorias. (Real Academia de la
Lengua Española, Octubre, 2014)

El análisis de correlación es un método usado para determinar la fuerza de la relación o


dependencia lineal existente entre las variables; si la fuerza de la dependencia lineal es pequeña,
entonces no podría usarse el análisis de la regresión para encontrar la relación lineal y usarla con
propósitos de predicción. (Weimer, 2003)

En el estudio de la correlación se busca determinar la fuerza y el sentido de la relación entre al


menos dos variables, una independiente y la otra dependiente. La fuerza, mide el grado de la
relación que existe entre las variables, sea esta fuerte o débil. El sentido por en cambio, mide la
variación de los valores Y respecto de X, es decir, si la pendiente es positiva la relación es directa y
si la pendiente es negativa la relación es inversa.

La variable que mide ambos parámetros es conocida como “coeficiente de correlación” y su valor
oscila entre -1 y +1, de tal manera que:

coeficiente de correlación (r)>0→correlación lineal positiva

coeficiente de correlación (r)<0→correlación lineal negativa

coeficiente de correlación (r)=0→no existe correlación lineal

La correlación es bastante visible en un diagrama de dispersión o nube de puntos en un sistema de


ejes cartesianos (x, y). Este tipo de gráfica ofrece una idea bastante aproximada sobre el tipo de
relación existente entre dos variables.

CORRELACIÓN LINEAL

En este punto haremos referencia a la correlación lineal, advirtiéndose que existen variables que
puedan estar relacionadas, pero no de forma lineal. El coeficiente de correlación de Pearson para
variables cuantitativas es un índice que mide el grado de variación entre distintas variables
relacionadas linealmente, y que, como ya se ha mencionado antes, sus valores absolutos oscilan
entre 0 y 1.

0≤r≤1
Para calcular el valor del coeficiente de correlación de Pearson es necesario primero calcular el
valor de la varianza y de la covarianza. (Vinuesa, 14 de octubre de 2016) Entonces:

La varianza de una muestra representa el promedio de la desviación de los datos con respecto a la
media y se calcula aplicando la siguiente fórmula:

Varianza (s2)=(xi-x)2N-1

La covarianza entre dos variables es una medida de la relación promedio de estas. Es la desviación
promedio del producto cruzado entre ellas. Se calcula aplicando la siguiente fórmula:

Covarianza(x;y)=(xi-x)(yi-y)N-1

A partir de ambos valores es posible obtener el coeficiente de correlación, definido como:

r=cov(x;y)sxsy

r=Nxiyi-xiyi[Nxi2-(xi2)][Nyi2-(yi2)]

Se dirá entonces, que la correlación entre dos variables X e Y es perfectamente positiva cuando
exactamente en la medida que aumenta una aumenta la otra. Un ejemplo de este suceso es la
relación espacio tiempo para un móvil que se desplaza a velocidad constante. Para este caso el
valor de r será de +1 y todos los valores de Y caerán sobre la prolongación de la misma línea
imaginaria trazada con pendiente positiva y ángulo de 45°. (COEFICIENTE DE CORRELACIÓN LINEAL
DE PEARSON)

Ilustración 1: Correlación lineal perfectamente positiva

Fuente: https://personal.us.es/vararey/adatos2/correlacion.pdf

Para el caso de una correlación perfectamente negativa el valor de r será de -1 y significará que tan
exactamente en la medida que aumenta una variable disminuye la otra. Un ejemplo de este suceso
es la relación entre presión y volumen, mostrándose en la siguiente figura. (COEFICIENTE DE
CORRELACIÓN LINEAL DE PEARSON)

Ilustración 2: Correlación lineal perfectamente negativa

Fuente: https://personal.us.es/vararey/adatos2/correlacion.pdf

El siguiente fenómeno es el que está cargado de componentes totalmente aleatorios y que no


suelen estar relacionados de ninguna forma. Estos eventos se caracterizan porque para una
variable X no es posible encontrar un único valor en la variable Y. En estas circunstancias se dice
que las variables no se relacionan y el valor de r es cero. (COEFICIENTE DE CORRELACIÓN LINEAL
DE PEARSON)

Ilustración 3: Diagrama de dispersión sin correlación

Fuente: https://personal.us.es/vararey/adatos2/correlacion.pdf

Pero +1, -1 y 0 no son los únicos valores que puede tomar el coeficiente de correlación; entre estos
límites existen n valores que podría tomar la variable y de acuerdo al sentido podría ser negativa o
positiva, pero en función de la magnitud podremos decir si es fuerte o débil. El siguiente diagrama
resume el análisis del coeficiente de correlación:

Ilustración 4: Diagrama resumen de los valores del coeficiente de correlación

Fuente: https://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf

De la misma manera que la formula antes descrita para calcular el valor del coeficiente de
correlación de Pearson (r), existe otra que utiliza el concepto de suma de cuadrados.

r=SSxySSxSSy

Donde:

SSxy=xy-xyn SSx=x2-(x)2n SSy=y2-(y)2n

Además del coeficiente de correlación (r) existe también el coeficiente de determinación que nos
ayuda a medir la bondad del ajuste de la recta de regresión. Básicamente nos indica el porcentaje
de la variación de Y que se explica a través del modelo lineal que se ha estimado, es decir a través
del comportamiento de X. (Vila, Sedano, López, & Juan, 2016)

coeficiente de determinación (R2)=(r2)

El existo de las predicciones de una variable dependen en gran medida del coeficiente de
determinación (bondad de la predicción). Si dos variables no covarían no será posible obtener
predicciones validas, y si la intensidad de la covariación es moderada a débil, las predicciones no
serán muy buenas.

Cuanto mayor sea la proporción, mejor será la predicción. Si el coeficiente de determinación fuese
igual a 1 significaría que la variable independiente (X) es capaz de “predecir” con exactitud a la
variable dependiente (Y) y que las predicciones no tendrían ningún margen de error. Si el
coeficiente de determinación fuese igual a cero significaría que la variable X tiene nula capacidad
predictiva de la variable a predecir (Y). (Universidad de Valencia, 2016)
Regresión Múltiple

El análisis de regresión múltiple es una técnica estadística que consiste en la extensión del análisis
de regresión simple a una forma donde se aplican dos o mas variables independientes; X1, X2,…,
Xk.; siendo: K>=2, para pronosticar el valor de la variable dependiente Y.

La estimación de la ecuación de regresión poblacional es la ecuación de regresión lineal múltiple


muestral.

Vous aimerez peut-être aussi