Vous êtes sur la page 1sur 3

Teora de correlacin

Introduccin
La correlacin es una medida caracterstica de la Estadstica Descriptiva Bivariada. Las medidas de correlacin sirven para describir qu tan bien una recta describe la relacin entre dos variables. Si X e Y son dos variables correlacionadas, es posible mostrar la localizacin de los puntos de ambas variables mediante un diagrama de dispersin basado en un sistema rectangular de coordenadas. Si todos los puntos en este diagrama de dispersin parecen formar una recta, la relacin es lineal. En este caso, esto implica que los puntos del diagrama pueden definirse mediante una ecuacin lineal. Si Y tiende a crecer conforme crece X, como en el Grfico 1, la relacin lineal se denomina positiva. Esto implica que: A mayor X, mayor Y (Ejemplo: A mayor altura, mayor peso) A menor X, menor Y (Ejemplo: A menor altura, menor peso)
Grfico 1: Relacin lineal positiva

110 100 90 80 70 60 50 159 169 179 189 199


Eje x: Altura (cm), Eje y: Peso (kg)

Si no existe relacin entre las variables, como en el Grfico 2, se dice que no hay correlacin entre ellas.
Grfico 2: Ausencia de relacin

110 100 90 80 70 60 50 159 169 179 189 199

Eje x: Altura (cm), Eje y: Peso (kg)

Si Y tiende a decrecer conforme crece X, como en el Grfico 3, la relacin lineal se denomina negativa. Esto implica que: A mayor X, menor Y (Ejemplo: A mayor altura, menor peso) A menor X, mayor Y (Ejemplo: A menor altura, mayor peso)
Grfico 3: Relacin lineal negativa

110 100 90 80 70 60 50 150 160 170 180 190 200 210


Eje x: Altura (cm), Eje y: Peso (kg)

En caso de que los puntos parecieran formar una curva, la correlacin se denomina no lineal. En tal caso la ecuacin apropiada sera una ecuacin cuadrtica, o de tercer o cuarto orden

El coeficiente de correlacin de Pearson (rxy)


El coeficiente de correlacin de Pearson entre dos variables aleatorias X e Y se define como el cociente entre la covarianza entre ambas variables y la desviacin tpica de cada una de ellas:

Existe una versin abreviada de esta expresin para el clculo manual

rxy n

X i Yi

Xi
2

Yi

X ( X)

Y ( Y)

Propiedades del coeficiente de correlacin de Pearson Siempre se encuentra comprendido en el intervalo -1 rxy 1. En ningn caso el coeficiente de correlacin puede encontrarse fuera de este intervalo, en tal caso sera incorrecto. El signo indica la direccin de la relacin o rxy > 0 implica Relacin lineal positiva o rxy < 0 implica Relacin lineal negativa Existen determinados valores clave como: o rxy = 0 implica Ausencia de relacin o rxy = 1 implica Relacin lineal positiva perfecta o rxy = - 1 implica Relacin lineal negativa perfecta Slo se debe emplear si la relacin entre las variables X e Y es aproximadamente lineal 2

Se utiliza preferentemente en variables cuantititativas No sirve para deducir relaciones causales Se dice que la relacin entre las variables es lineal perfecta cuando el diagrama de dispersin puede aproximarse a una recta de forma exacta:
Grfico 4. Relacin lineal positiva casi perfecta
100 90 80 70 60 50 40 30 140 150 160 170 180

Grfico 5. Relacin lineal negativa casi perfecta


80 70 60 50 40 30 20 10
200

r=0,99
190

r=-0,999
150 160 170 180 190 200

0 140

Valores del coeficiente de correlacin Se considerarn los siguientes niveles de relacin en funcin de los valores del coeficiente de correlacin: Relacin dbil (o prcticamente inexistente): rxy pertenece al intervalo [-0.4, 0.4] Relacin moderada: rxy pertenece a los intervalos [-0.7, -0.4] y [0.4, 0.7] Relacin fuerte: rxy pertenece a los intervalos [-1, -0.7] y [0.7, 1] Factores que pueden influir en el coeficiente de correlacin La variabilidad de las propias variables (la dispersin) El tamao de muestra: A mayor nmero de sujetos / observaciones (N), menor resulta el coeficiente de correlacin (Esto est relacionado con el hecho de que la N se incluya en el denominador de la expresin matemtica de rxy La influencia de una tercera variable, considerada perturbadora.

Vous aimerez peut-être aussi