Académique Documents
Professionnel Documents
Culture Documents
COEFICIENTE DE
CORRELACIN DE KARL
PEARSON
[ESTADSTICA Y PROBABILIDADES]
DEFINICIONES BSICAS
DESVIACIN ESTNDAR
En caso de que las variables presenten alguna frecuencia se
multiplicara el producto de las deviaciones con la frecuencia de cada
variable.
= 2
( xi )2 ( x )2
n
Siendo:
2
=Varianza
COVARIANZA
La covarianza es el valor que indica el grado de variacin conjunta de
dos variables aleatorias1; la cual est representada por la media
aritmtica de la sumatoria de los productos de las desviaciones de
cada una de las variables respecto a sus medias respectivas.
S xy =
(Xi X)(Yi
Y )
n
S xy =
(x i . y i ) x . y
n
xy >0
xy <0
xy =0
INCONVENIENTES
El valor de la covarianza depende de la escala elegida para
sus ejes. (El resultado ser diferente si se expresa en metros o
en centmetros)
El resultado de la covarianza tiene como unidades el producto
de las unidades de ambas variables.
No podemos acotarla
x =3
y =51 ,
y a valores de
cuadrante II a valores de
yi
mayores de
x i menores a
xi
mayores
yi
y , y as sucesivamente.
mayores de
Entonces, el valor de
( x ix)( y i y )
influencia sobre
xy
xy
el valor de
el valor de
disminuye
, el de
es negativo, los
xy
estn los
xy
indica
y .
r=
S xy
x. y
1 r 1 .
Si
Si
Si
Si
Si
Figura N01: Diagrama de dis percin para dos variables (x,y) que pres entan una relacin lineal directa.
Figura N 02: Diagrama de dispercin para dos variables (x,y) que presentan una relacin lineal inversa.
Figura N03: Diagrama de dispercin para dos variables(x,y) donde o las variables son independientes o existe una relacin no lineal.
r0
En el siguiente grfico se observa que no hay una relacin clara a las que
estn sujetas las variables. Al calcular el coeficiente de Pearson, ste
tendera a cero y podremos asumir
cualquiera de los dos posibles
comportamientos: O las variables son independientes o la relacin es no
lineal.
FRMULAS
VARIANZA
(xi )2
2
=
( x )
2
DESVIACIN
AGRUPADOS
ESTNDAR
DE
DATOS
= 2
COVARIANZA
S xy =
(x i . y i ) x . y
n
r=
S xy
x. y
FUNCIN Y DEPENDIENTE DE X
y= y +
PASOS
Se
Se
Se
Se
Se
Se
xy
x2
(xx )
PARA EL CLCULO
calcula el nmero de datos estudiados.
calcula la media aritmtica.
calcula las varianzas.
calcula la desviacin tpica.
calcula la covarianza.
aplica la frmula del coeficiente de correlacin lineal.
EJEMPLO
Una compaa de seguros considera que el nmero de vehculos
120 km /h
(x)
( y)
que
, puede
xi
(Accidentes)
yi
(Vehculos)
15
18
10
20
Solucin a)
120 Km/h ?
n=5
xi
n=5
SUMA
2. Media aritmtica:
yi
5
7
2
1
9
24
x i2
15
18
10
8
20
71
25
49
4
1
81
160
x =
xi = 5+7+2+1+ 9 = 24 =4.8
y =
y i2
225
324
100
64
400
1113
3. Varianza:
x=
2y =
4. Desviacin Tpica:
x = x2 = 8.96=2.993
y = y 2= 20.96=4.578
5. Covarianza:
xi . yi
75
126
20
8
180
409
S xy =
(x i . y i ) x . y = 409 4.814.2=13.64
n
r=
S xy
13.64
=
=0.995
x . y 2.9934.578
Interpretacin
Al ser la covarianza positiva, la correlacin ser dependiente
(directa); es decir, que al aumentar la velocidad aumentar
tambin el nmero de accidentes. Por otro lado, el valor del
coeficiente de correlacin de Pearson es muy prximo a 1; por
lo que la estimacin realizada estar muy cerca al valor real.
Solucin b)
Regresin de
y= y +
xy
x2
y=14.2+
sobre
(xx )
13.64
( x4.8)
8.96
y=1.52 x+ 6.9
Para un
es
y=16
x=6
vehculos.
16
vehculos a
120 Km/h .
Solucin c)
La prediccin hecha es buena, ya que como vimos antes, el
coeficiente de correlacin de Pearson est muy prximo a 1.
EJERCICIOS PROPUESTOS
1. En un saln de clases de 40 alumnos, se disponen los resultados de
los exmenes parciales con respecto a las asignaturas de
Matemticas y Fsica.
REFERENCIAS
Anderson, David, Dennis Sweeney, y Thomas Williams. Estadstica
para administracin y economa. Mexico D.F.: Thomson, 2004.