Académique Documents
Professionnel Documents
Culture Documents
UNAL 1 / 22
Covarianza
En este caso, los valores xi y yi son los datos obtenidos del individuo i.
UNAL 2 / 22
Ejemplo
UNAL 3 / 22
Para los datos de la tabla se tiene que x̄ = 2.875 y ȳ = 8.25. Luego:
1
Sxy = [(3 − 2.875)(11 − 8.25) + (7 − 2.875)(18 − 8.25) + (4 − 2.875)(9 − 8.25)+
8−1
(2 − 2.875)(4 − 8.25) + (0 − 2.875)(7 − 8.25) + (4 − 2.875)(6 − 8.25)+
(1 − 2.875)(3 − 8.25) + (2 − 2.875)(8 − 8.25)] = 8.036
Como el valor tiene signo positivo, se dice que a medida que aumenta el número de
anuncios, va aumentar el consumo de latas. Por lo cual se tiene una relación directa.
UNAL 4 / 22
Ejemplo
Se quiere revisar cómo sería la relación entre el rendimiento de dos entidades del es-
tado, comparando el presupuesto ejecutado, en miles de millones de pesos, durante los
últimos 6 años:
UNAL 5 / 22
Solución
Al trazar una linea que trate de tomar los puntos, parece que su relación es muy débil,
por que la linea es casi horizontal.
UNAL 6 / 22
Se puede verificar que x̄ = 8.67 y ȳ = 8, con lo cual:
Como el valor es muy cercano a cero, se puede decir, que la asociación es inversa
pero débil. En este ejemplo, la cercanía del valor de la covarianza a cero permite la
conclusión.
UNAL 7 / 22
Para datos agrupados:
k c
1 XX
Sxy = (xi − x̄)(yj − ȳ )fij
n−1
i=1 j=1
UNAL 8 / 22
Ejemplo
Previamente se determinó que los salarios tienen que relación con la cantidad de horas
laboradas. Se calcula la covarianza de los datos para ver el tipo de relación que se
establece. La información a utilizar es la siguiente:
UNAL 9 / 22
Por otro lado, como las marcas de clase van a representar a cada intervalo, podemos
ver la tabla conjunta de las dos variables, de acuerdo a sus marcas de clase como:
1
Sxy = [(400 − 986)(6 − 18.18)(320) + (400 − 986)(18 − 18.18)(550)+
2000 − 1
(400 − 986)(30 − 18.18)(150) + (1200 − 986)(6 − 18.18)(100)+
(1200 − 986)(18 − 18.18)(280) + (1200 − 986)(30 − 18.18)(115)+
(2000 − 986)(6 − 18.18)(85) + (2000 − 986)(18 − 18.18)(130)+
(2000 − 986)(30 − 18.18)(270)] = 119.3
Así, la relación entre variables es directa.
UNAL 10 / 22
Coeficiente de Correlación
Otro inconveniente viene de las unidades de la covarianza, que resulta ser el producto
de las unidades. Para el ejemplo de los salarios y las horas laboradas, las unidades de
la covarianza son miles de pesos-hora. En el caso del tiempo de empleo y el numero de
proyectos, las unidades serían meses-número proyectos. En los dos casos las unidades
no significan nada.
UNAL 11 / 22
Para resolver este inconveniente, se calcula el coeficiente de correlación de Pearson,
dado por:
Sxy
rxy =
Sx Sy
Donde Sxy es la covarianza, Sx es la desviación estándar de X y Sy es la desviación
estándar de Y.
UNAL 12 / 22
Ejemplo
Sxy 119.3
rxy = = = 0.02
Sx Sy (660.32)(8.65)
Sxy 8.036
rxy = = = 0.7868
Sx Sy (2.167)(4.713)
Sxy −0.6
rxy = = √ √ = −0.1138
Sx Sy 2.67 10.4
UNAL 13 / 22
Ejemplo
Se quiere ver la relación entre el periodo de tiempo en meses que un empleado lleva
trabajando en cierta entidad y el número de proyectos entregados por la entidad al
gobierno central. Se observa lo siguiente:
UNAL 14 / 22
Solución
En este caso se deben aplicar las fórmulas y conceptos de datos agrupados. Como
primer paso, determinamos las distribuciones marginales:
0-6 79 3
6 -12 93 9
De donde:
x̄ = (1/172)[(79 ∗ 3) + (93 ∗ 9)] = 6.24
q
sx = + (1/171)[79(3 − 6.24)2 ] + 93(9 − 6.24)2 ] = 2.99
UNAL 15 / 22
Número de f•j Marca de
proyectos clase yj
0-4 46 2
5-8 68 6.5
9 - 11 58 10
De donde:
ȳ = (1/172)[(46 ∗ 2) + (68 ∗ 6.5) + (58 ∗ 10)] = 6.48
q
sy = + (1/171)[46(2 − 6.48)2 ] + 68(6.5 − 6.48)2 + 58(10 − 6.48)2 ] = 3.09
UNAL 16 / 22
La covarianza es:
UNAL 17 / 22
Ejemplo
Persona 1 2 3 4 5 6 7 8 9 10 11 12
Cantidad de cigarrillos 0 0 0 10 13 20 27 35 35 44 53 60
Días de ausencia 1 3 8 10 4 14 5 6 12 16 10 16
UNAL 18 / 22
Primero, se realiza el gráfico entre las dos variables, teniendo en cuenta los pares de
valores. este gráfico es al que se llama el diagrama de dispersión. Sirve para dar una
idea inicial de lo que sucede entre las variables:
UNAL 19 / 22
La recta que pasa entre los puntos va a dar una idea de la relación entre las dos vari-
ables. En este caso se observa una relación directa, es decir, a mayor cantidad de
cigarrillos fumados por una persona, presenta mayor cantidad de días de ausencia por
enfermedad.
De los datos se tiene que el promedio de cigarrillos fumados para las 12 personas
es 24.75 y el promedio de días de ausencia es de 8.75. La desviación estándar de la
cantidad de cigarrillos es 20.98 y la desviación estándar de los días de ausencia es de
5.8. La covarianza es:
El coeficiente de correlación es
Sxy 72.02
rxy = = = 0.59
sx sy (20.98)(5.8)
UNAL 20 / 22
Ejemplo
Persona 1 2 3 4 5 6 7 8 9 10
Participación religiosa 5 25 45 20 30 40 1 15 10 35
Autoestima 8 3 2 7 5 5 4 4 7 3
UNAL 21 / 22
El diagrama de dispersión es el siguiente:
Se puede verificar que sxy = −16.8 y rxy = −0.56. Luego, la relación entre las dos
variables es inversa y moderada. De modo que a mayores niveles de participación
religiosa, menores niveles de autoestima. Lo cual, se ve reflejado en el gráfico.
UNAL 22 / 22