Académique Documents
Professionnel Documents
Culture Documents
3.5
102
Captulo 3 numricos
En la ecuacin (3.11) se us la notacin px para representar la media de la poblacin de la variable x y fiv para la de la variable y. La covarianza de la poblacin ff se define para una poblacin de tamao N.
Interpretacin de la covarianza
Para auxiliarnos en la interpretacin de la covarianza de la muestra es necesario tomar en cuenta la figura 3.7, que es la misma que el diagrama de dispersin de la figura 3.6, pero con una recta vertical punteada en x = 3 y una recta horizontal punteada en y = 51. En la grfica quedan cuatro cuadrantes: los puntos del cuadrante I corresponden a valores de x mayores que x y a valores de y mayores que y, los puntos del cuadrante II a valores de x, menores que x y a valores de y mayores que y, y as sucesivamente. Entonces, el valor de (x, - x)(y - y) debe ser positivo para los puntos ubicados en el cuadrante I, negativo para puntos del II, positivo para puntos del III y negativo para los del IV. Si el valor de sxy es positivo, los puntos que tuvieron la mxima influencia sobre sxy deben estar en los cuadrantes I y III. Por consiguiente, un valor positivo de sxy indica una asociacin lineal positiva entre x y y; esto es, al aumentar el valor de x, el de y aumenta. Sin embargo, si el valor de sxv es negativo, los puntos que tuvieron la mayor influencia sobre s estn en los cuadrantes II y IV. Por consiguiente, un valor negativo de siy indica una asociacin lineal negativa entre x y y; esto es, al aumentar el valor de x el valor de y disminuye. Por ltimo, si los puntos se distribuyen uniformemente en los cuatro cuadrantes, el valor de sxy ser cercano a cero, indicando que no hay asociacin lineal entre x y y. La figura 3.8 muestra los valores de sxy que se pueden esperar con tres tipos distintos de diagrama de dispersin. Retomando la figura 3.7, vemos que el diagrama de dispersin del almacn de equipos de sonido sigue el patrn de la parte superior de la figura 3.8. Como cabra esperar, el valor de la covarianza de la muestra es positivo, con s =11. De acuerdo con todo lo anterior, parecera que un valor positivo grande de la covarianza indica una fuerte relacin lineal positiva, y que un valor negativo grande indica una fuerte relacin lineal negativa. Sin embargo, un problema del uso de la covarianza como medida de la
Captulo 3 numricos
intensidad de la relacin lineal es que el valor de la covarianza que obtenemos depende de las unidades de medida de x y y. Por ejemplo, suponga que nos interesa la relacin entre la altura, x, y el peso, y, de los individuos. Es claro que la intensidad de la relacin debe ser la misma, si medimos la altura en pies o en pulgadas. No obstante, cuando la altura se expresa en pulgadas se obtienen valores numricos mucho mayores de (.v, - x) que cuando se expresa en pies. As, con la altura expresada en pulgadas, obtendramos un mayor valor en el numerador, 2(A,- - x)(y - J') en la ecuacin (3.10), y con l una mayor covarianza, cuando de hecho no hay diferencia en la relacin. Para evitar esta dificultad se usa el coeficiente de correlacin, que tambin mide la relacin entre dos variables.
Coeficiente de correlacin
Para los datos de una muestra, se define el coeficiente, de correlacin de momento del producto de Pesaron, como sigue.
3.5