Vous êtes sur la page 1sur 6

Capitulo 3

Estadstica descriptiva: mtodos numricos

3.5

MEDIDAS DE ASOCIACIN ENTRE DOS VARIABLES


Hasta ahora hemos examinado mtodos numricos cuyo objeto es resumir los datos de una sola variable. Con frecuencia, al gerente o a quien toma decisiones le interesa la relacin entre dos variables. En esta seccin presentaremos la covarianza y la correlacin como medidas descriptivas de la relacin entre dos variables. Retomemos el caso del almacn de equipos de sonido estereofnico en San Francisco, que presentamos en la seccin 2.4. Al administrador del almacn le interesa investigar la relacin entre la cantidad de comerciales de televisin que aparece en el fin de semana y las ventas en su negocio durante la siguiente semana. En la tabla 3.7 aparecen datos de la muestra, donde las ventas se expresan en cientos de dlares con una observacin para cada semana (;/ = 10). El diagrama de dispersin de la figura 3.6 indica una relacin positiva, donde las ventas mayores (y) estn asociadas con una mayor cantidad de comerciales (.v). De hecho, el diagrama de dispersin sugiere que se podra emplear una recta como una aproximacin de esa relacin. A continuacin presentaremos la covarianza como medida descriptiva de la asociacin lineal entre dos variables.

102

Captulo 3 numricos

Estadstica descriptiva: mtodos

En la ecuacin (3.11) se us la notacin px para representar la media de la poblacin de la variable x y fiv para la de la variable y. La covarianza de la poblacin ff se define para una poblacin de tamao N.

Interpretacin de la covarianza
Para auxiliarnos en la interpretacin de la covarianza de la muestra es necesario tomar en cuenta la figura 3.7, que es la misma que el diagrama de dispersin de la figura 3.6, pero con una recta vertical punteada en x = 3 y una recta horizontal punteada en y = 51. En la grfica quedan cuatro cuadrantes: los puntos del cuadrante I corresponden a valores de x mayores que x y a valores de y mayores que y, los puntos del cuadrante II a valores de x, menores que x y a valores de y mayores que y, y as sucesivamente. Entonces, el valor de (x, - x)(y - y) debe ser positivo para los puntos ubicados en el cuadrante I, negativo para puntos del II, positivo para puntos del III y negativo para los del IV. Si el valor de sxy es positivo, los puntos que tuvieron la mxima influencia sobre sxy deben estar en los cuadrantes I y III. Por consiguiente, un valor positivo de sxy indica una asociacin lineal positiva entre x y y; esto es, al aumentar el valor de x, el de y aumenta. Sin embargo, si el valor de sxv es negativo, los puntos que tuvieron la mayor influencia sobre s estn en los cuadrantes II y IV. Por consiguiente, un valor negativo de siy indica una asociacin lineal negativa entre x y y; esto es, al aumentar el valor de x el valor de y disminuye. Por ltimo, si los puntos se distribuyen uniformemente en los cuatro cuadrantes, el valor de sxy ser cercano a cero, indicando que no hay asociacin lineal entre x y y. La figura 3.8 muestra los valores de sxy que se pueden esperar con tres tipos distintos de diagrama de dispersin. Retomando la figura 3.7, vemos que el diagrama de dispersin del almacn de equipos de sonido sigue el patrn de la parte superior de la figura 3.8. Como cabra esperar, el valor de la covarianza de la muestra es positivo, con s =11. De acuerdo con todo lo anterior, parecera que un valor positivo grande de la covarianza indica una fuerte relacin lineal positiva, y que un valor negativo grande indica una fuerte relacin lineal negativa. Sin embargo, un problema del uso de la covarianza como medida de la

La covarianza es una medida de la asociacin lineal entre dos variables.

Captulo 3 numricos

Estadstica descriptiva: mtodos

intensidad de la relacin lineal es que el valor de la covarianza que obtenemos depende de las unidades de medida de x y y. Por ejemplo, suponga que nos interesa la relacin entre la altura, x, y el peso, y, de los individuos. Es claro que la intensidad de la relacin debe ser la misma, si medimos la altura en pies o en pulgadas. No obstante, cuando la altura se expresa en pulgadas se obtienen valores numricos mucho mayores de (.v, - x) que cuando se expresa en pies. As, con la altura expresada en pulgadas, obtendramos un mayor valor en el numerador, 2(A,- - x)(y - J') en la ecuacin (3.10), y con l una mayor covarianza, cuando de hecho no hay diferencia en la relacin. Para evitar esta dificultad se usa el coeficiente de correlacin, que tambin mide la relacin entre dos variables.

Coeficiente de correlacin
Para los datos de una muestra, se define el coeficiente, de correlacin de momento del producto de Pesaron, como sigue.

3.5

Medidas de asociacin entre dos variables

Vous aimerez peut-être aussi