Vous êtes sur la page 1sur 8

Descripcin De Datos Bivariados

Descripcin De Datos Bivariados


P2(7) Cuando se miden dos variables en una sola unidad experimental; los datos resultantes se llaman Datos Bivariados. Los mtodos para graficar datos bivariados, si las variables son cualitativas o cuantitativas, permiten estudiar las dos variables.

GRFICAS PARA VARIABLES CUALITATIVAS

P3(8) Cuando por lo menos una de las dos variables es cualitativa puede usar grficas de sectores o de pastel simples.

Ejemplo 3.1 Los profesores de universidades privadas reciben mejor remuneracin que los profesores de universidades pblicas? Los datos de la tabla 3.1 se tomaron de un muestra de 400 profesores cuya categora, tipo de universidad y salario se registraron. El nmero de da cada celda es el salario promedio (en miles de dlares) para los profesores que caen en esa categora. Use una grfica para contestar la pregunta planteada para esta muestra.

Tabla 3.1 Salarios de profesores por categora y tipo de universidad

Profesor de Tiempo completo

Profesor asociado

Profesor asistente

Pblica Privada

55.8 61.6

42.2 43.3

35.2 35.5

Solucin Para mostrar los salarios promedio de estos 400 profesores, sea un grafica de barras lado con lado, como se ilustra en la figura 3.1.La altura de las barras es el salario promedio, donde cada par de barras a lo largo del eje horizontal representa una categora acadmica diferente. Los salarios son mucho mayores para los profesores de tiempo completo de universidades privadas, pero hay muy poca diferencia en las dos categoras inferiores.

DIAGRAMAS DE DISPERSIN PARA DOS VARIABLES CUANTITATIVAS

P7(7) Cuando dos variables en una grafica son cuantitativas una se llama x y la otra y. Cada para de valores de...

Un diagrama de dispersin es una representacin grfica de la relacin entre dos variables, muy utilizada en las fases de Comprobacin de teoras e identificacin de causas raz y en el Diseo de soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causaefecto es la clave de la resolucin eficaz de un problema, que las relaciones de causa-efecto casi siempre muestran variaciones, y que es ms fcil ver la relacin en un diagrama de dispersin que en una simple tabla de nmeros

Diagrama de dispersin
De Wikipedia, la enciclopedia libre Saltar a: navegacin, bsqueda

El tiempo de espera entre las erupciones y la duracin de la erupcin del giser Old Faithful en el Parque Nacional Yellowstone, Wyoming, EE.UU. Este grfico sugiere que por lo general hay dos "tipos" de erupciones: uno de corta espera y corta duracin y otro de larga espera y larga duracin.

Un diagrama de dispersin es un tipo de diagrama matemtico que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posicin en el eje horizontal y el valor de la otra variable determinado por la posicin en el eje vertical.1 Un diagrama de dispersin se llama tambin grfico de dispersin.

[editar] Descripcin
Un diagrama de dispersin se emplea cuando existe una variable que est bajo el control del experimentador. Si existe un parmetro que se incrementa o disminuye de forma

sistemtica por el experimentador, se le denomina parmetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal. La variable medida o dependiente = eje de y usualmente se representa a lo largo del eje vertical. Si no existe una variable dependiente, cualquier variable se puede representar en cada eje y el diagrama de dispersin mostrar el grado de correlacin (no causalidad) entre las dos variables. Un diagrama de dispersin puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. La correlacin puede ser positiva (aumento), negativa (descenso), o nula (las variables no estn correlacionadas). Se puede dibujar una lnea de ajuste (llamada tambin "lnea de tendencia") con el fin de estudiar la correlacin entre las variables. Una ecuacin para la correlacin entre las variables puede ser determinada por procedimientos de ajuste. Para una correlacin lineal, el procedimiento de ajuste es conocido como regresin lineal y garantiza una solucin correcta en un tiempo finito. Uno de los aspectos ms poderosos de un grfico de dispersin, sin embargo, es su capacidad para mostrar las relaciones no lineales entre las variables. Adems, si los datos son representados por un modelo de mezcla de relaciones simples, estas relaciones son visualmente evidentes como patrones superpuestos. El diagrama de dispersin es una de las herramientas bsicas de control de calidad, que incluyen adems el histograma, el diagrama de Pareto, la hoja de verificacin, los grficos de control, el diagrama de Ishikawa y el ((diagrama de flujo)).

Covarianza
De Wikipedia, la enciclopedia libre Saltar a: navegacin, bsqueda

En estadstica la covarianza es una medida de dispersin conjunta de dos variables estadsticas.

Contenido

1 Definicin 2 Interpretacin de la covarianza 3 Propiedades 4 No correlacin e independencia 5 Relacin con el producto escalar 6 Enlaces Externos 7 Vase tambin

[editar] Definicin
La covarianza SXY (a veces tambin denotada Cov(X,Y) ) de dos variables aleatorias X e Y es:

donde es el operador esperanza. Para distribuciones discretas la frmula anterior se concreta en

Cuando las variables aleatorias X e Y son n-dimensionales, es decir, e , su matriz de covarianzas XY es:

[editar] Interpretacin de la covarianza


Si Sxy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de y. Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relacin lineal entre las dos variables estudiadas. Si Sxy < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeos valores de y.

[editar] Propiedades
Si X, Y, W, y V son variables aleatorias y a, b, c, d son constantes ("constante" en este contexto significa no aleatorio), se cumple que:

, la varianza de X

, frmula que suele emplearse en la prctica para calcular la covarianza.

Estas propiedades se deducen de manera casi directa de la definicin de la covarianza. En otras palabras la covarianza trata de explicar que tan relacionadas se encuentran dos variables entre s, que tanto se mueve una cuando la otra se mueve otro tanto. Ejemplo, si la variable X se mueve 1, supongamos que la variable Y se mueve 2, entonces podemos decir que la variable Y se mueve positivamente el doble de lo que se movera la variable X.

[editar] No correlacin e independencia


Si X e Y son independientes, entonces su covarianza es cero. Esto ocurre por la propiedad de independencia,

Lo opuesto, sin embargo, generalmente no es cierto: algunos pares de variables aleatorias tienen covarianza cero pese a que no son independientes. Bajo algunas hiptesis adicionales, la covarianza de valor cero implica independencia, como por ejemplo en el caso de la distribucin normal multivariante.

[editar] Relacin con el producto escalar


La mayora de las propiedades de la covarianza se deducen de las del producto escalar:
1. Bilinealidad: para las constantes a y b, y las variables aleatorias X, Y, y U, Cov(aX + bY, U) = a Cov(X, U) + b Cov(Y, U) 2. Simetra: Cov(X, Y) = Cov(Y, X) 3. Es un operador positivo definido: Var(X) = Cov(X, X) 0; adems, si Cov(X, X) = 0 entonces X es una variable aleatoria constante.

De hecho, la covarianza es un producto interior sobre el espacio cociente de las variables aleatorias de momentos finitos iguales salvo constante.

[editar] Enlaces Externos

Simulacin de la covarianza de una variable bidimensional continua [1] y discreta [2] con R (lenguaje de programacin)

[editar] Vase tambin


Regresin lineal Correlacin ANOVA Varianza


DISTRIBUCIONES BIDIMENSIONALES Las frecuencias se representarn por Fij y fij Recibe el nombre de distribucin marginal de X la distribucin que tiene la variable X ignorando la variable Y. Y viceversa. Distribuciones condicionadas: covarianza Es una medida de la intensidad de cierta asociacin estadstica entre dos variables. Tambin se puede expresar como , que se lee: La covarianza es igual al promedio de los productos cruzados menos el producto de las medias

NUBES DE PUNTOS. CORRELACIN stas son las notas de 12 estudiantes en Matemticas y en Fsica: Alumno Matemticas a 2 b 3 c 4 Fsica d 4 e 5 f 6 1 g 6 3 h 7 2 i 7 4 j 8 4 k 10 4 l 10 6 4 6 7 9 10

Es una distribucin bidimensional porque a cada individuo le corresponden los valores de dos variables. Si tomamos esos dos valores como las coordenadas de un punto, la distribucin puede ser representada mediante 12 puntos: nube de puntos. Se aprecia una relacin entre las dos variables: a mejor nota en Matemticas mejor nota en Fsica, pero solo a grandes rasgos, grosso modo. Se dice que existe correlacin entre esas dos variables. Relacionemos ahora las notas de Matemticas de los mismos alumnos con las de otra asignatura, Filosofa. Alumno Filosofa a b c d e f g h i j k 2 5 2 7 5 4 6 6 7 5 5 l 9

Matemticas 2 3 4 4 5 6 6 7 7 8 10 10

Tanto si nos fijamos en la tabla de datos como en la nube de puntos, apreciamos que tambin hay correlacin entre estas dos variables, pero es ms dbil que la anterior. Una jugadora de baloncesto lanza a canasta, desde distintas distancias, 10 balones cada vez. Lgicamente, encesta ms cuanto ms cerca est. Distancia(m) 1 2 3 4 5 6 7 8 Encestes 9 10 6 4 2 0 1 0

En este caso hay correlacin fuerte y negativa, pues al aumentar una variable tiende a disminuir la otra. La tendencia a variar conjuntamente las dos variables en una distribucin bidimensional se marca mediante la recta de regresin. Cuanto ms prximos estn los puntos a la recta, ms fuerte es la correlacin.

MEDIDA DE LA CORRELACIN Hemos visto que la correlacin entre dos variables (ms o menos fuerte, positiva o negativa) se aprecia mediante el grado de apertura de los puntos de la nube. Vamos a confeccionar una frmula que sirva para obtener su valor de forma numrica e inequvoca. Centro de gravedad de una distribucin bidimensional MEDIA DE LA VARIABLE MEDIA DE LA VARIABLE El punto se llama centro de gravedad de la distribucin. Covarianza Correlacin El coeficiente de correlacin, r, tiene las siguientes propiedades: No tiene dimensiones. Es decir, no depende de las unidades en las que se expresan los valores de las dos variables. Por tanto, si se realiza un cambio de unidades, el valor de r no vara. El valor de r est comprendido entre -1 y 1.

Si la correlacin es perfecta (puntos de la nube alineados), entonces | r | = 1, es decir, r = 1 r = -1. Si la correlacin es fuerte, | r | es prximo a 1. Si la correlacin es dbil, | r | es prximo a 0.

EJERCICIOS RESUELTOS

2 3 4 4 5 6 6 7 7 8 10 10 72

1 3 2 4 4 4 6 4 6 7 9

4 9 16 16 25 36 36 49 49 64 100

1 9 4 16 16 16 36 16 36 49 81

2 9 8 16 20 24 36 28 42 56 90 100 431

10 100 100 60 504 380

Utilizando la frmula anterior, calcular la correlacin entre las variables nota en Matemticas, x, nota en Fsica, y. Para ello, calcular previamente

El centro de gravedad es el punto (6,5). Observamos que este punto no tiene por que ser de le distribucin. Por tanto, Es una correlacin muy alta.

Mtodo de los mnimos cuadrados Partimos de la nube de puntos . Hemos de encontrar la recta que mejor se ajuste a la nube. Qu criterio seguimos para ese mejor ajuste? Consideramos todas las posibles rectas y =A+Bx y nos quedaremos con aquella para la cual los cuadrados de las distancias, , sumen lo menos posible: mnimo. De ese modo se llega (utilizando mtodos matemticos superiores a este curso) a lo siguiente:

La recta buscada pasa por el centro de gravedad de la distribucin. Su pendiente es

El signo del coeficiente de correlacin y el del coeficiente de regresin coinciden, pero aqu termina la coincidencia: puede ser que la recta de regresin tenga pendiente alta y, sin embargo

Vous aimerez peut-être aussi