Vous êtes sur la page 1sur 9

PROPSITO Que el estudiante comprenda la forma en que se establece una relacin entre dos variables, a partir de tablas, diagramas,

regresiones y correlaciones, y describa la naturaleza e intensidad de dicha relacin. Datos bivariados Se llaman datos bivariados a aquellos que provienen de dos variable medidas al mismo tiempo sobre cada individuo. Por ejemplo: Edad y Gnero, Escolaridad e Ingreso, Peso y Estatura, etc. Dependiendo de la naturaleza de cada variable se da el tratamiento a los datos. Caso 1: Dos variables Cualitativas Cuando los datos bivariados provienen de dos variables cualitativas, resulta conveniente organizarlos en una Tabla de Contingencia. Las columnas de esta tabla representan a las categoras de la variable 1 y los renglones representan a las categoras de la variable 2; la frecuencia aparecer en las celdas centrales de la tabla. Analicemos este caso con un ejemplo.

at

em

La siguiente tabla muestra el nmero de pacientes hospitalizados por la misma enfermedad en los ltimos 6 meses

at

ww w.

ic a1

Hospital 20 de Noviembre 43 52 Lpez Mateos 28 53

Gnero Hombres Mujeres

Los ngeles 36 34

Mdica Sur 44 50

Identifica las dos variables: ________________ y ________________ . El nmero 44 del primer rengln y la segunda columna significa que: 44 pacientes eran hombres y estuvieron hospitalizados en el hospital Mdica Sur El nmero 52 del tercer rengln y la tercera columna significa que: ________________________________________________________________ __________________________________________________________________

.c om

Al sumar las frecuencias absolutas de cada fila y de cada columna, se obtiene la frecuencia absoluta marginal.
Hospital Gnero Hombres Mujeres Total Los ngeles 36 34 70 Mdica Sur 44 50 20 de Noviembre 43 52 95 Lpez Mateos 28 53 189 Total

Que informacin obtenemos de estos valores? 70 pacientes (en total) estuvieron hospitalizados en el hospital Los ngeles _____ pacientes (en total) estuvieron hospitalizados en el 20 de Noviembre _____ pacientes (en total) eran mujeres _____ pacientes (en total) estuvieron hospitalizados en ________________

ic a1

.c om

189 pacientes (en total) eran mujeres

Claro!, tendramos que sumar todas las celdas, lo que es equivalente a sumar la ltima columna o el ltimo rengln que agregamos, y concluimos que: Se hizo el estudio con n = _____ pacientes

Frecuencias relativas Si dividimos todas las celdas de la tabla sobre el tamao de muestra (total de pacientes), obtenemos una nueva tabla, la cual nos proporciona la Frecuencia Relativa respecto al total.
Hospital Gnero Hombres Mujeres Total Los ngeles 0.1058 0.1470 0.2794 Mdica Sur 20 de Noviembre Lpez Mateos Total 0.4441

Qu porcentaje de pacientes eran hombres ngeles?

ww w.

Ahora, podramos saber sobre cuntos pacientes se hizo el estudio?

at

em

at

etc.

y estuvieron hospitalizadas en Los

Podemos responder la pregunta anterior utilizando la primera celda de la tabla: El 10.58% de los pacientes eran hombres y estuvieron hospitalizados en Los ngeles

Cmo interpretamos el resultado de la celda en el segundo rengln-segunda columna? ____________________________________________________________________ El porcentaje de pacientes que estuvieron en el hospital 20 de Noviembre es ____________%

Por otro lado, si dividimos los valores de cada rengln por el total del mismo, obtenemos la Frecuencia Relativa respecto al Genero.
Hospital Gnero Hombres Mujeres Los ngeles
36

Mdica Sur

/151 = 0.2384
50

De aqu, obtenemos que:

El 26.45% de los pacientes mujeres estuvieron en el hospital Mdica Sur De los pacientes mujeres, el ________% estuvo en el hospital Lpez Mateos

Ahora, si dividimos los valores de cada columna sobre el total de la misma, obtenemos la Frecuencia Relativa respecto al Hospital.
Hospital Gnero Hombres Mujeres Los ngeles
36

ww w.

El 23.84% de los pacientes hombres estuvieron en el hospital Los ngeles

at

em

at

/189 = 0.2645

ic a1

20 de Noviembre

.c om

Lpez Mateos

Mdica Sur

20 de Noviembre

Lpez Mateos

/70 = 0.5142
52

/95 = 0.5473

De la tabla anterior, obtenemos que: De los pacientes que estuvieron en Los ngeles, el 51.42 % eran mujeres El 54.73% de los pacientes que estuvieron en el hospital 20 de Noviembre eran ___________

Ejercicios 2.1 1.- La tabla de contingencia siguiente representa el Estado Civil y la preferencia por ciertos peridicos de distintas personas. Peridico preferido Estado Civil Soltero Casado Viudo Separado El Universal 11 6 5 7 Exclsior 6 10 6 8 Reforma 7 10 6 5 La Jornada 14 8 9 12

Con base en la tabla, responde las preguntas y completa la informacin a) El peridico Exclsior lo prefieren ______ personas b) Se entrevist a ______ personas Viudas.

e) De las personas que prefieren el Universal, qu porcentaje son solteros? ________ f) De las personas separadas, el __________ % prefiere leer la Jornada g) De las personas viudas, qu porcentaje prefiere leer el Reforma? ______________

2.- La siguiente tabla 1 muestra los datos obtenidos al observar el tipo sanguneo y el gnero de 20 personas.
Genero Tipo Sang. F O+ M O+ F O+ F A+ M O+ M O+ F A+ F O+ F O+ F O+ M O+ F A+ F O+ F O+ F A+ F O+ M O+ F B+ F O+ F O+

a) Organiza estos datos en una tabla de contingencia b) Escribe algunos enunciados sobre la informacin que se obtiene de ella c) Representa grficamente

ww w.

c) De las personas que prefieren el Exclsior, el _______ % son separadas

at

d) Qu porcentaje de personas son casadas y prefieren el peridico Reforma? ______

em

c) Cuntas personas son solteras y prefieren el peridico la Jornada? _____________

at

ic a1

.c om

Caso 1: Dos variables Cuantitativas Cuando los datos bivariados provienen de dos variables cuantitativas resulta de inters estudiar la relacin que guarda una con la otra. La relacin puede ser de muy distinta naturaleza: lineal, cuadrtica, exponencial, logartmica, trigonomtrica, etc. En estadstica la relacin que nos interesa es la Relacin Lineal, por lo que se llevan a cabo Anlisis de Correlacin Lineal y de Regresin Lineal El anlisis de correlacin, se usa para medir la fuerza de asociacin entre las variables. El objetivo medir la covarianza que existe entre esas dos variables numricas. El anlisis de regresin se usa con propsitos de prediccin. Se busca desarrollar un modelo estadstico til para predecir los valores de una variable dependiente o de respuesta basados en los valores de al menos una variable independiente o explicativa. Ejemplo Se decidi examinar la relacin entre la estatura, (en metros), y el peso, (en kilogramos), a partir de una muestra de 12 alumnas de cierta escuela. Los datos se muestran en la siguiente tabla.

1 2 3 4 5 6 7 8 9 10 11 12 Diagrama de dispersin

em

1.60 1.63 1.68 1.67 1.53 1.58 1.57 1.58 1.54 1.60 1.56 1.53

at

Alumna

Estatura (m.)

ic a1

.c om

Peso (kg.) 56 59 63 62 50 54 53 58 48 55 54 51

Es una grafica donde aparecen los valores muestrales considerados como parejas ordenadas (x1, y1), (x2, y2), , (xn, yn). Si los valores muestrales dan una configuracin de puntos como el del diagrama de dispersin, el modelo se llama de regresin lineal simple.

ww w.

at

Diagrama de Dispersin

Anlisis de Correlacin Lineal

El coeficiente toma valores en el intervalo -1, 1. Un valor negativo de r significa que la relacin entre las variables es inversamente proporcional, (a mayor X menor Y) Un valor positivo de r significa que la relacin entre las variables es directamente proporcional, (a mayor X mayor Y) Un valor cercano a 0, indica que la relacin entre las variables es casi nula, es decir, no hay relacin entre ellas. Un valor cercano a 1 significa que la relacin entre las variables es fuertemente lineal.

ww w.

at

El objetivo es ver si existe o no una relacin de carcter lineal entre las dos variables, y si existe, entonces medir el grado de intensidad de la linealidad. Esto comnmente se realiza calculando el coeficiente de correlacin lineal de Pearson:

em

at

ic a1

.c om

Anlisis de Regresin Lineal Si se cumplen ciertas suposiciones, la ordenada b de la muestra y la pendiente m de la muestra se pueden usar como estimaciones de los parmetros respectivos de la poblacin m* y b*. As, la ecuacin de regresin muestral que representa el modelo de regresin en lnea recta es: Y*i = mXi + b donde Y* = valor pronosticado de Y para cada observacin Xi = valor de X para cada observacin Mtodo de Mnimos Cuadrados: se refiere a encontrar la lnea recta que mejor se ajuste a los datos, de manera que las diferencias entre los valores reales Yi y los valores pronosticados a partir de la recta ajustada de regresin Y* i sean tan pequeas como sea posible.

at

em

Regresando a nuestro ejemplo de estatura y peso de alumnas, para realizar los clculos es til construir una tabla como la siguiente:

at

ic a1

.c om

1 2 3 4 5 6 7 8 9 10 11 12

1.60 1.63 1.68 1.67 1.53 1.58 1.57 1.58 1.54 1.60 1.56 1.53
19.07

ww w.

Alumna

Estatura (m) X

Peso (kg) Y 56 59 63 62 50 54 53 58 48 55 54 51
663

XY 89.60 96.17 105.84 103.54 76.50 85.32 83.21 91.64 73.92 88.00 84.24 78.03 1056.01

X2 2.5600 2.6569 2.8224 2.7889 2.3409 2.4964 2.4649 2.4964 2.3716 2.5600 2.4336 2.3409 30.3329

Y2 3136 3481 3969 3844 2500 2916 2809 3364 2304 3025 2916 2601 36865

Al sustituir los valores correspondientes para r, m y b se obtiene: r = 0.94 , m = 87.03 , b = - 83.06

Por tanto, la relacin lineal es fuerte y es positiva; y, la ecuacin de regresin lineal es Y* = 87.03 X - 83.06

Utilizando dicha ecuacin podemos predecir, por ejemplo, el peso de una alumna cuya estatura es de 1.55 m Y* = 87.03(1.55) - 83.06 = 51.83 De acuerdo a este modelo, una alumna cuya estatura fuera de 1.55 m., tendra un peso de 51.8 kg.

Ejercicios 2.2 1.- En una tienda de descuento se tiene la siguiente situacin para un determinado artculo No. de piezas 1 3 5 10 12 15 24 (x) Costo por pieza 55 52 48 36 32 30 25 (Y)

______________________________________________________________________

2.- La siguiente tabla representa la densidad de un mineral (X) y su contenido de hierro (Y) X Y a) Construye el diagrama de dispersin. 2.8 27 3.0 30 b) Calcula el coeficiente de correlacin r 3.2 30 3.2 34 c) Determina la ecuacin de regresin lineal 3.4 36 d) Traza la recta de regresin sobre el diagrama de dispersin e) Si la densidad del material es 2.9, determina el valor estimado del contenido de hierro. f) Si el contenido de hierro es de 31, determina la densidad estimada del material
3.- En un anlisis de regresin la pendientes de la recta de mejor ajuste vale 1 4.86 y la ordenada al origen es 5 .
0

a) La ecuacin de esa recta de mejor ajuste es _____________________

ww w.

at

em

at

c) Si una persona compra 20 piezas de ese artculo, cul sera el costo por pieza?

ic a1

b) La recta de regresin lineal por mnimos cuadrados es _________

.c om

a) El coeficiente de correlacin lineal vale _________

b) Considerando la recta de regresin de la pregunta anterior, qu efecto causa un valor de x =2? _____________________________________

ww w.

at

em

at

ic a1

.c om

Vous aimerez peut-être aussi