Académique Documents
Professionnel Documents
Culture Documents
regresiones y correlaciones, y describa la naturaleza e intensidad de dicha relacin. Datos bivariados Se llaman datos bivariados a aquellos que provienen de dos variable medidas al mismo tiempo sobre cada individuo. Por ejemplo: Edad y Gnero, Escolaridad e Ingreso, Peso y Estatura, etc. Dependiendo de la naturaleza de cada variable se da el tratamiento a los datos. Caso 1: Dos variables Cualitativas Cuando los datos bivariados provienen de dos variables cualitativas, resulta conveniente organizarlos en una Tabla de Contingencia. Las columnas de esta tabla representan a las categoras de la variable 1 y los renglones representan a las categoras de la variable 2; la frecuencia aparecer en las celdas centrales de la tabla. Analicemos este caso con un ejemplo.
at
em
La siguiente tabla muestra el nmero de pacientes hospitalizados por la misma enfermedad en los ltimos 6 meses
at
ww w.
ic a1
Los ngeles 36 34
Mdica Sur 44 50
Identifica las dos variables: ________________ y ________________ . El nmero 44 del primer rengln y la segunda columna significa que: 44 pacientes eran hombres y estuvieron hospitalizados en el hospital Mdica Sur El nmero 52 del tercer rengln y la tercera columna significa que: ________________________________________________________________ __________________________________________________________________
.c om
Al sumar las frecuencias absolutas de cada fila y de cada columna, se obtiene la frecuencia absoluta marginal.
Hospital Gnero Hombres Mujeres Total Los ngeles 36 34 70 Mdica Sur 44 50 20 de Noviembre 43 52 95 Lpez Mateos 28 53 189 Total
Que informacin obtenemos de estos valores? 70 pacientes (en total) estuvieron hospitalizados en el hospital Los ngeles _____ pacientes (en total) estuvieron hospitalizados en el 20 de Noviembre _____ pacientes (en total) eran mujeres _____ pacientes (en total) estuvieron hospitalizados en ________________
ic a1
.c om
Claro!, tendramos que sumar todas las celdas, lo que es equivalente a sumar la ltima columna o el ltimo rengln que agregamos, y concluimos que: Se hizo el estudio con n = _____ pacientes
Frecuencias relativas Si dividimos todas las celdas de la tabla sobre el tamao de muestra (total de pacientes), obtenemos una nueva tabla, la cual nos proporciona la Frecuencia Relativa respecto al total.
Hospital Gnero Hombres Mujeres Total Los ngeles 0.1058 0.1470 0.2794 Mdica Sur 20 de Noviembre Lpez Mateos Total 0.4441
ww w.
at
em
at
etc.
Podemos responder la pregunta anterior utilizando la primera celda de la tabla: El 10.58% de los pacientes eran hombres y estuvieron hospitalizados en Los ngeles
Cmo interpretamos el resultado de la celda en el segundo rengln-segunda columna? ____________________________________________________________________ El porcentaje de pacientes que estuvieron en el hospital 20 de Noviembre es ____________%
Por otro lado, si dividimos los valores de cada rengln por el total del mismo, obtenemos la Frecuencia Relativa respecto al Genero.
Hospital Gnero Hombres Mujeres Los ngeles
36
Mdica Sur
/151 = 0.2384
50
El 26.45% de los pacientes mujeres estuvieron en el hospital Mdica Sur De los pacientes mujeres, el ________% estuvo en el hospital Lpez Mateos
Ahora, si dividimos los valores de cada columna sobre el total de la misma, obtenemos la Frecuencia Relativa respecto al Hospital.
Hospital Gnero Hombres Mujeres Los ngeles
36
ww w.
at
em
at
/189 = 0.2645
ic a1
20 de Noviembre
.c om
Lpez Mateos
Mdica Sur
20 de Noviembre
Lpez Mateos
/70 = 0.5142
52
/95 = 0.5473
De la tabla anterior, obtenemos que: De los pacientes que estuvieron en Los ngeles, el 51.42 % eran mujeres El 54.73% de los pacientes que estuvieron en el hospital 20 de Noviembre eran ___________
Ejercicios 2.1 1.- La tabla de contingencia siguiente representa el Estado Civil y la preferencia por ciertos peridicos de distintas personas. Peridico preferido Estado Civil Soltero Casado Viudo Separado El Universal 11 6 5 7 Exclsior 6 10 6 8 Reforma 7 10 6 5 La Jornada 14 8 9 12
Con base en la tabla, responde las preguntas y completa la informacin a) El peridico Exclsior lo prefieren ______ personas b) Se entrevist a ______ personas Viudas.
e) De las personas que prefieren el Universal, qu porcentaje son solteros? ________ f) De las personas separadas, el __________ % prefiere leer la Jornada g) De las personas viudas, qu porcentaje prefiere leer el Reforma? ______________
2.- La siguiente tabla 1 muestra los datos obtenidos al observar el tipo sanguneo y el gnero de 20 personas.
Genero Tipo Sang. F O+ M O+ F O+ F A+ M O+ M O+ F A+ F O+ F O+ F O+ M O+ F A+ F O+ F O+ F A+ F O+ M O+ F B+ F O+ F O+
a) Organiza estos datos en una tabla de contingencia b) Escribe algunos enunciados sobre la informacin que se obtiene de ella c) Representa grficamente
ww w.
at
em
at
ic a1
.c om
Caso 1: Dos variables Cuantitativas Cuando los datos bivariados provienen de dos variables cuantitativas resulta de inters estudiar la relacin que guarda una con la otra. La relacin puede ser de muy distinta naturaleza: lineal, cuadrtica, exponencial, logartmica, trigonomtrica, etc. En estadstica la relacin que nos interesa es la Relacin Lineal, por lo que se llevan a cabo Anlisis de Correlacin Lineal y de Regresin Lineal El anlisis de correlacin, se usa para medir la fuerza de asociacin entre las variables. El objetivo medir la covarianza que existe entre esas dos variables numricas. El anlisis de regresin se usa con propsitos de prediccin. Se busca desarrollar un modelo estadstico til para predecir los valores de una variable dependiente o de respuesta basados en los valores de al menos una variable independiente o explicativa. Ejemplo Se decidi examinar la relacin entre la estatura, (en metros), y el peso, (en kilogramos), a partir de una muestra de 12 alumnas de cierta escuela. Los datos se muestran en la siguiente tabla.
1 2 3 4 5 6 7 8 9 10 11 12 Diagrama de dispersin
em
1.60 1.63 1.68 1.67 1.53 1.58 1.57 1.58 1.54 1.60 1.56 1.53
at
Alumna
Estatura (m.)
ic a1
.c om
Peso (kg.) 56 59 63 62 50 54 53 58 48 55 54 51
Es una grafica donde aparecen los valores muestrales considerados como parejas ordenadas (x1, y1), (x2, y2), , (xn, yn). Si los valores muestrales dan una configuracin de puntos como el del diagrama de dispersin, el modelo se llama de regresin lineal simple.
ww w.
at
Diagrama de Dispersin
El coeficiente toma valores en el intervalo -1, 1. Un valor negativo de r significa que la relacin entre las variables es inversamente proporcional, (a mayor X menor Y) Un valor positivo de r significa que la relacin entre las variables es directamente proporcional, (a mayor X mayor Y) Un valor cercano a 0, indica que la relacin entre las variables es casi nula, es decir, no hay relacin entre ellas. Un valor cercano a 1 significa que la relacin entre las variables es fuertemente lineal.
ww w.
at
El objetivo es ver si existe o no una relacin de carcter lineal entre las dos variables, y si existe, entonces medir el grado de intensidad de la linealidad. Esto comnmente se realiza calculando el coeficiente de correlacin lineal de Pearson:
em
at
ic a1
.c om
Anlisis de Regresin Lineal Si se cumplen ciertas suposiciones, la ordenada b de la muestra y la pendiente m de la muestra se pueden usar como estimaciones de los parmetros respectivos de la poblacin m* y b*. As, la ecuacin de regresin muestral que representa el modelo de regresin en lnea recta es: Y*i = mXi + b donde Y* = valor pronosticado de Y para cada observacin Xi = valor de X para cada observacin Mtodo de Mnimos Cuadrados: se refiere a encontrar la lnea recta que mejor se ajuste a los datos, de manera que las diferencias entre los valores reales Yi y los valores pronosticados a partir de la recta ajustada de regresin Y* i sean tan pequeas como sea posible.
at
em
Regresando a nuestro ejemplo de estatura y peso de alumnas, para realizar los clculos es til construir una tabla como la siguiente:
at
ic a1
.c om
1 2 3 4 5 6 7 8 9 10 11 12
1.60 1.63 1.68 1.67 1.53 1.58 1.57 1.58 1.54 1.60 1.56 1.53
19.07
ww w.
Alumna
Estatura (m) X
Peso (kg) Y 56 59 63 62 50 54 53 58 48 55 54 51
663
XY 89.60 96.17 105.84 103.54 76.50 85.32 83.21 91.64 73.92 88.00 84.24 78.03 1056.01
X2 2.5600 2.6569 2.8224 2.7889 2.3409 2.4964 2.4649 2.4964 2.3716 2.5600 2.4336 2.3409 30.3329
Y2 3136 3481 3969 3844 2500 2916 2809 3364 2304 3025 2916 2601 36865
Por tanto, la relacin lineal es fuerte y es positiva; y, la ecuacin de regresin lineal es Y* = 87.03 X - 83.06
Utilizando dicha ecuacin podemos predecir, por ejemplo, el peso de una alumna cuya estatura es de 1.55 m Y* = 87.03(1.55) - 83.06 = 51.83 De acuerdo a este modelo, una alumna cuya estatura fuera de 1.55 m., tendra un peso de 51.8 kg.
Ejercicios 2.2 1.- En una tienda de descuento se tiene la siguiente situacin para un determinado artculo No. de piezas 1 3 5 10 12 15 24 (x) Costo por pieza 55 52 48 36 32 30 25 (Y)
______________________________________________________________________
2.- La siguiente tabla representa la densidad de un mineral (X) y su contenido de hierro (Y) X Y a) Construye el diagrama de dispersin. 2.8 27 3.0 30 b) Calcula el coeficiente de correlacin r 3.2 30 3.2 34 c) Determina la ecuacin de regresin lineal 3.4 36 d) Traza la recta de regresin sobre el diagrama de dispersin e) Si la densidad del material es 2.9, determina el valor estimado del contenido de hierro. f) Si el contenido de hierro es de 31, determina la densidad estimada del material
3.- En un anlisis de regresin la pendientes de la recta de mejor ajuste vale 1 4.86 y la ordenada al origen es 5 .
0
ww w.
at
em
at
c) Si una persona compra 20 piezas de ese artculo, cul sera el costo por pieza?
ic a1
.c om
b) Considerando la recta de regresin de la pregunta anterior, qu efecto causa un valor de x =2? _____________________________________
ww w.
at
em
at
ic a1
.c om