Universidad Central de Venezuela Departamento de Ciencias Bsicas
Facultad de Medicina Ctedra de Estadstica
Escuela de Nutricin y Diettica Asignatura: Estadstica Aplicada
Profesora: Zuleima Rodrguez Acevedo
ACTIVIDAD FINAL
EXPLICACIN DE LA ACTIVIDAD: De una investigacin hipottica planteada, se dan los resultados del anlisis estadstico y se pide responder RAZONADAMENTE a una serie de preguntas relacionadas con la investigacin (ms abajo).
Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrn y nicotina de los cigarrillos vienen acompaados por incrementos en el monxido de carbono emitido al fumarel punto de partida son los datos que a continuacin se presentan y se plantea el siguiente objetivo:
OBJETIVO: Hacer el estudio descriptivo de los datos y encontrar un modelo que permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrn, Nicotina y Peso del cigarrillo.
Hacer un estudio descriptivo de las variables que intervienen en el estudio. Este documento tendr 3 partes:
PARTE 1: Genere un breve informe estadstico descriptivo, a partir de la salida de ordenador que se adjunta (tmese el espacio que necesite pero sea breve), en el que seale:
1) el tamao muestral,
El tamao de la muestral es el nmero de sujetos que componen la muestra extrada de una poblacin, necesarios para que los datos obtenidos sean representativos de la poblacin. En nuestro caso, el tamao muestral es de 25 cigarrillos, compuesto por 16 cigarrillos de tabaco rubio y 9 cigarrillos de tabaco negro.
2) cul es la variable con mayor variabilidad,
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. Las medidas de dispersin utilizadas en sta muestra son la Desviacin Tpica y la Varianza. La variable con mayor variabilidad es el alquitrn debido a que presenta una Desviacin Tpica de 5,87634 y una Varianza de 34,531, ambas mayores con respecto a las dems variables.
3) cul de las medias es ms representativa de los datos
El peso es la variable con la media ms representativa debido a que los valores de su Desviacin Tpica y Varianza son inferiores a los de las dems medias con un valor de 0,0877215 y 0,008 respectivamente, lo que significa que tiene una menor cantidad de valores que se hallen dispersos a la media con respecto a las dems variables.
4) cul de las medias es ms estable.
El error tpico son las variaciones a menudo inevitables. El error tpico puede definirse tambin como la variacin producida por factores distorsionantes tanto conocidos como desconocidos. Una media con menor error tpico es una media ms estable. Por tanto nuestra media ms estable es el peso, ya que posee un error tpico de 0,175443
PARTE II Compare la muestra de mayor variabilidad (la que usted seleccion) con la muestra que usted estudi para elaborar la base de datos, explique:
P2 4 6 4 5 7 16 8 11 8 2 8 5 6 9 8 8 6 6 1 7 9 8 7 8 7 9 7 6 6 7 Media 6,97 Moda 8 Mediana 7 Desviacin tpica 2,68 Error tpico 1,27 Varianza 6,97 Fuente: Archivo "Estadstica base de datos, tablas y grficos" segundo corte. Datos corespondientes a la Pregunta #2 de la encuesta socioeconmica, acerca del nmero de ambientes en la vivienda incluyendo aquellos destinados para dormir, de la muestra de 30 estudiantes pertenecientes a la Universidad Central de Venezuela Cul es la variable con mayor variabilidad
Entre la variable alquitrn y la variable del nmero de ambientes en la vivienda la que tiene mayor variabilidad es la de alquitrn con una Desviacin Tpica de 5,87634 y una Varianza de 34,531 con respecto al de la variable del nmero de ambientes.
Cul de las medias es ms representativa de los datos
La media ms representativa es la de nmero de ambiente en la vivienda utilizado en la base de datos. Debido a que es la que tiene los valores de 2,68 de la Desviacin Tpica y el 6,97 de la Varianza inferiores a los presentados por el alquitrn.
Cul de las medias es ms estable.
La media con el menor Error Tpico es el alquitrn con 1,17527, por lo tanto es la media ms estable de las dos.
PARTE III
Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrn y nicotina de los cigarrillos vienen acompaados por incrementos en el monxido de carbono emitido al fumar. Se Parte de los datos que se presentan y se plantea el siguiente objetivo:
OBJETIVO: Encontrar un modelo que nos permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrn, Nicotina y Peso del cigarrillo..
PARTE 3.1. Comience con una inspeccin grfica de las nubes de puntos. Genere un breve informe (tmese el espacio que necesite, pero sea breve) sobre la relacin entre el monxido de carbono y cada una de las variables explicativas, a partir de las correspondientes nubes de puntos que se adjuntan. A partir de la inspeccin visual de las nubes, cul de las variables parece ms relacionada con el monxido y si la relacin parece similar para los dos tipos de tabaco, Rubio y Negro.
A partir de las correspondientes nubes de puntos que se adjuntan, se manifiesta una correlacin dependiente entre la produccin de monxido de carbono con el contenido de nicotina y el contenido de alquitrn evidenciado en mayor medida con la variable del contenido de nicotina. Lo que significa que a mayor contenido de nicotina en el cigarrillo habr un aumento relativamente similar del monxido de carbono producido. Con respecto al peso, si bien existe una relacin, no se hace muy evidente. Respecto a si existe una relacin similar entre tabaco rubio y negro se puede decir que, si bien para ambos existe la misma correlacin entre el contenido de alquitrn y el monxido de carbono, las cantidades de dichos elementos encontrados en los cigarros de la muestra son superiores para el tabaco negro, o lo que es lo mismo, se encuentran notablemente en menor cantidad para el tabaco rubio.
PARTE 3.2. Bsqueda de modelos que permitan estimar la cantidad de MONXIDO de CARBONO, a partir de las variables Alquitrn, Nicotina y Peso del cigarrillo. a. Realice un breve informe sobre los modelos y su representatividad, a la vista de los resultados que se adjuntan: Interprete el coeficiente de determinacin R 2 y el coeficiente de regresin, en cada modelo y dganos cul le parece ms adecuado y porqu
Coeficiente de determinacin El coeficiente de determinacin R2 indica la existencia de una relacin lineal y Mide el porcentaje de variacin en la variable explicada por una variable dependiente, que es ms fuerte cuanto ms prximo es a 1, sta relacin est determinada en porcentaje, por tanto s R2=1 significa que explica el 100% de la muestra. En el caso del modelo MA este coeficiente es de 0.91 y el del modelo MN es de 0.93 en ambos casos la correlacin lineal es muy alta, explicando el 91% y 93% de la muestra respectivamente. En el tercer modelo MP es 0.46 donde la correlacin lineal es moderada, ya que solo explica el 46% de la muestra. Siendo la correlacin positiva en todos los casos, entonces cuando X aumenta se espera que Y tambin aumente. El coeficiente de regresin Con respecto al modelo MA, El valor de b es 0.73 que indica el incremento de alquitrn en promedio por monxido de carbono producido, el valor de a se interpretara como el valor obtenido, entendindose este valor como 3.88. En el segundo modelo MN el valor b indica que el aumento de la nicotina aumenta el monxido de carbono producido. Por ltimo en el modelo MP podemos ver una diferencia Como el coeficiente de correlacin lineal es 0.46 no podemos deducir que exista una relacin fuerte ni dbil, tendramos que realizar contraste de hiptesis para saberlo con claridad. Un valor 0 indica que Existe regresin lineal de Y en funcin de x. En relacin al caso se considera ms apropiado el coeficiente de determinacin dado que este nos permite conocer la intensidad de relacin lineal entre dos variables de un intervalo, a fin de predecir futuros resultados o testear una hiptesis, haciendo ms especfico el estudio y mejor interpretacin de los datos al momento de analizar la investigacin. A diferencia del coeficiente de regresin que solo nos suministra la relacin entre las variables.
PARTE IV
Calcule para la variable (ingreso y edad) y (ingreso familiar y nmero de personas que trabajan) de la muestra que usted estudi , el coeficiente de determinacin y correlacin
INGRESO = 157,89*EDAD - 900,96 R = 0,0968
Explicando apenas el 9,6% de la variable no posee una correlacin fuerte o moderada, solo podra hablarse de una correlacin dbil entre la edad y el ingreso.
INGRESO FAMILIAR = -256,35*NMERO DE PERSONAS QUE TRABAJAN + 22725 R = 0,0002
Explicando tan solo 0,02% de la variable, estaramos frente a una correlacin inexistente entre el ingreso familiar y el nmero de personas que trabajan en el hogar.
Grafique a travs de un diagrama de nubes las variables que estudi anteriormente
y = 157.89x - 900.96 R = 0.0968 Bs. F. 0 Bs. F. 10,000 Bs. F. 20,000 Bs. F. 30,000 Bs. F. 40,000 Bs. F. 50,000 Bs. F. 60,000 Bs. F. 70,000 Bs. F. 80,000 Bs. F. 90,000 0 20 40 60 80 100 120 I N G R E S O S
EDAD NUBE Y RECTA DE CORRELACIN ENTRE INGRESOS Y EDAD
PARTE V
Entrega de las encuestas en fsico
Coeficiente de correlacin
Recuerde: N= tamao de la muestra en estudio Xi = valores de la variable independiente Yi = valores de la variable dependiente Fecha de entrega: El trabajo ser entregado en grupo