Vous êtes sur la page 1sur 13

Universidad Central de Venezuela Departamento de Ciencias Bsicas

Facultad de Medicina Ctedra de Estadstica


Escuela de Nutricin y Diettica Asignatura: Estadstica Aplicada

Profesora: Zuleima Rodrguez Acevedo

ACTIVIDAD FINAL

EXPLICACIN DE LA ACTIVIDAD: De una investigacin hipottica planteada, se dan los resultados
del anlisis estadstico y se pide responder RAZONADAMENTE a una serie de preguntas
relacionadas con la investigacin (ms abajo).

Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrn y
nicotina de los cigarrillos vienen acompaados por incrementos en el monxido de carbono emitido al
fumarel punto de partida son los datos que a continuacin se presentan y se plantea el siguiente
objetivo:




OBJETIVO: Hacer el estudio descriptivo de los datos y encontrar un modelo que permita estimar la
cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrn, Nicotina y Peso del
cigarrillo.

Hacer un estudio descriptivo de las variables que intervienen en el estudio. Este documento tendr 3
partes:

PARTE 1: Genere un breve informe estadstico descriptivo, a partir de la salida de ordenador que
se adjunta (tmese el espacio que necesite pero sea breve), en el que seale:

1) el tamao muestral,

El tamao de la muestral es el nmero de sujetos que componen la muestra
extrada de una poblacin, necesarios para que los datos obtenidos sean
representativos de la poblacin. En nuestro caso, el tamao muestral es de 25
cigarrillos, compuesto por 16 cigarrillos de tabaco rubio y 9 cigarrillos de tabaco
negro.

2) cul es la variable con mayor variabilidad,

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran
la variabilidad de una distribucin, indicando por medio de un nmero, si las
diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto
mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms
homognea ser a la media. Las medidas de dispersin utilizadas en sta muestra
son la Desviacin Tpica y la Varianza. La variable con mayor variabilidad es el
alquitrn debido a que presenta una Desviacin Tpica de 5,87634 y una
Varianza de 34,531, ambas mayores con respecto a las dems variables.

3) cul de las medias es ms representativa de los datos

El peso es la variable con la media ms representativa debido a que los
valores de su Desviacin Tpica y Varianza son inferiores a los de las dems
medias con un valor de 0,0877215 y 0,008 respectivamente, lo que significa que
tiene una menor cantidad de valores que se hallen dispersos a la media con
respecto a las dems variables.

4) cul de las medias es ms estable.

El error tpico son las variaciones a menudo inevitables. El error tpico puede
definirse tambin como la variacin producida por factores distorsionantes tanto
conocidos como desconocidos. Una media con menor error tpico es una media
ms estable. Por tanto nuestra media ms estable es el peso, ya que posee un
error tpico de 0,175443

PARTE II
Compare la muestra de mayor variabilidad (la que usted seleccion) con la muestra que usted
estudi para elaborar la base de datos, explique:







P2 4 6 4 5 7 16 8 11 8 2 8 5 6 9 8 8 6 6 1 7 9 8 7 8 7 9 7 6 6 7
Media 6,97
Moda 8
Mediana 7
Desviacin tpica 2,68
Error tpico 1,27
Varianza 6,97
Fuente: Archivo "Estadstica base de datos, tablas y grficos" segundo corte.
Datos corespondientes a la Pregunta #2 de la encuesta socioeconmica, acerca del nmero de ambientes en la vivienda
incluyendo aquellos destinados para dormir, de la muestra de 30 estudiantes pertenecientes a la Universidad Central de
Venezuela
Cul es la variable con mayor variabilidad

Entre la variable alquitrn y la variable del nmero de ambientes en la vivienda la
que tiene mayor variabilidad es la de alquitrn con una Desviacin Tpica de
5,87634 y una Varianza de 34,531 con respecto al de la variable del nmero de
ambientes.

Cul de las medias es ms representativa de los datos

La media ms representativa es la de nmero de ambiente en la vivienda
utilizado en la base de datos. Debido a que es la que tiene los valores de 2,68 de
la Desviacin Tpica y el 6,97 de la Varianza inferiores a los presentados por el
alquitrn.

Cul de las medias es ms estable.

La media con el menor Error Tpico es el alquitrn con 1,17527, por lo tanto es
la media ms estable de las dos.


PARTE III

Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrn y
nicotina de los cigarrillos vienen acompaados por incrementos en el monxido de carbono emitido al
fumar. Se Parte de los datos que se presentan y se plantea el siguiente objetivo:


OBJETIVO: Encontrar un modelo que nos permita estimar la cantidad de MONOXIDO de
CARBONO, a partir de las variables Alquitrn, Nicotina y Peso del cigarrillo..




PARTE 3.1. Comience con una inspeccin grfica de las nubes de puntos. Genere un
breve informe (tmese el espacio que necesite, pero sea breve) sobre la relacin entre el
monxido de carbono y cada una de las variables explicativas, a partir de las correspondientes
nubes de puntos que se adjuntan. A partir de la inspeccin visual de las nubes, cul de las
variables parece ms relacionada con el monxido y si la relacin parece similar para los dos
tipos de tabaco, Rubio y Negro.

A partir de las correspondientes nubes de puntos que se adjuntan, se manifiesta
una correlacin dependiente entre la produccin de monxido de carbono con el
contenido de nicotina y el contenido de alquitrn evidenciado en mayor medida
con la variable del contenido de nicotina. Lo que significa que a mayor
contenido de nicotina en el cigarrillo habr un aumento relativamente similar
del monxido de carbono producido. Con respecto al peso, si bien existe una
relacin, no se hace muy evidente.
Respecto a si existe una relacin similar entre tabaco rubio y negro se puede decir
que, si bien para ambos existe la misma correlacin entre el contenido de
alquitrn y el monxido de carbono, las cantidades de dichos elementos
encontrados en los cigarros de la muestra son superiores para el tabaco negro,
o lo que es lo mismo, se encuentran notablemente en menor cantidad para el
tabaco rubio.


PARTE 3.2. Bsqueda de modelos que permitan estimar la cantidad de MONXIDO de
CARBONO, a partir de las variables Alquitrn, Nicotina y Peso del cigarrillo.
a. Realice un breve informe sobre los modelos y su representatividad, a la vista de los
resultados que se adjuntan: Interprete el coeficiente de determinacin R
2
y el coeficiente de
regresin, en cada modelo y dganos cul le parece ms adecuado y porqu



Coeficiente de determinacin
El coeficiente de determinacin R2 indica la existencia de una relacin lineal y
Mide el porcentaje de variacin en la variable explicada por una variable
dependiente, que es ms fuerte cuanto ms prximo es a 1, sta relacin est
determinada en porcentaje, por tanto s R2=1 significa que explica el 100% de la
muestra. En el caso del modelo MA este coeficiente es de 0.91 y el del modelo
MN es de 0.93 en ambos casos la correlacin lineal es muy alta, explicando el
91% y 93% de la muestra respectivamente. En el tercer modelo MP es 0.46 donde
la correlacin lineal es moderada, ya que solo explica el 46% de la muestra.
Siendo la correlacin positiva en todos los casos, entonces cuando X aumenta
se espera que Y tambin aumente.
El coeficiente de regresin
Con respecto al modelo MA, El valor de b es 0.73 que indica el incremento de
alquitrn en promedio por monxido de carbono producido, el valor de a se
interpretara como el valor obtenido, entendindose este valor como 3.88. En el
segundo modelo MN el valor b indica que el aumento de la nicotina aumenta el
monxido de carbono producido. Por ltimo en el modelo MP podemos ver una
diferencia Como el coeficiente de correlacin lineal es 0.46 no podemos deducir
que exista una relacin fuerte ni dbil, tendramos que realizar contraste de
hiptesis para saberlo con claridad.
Un valor 0 indica que Existe regresin lineal de Y en funcin de x.
En relacin al caso se considera ms apropiado el coeficiente de determinacin
dado que este nos permite conocer la intensidad de relacin lineal entre dos
variables de un intervalo, a fin de predecir futuros resultados o testear una
hiptesis, haciendo ms especfico el estudio y mejor interpretacin de los datos
al momento de analizar la investigacin. A diferencia del coeficiente de regresin
que solo nos suministra la relacin entre las variables.

PARTE IV


Calcule para la variable (ingreso y edad) y (ingreso familiar y nmero de personas que
trabajan) de la muestra que usted estudi , el coeficiente de determinacin y correlacin

INGRESO = 157,89*EDAD - 900,96
R = 0,0968

Explicando apenas el 9,6% de la variable no posee una correlacin fuerte o
moderada, solo podra hablarse de una correlacin dbil entre la edad y el
ingreso.

INGRESO FAMILIAR = -256,35*NMERO DE PERSONAS QUE TRABAJAN +
22725
R = 0,0002

Explicando tan solo 0,02% de la variable, estaramos frente a una correlacin
inexistente entre el ingreso familiar y el nmero de personas que trabajan en el
hogar.

Grafique a travs de un diagrama de nubes las variables que estudi anteriormente


y = 157.89x - 900.96
R = 0.0968
Bs. F. 0
Bs. F. 10,000
Bs. F. 20,000
Bs. F. 30,000
Bs. F. 40,000
Bs. F. 50,000
Bs. F. 60,000
Bs. F. 70,000
Bs. F. 80,000
Bs. F. 90,000
0 20 40 60 80 100 120
I
N
G
R
E
S
O
S

EDAD
NUBE Y RECTA DE CORRELACIN ENTRE INGRESOS Y EDAD


PARTE V

Entrega de las encuestas en fsico

Coeficiente de correlacin


Recuerde:
N= tamao de la muestra en estudio
Xi = valores de la variable independiente
Yi = valores de la variable dependiente
Fecha de entrega:
El trabajo ser entregado en grupo

Vous aimerez peut-être aussi