Vous êtes sur la page 1sur 5

PLANTEAMIENTO Y OBJETIVO:

Tomamos datos de la siguiente publicacin:


"Using Cigarette Data for an Introduction to Multiple Regression", by Lauren Mcintyre in
Volume 2, Number 1, of the Journal of Statistics Education.
La primera parte del objetivo lo cubriremos con esta tarea p2p, y la segunda parte, lo
cubriremos en la segunda tarea p2p al finalizar el mdulo 4.
Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido
de alquitrn y nicotina de los cigarrillos vienen acompaados por incrementos en el
monxido de carbono emitido al fumar. Partimos de estos datos y nos planteamos el
siguiente objetivo:

OBJETIVO: Hacer el estudio descriptivo de los datos y encontrar un modelo que nos
permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables
Alquitrn, Nicotina y Peso del cigarrillo.
Tarea. Hacer un estudio descriptivo de las variables que intervienen en el estudio. La
realizacin de esta tarea ir en un documento a parte que tendrs que subir en el apartado
"Fichero opcional" que se encuentra al final de la actividad p2p. Este documento tendr 3
partes:
PARTE 1: Genere un breve informe estadstico descriptivo, a partir de la salida de
ordenador que se adjunta (tmese el espacio que necesite pero sea breve), en el que
seale:

1) el tamao muestral,
El tamao muestral es 25

2) cul es la variable con mayor variabilidad,


La variable con mayor variabilidad es el alquitrn al presentar mayor Desviacin
Tpica.

3) cul de las medias es ms representativa de los datos


Observando el cuadro lneas abajo la media ms representativa de los datos se muestra
en el contenido de nicotina por no tener mayor variabilidad en el intervalo.

4) cul de las medias es ms estable.

Observando el cuadro lneas abajo la media ms estable de los datos se muestra en el peso
del cigarrillo por no tener mayor variabilidad en el intervalo.

alquitran
nicotina
peso
monox.carbon
N vlido (segn lista)

Media Representativa
Media-Desv.
Media+Desv.
Tpico
Tpico
5.93966
17.69234
0.521799
1.230201
0.093069
1.847499
7.78832
17.26768
25

Media Estable
Media-Error
Media+Error
Tpico
Tpico
10.64073
12.99127
0.1676
1.5844
0.794841
1.145727
11.58006
13.47594

Nota: Depende del objetivo del trabajo. Si lo que se pretende es saber si la media
representa bien a sus datos, utilizar media desviacin tpica. Si lo que quiere es saber si
se espera que la media sea estable en el muestreo, o sea, cmo de parecida ser su
media a la de otros investigadores que hagan estudios similares, utilizar media error
estndar.

Parte 2. Analice los percentiles a partir de la tabla correspondiente que aparece


debajo. Escriba un breve informe con los resultados ms relevantes entre los que al menos
debe estar la Mediana y el Recorrido intercuartlico (debe calcularlo a partir de la tabla)
para todas y cada una de las variables. En el informe compare, adems, los resultados
obtenidos con la Media y su dispersin y la Mediana y su dispersin.

Mediana
El percentil 50 es el valor de la mediana para cada una de las variables.
Es decir para la variable Monxido de Carbono el 50% de los casos est por encima de 13 y
el otro 50% est por debajo.
Para el contenido de Alquitrn el 50% de los casos est por encima de 12.4 y el otro 50%
est por debajo.
Para el contenido de Nicotina el 50% de los casos est por encima de 0.9 y el otro 50% est
por debajo.
Para el peso del cigarro el 50% de los casos est por encima de 0.9573 y el otro 50% est
por debajo.
Recorrido Intercuartilico
Es la diferencia entre el Q1 y el Q3 o la diferencia entre P75 Y P25
Para la variable Monxido de Carbono el R.I. = 15.65-9.75 = 5.9 es la distancia existente en
el 50% central de la distribucin.

Para el contenido de Alquitrn el R.I. = 15.15-7.9 = 7.25 es la distancia existente en el 50%


central de la distribucin.
Para el contenido de Nicotina el R.I. = 1.03-0.68 = 0.35 es la distancia existente en el 50%
central de la distribucin.
Para el peso del cigarro el R.I. = 1.016850-0.920550 = 0.0963 es la distancia existente en el
50% central de la distribucin.

alquitran
nicotina
peso
monox.carbon
N vlido (segn
lista)

Media-Desv.
Tpico
5.93966
0.521799
0.093069
7.78832
0

Media
Media+Desv.
Tpico
17.69234
1.230201
1.847499
17.26768
0

Mediana
Mediana-Desv.
Mediana+Desv.
Tpico
Tpico
7.12366
18.87634
12.045799
12.754201
0.022785
1.777215
-3.78238
5.69698
0

Se observa que el contenido de nicotina presenta menor variabilidad al tener en cuenta la


media y la mediana y la dispersin respectiva.
Parte 3. Analice los Box plot (diagramas de caja) que se adjuntan y saque las conclusiones
ms relevantes. Debe escribir, al menos, sobre la posible asimetra y la existencia, o no, de
outliers

Segn los diagramas de caja se muestra para todas las variables presencia de outliers. En el
caso de la variable Monxido C, se puede decir que presenta simetra en la informacin, en
cambio en las variables Alquitrn y Nicotina la distribucin es asimtrica a la izquierda y la
variable Peso del Cigarro es asimtrica a la derecha.
Se observa mayor variabilidad en los datos del contenido de monxido de carbono y en los
datos del contenido de alquitrn, con respecto a las variables contenido de nicotina y peso
del cigarro.

Vous aimerez peut-être aussi