Vous êtes sur la page 1sur 9

UNIVERSIDAD SIMÓN BOLÍVAR

Departamento de Cómputo Científico y Estadística


CO-3313 Estadística I
Septiembre-Diciembre 2017

PROYECTO DORMILONES

El objetivo principal de este trabajo es proveer información estadística de las horas extras
de sueño de 120 estudiantes de una universidad, los cuales fueron divididos en grupos,
haciendo referencia a las 4 carreras tomadas por dichos estudiantes. Para la elaboración
del proyecto se cuenta con los datos de las horas extras en las que duerme cada grupo de
universitarios. Debido a la manera en la que se manejan los datos, este trabajo se elabora
con base teórica y práctica en su mayoría. Para explicar de forma precisa los
procedimientos que se querían llevar a cabo, se hizo uso de tablas que permiten visualizar
los datos necesarios para la elaboración de gráficos que proporcionaran datos sustanciales.
Se puede conocer el valor del 25, 50 y 75 % de la distribución, la dispersión que poseen los
datos, así como también el comportamiento de la muestra en el área central. Para fines
prácticos del informe, se hizo uso de gráficos como se dice anteriormente, específicamente
Histogramas de Frecuencia y Diagramas de Cajas y Bigotes, lo cual permite mostrar los
datos de una manera más sencilla.

Integrantes:

Zaileth García 14-10385


Rosmin Antia 14-11218
Favour Omokagbor 14-11232
Estefanía García 14-11283
Planteamiento del problema:
La estadística descriptiva es utilizada mayormente para resumir información de un conjunt
o de datos y obtener conclusiones determinantes sobre estos. En este proceso se pueden
utilizar gráficos, tabuladores, entre otros para lograr una interpretación satisfactoria del es
tudio de los datos que se están presentando.
En la presente investigación, se realizan estudios e interpretaciones sobre la información e
stadística de las horas extras de sueño de 120 estudiantes de una universidad, los cu
ales fueron divididos en grupos, haciendo referencia a las 4 carreras tomadas por dic
hos estudiantes.
Mediante el uso de medidas de tendencia central, medidas sesgo y de dispersión, a
demás de diferentes tipos de gráficos, análisis de los mismos, y comparaciones, se po
drá observar cuantos estudiantes durmieron más o menos de las horas extras, lo que re
presenta el objetivo de este proyecto. Además de demostrar el uso e importancia de las he
rramientas que nos presenta la estadística descriptiva en la solución de problemas y en la
agrupación de variables y obtención de información relevante de las mismas en la to
ma de decisiones.
Base de datos:
Para la realización de este proyecto se contaron con datos como: las horas extras que d
uermen 120 estudiantes de una Universidad, los cuales fueron divididos en 4 grupos co
nformados por 30 cada uno. Cada grupo hace referencia a 4 carreras distintas esc
ogidas por los estudiantes.
Metodología
Para obtener los resultados necesarios, se utilizaron ciertas medidas descriptivas
pertenecientes a la estadística, para poder presentar resultados claros y precisos. Los datos
que disponemos para la realización de la investigación fueron ordenados en tablas para
mejor entendimiento.
Se hizo uso de tablas de datos no agrupados (ver Tabla 1), las cuales son generalmente
utilizadas cuando se está en presencia de pocos datos en una distribución, debido a que
las mismas abrevian dichos datos, tomando en cuenta su frecuencia absoluta (fi), es decir,
las veces que el mismo se repite en la distribución, y la frecuencia relativa (hi), que indica
la proporción de los elementos. (Fi) sería la suma de las frecuencias absolutas y (Hi) la
suma de las frecuencias relativas que concordara con el porcentaje del total de los
elementos, es decir el 100%. También se hizo uso de tabla de datos agrupados, las cuales
abrevian la información en intervalos o clases, y son utilizadas cuando la distribución posee
una extensa cantidad de datos. Estas últimas se utilizaron para poder realizar ciertos
gráficos, pero los cálculos se realizaron con las tablas de datos no agrupados.
Tabla 1. -Distribución de datos no agrupados de cada grupo.

Estos cálculos fueron utilizados para estudiar el comportamiento de la distribución, medidas


como la Media ( ) y la Mediana (Q2) las cuales dejan en evidencia el comportamiento de la
distribución en la región central, se hizo uso de medidas de posición como los Cuartiles, los
cuales indican el valor del 25 %( Q1) y 75 % (Q3) de la distribución. Así mismo, se hizo uso
del coeficiente de asimetría de Pearson (SK) y Curtosis (ɣ2 ), las cuales muestran si la
distribución es simétrica (al graficarla muestra un comportamiento equilibrado en torno a la
media y mediana) o asimétrica (suelen mostrar picos en sus extremos al graficarlas).
También se hizo uso de medidas de dispersión, tales como la Desviación Estándar (S) y el
Coeficiente de Variación (CV), que permiten saber si los valores están próximos entre sí.
Finalmente se hizo uso de dos tipos de gráficos, los cuales fueron los Histogramas de
Frecuencia y el Diagrama de Cajas y Bigotes o Boxplots, con el fin de presentar los
resultados de manera más sintetizada.
Desarrollo:
A petición de la parte interesada en este proyecto, se trabajara lo siguiente:
a) Un histograma de frecuencia de las horas de sueño extras para cada uno de
los grupos.
En vista de lo solicitado, se elaboró una tabla de datos agrupados (Ver tabla 2) para cada
uno de los grupos y así obtener las variables y datos respectivos, que nos ayudarían a ver
con más claridad las horas extras tomadas por cada grupo de estudiantes.

Tabla 2.- Tabla de datos agrupados de cada grupo

Los resultados obtenidos a través de las tablas de datos agrupados, se ven reflejados a
través de los histogramas (Ver gráfico 1) donde podemos observar que en el grupo 1, la
mayor frecuencia de las horas extras de sueño, se encuentra en el intervalo de [0,2) y la
menor se encuentra en el intervalo de [-4,2), Seguidamente en el grupo 2, se observa que
la mayor frecuencia de las horas extras de sueño, se encuentra en el intervalo de [0,2)
mientras que la menor se encuentra en el intervalo [6,8], Por consiguiente en el grupo 3, se
puede observar que la mayor frecuencia se encuentra en el intervalo de [1,2) mientras que
la menor frecuencia de horas de sueño extra se encuentra en el intervalo [2,3), la cual es
nula, Por último en el grupo número 4, se observa una mayor frecuencia de horas extras de
sueño en el intervalo [-1,0) mientras que la menor se encuentra en el intervalo [2,3), la cual
es nula.
Grafico 1.- Histogramas de frecuencias para cada grupo de
estudiantes.

b) Un resumen estadístico (mínimo, primer cuartil, segundo cuartil, media, tercer


cuartil, máximo, desviación estándar y coeficiente de variación). De las horas
de sueño extras de cada uno de los grupos de estudiantes. Interprete los
resultados.
Tabla 3.- Resumen estadístico de cada uno de los grupos

Partiendo de los datos presentados (Ver tabla 3), se puede interpretar:


La variable mínimo hace referencia a los valores más pequeños de las horas extras de
sueño del grupo de universitarios. Los Cuartiles o Q1 Y Q3 indican cual es el valor que tienen
el 25 y 75 % de la distribución respectivamente. En este caso, para realizar el cálculo de
dichos Cuartiles, para saber estos datos y la posición de cada valor, se ordenó la tabla de
manera ascendente. En el caso de la Mediana y partiendo de su definición en la cual se
indica que el valor de esta medida estadística corresponde al 50 % de la distribución total,
se realizó el mismo calculo utilizado para Q1 Y Q3. Con respecto a la Media ( ), se puede
decir que es una de las medidas más importantes de la estadística descriptiva, ya que da a
conocer el promedio de toda la distribución. El Máximo, contrario a lo que nos indica el
Mínimo, hace referencia a los valores más grandes de las horas extras de sueño tomada
por los universitarios. La Varianza (S2) es otra medida estadística, se debe hallar su valor
para conocer el de la Desviación Estándar (S), el propósito de esta última, es evidenciar de
manera precisa en donde se sitúan los datos en relación a la Media. Finalmente el
Coeficiente de Variación (CV) nos indica las dispersiones. Cuando el valor obtenido al
calcular el CV es menor que el 10% (CV<10%) se está en presencia de una distribución
homogénea.
c) Calcule el Coeficiente de asimetría de Pearson y Curtosis de las horas de
sueño extras de cada uno de los grupos de estudiantes para concluir con
relación a la asimetría y a la concentración de datos en la región central
Intérprete los resultados.

Con el objetivo de conocer la mayor información posible se procederá a utilizar medidas de


distribución para saber si los datos se reparten de manera uniforme alrededor del punto
central (media), y el grado de concentración que presentan en la región central de la
distribución, las medidas a utilizarse son las del coeficiente de asimetría de Pearson y las
medidas de Curtosis. Los cálculos de dichas medidas se realizaron con anticipación y
arrojaron los siguientes resultados:
Tabla 4.- Coeficiente de asimetría de Pearson y Medidas de Curtosis de cada árbol.

Tomando en cuenta estos datos (Ver tabla 4) se puede concluir que para el grupo 1, de
acuerdo al coeficiente de asimetría de Pearson la distribución presenta una asimetría
positiva, lo cual significa que es sesgada a la derecha, ya que SK>0 y se cumple que la
>mediana. Según la medida de Curtosis, la concentración de datos en la región central
está dada por una curva platicúrtica, ya que ɣ2 <0. Por lo tanto, el grado de concentración
es reducido en los valores centrales.
Para el grupo 2, se percibe que la distribución de los datos es sesgada a la derecha, es
decir, la asimetría es positiva ya que SK>0, se cumple nuevamente que la >mediana. Y
en cuanto a la medida de Curtosis, la concentración de los datos en la región central está
dada por una curva leptocúrtica, dado que ɣ2 >0. Lo que significa que existe una gran
concentración de valores en la región central de la distribución.
En cuanto al grupo 3, la distribución presenta una asimetría positiva, es sesgada a la
derecha, dado que SK>0 y se cumple que la >mediana. Según la medida de Curtosis, la
concentración de datos en la región central está dada por una curva platicúrtica, puesto que
ɣ2 <0.

Finalmente para el grupo 4, se tiene que la distribución de los datos es sesgada a la


derecha, lo que significa que la asimetría es positiva, ya que SK>0, y se cumple como en
los tres grupos anteriores que la >mediana. Con respecto a la Curtosis, la concentración
de los datos en la región central está dada por una curva platicúrtica, ya que ɣ2 <0. Por lo
que, el grado de concentración es reducido en los valores centrales, al igual que en el grupo
1 y el grupo 3.
Estas asimetrías se pueden apreciar en detalle en el histograma de frecuencia de cada uno
de los grupos (Ver gráfico 1).

d) Realice el grafico donde se pueda comparar las distribuciones de horas de


sueño extras de cada uno de los grupos de estudiantes (4 boxplots en el
mismo gráfico). Determine los grupos de estudiantes que menos y más
duermen.
Mediante éstas gráficas de caja (Ver gráfico 2) se observa que los estudiantes del grupo 1
y 3 son los que más horas duermen mientras que los estudiantes del grupo 2 y 4 son los
que menos horas de sueño
extra toman. Cabe destacar,
que en el grupo número 2 se
presentan datos atípicos en las
horas de sueño, éstos se
encuentran numéricamente
distantes del resto de los datos,
es decir, están fuera de los
rangos y medidas calculadas. A
través de la longitud de las
cajas se puede observar que
los grupos con más dispersión
de datos son el 3 y 4 y los de
menos dispersión son el grupo
1 y 2. En cuanto a la asimetría,
En ninguno de los gráficos la
mediana está en el centro, por
Grafico 2.- Diagrama de cajas y bigotes para cada grupo. lo que ninguno es simétrico, por
consiguiente se puede ver una
asimetría positiva ya que la mayor concentración de datos está por encima del 50%, lo que
significa que se centra entre el segundo y tercer cuartil, es decir que la distribución es
sesgada a la derecha.

Conclusiones y recomendaciones
A partir de los resultados obtenidos en las diversas parte del proyecto se puede llegar a la
conclusión que los grupos 1 y 3 son los que más horas extras duermen mientras que los
estudiantes de los grupos 2 y 4 son los que presentan menos horas extras de sueño, esto
se puede apreciar a través de los gráficos de caja (Ver gráfico 2). Mediante los histogramas
(Ver gráfico 1) se pudo apreciar cuales fueron las horas de sueño con mayor y menor
frecuencia, los cuales nos indican la cantidad o el rango de horas de sueño extra en la que
más se durmieron por cada grupo.
Por otro lado, mediante los resultados obtenidos en los cálculos de la Curtosis y asimetría
de Pearson (Ver tabla 4) pudimos apreciar que tan concentrados, homogéneos y
distribuidos se encontraban los datos de cada grupo. En el caso del grupo 1 se observó que
presenta una asimetría positiva y que la concentración de datos en la región central está
dada por una curva platicúrtica. En el grupo 2, la distribución de los datos fue sesgada a la
derecha y la concentración de los datos en la región central está dada por una curva
leptocúrtica, y por último, en el caso del grupo 3 y 4 la se presentó una asimetría positiva y
la concentración de datos en la región central estuvo dada por una curva platicúrtica.
En resumen, mediante este proyecto de investigación y análisis de datos se tuvo la
oportunidad de aprender más sobre la estadística descriptiva a través de métodos
numéricos y gráficos para resumir la información que fue suministrada, así como llevar
todos los conceptos y fórmulas de este tipo de estadística a la práctica y el análisis de los
distintos datos al llevarlos a un plano realista o cotidiano, lo cual es indispensable para
nuestra formación como estudiantes y futuros profesionales.

Bibliografía

 (2008) Diagrama de Caja y Bigotes. Página web: Estadística para todos.


Recuperado de http://www.estadisticaparatodos.es/taller/graficas/cajas.html.

 Sin autor. Estadística: conceptos básicos y definiciones. [archivo PDF].


Recuperado de http://www.mat.uda.cl/hsalinas/cursos/2010/eyp2/Clase1.pdf

Vous aimerez peut-être aussi