Vous êtes sur la page 1sur 27

Grácos para datos cuantitativos

Michael Wiper
Departamento de Estadística
Universidad Carlos III de Madrid

M. Wiper Estadística 1 / 18
Objetivo

Resultados de la prueba de
conocimientos para la incorporación a la
Escala de Cabos y Guardias de 2015.

Ilustrar los métodos grácos más importantes para resumir una muestra de datos
cuantitativos.

M. Wiper Estadística 2 / 18
El diagrama de barras para datos discretas
La tabla muestra la frecuencia de número de accidentes mortales por día en enero
a junio 2014.

Por ejemplo, había dos días en los que hubieron 9 accidentes mortales de tráco.

DGT
M. Wiper Estadística 3 / 18
El diagrama de barras

M. Wiper Estadística 4 / 18
El diagrama de barras

Hay una moda de tres accidentes diarios.


Los datos están concentrados mayoritamente entre 1 y 5 o 6 accidentes diarios.
Hay una ligera asimetría a la derecha o asimetría positiva.

M. Wiper Estadística 4 / 18
Frecuencias cumulativas

En casi un 75 % de los días, hay 4 o menos accidentes mortales.

M. Wiper Estadística 5 / 18
El gráco

M. Wiper Estadística 6 / 18
El histograma para datos continuos

Tenemos datos del número de hectareas quemadas en cada provincia de España


(sin incluir Ceuta y Melilla) en el año 2012.
Los datos varian entre 29 Ha (Álava) y 2246 Ha (Asturias)
No tiene sentido usar un diagrama de barras para cada valor individual.

M. Wiper Estadística 7 / 18
El histograma para datos continuos

Tenemos datos del número de hectareas quemadas en cada provincia de España


(sin incluir Ceuta y Melilla) en el año 2012.
Los datos varian entre 29 Ha (Álava) y 2246 Ha (Asturias)
No tiene sentido usar un diagrama de barras para cada valor individual.
Tenemos que agrupar los datos.

M. Wiper Estadística 7 / 18
El histograma para datos continuos
La mayoría de programas estadísticas tienen algoritmos automáticos para agrupar.
El siguiente gráco fue generado en Excel.

M. Wiper Estadística 8 / 18
El histograma para datos continuos
La mayoría de programas estadísticas tienen algoritmos automáticos para agrupar.
El siguiente gráco fue generado en Excel.

Hay barras anchas para representar la continuidad.

M. Wiper Estadística 8 / 18
El histograma para datos continuos
La mayoría de programas estadísticas tienen algoritmos automáticos para agrupar.
El siguiente gráco fue generado en Excel.

Hay barras anchas para representar la continuidad.


La elección de barras automática parece poco adecuado.

M. Wiper Estadística 8 / 18
El histograma para datos continuos

Una regla empírica es seleccionar aproximadamente n barras donde n es el
tamaño de la muestra.
En nuestro caso, usamos con (0, 350], (350, 700], ...

M. Wiper Estadística 9 / 18
El histograma para datos continuos
En el histograma se observa la fuerte asimetría positiva de los datos.

M. Wiper Estadística 10 / 18
El histograma para datos continuos
En el histograma se observa la fuerte asimetría positiva de los datos.

Hay dos valores mucho más grandes que los demás (atípicos).
Podemos mejorar empleando barras de distintas anchuras.

M. Wiper Estadística 10 / 18
Tabla de frecuencias con barras de distintas
anchuras
Ponemos barras menos anchas en principio y más anchas después.

M. Wiper Estadística 11 / 18
Tabla de frecuencias con barras de distintas
anchuras
Ponemos barras menos anchas en principio y más anchas después.

La anchura es proporcional a la frecuencia partido por la anchura. Así, el área


debajo de cada barra es igual a la frecuencia y el área debajo el histograma es
igual a 1.

M. Wiper Estadística 11 / 18
El histograma con barras de distintas anchuras

Ahora se ve la forma de los datos de manera mucho más clara.

M. Wiper Estadística 12 / 18
El histograma con barras de distintas anchuras

Ahora se ve la forma de los datos de manera mucho más clara.

½Es muy difícil hacer esto en Excel!

M. Wiper Estadística 12 / 18
El poligono de frecuencias

Supongamos que tenemos la siguiente tabla de frecuencias para unos datos


continuos.

M. Wiper Estadística 13 / 18
El poligono de frecuencias

Podemos construir un histograma.

M. Wiper Estadística 14 / 18
El poligono de frecuencias

Suavizando, tenemos un poligono de frecuencias.

Para una muestra muy grande, la forma del poligono se acerca a la forma de la
función de densidad.

M. Wiper Estadística 15 / 18
El poligono de frecuencias cumulativas

Podemos construir un histograma de frecuencias cumulativas.

M. Wiper Estadística 16 / 18
El poligono de frecuencias cumulativas

Ahora, unimos las barras desde los extremos izquierdos de cada intervalo.

Para muestras muy grandes, el poligono se acerca a la función de distribución


cumulativa.

M. Wiper Estadística 17 / 18
Resumen y siguiente sesión
Hemos comentado los grácos más utilizados para representar una muestra de
datos cuantitativos.

M. Wiper Estadística 18 / 18
Resumen y siguiente sesión
Hemos comentado los grácos más utilizados para representar una muestra de
datos cuantitativos.
Hemos observado algunas caracteristicas de la forma de una muestra de datos
como localización, escala o asimetría.

M. Wiper Estadística 18 / 18
Resumen y siguiente sesión
Hemos comentado los grácos más utilizados para representar una muestra de
datos cuantitativos.
Hemos observado algunas caracteristicas de la forma de una muestra de datos
como localización, escala o asimetría.
En las siguientes dos clases, introducimos formalmente las medidas más
importantes de forma.

M. Wiper Estadística 18 / 18

Vous aimerez peut-être aussi