Vous êtes sur la page 1sur 20

Unidad 2 TABLAS Y GRFICOS ESTADSTICOS

1.- RECUENTO Y AGRUPAMIENTO DE DATOS

Una vez que hemos observado y recogidos los datos, bien a travs de encuestas, bien con bases de datos ya almacenados, debemos resumir la informacin de forma adecuada y til para su posterior estudio. Atendiendo al problema que estemos estudiando, realizamos el agrupamiento de datos de una forma u otra: Si la variable es cualitativa, observamos y contamos el nmero de individuos de la poblacin que presentan cada una de las distintas modalidades del carcter. Ejemplo 1: Un estudio hecho en un conjunto de 24 personas con objeto de determinar su grupo sanguneo ha conducido a los siguientes resultados:

A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O.

Modalidad

Recuento

Frecuencia (n de veces que aparece) 11

||||| ||||| |

B O AB

||||| | ||||| | |

6 6 1

Si la variable es cuantitativa discreta, observamos y contamos el nmero de individuos de la poblacin que presentan cada uno de los distintos valores del carcter o variable, si son pocos valores.

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

11

Ejemplo 2: Las calificaciones obtenidas en un ejercicio se recogen en el siguiente grfico:

Calificaciones del ejercicio


5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 Calificaciones

Frecuencias

Calificaciones 1 2 3 4 5 6 7 8 9 10

Recuento | || | || ||| |||| ||| | || |

Frecuencia 1 2 1 2 3 4 3 1 2 1

Si la variable es cuantitativa continua sus valores se distribuyen en intervalos de clase. Al agrupar los valores de una variable en intervalos de clase, se simplifica su descripcin, pero se pierde precisin: cunto menor sea el nmero de intervalos que se consideren, menor ser la precisin, y viceversa.

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

12

Ejemplo 3: si a un grupo de 30 personas le preguntamos el dinero que en ese momento llevan encima (en ), nos encontramos con los siguientes datos:

45 5

115 18

25 20

30 67

17 50

8 37

2 150

268 20

60 98

78 18

159 12

230 31

500 42

120 10 56 110

Evidentemente, la variable estadstica tiene un recorrido (diferencia entre el mayor y menor valor) muy grande, 498 euros, por lo que si queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir cuntos intervalos queremos. Normalmente se suele trabajar con no ms de 10 o 12 intervalos. Amplitud =498/10 = 49,8, por lo que tomaremos intervalos de amplitud 50 Procuraremos que en la decisin de intervalos los valores observados no coincidan con los valores de los extremos del intervalo y si esto ocurre que no sea en ms de un 5% del total de observaciones. [ L i-1 , L i ) [ 0,50) [ 50, 100) [ 100,150) [ 150, 200) [ 200, 250) [ 250, 300) [ 300, 350) [ 350, 400) [ 400, 450) [ 450, 500) [ 500,550) | Recuento ||||| ||||| ||||| | ||||| | ||| || | | Frecuencia 16 6 3 2 1 1 0 0 0 0 1

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

13

2.- TABLAS ESTADSTICAS

Una vez realizado el recuento de datos interesa recoger la informacin de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados nmeros que representan el nmero de veces que ha aparecido, su proporcin con respecto a otros valores de la variable, etc. Estos nmeros se denominan frecuencias: As tenemos los siguientes tipos de frecuencia: Frecuencia absoluta: La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni Frecuencia relativa: La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fi
fi = ni N

N es el tamao de la muestra.

Porcentaje: La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi. pi = f i 100 Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa. Es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por Ni.

N i = nk
k =1

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

14

Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamao de la muestra, y la denotaremos por Fi
Fi = Ni N

Ejemplo 4: Se le ha preguntado a 50 familias el nmero de miembros activos (personas que trabajan); una vez realizado el recuento se ha confeccionado la tabla de frecuencias as: Personas Activas Xi 1 2 3 4 Total Nmero Familias ni 16 20 9 5 50 fi pi Ni Fi 16/50 36/50 45/50 50/50

16/50 32% 16 20/50 40% 36 9/50 5/50 1 18% 45 10% 50 100%

Ejercicio 1.- Realiza las tablas de frecuencias de los ejemplos 1, 2 y 3. Ejercicio 2.- Las notas obtenidas por un curso en un control de Matemticas han sido: 2, 3, 4, 3, 5 5, 6, 5, 4, 3 2, 6, 7, 7, 5 8, 8, 9, 3, 4 4, 5, 6, 5, 4

Distribyelas en una tabla de frecuencias. Ejercicio 3.- Completa los datos que faltan en la siguiente tabla de frecuencias:

X 1 2 3 4 Total

ni 4

fi 10 18

pi

Ni

Fi

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

15

3.- TABLAS ESTADSTICAS CON LA HOJA DECLCULO (Variable discreta) Vamos a obtener las tablas de frecuencias utilizando el ordenador. Para ello vamos a desarrollar, como ejemplo, el ejercicio 2 de la pgina anterior. Una vez abierta la hoja de clculo (en este caso, Cal de OpenOffice.org 2.0), vamos a introducir los datos en la columna A desde la fila 1 hasta la fila 25; despus en la columna C introducimos los valores de la variable desde la fila 1 hasta la fila 9. La hoja de clculo quedara as:

Para obtener la columna de las frecuencias absolutas utilizamos la funcin CONTAR.SI. La columna D va a contener dichos valores.

Para ellos situamos el cursor en la posicin D1 y seleccionamos la funcin, de tres maneras posibles: Insertar + funcin de la barra de mens; Ctrl +F2; o bien, de la barra de edicin de frmulas.

De cualquiera de esas formas, llegamos a la pantalla en la que elegiremos nuestra funcin:

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

16

Pulsando en siguiente, especificamos el rea: A$1:A$25 (fijando las posiciones de las filas con $ para despus poder arrastrar) y en criterios: C1 Aceptamos y debemos obtener un 2 en la celda D1, es decir, el nmero de personas que han obtenido un 2 en el control; despus arrastramos y obtenemos los dems valores.

A continuacin, seguimos como es habitual obteniendo las dems columnas.

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

17

Ejercicio 4.- Estudiando el nmero de hijos de 30 familias elegidas al azar en una ciudad se han obtenido los siguientes datos:

1, 2, 3, 5, 6,

0, 7, 8, 4, 1,

3, 4, 5, 2, 6,

5, 2, 3, 4, 6,

2, 3, 4, 6, 4,

3, 6, 6, 3, 3

Utiliza la hoja de clculo para distribuir los datos en una tabla de frecuencias.

4.- TABLAS ESTADSTICAS CON LA HOJA DECLCULO (Variable continua)

En el caso de que la variable sea continua (o discreta con un elevado nmero de valores) procedemos as: Vamos a desarrollar el ejemplo 3 de las pginas anteriores Una vez abierta la hoja de clculo (en este caso, Cal de OpenOffice.org 2.0), vamos a introducir los datos en la columna A desde la fila 1 hasta la fila 30; despus en la columna C introducimos los extremos superiores de los intervalos en que hemos dividido la poblacin desde la fila 1 hasta la fila 11. La hoja de clculo quedara as:

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

18

Para obtener la columna de las frecuencias absolutas utilizamos la funcin FRECUENCIA. La columna D va a contener dichos valores. Para ellos situamos el cursor en la posicin D1 y seleccionamos la funcin:

Rellenamos los datos y grupos (obsrvese las explicaciones de cada campo):

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

19

Aceptamos y obtenemos:

Atencin: El dato D1 son los valores que estn en el intervalo (0, 50], el dato D2 son los valores que estn en el intervalo (50, 100], y as los dems. (El dato D12 son los mayores de 550). O sea, al contrario de cmo lo hemos estado considerando antes. No tiene mayor importancia ya que evitaremos en lo posible intervalos con datos en los extremos. En lo sucesivo haremos arreglos en la tabla para que aparezcan los intervalos y las marcas de clase, procurando una presentacin elegante.

Ejercicio 5.- Las puntuaciones obtenidas por 30 personas de un instituto en un test de inteligencia han sido:

100, 102, 98, 95, 92, 145, 116, 93, 89, 86,

105, 121, 110, 84, 87, 97, 114, 127, 103, 104,

94, 99, 98, 112, 123, 135, 128, 109, 110, 85

Agrupa los datos en intervalos de clase y construye una tabla completa de frecuencias (con sus respectivas marcas de clase). 20

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

5.- GRFICOS ESTADSTICOS

Una vez recogida la informacin en tablas, puede ser til resumir dicha informacin a travs de grficos; debemos conseguir que con un simple vistazo se nos presente la mayor informacin posible. Segn el carcter que estemos estudiando (cualitativo, cuantitativo discreto o cuantitativo continuo) utilizaremos distintos tipos de grficos.

A) Diagrama de barras o rectngulos. Consiste en dos ejes perpendiculares y una barra o rectngulo para cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los valores de la variable (aunque tambin se puede hacer en el vertical). El otro eje se grada segn los valores de las frecuencias. La representacin grfica consiste en dibujar una barra o un rectngulo para cada uno de los valores de la variable de altura igual a su frecuencia.

El diagrama de barras asociado al ejemplo 1 sera de este tipo:

Grupo sanguneo
11 10 9 8

Frecuencias

7 6 5 4 3 2 1 0 A B AB O

Grupo sanguineo

Con la hoja de clculo OpenOffice Cal debemos seguir los siguientes pasos resumidos en las pantallas. Lo primero ser introducir las modalidades y las frecuencias:

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

21

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

22

Por ltimo pulsamos sobre Crear y situamos el grfico donde queramos para que quede visible junto con los datos (opcional).

Ejercicio 6.- Construye un diagrama de barras para los datos del ejercicio 2. Ejercicio 7.- Recupera la tabla del ejercicio 4 e inserta un diagrama de barras.

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

23

B) Histograma de frecuencias. Es un caso particular del diagrama anterior en el caso de variables continuas. Si los intervalos son correlativos, los rectngulos aparecen pegados en la representacin grfica. En caso de que la amplitud de los intervalos no se igual para todos, hay que hacer coincidir el rea del rectngulo con la frecuencia del intervalo.

El histograma asociado al ejemplo 3 es:

Dinero que se lleva encima


20 15 Euros 10 5 0 Intervalos (0,50] (50,100] (100,150] (150,200] (200,250] (250,300] (300,350] (350,400] (400,450] (450,500]

Este grfico se ha realizado con la hoja de clculo Excel de Microsoft Office. Se deja como ejercicio su realizacin.

Ejercicio 8.- Recupera la tabla del ejercicio 5 e inserta un histograma.

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

24

C) Pirmides

de

poblacin.

Cuando

se

realizan

representaciones

correspondientes a edades de poblacin, cambiamos el eje Y por el eje X para obtener las llamadas pirmides de poblacin, que no son ms que 2 histogramas a izquierda y derecha, para hombres y mujeres. Veamos un ejemplo:

D) Polgono de frecuencias. Los polgonos de frecuencias son lneas poligonales que unen los vrtices superiores de las barras de un diagrama de barras o los puntos medios de las bases superiores de los rectngulos de un histograma, segn sea la variable agrupada o no agrupada.

El polgono de frecuencia asociado al ejemplo 2 es:

Calificaciones del ejercicio


Frecuencias 6 4 2 0 1 2 3 4 5 6 7 8 9 10 Calificaciones

Un caso particular de aplicacin de los histogramas y los polgonos de frecuencias es el climograma, que representa la marcha anual de las temperaturas y de las lluvias medias, sobre un mismo sistema de coordenadas. Veamos un ejemplo:

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

25

E) Diagrama de sectores. Es un grfico estadstico formado por un crculo dividido en sectores circulares cuyas amplitudes son proporcionales a las frecuencias de los datos representados. El diagrama de sectores asociado al ejemplo 1 es:

Grupos sanguneos

A B AB O

F) Pictogramas. Son grficos con dibujos alusivos al carcter que se est estudiando y cuyo tamao es proporcional a la frecuencia que representan; dicha frecuencia se suele representar. En el siguiente ejemplo hemos representado el nmero de partidos ganados, perdidos o empatados de un equipo:

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

26

G) Cartogramas. Son grficos realizados sobre mapas, en los que aparecen indicados sobre las distintas zonas cantidades o colores de acuerdo con el carcter que representan.

En el siguiente cartograma observamos la urbanizacin en el mundo atendiendo a la industrializacin

Ejercicio 9.- Los resultados finales de una evaluacin de matemticas han sido:

S, S, S. B, I

S, I, B, N, N S, S, I, I, I

S, S, S, Sb, N

N, N, S, I, S

S, B, B.

a) De qu tipo es esta variable? b) Construye una tabla con las frecuencias absolutas, relativas y porcentuales. c) Realiza un diagrama de barras que describa la distribucin anterior. d) Elabora un diagrama de sectores. e) Elabora un diagrama de sectores que muestre los alumnos que promocionan y los que no.

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

27

Ejercicio 10.- Los siguientes datos corresponden a la superficie, en metros cuadrados, de 26 viviendas elegidas al azar en una localidad:

124, 10025, 67, 7856, 83

15476, 5989, 1054, 124, 1005

95, 9875, 8935, 87

135, 12678, 105, 197, 1568

13425, 6745, 7472, 589, 5057, 73, 7457

a) Distribuye los datos en tres intervalos que clasifiquen las viviendas segn su superficie entre 50 m2 y 90 m2, entre 90 m2 y 120 m2, y entre 120 m2 y 200 m2. b) Elabora una tabla de frecuencias y represntala mediante un histograma y un diagrama de sectores.

Ejercicio 11.- El siguiente diagrama de sectores muestra la procedencia de la mano de obra en la agricultura espaola durante el ao 1999. Con los datos del diagrama construye una tabla de frecuencias absolutas, relativas y porcentuales y halla el valor de los ngulos de cada sector circular.

Mano de obra en la agricultura espaola Mano de


obra no familiar eventual; 234248

Mano de obra no familiar fija; 149385

Mano de obra familiar; 805260

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

28

Ejercicio 12.- En el siguiente grfico se dan los porcentajes de audiencia de diversos medios segn grupos de edad.

Porcentajes de audiencia sobre la poblacin de cada grupo de edad

100 90 80 70 60 50 40 30 20 10 0
65 y ms
Diarios Revistas Radio Televisin Cine Internet

14 - 19 20 - 24 25 - 34 35 - 39 45 - 54 55 - 64

a) Sobre qu base de poblacin estn calculados esos porcentajes? b) Qu medios y qu grupos de edad superan el 50 % de audiencia? c) Ordena de menor a mayor las preferencias de medios en el grupo de edad de 14 aos a 19 aos. d) Haz un comentario personal de la informacin recogida en el grfico.

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

29

Ejercicio 13.a) Localiza en la pgina del IEA, el apartado ''Padrn Municipal de Habitantes'' y en l consulta la Informacin Padronal del ao 2006. b) Guarda la tabla de Municipios de Andaluca; brela con la hoja de clculo y distribuye todos los municipios en intervalos: (0,2000), (2000,5000), (5000,10000), (10000 ,20000), (20000, 50000), (50000, 100000) y 100000 en adelante. c) Confecciona un grfico adecuado. Ejercicio 14.- Abre la tabla Poblacin de Andaluca por provincias (2006). Una vez guardada y abierta en una hoja de clculo, realiza un grfico de columnas apiladas en el que se observe la aportacin del nmero de hombres y mujeres sobre el total de cada provincia. Ejercicio 15.- Realiza un grfico de columnas dobles para comparar la poblacin de Andaluca por provincias de los aos 2006 y el avance del padrn del ao 2007.

I. E. S. LLANES Estadstica. 2 Bachillerato. Curso 2007/2008

30