Vous êtes sur la page 1sur 11

Apuntes de clase y ejemplos

Presentación de datos.
Para organizar los datos:

 Tablas de distribución de frecuencias


 Gráficos

Distribución de frecuencias: es una tabla utilizada para organizar datos. La columna de la izquierda
(llamada clases o grupos) contiene todos los valores que puede tomar la variable estudiada. La columna de la
derecha es una lista de las frecuencias o número de observaciones correspondientes a cada clase.

 Distribución de frecuencias de variable cualitativa.


 Distribución de frecuencias de variable cuantitativa:
o Sin agrupar.
o Agrupada.

Distribución de frecuencias de una variable cualitativa.


Ejemplo.

Se registró el sexo de los primeros 20 clientes que entraron en un Wallmart al abrir.

Codificación: 0= hombre, 1=mujer.

0 1
1 1
0 0
0 1
0 0
0 0
0 0
0 1
1 0
1 0

Tabla de distribución de frecuencias.

Valores frecuencia frecuencia relativa grados


Hombre 0 13 65% 234
Mujer 1 7 35% 126
20 100% 360

Gráfica de barras: la altura de cada rectángulo representa la frecuencia de cada valor. Las barras se dibujan separadas
entre sí. Sirve para llamar la atención en la frecuencia de cada valor.
Apuntes de clase y ejemplos

15

10

0
Hombre Mujer

Gráfica de sectores (circular, de pastel, de pie, de tarta): el círculo representa el total y los segmentos que
parten del centro representan las proporciones de ese total. Cada segmento es proporcional a la frecuencia
correspondiente. Se utiliza cuando se quiere llamar la atención sobre la proporción.

Mujer
35%
Hombre
65%

Ejemplo.

Se preguntó a 15 personas qué les parece el servicio de un restaurant. Los datos registrados son los siguientes:

1 1 2
4 2 1
3 1 2
1 4 4
2 4 4
Codificación: 1=Muy satisfecho, 2=satisfecho, 3=regular, 4=nada satisfecho.

Valores frecuencia frecuencia relativa grados


Muy satisfecho 1 5 33.33% 120
Satisfecho 2 4 26.67% 96
Regular 3 1 6.67% 24
Nada satisfecho 4 5 33.33% 120
15 100% 360
Apuntes de clase y ejemplos

6
5
4
3
2
1
0
Muy satisfecho Satisfecho Regular Nada satisfecho

Nada Muy
satisfecho satisfecho
33% 33%

Satisfecho
Regular 27%
7%

Distribución de frecuencias de una variable cuantitativa


Distribución de frecuencias sin agrupar
Cuando son pocos datos o pertenecen a una variable discreta, se pueden representar de forma no agrupada.

Ejemplo.

Se contaron el número de automóviles vendidos al mes en 20 sucursales Ford. Los datos son los siguientes.

6 8 10 8
7 9 8 10
10 7 10 10
9 11 9 9
8 9 9 9

Valores Frecuencia Frecuencia relativa frecuencia acumulada frecuencia relativa acumulada


6 1 5% 1 5%
7 2 10% 3 15%
8 4 20% 7 35%
9 7 35% 14 70%
10 5 25% 19 95%
11 1 5% 20 100%
Apuntes de clase y ejemplos

20 100%
Frecuencia: número de observaciones para cada clase o valor de la variable.

Frecuencia relativa: la proporción de cada frecuencia con respecto al total de observaciones.

Frecuencia acumulada: para cada valor xi, es la suma de las frecuencias de los valores anteriores o iguales a
xi.

Frecuencia relativa acumulada: es la frecuencia acumulada de las frecuencias relativas anteriores o iguales a
cada valor xi.

Polígono de frecuencias: línea que une los puntos donde se relaciona cada clase con su frecuencia. Muestra
la simetría de la distribución de frecuencias.
Apuntes de clase y ejemplos

(nota técnica: Por cuestiones


8
7 de tiempo, no añadí en Excel
6 los valores que cierran la
frecuencias

5 curva gráficamente. Pero


4 ustedes al realizarlo de forma
3
manual deben añadirlo).
2
1
0
6 7 8 9 10 11
autos vendidos

8
7
6
frecuencia

5
4
3
2
1
0
6 7 8 9 10 11
Autos vendidos

Ejemplo.

Considere los siguientes datos, pertenecientes a la talla de zapatos de 15


personas.

3 6 8
9 4 7
7 8 9
2 8 6
4 6 3

frecuencia
frecuencia frecuencia relativa
Valores frecuencia relativa acumulada acumulada
2 1 6.67% 1 6.67%
3 2 13.33% 3 20.00%
4 2 13.33% 5 33.33%
5 0 0.00% 5 33.33%
6 3 20.00% 8 53.33%
7 2 13.33% 10 66.67%
8 3 20.00% 13 86.67%
Apuntes de clase y ejemplos

frecuencia
frecuencia frecuencia relativa
Valores frecuencia relativa acumulada acumulada
9 2 13.33% 15 100.00%
15 100.00%

0
2 3 4 5 6 7 8 9

4
3
frecuencia

2
1
0
2 3 4 5 6 7 8 9
tallas de zapatos

Distribución de frecuencia de datos agrupados.


Cuando son muchos datos o pertenecen a una variable continua, se presentan de forma agrupada.

Al agruparse deben ser mínimo 5 clases y máximo 20.

Una regla simple para calcularlos es la siguiente:

2k≥n
También puede utilizarse la ley de Sturges:

k=1+3.3log(n)
Decidir cuántas clases se utilizarán es cuestión de criterio y no hay reglas específicas para ello. Pero las pautas
como la regla simple y la ley de Sturges nos ayudan a decidir un número adecuado de intervalos.

Pasos para agrupar datos:


1. Decidir el número de clases o intervalos.
2. Calcular el ancho o amplitud de las clases (o intervalos). Se redondea a un número entero para
facilitar la interpretación.
Apuntes de clase y ejemplos

a.
3. Colocar las observaciones en su correspondiente clase de manera que sean inclusivos y no se solapen.

Ejemplo.

Se registraron los tiempos (en horas) de 20 obreros para finalizar una manufactura. Los datos a continuación:

3.5 5 3 3.9
5.2 2.3 6.2 1
2.8 3.6 2.4 4.4
6.7 2.6 4.8 2.8
4.5 2.9 3.6 5.5
1. Decidir el número de clases.

N=20

25=32

K=5

Se ordenan para localizar valor max y valor min.

1
2.3
2.4
2.6
2.8
2.8
2.9
3
3.5
3.6
3.6
3.9
4.4
4.5
4.8
5
5.2
5.5
6.2
6.7
2. Decidir la amplitud de cada clase.

max 6.7
min 1
rango 5.7
Apuntes de clase y ejemplos

n 20
k 5
amplitud (6.7-1)/5=1.14 aproximado a 1.2

3. Armar las clases de manera que sean inclusivas y no se solapen.

LIR LSR ¿Cómo se leen los intervalos? Clases MC FREC FREC R FREC A FREC R A
1 2.2 1 y menos de 2.2 [1, 2.2) 1.6 1 5% 1 5%
2.2 3.4 2.2 y menos de 3.4 [2.2, 3.4) 2.8 7 35% 8 40%
3.4 4.6 3.4 y menos de 4.6 [3.4, 4.6) 4 6 30% 14 70%
4.6 5.8 4.6 y menos de 5.8 [4.6, 5.8) 5.2 4 20% 18 90%
5.8 7 5.8 y menos de 7 [5.8, 7) 6.4 2 10% 20 100%
20 100%

Marca de clase: punto medio de cada clase.

LIR: límite inferior real del intervalo.

LSR: límite superior real del intervalo.

Histograma: gráfica que coloca las clases de una distribución de frecuencias en el eje horizontal y las
frecuencias en el eje vertical. Revela detalles y patrones de la distribución. Las barras se dibujan unidas. Se
utiliza para datos agrupados.

8
7
7
6
6
5
frecuencia

4
4
3
2
2
1
1
0
1 y menos de 2.2 2.2 y menos de 3.4 3.4 y menos de 4.6 4.6 y menos de 5.8 5.8 y menos de 7
Horas para terminar una manufacturas

Polígono de frecuencias: se grafica con las marcas de clase y las frecuencias.


Apuntes de clase y ejemplos

8
7
6
5
frecuencia

4
3
2
1
0
1.6 2.8 4 5.2 6.4
Horas para terminar una manufactura

Ojiva o diagrama de Galton: llamado a veces gráfico de frecuencias acumuladas, es una línea que conecta
puntos que son el porcentaje acumulado de observaciones situadas por debajo del límite superior de cada
intervalo en una distribución de frecuencias acumuladas.

120%
frecuencia relativa acumulada

100% 100%
90%
80%
70%
60%

40% 40%

20%
5%
0%
2.2 3.4 4.6 5.8 7
Horas para terminar una manufactura

Otros gráficos.
Diagrama de puntos
Cuando queremos relacionar dos variables entre sí, utilizamos el diagrama de puntos.

Una de las variables debe ser una serie ordenada.

Se puede relacionar una variable con respecto al tiempo (serie de tiempo).

También se pueden relacionar dos variables entre sí.

Ejemplo. Relacionando dos variables.


Apuntes de clase y ejemplos

Producción de
petróleo Inversión
450 3.2
480 2.6
500 2.8
520 2.8
560 3.3
580 3.1
590 3.3
600 3.2
620 3.5
650 3.5
700 3.9

4
3.9
3.8
3.7
3.6
Inversión

3.5
3.4
3.3
3.2
3.1
3
400 450 500 550 600 650 700 750
Produccion de petroleo

Series de tiempo.

Periodo Porcentaje de población desempleada en Cancún


2008/01 4.5
2008/02 3.0
2008/03 4.3
2008/04 4.9
2009/01 5.0
2009/02 7.2
2009/03 8.1
2009/04 6.7
2010/01 6.0
2010/02 6.6
2010/03 6.2
Fuente: INEGI.
Porcentaje de población desempleada en Cancún

0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0

2008/01

2008/02
Apuntes de clase y ejemplos

2008/03

2008/04

2009/01

2009/02

Trimestres
2009/03

2009/04

2010/01

2010/02

2010/03