Académique Documents
Professionnel Documents
Culture Documents
DISTRIBUCIN DE FRECUENCIAS
Cuando se toma una muestra de n observaciones de una variable X, las distintas observaciones se
designan por x1, x2, x3,, xn, conforme al orden en que se han obtenido. En general xi representa la isima observacin. La n-sima observacin (xn) constituye la ltima observacin.
La representacin de las observaciones en forma de lista no resulta cmoda y tampoco permite
visualizar de manera rpida y clara los elementos importantes, por lo cual es necesario confeccionar
un cuadro que presente la informacin en forma resumida. Este cuadro se denomina cuadro o tabla
de distribucin de frecuencias.
Las tablas estadsticas deben tener un ttulo que indique QUE informacin se presenta, DONDE
fueron recolectados los datos, CUANDO se obtuvo la informacin. Cuando el ttulo sea muy extenso
se puede acompaar con un llamado a pie de pgina.
En general, la tabla de distribucin de frecuencias permite observar con rapidez y facilidad:
Los distintos grupos o categoras en que se clasifican los datos (k grupos o categoras).
Frecuencias absolutas (ni), que corresponde al nmero de observaciones que se clasifica en
cada uno de los k grupos, donde
k
0 ni n
Frecuencias relativas (fi), que corresponde a la fraccin de observaciones (respecto del total)
que se clasifican en cada grupo o categora, donde
fi ni / n
i 1
0 fi 1
f
i 1
Ni n j
j 1
donde:
0 Ni n
Nk n
N1 n1
N 2 n1 n2
N 3 n1 n2 n3
N k n1 n2 n3 ..
nk n
Fi f j
j 1
donde:
13/03/2016
0 Fi 1
Fk 1
Estadstica I
Prof. Edmundo Pea Rozas
F1 f1
F2 f1 f 2
F3 f1 f 2 f3
Fk f1 f 2 f3 ..
fk 1
13/03/2016
Estadstica I
Prof. Edmundo Pea Rozas
Datos
1
2
4
7
0
8
3
5
13/03/2016
6
7
2
5
1
5
4
4
5
3
1
6
5
3
6
2
xi
ni
0
1
2
3
4
5
6
7
8
1
3
3
3
3
5
3
2
1
fi
Ni
Fi
0.04
0.13
0.13
0.13
0.13
0.21
0.13
0.08
0.04
1
4
7
10
13
18
21
23
24
0.04
0.17
0.29
0.42
0.54
0.75
0.88
0.96
1.00
Estadstica I
Prof. Edmundo Pea Rozas
La construccin de este tipo de tabla utilizando Excel se puede realizar escribiendo directamente la
frmula para la frecuencia relativa, absoluta acumulada y relativa acumulada, mientras que para la
frecuencia absoluta se puede utilizar la funcin CONTAR.SI o bien la funcin FRECUENCIA,
debiendo tener presente que esta funcin se debe ingresar como una matriz.
=G3/$G$11
fi
Fi
=E6/$G$11
=E7+G6
=CONTAR.SI($A$2:$C$9;D8)
=FRECUENCIA(A2:C9;D15:D23)
La marca de clase (xi), que representa al valor que caracteriza a cada intervalo. La marca de
clase se calcula como la semi-suma entre el lmite superior e inferior de cada intervalo de clase.
xi
Li 1 Li
2
13/03/2016
Estadstica I
Prof. Edmundo Pea Rozas
Considerar como lmite inferior del primer intervalo un valor menor o igual que el mnimo
observado en el conjunto de datos y considerar como lmite superior del ltimo intervalo un valor
mayor o igual que el mximo observado.
Los intervalos de clase sern cerrados por la izquierda y abiertos por la derecha, en tanto que el
ltimo ser cerrado tanto en su lmite superior como inferior1, a objeto de asegurar que los
intervalos sean contiguos y evitar que una observacin pertenezca a ms de un intervalo al mismo
tiempo.
Mientras mayor sea la amplitud del intervalo de clase, mayor ser la prdida de informacin, por el
contrario, mientras menor sea la amplitud del intervalo de clase, menor deber ser la prdida de
informacin, sin embargo un nmero excesivo de intervalos atenta contra la capacidad de
resumen de la tabla de distribucin de frecuencias.
Se sugiere considerar entre 5 y 10 intervalos de clase.
Pasos a Seguir
1. Determinar el nmero de intervalos (k).
a. Si n 100
k 2 n
b. Si n 100
k 1 3.32193 log n
Nota: Considerar la parte entera
regla de Norcliffe
regla de Sturges
Rx x 'mx x 'mn
En esta etapa es recomendable calcular el recorrido utilizando valores mnimos y mximos que
sean cmodos de utilizar, asegurndose de que estos incluyan el mnimo y mximo reales y que
estos no se alejen demasiado de los observados..
3. Calcular la amplitud de cada intervalo, donde k es el nmero de intervalos
Rx
k
xi
Li 1 Li
2
Este criterio se adopta para el trabajo en este curso pero, no es una condicin estricta, siendo
posible adoptar un criterio distinto, por ejemplo: a la inversa o cerrando el lmite inferior del primer
intervalo o el superior del ltimo, o ambos
13/03/2016
Estadstica I
Prof. Edmundo Pea Rozas
Ejemplo:
Consideremos las siguientes observaciones correspondientes a los kilmetros recorridos por un
chofer en el turno de la maana en una lnea de colectivos de la comuna de Concepcin:
43,7
110,0
90,9
96,1
68,4
83,5
51,2
64,3
63,3
47,1
69,0
76,9
59,5
78,4
87,8
68,1
89,5
103,7
94,5
81,2
73,3
51,9
75,1
64,6
52,7
74,4
66,3
77,0
56,2
68,6
84,0
86,9
100,1
79,2
64,6
40,0
67,5
88,6
47,5
79,7
Desarrollo
Como n=40 k 2 40 6.32 6
El mnimo y el mximo son 40 y 110 respectivamente, de tal forma que el recorrido (110-40), no es
mltiplo de 6, siendo ms cmodo utilizar como mnimo y mximo 40 y 112 respectivamente,
entonces:
Rx x 'mx x 'mn
Rx 112 40 72
Rx
72
a
12
6
k
xi ( Li 1 Li ) / 2
Li 1 x 'mn a (i 1)
Li x 'mn a i
L0 40 12(1 1) 40
L1 40 12(2 1) 52
L2 40 12(3 1) 64
L3 40 12(4 1) 76
L4 40 12(5 1) 88
L5 40 12(6 1) 100
L1 40 12 1 52
L2 40 12(2) 64
L3 40 12(3) 76
L4 40 12(4) 88
L5 40 12(5) 100
x5 (88 100 ) / 2 94
L6 40 12(6) 112
2
3
4
5
6
Li 1
Li
xi
40,0
52,0
64,0
76,0
88,0
100,0
52,0
64,0
76,0
88,0
100,0
112,0
46,0
58,0
70,0
82,0
94,0
106,0
ni
fj
6
4
12
10
5
3
40
0.150
0.100
0.300
0.250
0.125
0.075
1.000
x1 (40 52) / 2 46
x 2 (52 64) / 2 58
x3 (64 76) / 2 70
x 4 (76 88) / 2 82
Ni
6
10
22
32
37
40
Fi
0.150
0.250
0.550
0.800
0.925
1.000
13/03/2016
Estadstica I
Prof. Edmundo Pea Rozas
=MIN(A2:J5)
=MAX(A2:J5)
=L3-L2
=REDONDEAR.MAS(L4/L6;0)
xi
13/03/2016
Li 1 Li
2
Estadstica I
Prof. Edmundo Pea Rozas
Ejemplo:
Los datos que se presentan a continuacin corresponden al nmero de clientes atendidos en un da
por cada uno de los integrantes de la fuerza de ventas de una multitienda.
37
24
11
76
66
97
53
38
11
18
64
5
88
80
78
19
94
48
27
74
9
57
51
99
79
14
39
70
56
28
94
99
50
68
35
79
49
70
34
64
Li 1
0
11
21
31
41
51
61
71
81
91
47
76
26
30
32
3
74
29
53
48
17
51
15
32
16
66
73
64
91
89
Li
10
20
30
40
50
60
70
80
90
100
62
91
29
56
77
90
54
36
32
99
xi
5,0
15,5
25,5
35,5
45,5
55,5
65,5
75,5
85,5
95,5
54
83
19
47
51
77
48
53
20
0
ni
11
15
16
17
16
20
17
15
12
11
150
24
36
47
49
54
34
88
44
54
37
fj
0,073
0,100
0,107
0,113
0,107
0,133
0,113
0,100
0,080
0,073
1.000
80
39
52
18
58
33
48
89
15
67
88
56
41
68
70
49
28
3
11
51
Ni
11
26
42
59
75
95
112
127
139
150
9
83
50
28
31
53
1
27
96
1
98
65
53
68
0
24
46
28
27
63
Fi
0,073
0,173
0,280
0,393
0,500
0,633
0,747
0,847
0,927
1,000
Variable Discreta
Variable Continua
Pocos valores Muchos valores
distintos
distintos
Agrupar en
intervalos
Muchas
No agrupar en
Agrupar en
Observaciones
intervalos
intervalos
Pocas
No agrupar en
Agrupar en
Observaciones
intervalos
intervalos
13/03/2016
8
87
75
11
100
29
89
73
16
25
78
69
34
82
90
43
51
39
8
64