Vous êtes sur la page 1sur 8

Estadstica I

Prof. Edmundo Pea Rozas

DISTRIBUCIN DE FRECUENCIAS
Cuando se toma una muestra de n observaciones de una variable X, las distintas observaciones se
designan por x1, x2, x3,, xn, conforme al orden en que se han obtenido. En general xi representa la isima observacin. La n-sima observacin (xn) constituye la ltima observacin.
La representacin de las observaciones en forma de lista no resulta cmoda y tampoco permite
visualizar de manera rpida y clara los elementos importantes, por lo cual es necesario confeccionar
un cuadro que presente la informacin en forma resumida. Este cuadro se denomina cuadro o tabla
de distribucin de frecuencias.
Las tablas estadsticas deben tener un ttulo que indique QUE informacin se presenta, DONDE
fueron recolectados los datos, CUANDO se obtuvo la informacin. Cuando el ttulo sea muy extenso
se puede acompaar con un llamado a pie de pgina.
En general, la tabla de distribucin de frecuencias permite observar con rapidez y facilidad:
Los distintos grupos o categoras en que se clasifican los datos (k grupos o categoras).
Frecuencias absolutas (ni), que corresponde al nmero de observaciones que se clasifica en
cada uno de los k grupos, donde
k

0 ni n

Frecuencias relativas (fi), que corresponde a la fraccin de observaciones (respecto del total)
que se clasifican en cada grupo o categora, donde

fi ni / n

i 1

0 fi 1

f
i 1

Frecuencia absoluta acumulada (Ni), es el nmero de observaciones menores o iguales a las


que se clasifican en el grupo o categora i, donde:
i

Ni n j
j 1

donde:

0 Ni n

Nk n

N1 n1
N 2 n1 n2
N 3 n1 n2 n3
N k n1 n2 n3 ..

nk n

Frecuencia relativa acumulada (Fi), corresponde a la fraccin de observaciones (respecto del


total) menores o iguales a las que se clasifican en el grupo o categora i, donde:
i

Fi f j
j 1

donde:

13/03/2016

0 Fi 1

Fk 1

Estadstica I
Prof. Edmundo Pea Rozas

F1 f1

F2 f1 f 2
F3 f1 f 2 f3
Fk f1 f 2 f3 ..

fk 1

Caso Variable Cualitativa


La tabla de distribucin de frecuencias en el caso de una variable cualitativa se debe tener muy
presente la escala en que se encuentre la variable; si se trata de una variable en escala nominal solo
son aplicables las frecuencias absoluta y relativa. Las frecuencias acumuladas carecen de
significado a menos que la variable se encuentre medida al menos en escala ordinal.
Ejemplo: La tabla siguiente muestra la distribucin de ocupados por rama de la regin del Bobo
(miles de personas) en el trimestre Octubre Diciembre de 2012
Ocupados por Rama de Actividad Econmica en Regin del Bobo
Trimestre Octubre- Noviembre-Diciembre 2012 (miles de personas)
Frec.
Rama de Actividad
Frec.rel
Abs.
Agricultura, ganadera, caza y silvicultura
106,86
0,126
Pesca
6,82
0,008
Explotacin de minas y canteras
14,87
0,018
Industrias manufactureras
120,49
0,143
Suministro de electricidad, gas y agua
11,51
0,014
Construccin
66,48
0,079
Comercio
158,95
0,188
Hoteles y Restaurantes
23,85
0,028
Transporte, almacenamiento y comunicaciones
45,99
0,054
Intermediacin financiera
7,90
0,009
Actividades inmobiliarias, empresariales y de alquiler
29,3
0,035
Administracin pblica
58,58
0,069
Enseanza
73,77
0,087
Servicios sociales y de salud
42,29
0,050
Otras actividades de servicios comunitarios, sociales y
24,57
0,029
personales
Hogares privados con servicio domsticos
53,16
0,063
Org. y organismos extraterritoriales
0,00
0,000
Total
845,39
1,00
Fuente: Compendio Estadstico 2013, INE, Chile

13/03/2016

Estadstica I
Prof. Edmundo Pea Rozas

Ejemplo: La informacin contenida en la tabla siguiente corresponde a, la distribucin de los


habitantes de la VIII Regin que sufren algn tipo de discapacidad, de acuerdo al Primer Estudio
Nacional de la Discapacidad en Chile, efectuado el ao 2004.
Distribucin de Personas con Discapacidad
en la VIII Regin, Segn Tipo. 2004
ni
fi
Discapacidad
Fsica
141.456 0.29
Intelectual
56.720 0.11
Visual
81.900 0.16
Auditiva
36.092 0.07
Siquitrica
29.710 0.06
Viscerales
100.532 0.20
Mltiple
53.840 0.11
Total
500.250 1.00

Caso Variable Cuantitativa Discreta


Ejemplo:
frecuencias.

Dado el siguiente conjunto de observaciones construir una tabla de distribucin de

Datos
1
2
4
7
0
8
3
5

13/03/2016

6
7
2
5
1
5
4
4

5
3
1
6
5
3
6
2

xi

ni

0
1
2
3
4
5
6
7
8

1
3
3
3
3
5
3
2
1

fi

Ni

Fi

0.04
0.13
0.13
0.13
0.13
0.21
0.13
0.08
0.04

1
4
7
10
13
18
21
23
24

0.04
0.17
0.29
0.42
0.54
0.75
0.88
0.96
1.00

Estadstica I
Prof. Edmundo Pea Rozas

La construccin de este tipo de tabla utilizando Excel se puede realizar escribiendo directamente la
frmula para la frecuencia relativa, absoluta acumulada y relativa acumulada, mientras que para la
frecuencia absoluta se puede utilizar la funcin CONTAR.SI o bien la funcin FRECUENCIA,
debiendo tener presente que esta funcin se debe ingresar como una matriz.
=G3/$G$11
fi

Fi

=E6/$G$11
=E7+G6

=CONTAR.SI($A$2:$C$9;D8)
=FRECUENCIA(A2:C9;D15:D23)

Caso Variable Continua


Cuando se tiene una variable continua y se desea construir una tabla de distribucin de frecuencias,
a diferencia del caso de las variables discretas, nos encontramos un rango de valores demasiado
amplio, por tal razn es necesario agruparlos en intervalos.
Usualmente se construyen m intervalos, todos de igual longitud, sin embargo, esto ltimo no es una
condicin estricta, de tal manera que si la situacin lo amerita se pueden construir intervalos de
distinta longitud o incluso dejar abierto el intervalo superior o inferior (o ambos)
La estructura de la tabla es esencialmente la misma que la utilizada en el caso de la variable discreta
pero, se debe agregar:
El lmite inferior y superior de cada intervalo de clase, denotados como Li 1 Li .

La marca de clase (xi), que representa al valor que caracteriza a cada intervalo. La marca de
clase se calcula como la semi-suma entre el lmite superior e inferior de cada intervalo de clase.

xi

Li 1 Li
2

Construccin de Intervalos de Clase


No existe una regla fija que permita la construccin de los intervalos de clase que resulten ptimos
en nmero y amplitud, sin embargo, existen algunas recomendaciones que es conveniente tener en
cuenta debido a que si bien las tablas de distribucin de frecuencias permiten resumir los datos,
tambin provocan una prdida de informacin.
La construccin de los intervalos de clase se debe hacer siguiendo las pautas que se indican a
continuacin pero sin dejar de lado el sentido comn y la participacin directa de los investigadores, a
objeto de que la prdida de informacin no sea significativa.

13/03/2016

Estadstica I
Prof. Edmundo Pea Rozas

Considerar como lmite inferior del primer intervalo un valor menor o igual que el mnimo
observado en el conjunto de datos y considerar como lmite superior del ltimo intervalo un valor
mayor o igual que el mximo observado.
Los intervalos de clase sern cerrados por la izquierda y abiertos por la derecha, en tanto que el
ltimo ser cerrado tanto en su lmite superior como inferior1, a objeto de asegurar que los
intervalos sean contiguos y evitar que una observacin pertenezca a ms de un intervalo al mismo
tiempo.
Mientras mayor sea la amplitud del intervalo de clase, mayor ser la prdida de informacin, por el
contrario, mientras menor sea la amplitud del intervalo de clase, menor deber ser la prdida de
informacin, sin embargo un nmero excesivo de intervalos atenta contra la capacidad de
resumen de la tabla de distribucin de frecuencias.
Se sugiere considerar entre 5 y 10 intervalos de clase.

Pasos a Seguir
1. Determinar el nmero de intervalos (k).
a. Si n 100
k 2 n
b. Si n 100
k 1 3.32193 log n
Nota: Considerar la parte entera

regla de Norcliffe
regla de Sturges

2. Determinar el recorrido de la variable, es decir, se debe calcular la diferencia entre el valor


mximo y mnimo observado.

Rx x 'mx x 'mn
En esta etapa es recomendable calcular el recorrido utilizando valores mnimos y mximos que
sean cmodos de utilizar, asegurndose de que estos incluyan el mnimo y mximo reales y que
estos no se alejen demasiado de los observados..
3. Calcular la amplitud de cada intervalo, donde k es el nmero de intervalos

Rx
k

Aproximar la amplitud a un valor cmodo

4. Calcular el lmite inferior de cada intervalo de clase como:


Li 1 x 'mn a (i 1) donde i 1,, k
5. Calcular el lmite superior como

Li x 'mn a i donde i 1,, k

6. Calcular la marca de clase como:

xi

Li 1 Li
2

Este criterio se adopta para el trabajo en este curso pero, no es una condicin estricta, siendo
posible adoptar un criterio distinto, por ejemplo: a la inversa o cerrando el lmite inferior del primer
intervalo o el superior del ltimo, o ambos
13/03/2016

Estadstica I
Prof. Edmundo Pea Rozas

Ejemplo:
Consideremos las siguientes observaciones correspondientes a los kilmetros recorridos por un
chofer en el turno de la maana en una lnea de colectivos de la comuna de Concepcin:
43,7
110,0
90,9
96,1

68,4
83,5
51,2
64,3

63,3
47,1
69,0
76,9

59,5
78,4
87,8
68,1

89,5
103,7
94,5
81,2

73,3
51,9
75,1
64,6

52,7
74,4
66,3
77,0

56,2
68,6
84,0
86,9

100,1
79,2
64,6
40,0

67,5
88,6
47,5
79,7

Desarrollo
Como n=40 k 2 40 6.32 6
El mnimo y el mximo son 40 y 110 respectivamente, de tal forma que el recorrido (110-40), no es
mltiplo de 6, siendo ms cmodo utilizar como mnimo y mximo 40 y 112 respectivamente,
entonces:

Rx x 'mx x 'mn

Rx 112 40 72

Rx
72
a
12
6
k
xi ( Li 1 Li ) / 2

Li 1 x 'mn a (i 1)

Li x 'mn a i

L0 40 12(1 1) 40
L1 40 12(2 1) 52
L2 40 12(3 1) 64
L3 40 12(4 1) 76
L4 40 12(5 1) 88
L5 40 12(6 1) 100

L1 40 12 1 52
L2 40 12(2) 64
L3 40 12(3) 76
L4 40 12(4) 88
L5 40 12(5) 100

x5 (88 100 ) / 2 94

L6 40 12(6) 112

x6 (100 112 ) / 2 106

2
3
4
5
6

Li 1

Li

xi

40,0
52,0
64,0
76,0
88,0
100,0

52,0
64,0
76,0
88,0
100,0
112,0

46,0
58,0
70,0
82,0
94,0
106,0

ni

fj
6
4
12
10
5
3
40

0.150
0.100
0.300
0.250
0.125
0.075
1.000

x1 (40 52) / 2 46
x 2 (52 64) / 2 58
x3 (64 76) / 2 70
x 4 (76 88) / 2 82

Ni
6
10
22
32
37
40

Fi
0.150
0.250
0.550
0.800
0.925
1.000

La construccin de la tabla utilizando Excel es esencialmente igual al caso anterior, difiriendo


solamente en el clculo de la frecuencia absoluta simple y acumulada

13/03/2016

Estadstica I
Prof. Edmundo Pea Rozas

=MIN(A2:J5)
=MAX(A2:J5)

=L3-L2

=REDONDEAR.MAS(L4/L6;0)

Caso Variable Discreta Agrupada en Intervalos


Si se trata de una variable discreta que adopta un rango muy amplio de valores, es posible agruparlos
en intervalos de clase, utilizando un procedimiento similar al caso de las variables continuas, siendo
ms intuitiva y simple su construccin pues no es necesario generar la sensacin de continuidad de
un intervalo a otro.
As, una vez que se ha establecido la amplitud del intervalo:
Calcular el lmite superior de cada intervalo de clase como
Li x 'mn a i donde i 1,, k
El lmite inferior del primer intervalo corresponde a x 'mn ( L0 x 'mn ) mientras que los lmites inferiores
de los intervalos siguientes se obtienen sumndole 1 (UNO) al lmite superior del intervalo anterior
Calcular la marca de clase como:

xi

13/03/2016

Li 1 Li
2

Estadstica I
Prof. Edmundo Pea Rozas

Ejemplo:
Los datos que se presentan a continuacin corresponden al nmero de clientes atendidos en un da
por cada uno de los integrantes de la fuerza de ventas de una multitienda.
37
24
11
76
66
97
53
38
11
18

64
5
88
80
78
19
94
48
27
74

9
57
51
99
79
14
39
70
56
28

94
99
50
68
35
79
49
70
34
64

Li 1
0
11
21
31
41
51
61
71
81
91

47
76
26
30
32
3
74
29
53
48

17
51
15
32
16
66
73
64
91
89

Li
10
20
30
40
50
60
70
80
90
100

62
91
29
56
77
90
54
36
32
99

xi
5,0
15,5
25,5
35,5
45,5
55,5
65,5
75,5
85,5
95,5

54
83
19
47
51
77
48
53
20
0

ni
11
15
16
17
16
20
17
15
12
11
150

24
36
47
49
54
34
88
44
54
37

fj
0,073
0,100
0,107
0,113
0,107
0,133
0,113
0,100
0,080
0,073
1.000

80
39
52
18
58
33
48
89
15
67

88
56
41
68
70
49
28
3
11
51

Ni
11
26
42
59
75
95
112
127
139
150

9
83
50
28
31
53
1
27
96
1

98
65
53
68
0
24
46
28
27
63

Fi
0,073
0,173
0,280
0,393
0,500
0,633
0,747
0,847
0,927
1,000

Variable Discreta
Variable Continua
Pocos valores Muchos valores
distintos
distintos
Agrupar en
intervalos
Muchas
No agrupar en
Agrupar en
Observaciones
intervalos
intervalos
Pocas
No agrupar en
Agrupar en
Observaciones
intervalos
intervalos

13/03/2016

8
87
75
11
100
29
89
73
16
25

78
69
34
82
90
43
51
39
8
64

Vous aimerez peut-être aussi