Académique Documents
Professionnel Documents
Culture Documents
pg. 1
Bajo el trmino Estadstica Descriptiva se engloban las tcnicas que nos permitirn realizar un
anlisis elemental de las observaciones experimentales observadas.
TEMA 4: TABLAS DE FRECUENCIA
Tabular los datos, consiste en presentar los datos estadsticos en forma de tablas o cuadros.
1) Tabla de datos (variables cualitativas):
Situados en una tabla los valores de la variable (desde el mnimo al mximo) o los intervalos que
los contienen, procedemos a contar las veces que se repiten.
* Frecuencia
Absoluta :
Es el nmero de veces
que se presenta cada
valor de la variable.
* Frecuencia Relativa
:
Cociente (divisin) entre
la frecuencia absoluta y el
nmero total de
observaciones (N).
* Frecuencia Relativa
Porcentual % :
Frecuencia relativa
multiplicada por 100 (es la
expresin de las
frecuencias en %).
*Frecuencias Acumuladas ,
, % :
Para un cierto valor de la variable, la frecuencia acumulada se obtiene sumando las
frecuencias anteriores.
Ejemplo:
Tabla1: Severidad de accidentes en temporeros del arndanos
durante enero 2012.
Tipos
de
accidentes
leve
80
medio
95
grave
25
80 0,400
175 0,475
200 0,125
0,400
0,875
1
%
40%
47,5%
12,5%
%
40%
87,5%
100%
pg. 2
Ejemplo:
Tabla 2: Edades en una comunidad hippie Santiago 2008.
Intervalos
%
%
13,5 6
6
0,09 0,09 8,57
8,57
10,17
20 6
12 0,09 0,17 8,57
17,14
17,23
26,5 8
20 0,11 0,29 11,43
28,57
23,30
33,5 11 31 0,16 0,44 15,71
44,28
30,37
40,5
11
42
0,16
0,60
15,71
60,00
37,44
47,5 11 53 0,16 0,76 15,71
75,71
44,51
54,5 9
62 0,13 0,89 12,86
88,57
51,58
61,5
8
70
0,11
1,00
11,43
100,00
58,65&
pg. 3
pg. 4
Moda: es el valor ms frecuente. Puede ocurrir que no haya moda o que haya ms de una
(empates en el mximo). El smbolo es ( .
Media (promedio): es la suma de todos los valores dividida por el nmero de ellos.
Mediana: es el valor que ocupa el centro de la distribucin una vez ordenados los datos (el valor
del medio). El smbolo es (5
+1
, si N es impar
2
Cuartil: son los 3 valores que dividen la serie de datos en 4 partes iguales, cada una de las cuales
representa un 25% de distribucin.
_ Para datos agrupados, se determina por:
E
_ Para datos no agrupados, se determina por:
E
4 /.
=
)
+
D
D =
4
) : lmite inferior de la clase
D : cuartil pedido
/. : Frecuencia acumulada anterior a la clase.
E: nmero del decil pedido
: frecuencia absoluta de la clase
: Total de datos.
: Total de datos.
pg. 5
Quintil: son los 4 valores que dividen la serie de datos en 5 partes iguales, cada una de las cuales
representa un 20% de distribucin.
Decil: son los 9 valores que dividen la serie de datos en 10 partes iguales, cada una de las cuales
representa un 10% de distribucin.
Percentil: son los 99 valores que dividen la serie de datos en 100 partes iguales, cada una de las
cuales representa un 1% de distribucin.
Grfico de variabilidad: Basado en los cuartiles, adopta la forma del grfico de la derecha. En l
se reflejan los cuartiles 1 y 3 y la mediana, junto a los extremos inferior y superior :
FP F.
LMN = F. 3F = F. 3 O
Q
2
FP A F.
LRST FP 3F FP 3 O
Q
2
Se consideran observaciones atpicas aquellas que quedan fuera del intervalo ULMN , LRST V
pg. 6
Rango : como ya se vio, corresponde al valor mximo menos el valor mnimo, el rango mide
"la dispersin total" del conjunto de datos. Aunque el rango es una medida de dispersin simple
y que se calcula con facilidad, su debilidad preponderante es que no toma en consideracin la
forma en que se distribuyen los da tos entre los valores ms pequeos y los ms grandes.
Dos medidas de dispersin que se utilizan con frecuencia y que s toman en consideracin la forma
en que se distribuyen los valores son la varianza y su raz cuadrada, la desviacin estndar. Estas
medidas establecen la forma en que los valores fluctan con respecto a la media.
] A 1 C
\=^
] : media de clase de casa intervalo
1 : media aritmtica (promedio de datos)
: frecuencia absoluta de cada clase
: Total de datos.
pg. 7
Coeficiente de variacin (4_ : es un ndice abstracto, que no tiene unidad de medida. Da igual
que midamos la variable en cm, kg, etc., el coeficiente de variacin se expresa siempre como
`
porcentaje. 4_ = 100
a
87
65
33
70
47
a)
b)
c)
d)
e)
54
57
100
68
57
82
66
69
70
86
93
25
77
65
25
47
70
88
70
66
40
85
63
84
40
53
36
20
52
100
88
61
42
60
32
58
34
55
54
39
100
84
33
98
57
83
85
55
51
93
64
62
100
47
98
72
80
47
58
95
85
65
55
64
95
67
23
85
65
33
60
96
68
60
70
42
30
53
45
51
65
45
82
75
60
100
76
52
75
83
4) Una fbrica empaqueta en lotes de 100 unidades los tornillos que produce. Se establece
un plan de inspeccin por muestreo consistente en examinar, de cada lote, 20 tornillos
elegidos al azar y rechazar el lote si de los 20 aparecen ms de 4 defectuosos; almacenar
el lote como revisable si el nmero de defectuosos es menor que 5 pero mayor que 1,
y aceptarlo en otro caso. Se inspeccionan 52 lotes y resulta el siguiente nmero de
tornillos defectuosos de cada muestra:
1 2 4 3 2 0 9 2 0 2 0 0 4 3 0 2 0 1 6 5 2 0 0 1 0 3
2 0 7 1 4 3 0 2 1 0 4 3 0 7 1 0 0 3 2 0 1 0 5 2 0 1
a)
b)
c)
d)
e)
f)
g)
h)
i)
a)
b)
c)
d)
e)
f)
g)
h)
287 300 288 302 313 314 289 292 321 327
293 289 292 289 308 326 303 287 293 322
304 329 295 307 297 302 294 301 287 313
308 307 304 291 288 297 316 322 317 308
321 324 323 316 292 289 299 294 328 296
Cuntos discos duraron entre 293 y 299 horas?
Cuntos discos no alcanzaron a durar 300 horas?
Qu porcentaje representan los discos que duraron entre 311 y 317 horas?
Qu porcentaje representan los discos que duraron menos de 305 horas?
Cuntos discos duraron ms de 311 horas?
Cuntos discos duraron menos de 305 horas?
Qu porcentaje representan los discos que duraron entre 287 y 299 horas?
Cul es el intervalo de mayor frecuencia absoluta?
69
132
90
103
134
83
115
75
133
129
85
120
137
138
96
93
127
131
133
99
73
130
73
110
72
81
105
62
61
104
94
114
100
91
97
104
123
109
87
84
125
121
117
136
98
9) Segn la Asociacin de lucha contra la Bulimia y la Anorexia, las pautas culturales han
determinado que la delgadez sea sinnimo de xito social. Muchos jvenes luchan para
conseguir el fsico ideal motivados por modelos, artistas o por la publicidad comercial.
Durante el mes de marzo del ao 2006, en el colegio Alcntara de la ciudad de Talca,
despus de las vacaciones de verano, se observ con precaucin a 27 alumnos con
sntomas de anorexia, registrndose los siguientes signos visibles:
Dieta Severa
Uso de Ropa Holgada
Miedo a Engordar
Dieta Severa
Dieta Severa
Hiperactividad
Uso de Laxantes
Uso de Laxantes
Uso de Ropa Holgada
Miedo a Engordar
Dieta Severa
Dieta Severa
Uso de Ropa Holgada
Dieta Severa
Uso de Laxantes
Dieta Severa
Hiperactividad
Hiperactividad
Hiperactividad
Uso de Laxantes
Uso de Ropa Holgada
Dieta Severa
Uso de Ropa Holgada
Miedo a Engordar
Uso de Ropa Holgada
Uso de Laxantes
Dieta Severa
4
5
12
10
15
3
1
%
%
pg. 11
1
9
18
27
27
%
%
Peso (Kg)
15-19
20-24
25-29
30-34
35-39
40-44
Total
A
7
3
2
11
10
7
40
B
3
6
8
8
12
3
40
9
pg. 12
9 9
10
10
10
10
10
11
Tiempo
de espera
(en
minutos)
[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
Nmero
de
pacientes
3
35
98
63
55
44
12
pg. 13
3)
En una empresa trabajan 20000 productores, cuyos salarios, segn categoras, son:
[35, 40)
[40, 45)
[45, 50]
grfico
6
5
1
salarios
N de
(miles de ptas)
productores
10-20
12000
20-40
6000
40-50
1000
50-100
800
100-200
200
a) Qu parte de la nmina recibe el 60% de los productores peor pagados?
b) Qu parte de la nmina recibe el 5% de los productores mejor pagados?
MEDIDAS DE DISPERCION
1) La distribucin de las estaturas en centmetros de los alumnos de un centro, expresados
en porcentajes, es la siguiente:
Porcentajes
a) Siendo abiertos los intervalos primero y el ltimo, Estaturas
0'3
qu valores sera razonable considerar para los [145 a 150 [
[150 a 155[
1'6
lmites extremos de esos intervalos?
[155
a
160[
9'4
b) Si suponemos que en el Centro hay 1200 alumnos,
[160 a 165[
20'5
cules seran las frecuencias absolutas?
[165
a
170[
31'5
c) Calcular la estatura media y la desviacin tpica.
22'5
d) Entre qu estaturas se encuentra la quinta parte de [170 a 175[
[175
a
180[
10'7
las estaturas centrales?
[180 a 185 ]
3'5
3) Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron pesos de 60,
52, 55 y 65 kilos. Hallar la varianza de los estudiantes.
EJERCICIOS COMPLETOS
1) En una industria dos operarios en siete das de trabajo, son capaces de producir, por da,
y en forma individual la siguiente cantidad de rbol es para fresa de 250 mm de longitud por
300 mm de dimetro.
pg. 14
Determine
a) Produccin media de cada operario.
b) Moda del operario A.
c) Mediana del operario B.
d) Rango del operario A y del operario B
e) Varianza del operario A.
f) Desviacin estndar de ambos operarios.
g) Son las muestras homogneas?
Edad
[10,12)
[12,14)
[14,16)
[16,18)
[18,20]
2
1
3
2
2
4
0
3
4
1
5
2
0
1
2
3
3
0
2
3
3
4
3
1
2
1
0
2
5
1
3
4
2
4
0
2
3
2
5
3
Edad
15-19
20-24
25-29
30-34
35-39
40-44
45-49
50-54
total
2
4
1
1
4
2
1
3
hombre
2
80
174
210
385
450
295
174
1770
3
0
4
1
N
4
11
24
34
40
mujer
2
210
303
315
656
656
409
200
2751
4
3
0
4
pg. 15