Vous êtes sur la page 1sur 38

DISTRIBUCIÓN DE

FRECUENCIAS
¿CÓMO SE ORGANIZAN LOS DATOS U
OBSERVACIONES?
Distribución de Frecuencias

Una distribución de frecuencias es una tabla en la


que un conjunto de datos, se divide en un número
adecuado de clases (categorías), se presenta también
el número de unidades pertenecientes a cada clase.
Distribución de frecuencias según variable discreta

Para obtener una tabla de distribución de frecuencias cuando la


variable es discreta se procede de la siguiente manera:
a) Se identifica la variable en estudio
b) Se ordenan los datos en forma ascendente o descendente
c) Se calculan los elementos de la tabla o distribución de
frecuencias.
Xi fi Fi hi Hi
OBSERVACION
FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA
ABSOLUTA ABSOLUTA RELATIVA RELATIVA
ACUMULADA ACUMULADA
X1 f1 F1=f1 h1=f1/n H1=h1
X2 f2 F2=f1+ f2 h2 H1=h1+ h2

Xm fm Fm=f1+ f2 hm Hm=h1+ h2
+…+fm +…+hm
=n =1
Ejemplo
Los siguientes datos corresponden al número
de errores ortográficos registrados en 30
jóvenes, durante un control :

2 0 4 4 1 4 0 3 2 0 0 1 11 0 1 2 4
3 11152 2 5 4 0 40

Obtenga una tabla de distribución de


frecuencias
X: Número de errores ortográficos
Xi fi Fi hi % Hi %

0 7 7 23,3 23,3
1 8 15 26,7 50,0
2 5 20 16,7 66,7
3 2 22 6,7 73,3
4 6 28 20,0 93,3
5 2 30 6,7 100,0
------- -------
Total 30 100,0

Donde:

Xi : Observación
fi : Frecuencia simple
Fi : Frecuencia acumulada
hi : Frecuencia relativa
Hi : Frecuencia relativa acumulada
Distribución de frecuencias según variable
continua

Para obtener una tabla de distribución de


frecuencias cuando la variable es continua
se procede de la siguiente manera:

a) Se identifica la variable en estudio


b) Determinar el número de clases o
intervalos (m)
m = 1+3.32 log n

c)Determinar la amplitud o recorrido


A = V. Máximo - V. mínimo
d) Determinar el ancho o longitud del intervalo
de clase
A
c 
m
Se recomienda el redondeo por exceso

e)Determinar los límites o intervalos de clase

[ Li-1 , Li > ó < Li-1 , Li ]

f) Determinar las marcas de clase

g)Calcular las frecuencias absolutas simples,


relativas, acumuladas, etc.
INTERVALO Xi fi Fi hi Hi
[ Li, Ls>
MARCA FRECUEN FRECUENCIA FRECUEN FRECUENCIA RELATIVA
DE CIA ABSOLUTA CIA ACUMULADA
CLASE ABSOLUT ACUMULADA RELATIVA
A
X1 f1 F1=f1 h1 H1=h1
X2 f2 F2=f1+ f2 h2 H1=h1+ h2

Xm fm Fm=f1+ f2 hm Hm=h1+ h2 +…+hm
+…+fm =1
=n
Las siguientes son medidas de la resistencia a
rompimiento (en onzas) de una muestra de 40
hilos de lino.

32,5 15,2 35,4 21,3 28,4 21,2 28,3 27,1


25,0 32,7 27,3 33,7 29,4 21,9 29,3 20,6
29,5 21,8 37,5 33,5 25,4 34,1 27,5 29,6
22,2 26,9 24,6 28,9 24,8 28,1 26,9 29,5
17,3 29,6 22,7 34,6 30,2 29,0 26,8 31,3

Construya una tabla de distribución de


frecuencias.
a) X: Resistencia en onzas en hilos de
lino....

b) m=1+3,32log(40) aprox. m=6

c) A = V. Max – V.Min
A = 37,5 – 15,2
A = 22,3

d) C =A/m =3,72

Redondeado por exceso  c = 3,8

Luego la Tabla de Distribución de


frecuencias es:
(n / 2 - Fi-1 )
Me = Li + C
f me
1  1  f i  f i 1
Mo  Li  c  2  f i  f i 1
1   2
Representaciones Gráficas de Distribuciones de
frecuencias
MEDIDAS DE RESUMEN
Para describir un conjunto de OBSERVACIONES
obtenidos de una muestra podemos emplear una serie de
medidas que resumen toda la información o parte de la
información de la muestra. Estas medidas pueden ser
medidas de tendencia central o de posición, medidas de
variabilidad o de dispersión y algunos índices. Las
medidas de resumen son descripciones numéricas que
se utilizan para caracterizar la información muestral.
MEDIDAS DE
MEDIDAS DE DISPERSION
TENDENCIA
CENTRAL Las medidas de dispersión
Son medidas que cuantifican la separación, la
indican alrededor de qué dispersión, la variabilidad de las
valores se encuentran observaciones de la distribución
distribuidas las respecto al valor central.
observaciones de la
muestra.

medidas de tendencia medidas de dispersión


central
MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN

I.Para datos sin agrupar.- Dado un conjunto de n medidas u


observaciones x1,x2,....xn , podemos describir el centro,
medio o lugar central de diferentes formas:

a)Media Aritmética (x ) .- Si tenemos un conjunto de n


mediciones x1,x2,....xn, la media aritmética es el promedio de
las mediciones:
n

 xi
x  i 1
n
Ejemplo
Las siguientes 11 observaciones corresponden al contenido de
sólidos en el agua en partes por millón (ppm):
4520 4570 4520 4490 4570 4500 4520 4520
4521 4540 4500 4590
La media aritmética para estas 11 observaciones es:
Aprox. 4531 ppm
b) Mediana.- Si tenemos un conjunto de n mediciones
x1,x2,....xn, la mediana es aquel valor que no es superado
ni supera a más de la mitad de las n observaciones
dispuestas según su magnitud ya sea creciente o
decreciente

Del ejemplo anterior:

4490 4500 4500 4520 4520 4520 4520 4540 4570


4570 4590

Tenemos que la mediana es: 4520 ppm


Ejemplo
Un analista desea determinar el número de moles de cobre
II en un volumen dado de una solución, por electrólisis.
Suponga que el químico empleó sólo 9 muestras de la
solución para el experimento y que los resultados fueron, en
moles de la sustancia en referencia, como sigue:

0,15 0,17 0,19 0,15 0,18 0,16 0,17 0,18 0,19

Calcule la media , mediana y moda


c) Moda.- Es el valor que con más frecuencia
se presenta en un conjunto de observaciones.

Del ejemplo anterior tenemos que la moda es:

Mo=4520 ppm
Ejemplo
Un ingeniero químico vigila la calidad del
agua midiendo la cantidad de sólidos
suspendidos en una muestra de agua pluvial.
En 11 días distintos observó los sólidos
suspendidos (partes por millón).

14 12 21 28 30 63 29 63 55 19 20

Calcule e interprete la media aritmética y la mediana


PROPIEDADES DE LA MEDIA ARITMÉTICA
Ejemplo. Los siguientes datos corresponden al número de
partículas de polen en 50 muestras (de 1 cm3 ) de aire.
0 0 0 2 1 2 1 2 1
1 2 1 2 2 0 1 0 1
1 4 3 3 4 4 4 3 5
4 5 5 3 3 4 5 5 4
3 4 4 3 3 5 3 5 3
4 5 5 3 3
a)Defina la variable en estudio, tipo de variable.
b)Complete la tabla de frecuencias. Calcule e interprete la
mediana y el promedio
c)¿Cuál es la cantidad de partículas que más se repite en las
muestras?
d)¿Qué proporción de muestras contienen cuatro partículas?
e)¿Qué cantidad de muestras presentan no más de tres
partículas?
f)¿Qué porcentaje de muestras contienen más de dos partículas?
II.Para datos agrupados.-
a) MEDIA ARITMETICA (Xi) .- Si la
distribución de frecuencias que se dispone
corresponde a una clasificación con intervalos,
se aplica la siguiente fórmula:
m

_
x i 1
i fi
X
m

f
i 1
i
Donde:
m: Número de clases o intervalos
xi: Marca de clase
fi: Frecuencia absoluta simple
b) MEDIANA (Me).- Para calcular la mediana en una tabla
de una distribución de frecuencias, consideramos la
siguiente fórmula:
(n / 2 - Fi-1 )
Me = Li + C
f me
Donde:

Li: Límite inferior de la clase que contiene a la mediana


n: Número total de observaciones
Fi-1: Frecuencia absoluta acumulada de la clase anterior
a la que contiene a la mediana (clase mediana *)
Fme: Frecuencia absoluta de la clase que contiene a la
mediana
C: Amplitud de la clase que contiene a la mediana.

* Es la primera clase cuya frecuencia absoluta


acumulada excede a n/2
c) MODA (Mo).- En una tabla o distribución de
frecuencias es aproximadamente la marca de
clase o punto medio de la clase que tiene la
mayor frecuencia absoluta simple.

También podemos hacer uso de la siguiente


fórmula:
1
Mo  Li  c
1   2
Donde:
 1  f i  f i 1
 2  f i  f i 1

Li: Límite inferior de la clase modal


C:Ancho de intervalo
Del ejemplo datos de resistencia en
onzas, la clase modal es la cuarta clase
por tener la mayor frecuencia absoluta
simple. La moda es:

18  4
Mo  26,6  3,8  28,6 onzas
18  4  18  6
MEDIDAS DE POSICIÓN RELATIVA
Son medidas que permiten conocer otros puntos característicos
de la distribución que no son los valores centrales. Entre otros
indicadores, tenemos:
CUARTIL
DECIL
PERCENTIL
1.Cuartil: son 3 valores que distribuyen la serie de datos,
ordenada de forma creciente o decreciente, en cuatro
tramos iguales, en los que cada uno de ellos concentra el
25% de los resultados.
2.Decil: son 9 valores que distribuyen la serie de
datos, ordenada de forma creciente o decreciente, en
diez tramos iguales, en los que cada uno de ellos
concentra el 10% de los resultados.
3.Percentil: son 99 valores que distribuyen la serie
de datos, ordenada de forma creciente o
decreciente, en cien tramos iguales, en los que cada
uno de ellos concentra el 1% de los resultados.
REGLA PARA EL CALCULO DE PERCENTILES DE LA
MUESTRA
1. Ordenar las observaciones de menor a mayor
2. Determine el producto np
3. np no es un entero, redondéelo al entero
inmediato posterior y determine el valor ordenado
correspondiente. si np es un entero digamos k,
calcule la media de las observaciones ordenadas
k-ésima y (k+1) ésima.
Ejemplo
Las siguientes son 20 determinaciones de la emisión
diaria (en toneladas) de óxido de azufre de una
planta industrial.
15,8 26,4 17,3 11,2 23,9 24,8 18,7 13,9 9,0
13,2 12,7 9,8 6,2 14,7 17,5 26,1 12,8 28,6
17,6 23,7
Obtenga los cuartiles y percentiles 95, 65 y 85
Ordenando los datos:
6,2 9,0 9,8 11,2 12,7 12,8 13,2 13,9
14,7 15,8 17,3 17,5 17,6 18,7 23,7 23,9
24,8 26,1 26,4 28,6

P95 =????
np = 20(95/100) = 19

P95 = (26,4+28,6) / 2 =27,5 toneladas.


Si los datos se encuentran agrupados
(distribución de frecuencias), podemos hacer
uso de la siguiente fórmula:

kn
( - Fi-1 )
Pk = Li + 100 C
f pk
Del ejemplo anterior . Calcule el P85 e interprete el
resultado obtenido.
Límite xi fi Fi hi Hi
[ >
15,2 - 19,0 17,1 2 2 2/40 2/40
19,0 - 22,8 20,9 7 9 7/40 9/40
22,8 - 26,6 24,7 4 13 4/40 13/40
26,6 - 30,4 28,5 18 31 18/40 31/40
30,4 - 34,2 32,3 6 37 6/40 37/40
34,2 - 38,0 36,1 3 40 3/40 1

La clase correspondiente al P85 es la clase cuya


frecuencia absoluta acumulada excede a kn/100,
esto es 85x40/100 = 34 (quinta clase).

Reemplazando, tenemos:
34  31
p85  30,4  ( )3,8  32,3 onzas
6
Ejemplo
Se realizó una investigación sobre la contaminación
ambiental. Para ello se estudió la acidez del agua de
lluvia caída en 40 localidades del país. Registrándose
los siguientes niveles de pH:

5,9 5,7 6,0 3,9 4,8 4,9 6,0


6,9
3,2 4,2 4,9 6,2 4,9 6,0 6,4 5,8
5,0 3,9 5,0 5,3 5,8 5,7 5,7 6,2
5,1 6,0 5,1 5,7 5,1 4,8 5,8 5,9
5,3 5,0 5,4 5,9 6,4 5,9 5,7 6,0

a)Defina la variable en estudio.


b)¿cuál es el nivel de acidez más frecuente?
c)Calcule e interprete P25,Q3 y D4
d)Halle la desviación estándar e interprete.

Vous aimerez peut-être aussi