Vous êtes sur la page 1sur 13

TUTOR: PEDRO AGUSTIN DUARTE ACOSTA

Medidas descriptivas de las distribuciones de frecuencia.



Se ha visto que los mtodos grficos son extremadamente tiles para lograr una
descripcin de los datos y es por esto que las representaciones resultantes de las
distribuciones de frecuencia nos permitieron discernir las tendencias y patrones de los
datos; sin embargo, los mtodos grficos presentan limitaciones cuando se desea tener
una mayor exactitud, motivo por el cual si necesitamos de medidas ms exactas de un
conjunto de datos, recurrimos a nmeros individuales, llamados estadsticos resumidos.
Mediante estos estadsticos podemos describir ciertas caractersticas del conjunto de
datos los cuales nos permitirn tomar decisiones ms rpidas y satisfactorias.
Cuatro de estas caractersticas son:
1) Medidas de tendencia central
2) Medidas de dispersin.
3) Medidas de sesgo.
4) Medidas de curtosis.


Medidas de tendencia central

Promedio
Es un valor tpico o representativo de un conjunto de datos. Como tales valores tienden a
situarse en el centro del conjunto de datos ordenados segn su magnitud, los promedios
se conocen tambin como medidas de centralizacin o de tendencia central.
Entre las medidas de tendencia central tenemos:


La Media Aritmtica
Es aquella que representa el promedio aritmtico de un conjunto de observaciones, la
misma acta como punto de equilibrio, de manera que las observaciones menores
equilibran a las mayores.
Notacin

poblacin una para sea cuando


muestra una para sea cuando x


Frmulas:
Datos no agrupados Datos agrupados
N
i
x

n
x ... x x x
n
n
i
x
x
N
1 i
n
3 2 1 1 i

=
+ + + +
=

=
=
=

n
f * x ... x f * x x
n
i
f
i
f *
i
x
x
g
g
3
f *
3
2
2
1
f *
1
g
1 i
+ + + +
=
=

=
=

x
i
son las marcas de clase
f
i
son las respectivas frecuencias absolutas
Para los datos agrupados, lo que se calcula es una estimacin del valor de la media ya que
al agrupar por clases no conocemos los valores individuales de cada observacin, slo
que para facilitar los clculos se ha de renunciar a la exactitud.

Ejemplos:
1) Calcular la media aritmtica de 8, 3, 5, 12, 10:
6 , 7
5
10 12 5 3 8
=
+ + + +
=
2) Del ejemplo inicial sobre el investigador que deseaba determinar
cmo variaban las estaturas de las obreras de una empresa y el
cual tomaba una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas, se haba obtenido la siguiente tabla:
l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 56) 2 54,5 2 0,0400 4 0,0400 4
[56 59) 5 57,5 7 0,1000 10 0,1400 14
[59 62) 9 60,5 16 0,1800 18 0,3200 32
[62 65) 15 63,5 31 0,3000 30 0,6200 62
[65 68) 12 66,5 43 0,2400 24 0,8600 86
[68 71) 5 69,5 48 0,1000 10 0,9600 96
[71 74) 2 72,5 50 0,0400 4 1,0000 100






Para calcular la media, debemos agregar una nueva columna:
l
i
- l
i+1
f
i
x
i
x
i
* f
i
[53 56) 2 54,5 109,0
[56 59) 5 57,5 287,5
[59 62) 9 60,5 544,5
[62 65) 15 63,5 952,5
[65 68) 12 66,5 798,0
[68 71) 5 69,5 347,5
[71 74) 2 72,5 145,0
E = 3184
68 , 63
50
3184
x = = pulgadas
Interpretacin: en promedio, las obreras presentaron una estatura
de 63,68 pulgadas.


La Media Aritmtica Ponderada
A veces se asocia a los nmeros de un conjunto de datos, ciertos factores o pesos y es por
ello que la media aritmtica ponderada es un promedio que se calcula a fin de tener en
cuenta la importancia de cada valor para el total global.
Notacin: w x
Frmula:
k 3 2
k k 3 3 2 2
k
1 i
i
k
1 i
i i
w
w ... w w w
x * w ... x * w x * w x * w
w
x * w
x
1
1 1
+ + + +
+ + + +
= =

=
=

Al calcular la media aritmtica a partir de datos agrupados, en realidad
obtuvimos la media aritmtica ponderada utilizando las marcas de clase para
los valores de x y las frecuencias de cada clase como los pesos, en ese caso
E f
i
= E w
i
.
Ejemplo:
Si un examen final de curso se valora como 3 veces los exmenes parciales y
un estudiante tiene una nota de examen final de 85 y notas de exmenes
parciales de 70 y 90, calcular su nota final.
83
3 1 1
85 * 3 90 * 1 70 * 1
xw =
+ +
+ +
= puntos.

Observaciones sobre la media aritmtica:
Es una medida que toma en consideracin todos los valores de la
distribucin. Esto es positivo, pero por la misma razn es muy sensible
a la presentacin de observaciones extremas o anmalas que hacen
que la media se desplace hacia ellas. En consecuencia no es
recomendable usar la media como medida de tendencia central en los
casos en el cual el conjunto de datos no es homogneo, pues la
cantidad obtenida no es representativa del total de los datos.
Tiene la ventaja de que es nica y siempre se puede calcular (si no
hay intervalos abiertos).
El valor de la media aritmtica puede no coincidir con los valores de la
variable.

Algunas propiedades de la media aritmtica:
La suma algebraica de las desviaciones de un conjunto de nmeros
con respecto a su media aritmtica es cero.
( ) 0 x x
k
1 i
i
=

=

La media aritmtica de una constante es igual a la constante.
La media de la suma de dos o ms variables es igual a la suma de las
medias de dichas variables.

i
y
i
x
i
y
i
x x x x + =
|
.
|

\
|
+
Si a cada valor de la serie se le agrega una constante, la media de la
nueva serie es igual a la media de la serie original ms la constante.
Igual sucede si a la media se le resta una constante.
k x x k x x
i
x k
i
x
i
x k
i
x = + =
|
.
|

\
|
|
.
|

\
|
+
Media de medias: Si f
1
nmeros tienen de media m
1
, f
2
nmeros tiene
de media m
2
,..., f
k
nmeros tienen de media m
k
, entonces la media
de todos los nmeros es:

k 3 2 1
k k 3 3 2 2 1 1
w
f ... f f f
m * f ... m * f m * f m * f
x
+ + + +
+ + + +
=
es, decir, la media aritmtica ponderada de todas las medias.


La Mediana
Es el punto medio de un conjunto de datos representando el valor ms central en dicho
conjunto, por lo que deja por encima y por debajo la misma cantidad de datos (una vez
que estos han sido ordenados). Geomtricamente es el valor de x que corresponde a la
vertical que divide al histograma en dos partes de igual rea.
Notacin: Med
Frmulas:
Datos no agrupados Datos agrupados
El valor de la mediana puede coincidir o no
con un valor de la serie, todo depende si el
nmero de datos es par o impar.
Los pasos son:
1. Organizar por orden
ascendente a los datos.
2. Utilizar la frmula de
posicionamiento de punto:
2
1 n +
para localizar el lugar
que ocupa el valor de la
mediana en el arreglo
ordenado.
3. Si el conjunto tiene un nmero
impar de elementos, el de la mitad
ser la mediana, si contiene un
nmero par de elementos, la
mediana ser el promedio
aritmtico de los dos que se hallan
en la mitad.
a *
f
F
2
n
l Med
med
a
i

+ =
en donde:
l
i
es el lmite inferior.
F
a
es la frecuencia acumulada anterior.
f
med
es la frecuencia absoluta del intervalo
de la mediana.
a es la amplitud.

Los pasos son:
1. Calcular
2
n

2. Localizar ese valor en F
i
, si no est,
pasar al inmediato superior. Con
esto se halla el intervalo de la
mediana.
3. Aplicar la frmula sustituyendo los
valores correspondientes.

Ejemplos:
1) Datos no agrupados:
Sean los nmeros: 3, 4, 4, 5, 6, 8, 8, 8, 10. Usando la frmula de
posicionamiento, el valor ocupado por la posicin 5
2
1 9
=
+
sera a
mediana, entonces la respuesta es 6.
Sean los nmeros: 5, 5, 7, 9, 11, 12, 15, 18. Usando la frmula de
posicionamiento, el valor 5 , 4
2
1 8
=
+
dara la posicin de la mediana;
como no hay esa posicin, buscamos el promedio de los nmeros que
ocupan los puestos 4 y 5, dando como resultado que la mediana ser
10

2) Datos agrupados:
Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban
las estaturas de las obreras de una empresa y el cual tomaba una muestra de 50
mujeres para registrar luego sus estaturas en pulgadas, se haba obtenido la
siguiente tabla:

l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 56) 2 54,5 2 0,0400 4 0,0400 4
[56 59) 5 57,5 7 0,1000 10 0,1400 14
[59 62) 9 60,5 16 0,1800 18 0,3200 32
[62 65) 15 63,5 31 0,3000 30 0,6200 62
[65 68) 12 66,5 43 0,2400 24 0,8600 86
[68 71) 5 69,5 48 0,1000 10 0,9600 96
[71 74) 2 72,5 50 0,0400 4 1,0000 100

Paso 1:
25
2
50
2
n
= =

Paso 2:
Como 25 no aparece en F
i
, pasamos al inmediato superior: 31.

Paso 3:
=

+ = 3 *
15
16 25
62 Med 63,8 pulgadas
Interpretacin: El 50% de las obreras tienen una estatura igual o
inferior a 63,8 pulgadas aproximadamente.

Observaciones sobre la mediana:
Como medida descriptiva, tiene la ventaja de no estar afectada por las
observaciones extremas, ya que no depende de los valores que toma
la variable, sino el orden de los mismos. Por ello, es adecuado su uso
en distribuciones que presentan observaciones extremadamente
grandes o pequeas.
Puede ser calculada an a partir de datos agrupados con clases
abiertas.
Puede usarse con datos cualitativos.
No utiliza toda la informacin de los datos (slo los valores centrales).
Su mayor defecto es que no se ajusta fcilmente al clculo algebraico,
lo que hace que sea difcil de utilizar en otras reas, como en la
inferencia.


La Moda
Es el valor de los datos que se presenta con ms frecuencia, por lo que representa el punto
ms alto en la curva de distribucin de un conjunto de datos.
Notacin: Mo
Frmulas:
Datos no agrupados Datos agrupados
No hay frmulas, slo ver cul valor
o elemento es el que ms se repite.
a l Mo *
2

i
+
+ =
l
i
es el lmite inferior (si se trabajan
con lmites imaginarios y reales, se
toman los reales).
A
1
es el valor que se obtiene a restar
la f
modal
con la frecuencia anterior.
A
2
es el valor que se obtiene a restar
la f
modal
con la frecuencia siguiente.
a es la amplitud.

Los pasos para calcular la moda con datos agrupados seran:
1. Ubicar la mayor f
i
para hallar el intervalo modal
2. Aplicar la frmula







Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las
estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para
registrar luego sus estaturas en pulgadas, se haba obtenido la siguiente tabla:

l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 56) 2 54,5 2 0,0400 4 0,0400 4
[56 59) 5 57,5 7 0,1000 10 0,1400 14
[59 62) 9 60,5 16 0,1800 18 0,3200 32
[62 65) 15 63,5 31 0,3000 30 0,6200 62
[65 68) 12 66,5 43 0,2400 24 0,8600 86
[68 71) 5 69,5 48 0,1000 10 0,9600 96
[71 74) 2 72,5 50 0,0400 4 1,0000 100
Para calcular la moda:
1. Ubicamos la mayor frecuencia absoluta, en este caso es 15 y el mismo
pertenece a la cuarta clase.
2. Aplicamos la frmula:
( ) ( )
=
+

+ = 3 *
12 15 9 15
9 15
62 Mo 64 pulgadas
Interpretacin: la mayora de las obreras tienen una estatura de 64
pulgadas aproximadamente.

Observaciones sobre la moda:
Se puede usar para datos cualitativos y cuantitativos.
Se puede emplear aunque existan clases abiertas en la distribucin.
Puede no ser nica, por ello, cuando los conjuntos de datos contiene
2, 3, o ms modas, son difciles de interpretar.
Puede que una distribucin no tenga moda.
El intervalo modal es aquel que posee una barra en el histograma con
mayor altura geomtricamente, se calcula segn la grfica:




Cuantiles

Si una serie de datos se colocan en orden de magnitud, el valor medio que divide al
conjunto de datos en dos partes iguales es la mediana, por extensin de esta idea se puede
pensar en aquellos valores que dividen a los datos en cuatro partes iguales, en cien partes
iguales, etc. El nombre genrico es el de cuantil y el mismo se define como el valor bajo
el cual se encuentra una determinada proporcin de los valores de una distribucin.
Dentro de las medidas de los cuantiles tenemos:

Deciles:
Son aquellos valores que dividen en diez partes iguales a un conjunto de
datos ordenados. Se representan por D
1
, D
2
, D
3
, ....D
9
. De esta manera
tenemos que:
- D
1
(primer decil) es el valor por debajo del cual se encuentran como
mximo el 10% de las observaciones, mientras que el 90% restante se
sitan por encima de l.
- D
2
(segundo decil) es el valor por debajo del cual se encuentran como mximo el 20%
de las observaciones, mientras que el 80% restante se sitan por encima de l.
Y as sucesivamente.

Cuartiles:
Son aquellos valores que dividen en cuatro partes iguales a un conjunto de
datos ordenados. Se representan por Q
1
, Q
2
, y Q
3
. De esta manera tenemos
que:
- Q
1
(primer cuartil) es el valor por debajo del cual se sitan a lo sumo el
25% de las observaciones y por encima de ste el 75% restante.
- Q
2
(segundo cuartil) es el valor por debajo de cual se sitan a lo sumo el
50% de las observaciones y por encima de ste el 50% restante. Est justo
en el centro y corresponde a la mediana
- Q
3
(tercer cuartil) es el valor por debajo del cual se sitan a lo sumo el 75%
de las observaciones y por encima de ste el 25% restante
Observacin: Hay algunas variaciones en las convenciones de clculo de cuartiles ya que
los valores reales calculados pueden variar un poco dependiendo de la convencin
seguida. Sin embargo, el objetivo de todos los procedimientos de clculo de cuartiles es
dividir los datos en aproximadamente cuatro partes iguales.

Percentiles:
Son aquellos valores que dividen a un conjunto de datos ordenados en cien
partes iguales. Se representan por P
1
, P
2
.... , P
99
. De esta manera tenemos
que:
- P
1
es el valor por debajo del cual se sitan a lo sumo el 1% de los datos y
por encima de l tenemos el 99% restante.
- P
2
es el valor por debajo del cual se sitan a lo sumo el 2% de los datos y
por encima de l tenemos el 98% restante. Y as sucesivamente..
En forma genrica el p-simo percentil es un valor tal que por lo menos un
p por ciento de los elementos tiene dicho valor o menos y, al menos, un
(100-p) por ciento de los elementos tiene ese valor o ms.
Es conveniente tomar en cuenta que: D
1
= P
10
, D
2
= P
20
, Q
1
= P
25
, y as
sucesivamente.
Dependiendo de si trabajamos con datos agrupados o no tendremos los
siguientes pasos para el clculo de los percentiles:
* Para datos no agrupados:
1. Ordenar los datos de manera ascendente.
2. Calcular el ndice:
n *
100
P
i |
.
|

\
|
=
- Si i es entero, el p-simo percentil es el promedio de los
valores de los datos ubicados en los lugares i e i +1.

- Si i no es entero, se redondea. El valor entero inmediato
mayor que i indica la posicin del p-simo percentil.

Ejemplo:
Determinar el P
50
y el P
85
de los datos siguientes:
2350, 2450, 2550, 2380, 2255, 2210, 2390, 2630, 2440, 2825, 2420,
2380.
1. Ordenamos de manera ascendente:
2210, 2255, 2350, 2380, 2380, 2390, 2420, 2440, 2450, 2550, 2630, 2825.
Para P
50
:
2. Calculamos i: 6 12 *
100
50
i = |
.
|

\
|
=
Como i es entero, P
50
es el promedio de los 6 y 7, luego nos dara:
2405
2
2420 2390
P
50
=
+
=
Para P
85
:
2. Calculamos i: 2 , 0 1 12 *
100
85
i = |
.
|

\
|
=
Como i no es entero, redondeamos. El lugar del P
85
es el siguiente
entero mayor que 10,2 es decir, el lugar 11. Esto nos dara que P
85
=
2630.


* Para datos agrupados:
a. Se aplica la frmula:
a
f
F
100
p * n
l P *
p
a
i p

= +

b. Para aplicar la frmula, los pasos son:
1. Ubicar el resultado de
100
p * n
en F
i

2. Si no est el valor, se pasa al inmediato superior.
3. Al ubicar el valor de F
i
determinamos el intervalo de donde se
obtendrn los datos para sustituir en la ecuacin.
Observacin: si se trabajan con lmites reales e imaginarios, se
toman los reales.

Por medio de los percentiles, se halla el valor de la variable para un
porcentaje dado.
Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las
estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para
registrar luego sus estaturas en pulgadas, se haba obtenido la siguiente tabla:
l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 56) 2 54,5 2 0,0400 4 0,0400 4
[56 59) 5 57,5 7 0,1000 10 0,1400 14
[59 62) 9 60,5 16 0,1800 18 0,3200 32
[62 65) 15 63,5 31 0,3000 30 0,6200 62
[65 68) 12 66,5 43 0,2400 24 0,8600 86
[68 71) 5 69,5 48 0,1000 10 0,9600 96
[71 74) 2 72,5 50 0,0400 4 1,0000 100
P
15
= ?
1. 5 , 7
100
15 * 50
100
p * n
= =
2. 17 , 59 3 *
9
7 5 , 7
59 P
15
=

+ = pulgadas
Interpretacin: el 15% de las obreras tienen una estatura de 59,17 pulgadas o menos.

Q
1
= ?
Q
1
= P
25
1. 5 , 12
100
25 * 50
100
p * n
= =
2. 83 , 60 3 *
9
7 5 , 12
59 P
25
=

+ = pulgadas
Interpretacin: el 25% de las obreras tienen una estatura de 60,83 pulgadas o menos.

D
3
= ?
D
3
= P
30

1. 15
100
30 * 50
100
p * n
= =
2. 67 , 61 3 *
9
7 15
59 P
30
=

+ = pulgadas
Interpretacin: el 30% de las obreras tienen una estatura de 61,67 pulgadas o menos.

P
75
= ?
1. 5 , 37
100
75 * 50
100
p * n
= =
2. 63 , 66 3 *
12
31 5 , 37
6 P
75
=

+ = pulgadas
Interpretacin: el 75% de las obreras tienen una estatura de 66,63 pulgadas o menos.




Rango Percentil
Es una expresin mediante la cual podemos hallar el porcentaje, dado un
valor de la variable. Dicha expresin se obtiene al despejar p en la frmula
de percentiles para datos agrupados, el proceso para hallar el rango percentil
es:
1. Ubicar el valor de la variable que nos dan, en el intervalo que le corresponda.
2. Una vez ubicado, podemos determinar l
i
, f
i
, etc, para sustituir en la frmula:
( )
100 *
n
F
a
f * l P
p
a
i i p
+

=

Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las
estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para
registrar luego sus estaturas en pulgadas, se haba obtenido la siguiente tabla:
l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 56) 2 54,5 2 0,0400 4 0,0400 4
[56 59) 5 57,5 7 0,1000 10 0,1400 14
[59 62) 9 60,5 16 0,1800 18 0,3200 32
[62 65) 15 63,5 31 0,3000 30 0,6200 62
[65 68) 12 66,5 43 0,2400 24 0,8600 86
[68 71) 5 69,5 48 0,1000 10 0,9600 96
[71 74) 2 72,5 50 0,0400 4 1,0000 100

Hallar el porcentaje de obreras cuyas estaturas son iguales o inferiores a 67 pulgadas:
1. Ubicamos el valor de 67 en la tabla y vemos que corresponde a la 5
ta
clase.
2. Sustituimos los valores:

( )
78% 100 *
50
1 3
3
12 * 5 6 7 6
p =
+

=
Interpretacin: el 78% de las obreras tienen estaturas iguales o inferiores a 67 pulgadas.