Vous êtes sur la page 1sur 13

INTRODUCCIN

El conocimiento de la forma de la distribucin y del respectivo promedio


de una coleccin de valores de una variable, puede servir para tener una
idea bastante clara de la conformacin, pero no de de la homogeneidad de
cada una de los valores con respecto a la medida de tendencia central
aplicada. En el caso de las variables con valores que pueden definirse en
trminos de alguna escala de medida de igual intervalo, puede usarse un tipo
de indicador que permite apreciar el grado de dispersin o variabilidad
existente en el grupo de variantes en estudio.

A estos indicadores les llamamos medidas de dispersin, por cuanto


que estn referidos a la variabilidad que exhiben los valores de las
observaciones, ya que si no hubiere variabilidad o dispersin en los datos
inters, entonces no habra necesidad de la gran mayora de las medidas de
la estadstica descriptiva.

El concepto de dispersin o variabilidad juega un papel clave dentro de


la Estadstica. Si los hechos no se repitieran o se repitieran sin variacin, la
Estadstica casi no tendra razn de ser; pero la realidad es que la mayora
de los fenmenos se repiten y lo hacen mostrando variaciones de mayor o
menor intensidad; de ah la importancia que tiene la Estadstica en el mundo
moderno, al suministrarle al hombre procedimientos vlidos y confiables para
analizar esos hechos que se repiten y hacer inferencias acerca de ellos a
pesar de la variabilidad que presentan.

En esta oportunidad veremos el clculo de las medidas de dispersin


para datos no agrupados.
DISPERSIN

Se conoce como Dispersin a la medida en la que los datos se


dispersan alrededor de un punto central (normalmente la media aritmtica)
en una muestra (MathematicsDictionary.com, 2014).

Al igual que sucede con cualquier conjunto de datos, la media, la


mediana y la moda slo revelan una parte de la informacin que se necesita
acerca de las caractersticas de los datos. Para aumentar el entendimiento
del patrn de los datos, se debe medir tambin su dispersin, extensin o
variabilidad.

La dispersin es importante porque:


Proporciona informacin adicional que permite juzgar la confiabilidad
de la medida de tendencia central. Si los datos se encuentran ampliamente
dispersos, la posicin central es menos representativa de los datos.

Ya que existen problemas caractersticos para datos ampliamente


dispersos, debemos ser capaces de distinguir que presentan esa dispersin
antes de abordar esos problemas.

Quiz se desee comparar las dispersiones de diferentes muestras. Si


no se desea tener una amplia dispersin de valores con respecto al centro de
distribucin o esto presenta riesgos inaceptables, se necesita tener habilidad
de reconocerlo y evitar escoger distribuciones que tengan las dispersiones
ms grandes.

Pero si hay dispersin en la mayora de los datos, se debe estar en


capacidad de describirla. La dispersin ocurre frecuentemente y su grado de
variabilidad es importante.
Medidas de Dispersin

Las Medidas de Dispersin resumen la informacin de la muestra o


serie de datos, revelando informacin acerca de la magnitud del alejamiento
de la distribucin de datos en relacin a un valor central o de concentracin
de los datos. stas complementan la informacin sobre la distribucin de la
variable, indicando si los valores de la variable estn muy dispersos o se
concentran alrededor de la medida de centralizacin.

Absolutas

Rango o recorrido Cuando se quieren sealar valores extremos en una


distribucin de datos, se suele utilizar la amplitud como medida de
dispersin. La amplitud es la diferencia entre el valor mayor y el menor de la
distribucin.

El rango es la medida de dispersin ms sencilla y tambin, por tanto,


la que proporciona menos informacin. Adems, esta informacin puede ser
errnea, pues el hecho de que no influyan ms de dos valores del total de la
serie puede provocar una deformacin de la realidad.

Propiedades del Rango o Recorrido:


El recorrido es la medida de dispersin ms sencilla de interpretar
puesto que simplemente es la distancia entre los valores extremos (mximo y
mnimo) en una distribucin

Puesto que el recorrido se basa en los valores extremos ste tiende a


ser errtico. No es extrao que en una distribucin de datos econmicos o
comerciales incluya a unos pocos valores en extremo pequeos o grandes.
Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersin
con respecto a esos valores anormales, ignorando a los dems valores de la
variable.

La principal desventaja del recorrido es que slo est influenciado por


los valores extremos, puesto que no cuenta con los dems valores de la
variable. Por tal razn, siempre existe el peligro de que el recorrido ofrezca
una descripcin distorsionada de la dispersin.

En el control de la calidad se hace un uso extenso del recorrido


cuando la distribucin a utilizarse no la distorsionan y cuando el ahorro del
tiempo al hacer los clculos es un factor de importancia.

Por ejemplo, obsrvese estas dos series correspondientes a los


nmeros de productos manufacturados por dos lneas de produccin
distintas:

Serie 1: 1 5 7 7 8 9 9 10 17
Serie 2: 2 4 6 8 10 12 14 16 18

Rango Serie 1: 17 1: 16
Rango Serie 2: 18 2: 16

Si bien ambas series tienen rango 16, estn desigualmente agrupadas,


pues mientras la primera tiene una mayor concentracin en el centro, la
segunda se distribuye uniformemente a lo largo de todo el recorrido.

Varianza (S2) es la ms utilizada. Es la media de los cuadrados de las


diferencias entre cada valor de la variable y la media aritmtica de la
distribucin.
Esta varianza muestral se obtiene como la suma de las de las
diferencias de cuadrados y por tanto tiene como unidades de medida el
cuadrado de las unidades de medida en que se mide la variable estudiada.

Ejemplo:

Se tienen las edades de cinco empleados del departamento de archivo


de una empresa: 18,23, 25, 27, y 34. Al calcular la media aritmtica
(promedio de las edades, se obtuvo 25.4 aos, encontrar la varianza de las
edades de estos empleados:
Para calcular se utiliza una tabla estadstica de trabajo de la siguiente
manera:

_ _
Xi ( Xi -X) ( Xi -X)2

18 (18 25.5)=-7.4 (-7.4)2=54.76


23 (23 25.5)=-2.4 (-2.4)2= 5.76
25 (25 25.5)=-0.4 (-0.4)2= 0.16
27 (27 25.5)= 1.6 ( 1.64)2= 2.16
34 (34 25.5)= 8.6 ( 8.6)2 =73.96
Total Xxxx 137.20
_
(XI-X)2 137.20
2
= ------------ = ----------- = 27.4 aos
n 5

Respuesta: la varianza de las edades es de 27.4 aos


Desviacin tpica La desviacin tpica o estndar (S) es la raz cuadrada
de la varianza. Expresa la dispersin de la distribucin y se expresa en las
mismas unidades de medida de la variable. La desviacin tpica es la medida
de dispersin ms utilizada en estadstica.

Aunque esta frmula de la desviacin tpica muestral es correcta, en la


prctica, la estadstica interesa para realizar inferencias poblacionales, por lo
que en se caso se utiliza como denominador el valor n-1, en lugar de n.

Cambiar el denominador de n por n-1 se debe al hecho de que esta


segunda frmula es una estimacin ms precisa de la desviacin estndar
verdadera de la poblacin y posee las propiedades necesarias para realizar
inferencias a la poblacin.

Propiedades de la media, varianza y desviacin tpica:


Son ndices que describen la variabilidad o dispersin y por tanto cuando los
datos estn muy alejados de la media, el numerador de sus frmulas ser
grande y la varianza y la desviacin tpica lo sern.

Al aumentar el tamao de la muestra, disminuye la varianza y la desviacin


tpica. Para reducir a la mitad la desviacin tpica, la muestra se tiene que
multiplicar por 4.
Cuando todos los datos de la distribucin son iguales, la varianza y la
desviacin tpica son iguales a 0.

Para su clculo se utilizan todos los datos de la distribucin; por tanto,


cualquier cambio de valor ser detectado. Es decir, si a todos los valores de
una distribucin se les multiplica por una constante, su media y desviacin
tpica quedan multiplicadas por la misma constante, mientras que la varianza
queda multiplicada por el cuadrado de esa constante. Si a todos los valores
de una distribucin se les suma una constante, su media queda aumentada
en ese valor, mientras que su varianza no se modifica.

Ejercicio
Un miembro del consejo de Administracin de una empresa ha
comprobado que, si bien todos los aos tienen una junta, ha habido aos que
tienen hasta cinco. Por la experiencia acumulada durante aos, sabe que el
nmero de juntas anual se distribuye con arreglo a la siguiente tabla:

N de juntas al ao 1 2 3 4 5
Probabilidad 2/15 5/15 1/15 3/15 4/15

a) Calcular la media
b) Calcular la varianza y la desviacin tpica

Solucin
Para realizar los clculos usamos la tabla de probabilidades

xi pi xi pi xi2 pi

1 2/15 2/15 2/15


2 5/15 10/15 20/15
3 1/15 3/15 9/15
4 3/15 12/15 48/15
5 4/15 20/15 100/15
1 47/15 179/15
a) Media
47
3.13
15

b) Varianza y desviacin tpica


179
2 (3.13) 2 2.13
15
2.13 1.46

Relativa

Coeficiente de Variacin de Pearson

Las medidas de tendencia central tienen como objetivo el sintetizar los


datos en un valor representativo, las medidas de dispersin nos dicen hasta
que punto estas medidas de tendencia central son representativas como
sntesis de la informacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de los valores de la distribucin
respecto al valor central. Distinguimos entre medidas de dispersin
absolutas, que no son comparables entre diferentes muestras y las relativas
que nos permitirn comparar varias muestras.

El problema de las medidas de dispersin absolutas es que


normalmente son un indicador que nos da problemas a la hora de comparar.
Comparar muestras de variables que entre s no tienen cantidades en las
mismas unidades, de ah que en ocasiones se recurra a medidas de
dispersin relativas.

Un problema que se plantea, tanto la varianza como la desviacin


estndar, especialmente a efectos de comparaciones entre distribuciones, es
el de la dependencia respecto a las unidades de medida de la variable.
Cuando se quiere comparar el grado de dispersin de dos distribuciones que
no vienen dadas en las mismas unidades o que las medias no son iguales se
utiliza el llamado Coeficiente de Variacin de Pearson, del que se demuestra
que nos da un nmero independiente de las unidades de medidas
empleadas, por lo que entre dos distribuciones dadas diremos que posee
menor dispersin aquella cuyo coeficiente de variacin sea menor y que se
define como la relacin por cociente entre la desviacin estndar y la media
aritmtica; o en otras palabras es la desviacin estndar expresada como
porcentaje de la media aritmtica.

Propiedades del Coeficiente de Pearson

Si a todos los valores de la variable se le suma una misma constante


el coeficiente de variacin queda alterado.

Ejemplo:

Una compaa de ventas ofrece como premio de incentivo al mejor


vendedor del trimestre anterior las entradas al palco empresarial en la serie
final de bisbol de las grandes ligas. De los registros de ventas se tienen los
siguientes datos de ventas, expresados en porcentajes de cumplimiento de
las metas fijadas mensualmente:

Vendedor A 95 105 100

Vendedor B 100 90 110


El promedio trimestral de cumplimiento de las metas de ventas de
ambos vendedores es igual y equivale al 100%, pero slo le puede dar el
premio de incentivo a uno de ellos. Este problema se resuelve utilizando el
coeficiente de variacin de Pearson, para estos efectos es necesario
encontrar la desviacin estndar trimestral de las ventas de cada uno de la
siguiente manera:

Vendedor A

_ _
Xi ( Xi - X ) ( Xi - X)2
95 95 100 = -5 (-5)2 = 25
105 105 100 = 5 ( 5)2 = 25
100 100 100 = 0 ( 0)2 = 0
Total XXX 50

La desviacin estndar es =
50
3
= 16.667=4.08 , luego

entonces el coeficiente de variacin es igual a:

4.08
CV = = =0,0408
x 100

Vendedor B

_ _
Xi ( Xi - X ) ( Xi - X)2
100 100 100 = 0 ( 0 )2 =
0
90 90 100 = -10 (-10)2 = 100
110 110 100 = 10 ( 10)2 = 100
Total XXX 200
La desviacin estndar es =
200
3
= 66.667=8.16 , entonces

el coeficiente de variacin es igual a:

8.16
CV = = =0,0 816
x 100

Respuesta: Dado que el vendedor A tiene menor coeficiente de


variacin, A l le corresponde recibir el premio de incentivo.
CONCLUSIN

No se puede gestionar lo que no se mide. Las mediciones son la clave.


Si algo no se puede medir, no se puede controlar. Si no se puede controlar,
no se puede gestionar. La falta sistemtica o ausencia estructural de
estadsticas en las organizaciones impide una administracin cientfica de las
mismas. Dirigir slo en base a datos financieros del pasado, realizar
predicciones basadas ms en la intuicin o en simples extrapolaciones, y
tomar decisiones desconociendo las probabilidades de xito u ocurrencia,
son slo algunos de los problemas o inconvenientes ms comunes hallados
en las empresas.

Carecer de datos estadsticos en cuanto a lo que acontece tanto interna


como externamente, impide decidir sobre bases racionales, y adoptar las
medidas preventivas y correctivas con el suficiente tiempo para evitar daos,
en muchos casos irreparables, para la organizacin.

Es por ello que resulta fundamental para la gerencia conocer el uso de


mediciones estadsticas que puedan aplicarse al mbito administrativo, de
manera de realizar seguimiento a las actividades que se realizan en la
empresa. Herramientas estadsticas como las que se comentaron en el
presente trabajo pueden ayudar a la toma de decisiones oportunas, lo que
permitir a la empresa alcanzar los objetivos que se trace.
REFERENCIAS BIBLIOGRFICAS

Cabrera, F. (2013). Medidas de dispersin. [Documento web en lnea].


Disponible: http://www.monografias.com/trabajos43/medidas-
dispersion/medidas-dispersion.shtml

Cetic. (2014). Estadstica: medidas de dispersin. [Pgina web en lnea].


Disponible:
http://www.cetic.edu.ve/files/ced/2005/medidas_dispersion/index.html

MathematicsDictionary.com (2014). Definicin de Dispersin. [Pgina web


en lnea]. Disponible:
http://www.mathematicsdictionary.com/spanish/vmd/full
/d/dispersioninstatistics.htm

Vous aimerez peut-être aussi