Vous êtes sur la page 1sur 16

MEDIDAS DE DISPERSIN O

VARIABILIDAD
Introduccin
Describir resumidamente slo con MTC, es incompleto

Necesidad: buscar otro tipo de estadgrafo, que d cuenta
de la homogeneidad o heterogeneidad de la distribucin

Medidas de Dispersin (MD)

As, la recomendacin es que en trminos descriptivos
siempre se debe recurrir a una MTC y una MD para una
adecuada y completa descripcin.

Preguntas tales como:
hay valores distintos en el conjunto?
cun distintos son los datos contenidos en la
distribucin?
no se pueden responder solo con las MTC. Es preciso
recurrir a otro tipo de estadgrafos, las MD.
Medidas de Dispersin
Se definen como el conjunto de estadgrafos que dan cuenta
del nivel o grado de homogeneidad o heterogeneidad interna
de una distribucin de frecuencias.

Las MD sealan la variabilidad o dispersin del conjunto.

Las MD deben utilizar un punto de referencia para cumplir
su propsito y por lo general es la Media Aritmtica.

Al igual que con las MTC las MD se buscan o identifican
casi- siempre en las fi pero se determinan en las xi

Slo se pueden aplicar para variables de nivel de medicin
de Intervalo o superior. No existen MD para variables de
niveles de medicin ordinal o nominal.
Aunque existen muchas, las ms
empleadas y tiles son:
Rango o Recorrido (r)

Varianza (s2)

Desviacin Estndar (s)

Coeficiente de Variacin (CV)
1. Rango/ Recorrido (R)
Se lo conceptualiza como la distancia
algebraica que recorre la variable entre su
xi menor y su xi mayor. De all el nombre
de recorrido.

Se define como la diferencia algebraica
(resta) entre el valor ms alto y el valor
ms bajo o menor del conjunto de datos.

En algunos textos se define como medida
bruta de dispersin
Caractersticas y requisitos
Requiere variable numrica, de intervalo o superior

No exige que los datos estn ordenados o agrupados en
tablas de frecuencia.

Se busca e identifica directamente sobre las xi; no supone
observar las fi.

Su determinacin es simple y rpida, ya que es una sencilla
resta aritmtica entre dos valores.

-Su interpretacin tambin es sencilla pues es directa:
mientras mayor es el resultado ms dispersin
Sin embargo, presenta algunas
limitaciones importante
Depende totalmente de la escala en que est representados
los datos (unidades, centenas, miles, etc.). Por lo que su
interpretacin a veces es dificultosa o puede inducir a
engao

No es muy til para comparar resultados provenientes de
dos grupos distintos o grupos con tamaos diferentes

Es sensible a la existencia de valores extremos

No toma en cuenta las frecuencias con que estn presente
los distintos xi. Se contenta con que un valor extremo est
presente una vez para considerarlo como referencia y
determinar el recorrido de la variable, lo cual es vlido pero
puede inducir a conclusiones sino erradas al menos
incompletas.
Frmula
Ej.: tomemos como variable la Edad del Pblico que asisti a la
primera funcin de la pelcula Una noche en el museo.
Xi mayor = 86
Xi menor = 8
El rango recorrido es 76. Como es un nmero alto (por simple
anlisis de lgica de sentido comn) se puede concluir que la
dispersin de los datos (en este caso la edad de los asistentes a
dicha funcin de cine) es alta, es decir, que existi un conjunto
heterogneo -en cuanto a edad- de personas que fueron al cine a
esa primera funcin.
Y si ahora tomamos la variable Ingresos econmicos de los
ciudadanos que en las ltimas elecciones votaron en blanco
Xi mayor = $ 5.000.000
Xi menor = $ 100.000
En este ejemplo el rango es de $ 4.900.000, o
sea, la variable presenta una gran dispersin:
hay sujetos que ganan mucho y sujetos que
ganan muy poco y todos votaron de la misma
manera.
Ms all de las interpretaciones particulares para cada caso, si
se comparan los resultados de estos ejemplos es difcil llegar a
una conclusin sustantiva del tipo la variable x es la que
presente ms/ menos dispersin. Hay una dificultad asociada
con la escala de medicin.
Por ello, y a pesar de todas sus ventajas, no es muy empleada,
excepto cuando se desea tener una primera aproximacin a la
dispersin de la variable y que despus sea corroborada o
corregida con otra medida de dispersin ms eficiente.
2. Varianza (s2)
Dadas las limitaciones del Rango como medida de
dispersin, se han desarrollado en estadstica medidas que
superan tales dificultades, buscando dar cuenta de mejor
manera del grado de heterogeneidad o dispersin de los
datos.

Con excepcin del Rango/ Recorrido todas las medidas de
dispersin tienen implcita la idea de la desviacin o
alejamiento de los datos respecto de un punto de
referencia.

Las frmulas siempre apuntan a determinar la desviacin
respecto de esa referencia. La varianza (s2) se
conceptualiza como el promedio de las desviaciones de los
datos respecto del promedio.
Caractersticas y requisitos
Requiere variable de intervalo o de razn

No exige que los datos estn ordenados o agrupados en tablas de
frecuencia, aunque es ms fcil si estn agrupados en tablas

Su clculo requiere de una frmula.

Posibilita comparar resultados de medidas de dispersin
provenientes de conjuntos de datos de diferentes tamaos sin que
esto afecte (siempre que se mantenga la escala de la medicin de
ambos conjuntos de datos)

Su interpretacin no es sencilla ni directa dado que su principal
limitacin en el mbito descriptivo es que su resultado est en una
escala diferente a la de los datos originales. A modo de ejemplo, si
los datos originales son manzanas el resultado que entrega la
frmula de la varianza no son manzanas.
Frmula para datos en Categoras Unitarias
Frmula Datos en Categoras No Unitarias
f
f
Ej: Tomemos por ejemplo la variable Notas
obtenidas en el semestre en Estadstica. Si los
valores fueran 1, 4, 7,0 calcule la varianza.
La respuesta es que no hay una interpretacin sustantiva de
la varianza. No se puede afirmar que el conjunto de datos es
ms o menos disperso. Solo se puede sostener que el grado
promedio de desviacin de los datos respecto del promedio
es 6.0.

Pero, debe tenerse presente que este valor (6.0) no est en
la escala de medicin de los datos originales, por lo que no
cabe interpretarla como notas. No son notas. A lo sumo, son
notas al cuadrado, o sea, nada claro.

No obstante esta aparente dificultad, debemos recordar que
buscamos responder cunta dispersin o heterogeneidad
existe en la distribucin: Especficamente cul es la
dispersin de la notas del alumno que presenta tres
calificaciones (1,4,7) y cuyo promedio es 4.0?
Altura Marca de
clase (Xi)
/ X X /= Frecuencia (f) f / X X/
60 62
63 65
66 68
69 71
72 74
61
64
67
70
73
6
18
42
27
8
N= f = f / X X/ =