Vous êtes sur la page 1sur 8

http://matematicas.reduaz.mx/home/Docentes/ltrueba/diplomado/pagina15.

htm

MEDIDAS DE VARIABILIDAD O DISPERSIN

Los estadsticos de tendencia central o posicin nos indican donde se sita un grupo de puntuaciones. Los de variabilidad o dispersin nos indican si esas puntuaciones o valores estn prximas entre s o si por el contrario estn o muy dispersas. Una medida razonable de la variabilidad podra ser la amplitud o rango, que se obtiene restando el valor ms bajo de un conjunto de observaciones del valor ms alto. Es fcil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes: No utiliza todas las observaciones (slo dos de ellas); Se puede ver muy afectada por alguna observacin extrema;

El rango aumenta con el nmero de observaciones, o bien se queda igual. En cualquier caso nunca disminuye. En el transcurso de esta seccin, veremos medidas de dispersin mejores que la anterior. Estas se determinan en funcin de la distancia entre las observaciones y algn estadstico de tendencia central.

Desviacin media, Dm Se define la desviacin media como la media de las diferencias en valor absoluto de los valores de la variable a la media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces

Si los datos estn agrupados en una tabla estadstica es ms sencillo usar la relacin

Como se observa, la desviacin media guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente, esto

hace que sea muy engorroso trabajar con ella a la hora de hacer inferencia a la poblacin.

Varianza y desviacin tpica Como forma de medir la dispersin de los datos hemos descartado:

( x x ) , pues sabemos que esa suma vale 0, ya que las


i 1 i

desviaciones con respecto a la media se compensan al haber trminos en esa suma que son de signos distintos.

Para tener el mismo signo al sumar las desviaciones con respecto a la media podemos realizar la suma con valores absolutos. Esto nos lleva a la Dm, pero como hemos mencionado, tiene poco inters por las dificultades que presenta.

Si las desviaciones con respecto a la media las consideramos al cuadrado,


( xi x ) 2 ,

de nuevo obtenemos que todos los sumandos tienen el

mismo signo (positivo). Esta es adems la forma de medir la dispersin de los datos de forma que sus propiedades matemticas son ms fciles de utilizar. Vamos a definir entonces dos estadsticos que sern fundamentales en el resto del curso: La varianza y la desviacin tpica.

La varianza,

, se define como la media de las diferencias cuadrticas

de n puntuaciones con respecto a su media aritmtica, es decir

Para datos agrupados en tablas, usando las notaciones establcidas en los captulos anteriores, la varianza se puede escibir como

Una frmula equivalente para el clculo de la varianza es

Si los datos estn agrupados en tablas, es evidente que

La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden en metros, la varianza lo hace en ). Si

queremos que la medida de dispersin sea de la misma dimensionalidad que las observaciones bastar con tomar su raz cuadrada. Por ello se define la desviacin tpica, , como

Ejemplo Calcular la varianza y desviacin tpica de las siguientes cantidades medidas en metros:

3,3,4,4,5

Solucin: Para calcular dichas medidas de dispersin es necesario calcular previamente el valor con respecto al cual vamos a medir las diferencias. ste es la media:

La varianza es:

siendo la desviacin tpica su raz cuadrada:

Observacin Adems de las propiedades que hemos demostrado sobre la varianza (y por tanto sobre la desviacin tpica), ser conveniente tener siempre en mente otras que enunciamos a continuacin:

Ambas son sensibles a la variacin de cada una de las puntuaciones, es decir, si una puntuacin cambia, cambia con ella la varianza. La razn es que si miramos su definicin, la varianza es funcin de cada una de las puntuaciones.

Si se calculan a traves de los datos agrupados en una tabla, dependen de los intervalos elegidos. Es decir, cometemos cierto error en el clculo de la varianza cuando los datos han sido resumidos en una tabla estadstica mediante intervalos, en lugar de haber sido calculados directamente como datos no agrupados. Este error no ser importante si la eleccin del nmero de intervalos, amplitud y lmites de los mismos ha sido adecuada.

La desviacin tpica tiene la propiedad de que en el intervalo

se encuentra, al menos, el 75% de las observaciones (vease ms adelante el teorema de Thebycheff, pgina ). Incluso si tenemos

muchos datos y estos provienen de una distribucin normal (se definir este concepto ms adelante), podremos llegar al 95 %.

No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de tendencia central.

Vous aimerez peut-être aussi