Vous êtes sur la page 1sur 8

Varianza y desviacin estndar para datos agrupados

La varianza para datos agrupados, una vez vista la media para datos agrupados, la podemos definir como:

donde m es el nmero de clases o agrupamientos y .

la frecuencia para el respectivo dato

Podemos construir otra relacin muy similar a la que tenamos para el caso de datos no agrupados, como se muestra en el siguiente teorema:

Teorema. La varianza para un conjunto de datos agrupados es dada como

Demostracin. Consideremos la definicin

Desarrollando el cuadrado tenemos:

recordando que la definicin para la media

entonces

adems sabemos que la suma de las frecuencias es igual al nmero de datos, es

decir,

, por lo que

lo cual demuestra el teorema.

Retomando el ejemplo planteado en el ejemplo del clculo de la desviacin absoluta media, para el caso de las calificaciones reportadas por el profesor:

Clases para las calificaciones

Frecuencia de datos

Punto medio de clase

Cuadrados de las desviaciones por su frecuencia

1 1 3 0 5 4 6 10 18 2

0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5

39.69 28.09 55.47 0 26.45 6.76 0.54 4.9 52.02 14.58

Obtener la desviacin estndar para este conjunto de datos agrupados es inmediata, basta con sacar la raz cuadrada a la varianza obtenida.

http://dieumsnh.qfb.umich.mx/estadistica/vardatono.htm

2.7.4 Varianza y desviacin tpica


Como forma de medir la dispersin de los datos hemos descartado:

, pues sabemos que esa suma vale 0, ya que las desviaciones con respecto a la media se compensan al haber trminos en esa suma que son de signos distintos. Para tener el mismo signo al sumar las desviaciones con respecto a la media podemos realizar la suma con valores absolutos. Esto nos lleva a la Dm, pero como hemos mencionado, tiene poco inters por las dificultades que presenta.

Si las desviaciones con respecto a la media las consideramos al cuadrado, , de nuevo obtenemos que todos los sumandos tienen el mismo signo (positivo). Esta es adems la forma de medir la dispersin de los datos de forma que sus propiedades matemticas son ms fciles de utilizar. Vamos a definir entonces dos estadsticos que sern fundamentales en el resto del curso: La varianza y la desviacin tpica.

La varianza,

, se define como la media de las diferencias cuadrticas de n puntuaciones

con respecto a su media aritmtica, es decir Para datos agrupados en tablas, usando las notaciones establcidas en los captulos

anteriores, la varianza se puede escibir como Una frmula equivalente para el clculo de la varianza est basada en lo siguiente:

Con lo cual se tiene

Si los datos estn agrupados en tablas, es evidente que

La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden en metros, la varianza lo hace en ). Si queremos que la medida de

dispersin sea de la misma dimensionalidad que las observaciones bastar con tomar su raz cuadrada. Por ello se define la desviacin tpica, , como

Vous aimerez peut-être aussi