Vous êtes sur la page 1sur 14

MEDIDAS DE DISPERSIN

A pesar de la gran importancia de las medidas de tendencia central y de la cantidad de informacin que
aportan individualmente, no hay que dejar de sealar que en muchas ocasiones esa informacin, no slo no es
completa, sino que puede inducir a errores en su interpretacin. Veamos algunos ejemplos.


Consideremos dos grupos de personas extrados como muestras respectivas de dos poblaciones distintas: el
primero est compuesto por 100 personas que asisten a la proyeccin de una pelcula para nios, y el segundo
por 100 personas elegidas entre los asistentes a una discoteca juvenil. Pudiera ocurrir que, aun siendo las
distribuciones de las edades de ambos grupos muy distinta, la media y la mediana coincidieran para ambas.
(Da un ejemplo concreto en que esto ocurra).

Igualmente ocurre en este otro ejemplo. La caja de un kiosco registra las siguientes entradas en miles de
pesos, a lo largo de dos semanas correspondientes a pocas distintas del ao

1 semana 2 semana
10 30
20 40
30 50
50 50
60 60
80 60
100 60
350 350


La media y la mediana de ambas distribuciones coinciden (el valor de ambas es 50 en los dos casos) y, sin
embargo, las consecuencias que se podran derivar de una y otra tabla son bien distintas.

Comprendemos pues, a la vista de estos ejemplos, la necesidad de conocer otras medidas, aparte de los
valores de centralizacin, que nos indiquen la mayor o menor desviacin de cada observacin respecto de
aquellos valores.

Las medidas de desviacin, variacin o dispersin que estudiaremos a continuacin son: Rango o amplitud,
desviacin media y desviacin tpica.

RANGO, AMPLITUD TOTAL O RECORRIDO

El rango se suele definir como la diferencia entre los dos valores extremos que toma la variable. Es la medida
de dispersin ms sencilla y tambin, por tanto, la que proporciona menos informacin. Adems, esta
informacin puede ser errnea, pues el hecho de que no influyan ms de dos valores del total de la serie puede
provocar una deformacin de la realidad.
Comparemos, por ejemplo, estas dos series:

Serie 1: 1 5 7 7 8 9 9 10 17
Serie 2: 2 4 6 8 10 12 14 16 18

Ambas series tienen rango 16, pero estn desigualmente agrupadas, pues mientras la primera tiene una mayor
concentracin en el centro, la segunda se distribuye uniformemente a lo largo de todo el recorrido.

El uso de esta medida de dispersin, ser pues, bastante restringido.

DESVIACIN MEDIA

En teora, la desviacin puede referirse a cada una de las medidas de tendencia central: media, mediana o
moda; pero el inters se suele centrar en la medida de la desviacin con respecto a la media, que llamaremos
desviacin media.

Puede definirse como la media aritmtica de las desviaciones de cada uno de los valores con respecto a la
media aritmtica de la distribucin, y de indica as:

N
x x
DM


=

Ntese que se toman las desviaciones en valor absoluto, es decir, que la frmula no distingue si la diferencia
de cada valor de la variable con la media es en ms o en menos.

Ya se habr advertido que esta expresin sirve para calcular la desviacin media en el caso de datos sin
agrupar. Veamos un ejemplo:

Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviacin media de estos valores.

x
x x x
2 -3 3
2 3 3
4 -1 1
4 -1 1
4 -1 1
5 0 0
6 1 1
7 2 2
8 3 3
8 3 3

DM = 1,8

Veamos ahora cmo se calcula la desviacin media en el caso de datos agrupados en intervalos.

N
x n
DM
i

=

donde observamos que ahora las desviaciones van multiplicadas por las frecuencias de los intervalos
correspondientes.

Adems, las desviaciones son de cada centro, o marca de clase, a la media aritmtica. Es decir,

N
x x n
DM
m i

=
) (



Ejemplo: Para hallar la desviacin media de la siguiente tabla referida a las edades de los 100 empleados de
una cierta empresa:


Clase n
i
16-20 2
20-24 8
24-28 8
28-32 18
32-36 20
36-40 18
40-44 15
44-48 8
48-52 3

veamos cmo se procede:

Clase n
i
x
m n
i
x
m x x n
i
x x
16-20 2 18 36 16,72 33,44
20-24 8 22 176
24-28 8
28-32 18
32-36 20
36-40 18
40-44 18
44-48 8
48-52 3
100


DM = 6,09

La desviacin media viene a indicar el grado de concentracin o de dispersin de los valores de la variable. Si
es muy alta, indica gran dispersin; si es muy baja refleja un buen agrupamiento y que los valores son
parecidos entre s.

La desviacin media se puede utilizar como medida de dispersin en todas aquellas distribuciones en las que
la medida de tendencia central ms significativas haya sido la media. Sin embargo, para las mismas
distribuciones es mucho ms significativa la desviacin tpica, que estudiaremos a continuacin, y eso hace
que el uso de la desviacin media sea cada vez ms restringido.

DESVIACIN TPICA

Es sin duda la medida de dispersin ms importante, ya que adems sirve como medida previa al clculo de
otros valores estadsticos.

La desviacin tpica se define como la raz cuadrada de la media de los cuadrados de las desviaciones con
respecto a la media de la distribucin. Es decir,

( )
N
x x
S


=
2


para datos sin agrupar, o bien:

N
x x
S


=
2


Clculo de la desviacin tpica para datos no agrupados en clases

Veamos la frmula anterior aplicada a un caso concreto.

Hallar la desviacin tpica de la serie: 5, 8, 10, 12, 16.

x
x x x x
2
5 -5,2 27,04
8 -2,2 4,84
10 -0,2 0,04
12 1,8 3,24
16 5,8 33,64

Primero hallamos x = 10,2

luego S = 71 , 3 76 , 13 =

Clculo de la desviacin tpica para datos agrupados en clases y agrupados por frecuencias

Mtodo largo: Se aplica la siguiente frmula
N
f x
S

=
2


donde x x x
m
= y f es la frecuencia absoluta de cada intervalo.

Mtodo abreviado o corto: La frmula a utilizar es:

2
2
|
|
.
|

\
|
=

N
f d
N
f d
I S

donde:
I: amplitud de la clase
D: distancia en clases desde cada una en concreto a la clase que contiene a la media supuesta A.

Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen as:

Clases f
150 155
155 160
160 165
165 170
170 175
175 180
180 185
185 190
190 195
195 200
3
6
12
18
25
17
10
7
4
1
103
Resp: S = 9,56

La presentacin de datos estadsticos constituye en sus diferentes modalidades uno de los
aspectos de mas uso en la estadstica descriptiva. A partir podemos visualizar a travs de los
diferentes medios escritos y televisivos de comunicacin masiva la presentacin de los datos
estadsticos sobre el comportamiento de las principales variables econmicas y sociales,
nacionales e internacionales.
1-Presentacin escrita: Esta forma de presentacin de informaciones se usa cuando una
serie de datos incluye pocos valores, por lo cual resulta mas apropiada la palabra escrita como
forma de escribir el comportamiento de los datos; mediante la forma escrita, se resalta la
importancia de las informaciones principales.
2-Presentacin tabular: Cuando los datos estadsticos se presentan a travs de un conjunto
de filas y de columnas que responden a un ordenamiento lgico; es de gran eso e importancia
para el uso e importancia para el usuario ya que constituye la forma ms exacta de presentar
las informaciones. Una tabla consta de varias partes, las principales son las siguientes:
Titulo: Es la parte ms importante del cuadro y sirve para describir todo l contenido de este.
Encabezados: Son los diferentes subttulos que se colocan en la parte superior de cada
columna.
Columna matriz: Es la columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones numricas que aparecen en la tabla.
Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la
tabla o cuadro y que no han sido explicados en otras partes.
3-Presentacin grafica: Proporciona al lector o usuario mayor rapidez en la comprensin de
los datos, una grafica es una expresin artstica usada para representar un conjunto de datos.
De acuerdo al tipo de variable que vamos a representar, las principales graficas son las
siguientes:
Histograma: Es un conjunto de barras o rectngulos unidos uno de otro, en razn de que lo
utilizamos para representar variables continuas.
Polgono de frecuencias: Esta grafica se usa para representar los puntos medios de clase en una
distribucin de frecuencias
Grfica de barras: Es un conjunto de rectngulos o barras separadas una de la otra, en razn
de que se usa para representar variables discretas; las barras deben ser de igual base o ancho y
separadas a igual distancia. Pueden disponerse en forma vertical y horizontal.
Grfica lineal: Son usadas principalmente para representar datos clasificados por cantidad o
tiempo; o sea, se usan para representar series de tiempo o cronolgicas.
Grfica de barra 100% y grfica circular: se usan especialmente para representar las partes en
que se divide una cantidad total.
La ojiva: Esta grafica consiste en la representacin de las frecuencias acumuladas de una
distribucin de frecuencias. Puede construirse de dos maneras diferentes; sobre la base "menor
que" o sobre la base "o ms". Puede determinar el valor de la mediana de la distribucin.
En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin De
sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema De referencia
(coordenadas), permiten presentar informacin cuantitativa.
La utilidad De los grficos es doble, ya que pueden servir no slo como sustituto a las tablas,
sino que tambin constituyen por s mismos una poderosa herramienta para el anlisis De los
datos, siendo en ocasiones el medio ms efectivo no slo para describir y resumir la
informacin, sino tambin para analizarla.
En este trabajo solo nos vamos a centrar nicamente en los grficos como vehculo de
presentacin de datos, sin abordar su otra faceta como herramienta de anlisis












































Las medidas de tendencia central son aquellas que nos proporcionan informacin a cerca de
la ubicacin del conjunto de datos y son:
Media Aritmtica: Es la suma de los valores de un conjunto de observaciones dividido por
el numero total de observaciones.
Media para serie de datos
simples

Media para datos agrupados
por frecuencia

Mediana: Md (o Me) Es un valor de la variable que divide a un conjunto de observaciones
(ordenado de menor a mayo o viceversa)
en dos sub conjuntos que contienen la misma cantidad de datos.
Datos simples n impar
Ejemplo: para una serie 1,2,3,4,5,6,7 la Md = 4
n par
Ejemplo: para una serie 2,3,5,10,11,14 la Md = 5 +10/2 = 7.5
Datos
en frecuencias
frecuencia simple Md=al valor de la variable x cuya frecuencia acumulada contiene al resultado de:
si el total de las frecuencias es impar
si el total de las frecuencias es par
n
Xi
X
n
i

=
=
1

=
=
=
n
i
n
i
fi
fi Xi
X
1
1
*
2
1 + n
2
n
frecuencia agrupada en
intervalos

Li: es el limite inferior de la clase mediana
fa: frecuencia acumulada anterior a la clase
mediana
fMd: frecuencia de la clase mediana.
a: amplitud del intervalo
Modo o Moda: Mo Es aquel o aquellos valor de la variable x que ocurren con mayor
frecuencia en el conjunto.
Datos simples
Ejemplo: para una serie 1,1,3,4,5,1,7 la Mo = 1
Ejemplo: para una serie 1,4,1,3,4,5,1,4,7 Mo1 = 1 y Mo2 = 4
Datos
en
frecuencias
frecuencia simple

frecuencia
agrupada en intervalos


Li: es el limite inferior de la clase modal
1: diferencia entre fi de la clase modal y la fi anterior a esta
2: diferencia entre fi de la clase modal y la fi posterior a esta
a: amplitud del intervalo


























a
fMd
fa
fi
li Md *
2

+ =

(

A + A
A
+ = a li Mo *
2 1
1
(

A + A
A
+ = a li Mo *
2 1
1

La curva normalLa curva normal es la grfica de la llamada
funcin de densidad de probabilidad, expresada por la
ecuacin

22
2
1()2
x
f x e




, donde

es la media poblacional y

es ladesviacin estndar de la poblacin. Su dominio es
+
, por lo que la colas de la curva seextienden hacia ms
infinito y menos infinito, sin que exista punto de
interseccin con eleje
x
. Cuando los parmetros de la ecuacin toman los valores

=0
y

=1
, la curva sellama Curva normal estandarizada y es la que se
usa con mucha frecuencia en estadstica.La integral definida
de dicha funcin
2
2
1()12
x
f x d x e d
x





lo que significa que el rea bajo la curva, dentro de esos
lmites, es 1. Siendo cierta esasituacin, de acuerdo con la
llamada regla emprica, se sabe que el 68.26% de dicha rea
seencuentra entre los valores de
s= -1
y
1
, que el 95.44% se encuentre entre
s= -2
y
2
y que el99.7% se encuentre entre los valores de
s= -3
y
3.
A medida de que los valores de
s
crecena la izquierda o la derecha (en valor absoluto), el rea
bajo la curva y su porcentaje, en losintervalos subsecuentes
a los indicados, tienden a ser cero.
P o r c e n t a j e s
0 . 1 % 2 . 3 % 1 5 .
9 % 5 0 % 8 4 . 1 % 9
7 . 7 % 9 9 . 9 % Porcentajes
Acumuladosredondeados2 % 1
6 % 5 0 % 8
4 % 9 8 %

22
2
1( )2
x
f x e

Vous aimerez peut-être aussi