Académique Documents
Professionnel Documents
Culture Documents
( )
= =
donde
4
jn
es la posicin del cuartil en el intervalo.
Deciles: Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
1
1
10
, 1, 2,..., 9
i
j i
i i
jn
F
D L A j
F F
( )
= =
Percentiles: Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
1
1
100
, 1, 2,..., 99
i
j i
i i
jn
F
C L A j
F F
( )
= =
Medidas de dispersin
Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin. Las medidas
principales de variabilidad implican las desviaciones de la media,
1 2
, , ,
n
x x x x x x . . Es decir, las desviaciones de
la media se obtienen restando x a cada una de las n observaciones de la muestra.
Rango o recorrido: es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
Rango intercuartil: mide la dispersin del 50%central de los datos.
3 1
RIC Q Q =
Varianza: La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media.
Poblacional:
, )
2
2
1
n
i
i
x x
n
=
_
Muestral:
, )
2
2
1
1
n
i
i
x x
S
n
=
_
Desviacin estndar: es la raz aritmtica de la varianza y representa el desvo promedio de las observaciones de su
media.
Me Q
1
Q
3
Min Max
Desviacin mediana:
1
.
n
i i
i
x Me f
d Me
n
=
=
_
Nota: La varianza y la media no son resistentes a la presencia de valores extremos.
Qu medida de dispersin usar?
o Cuando se usa la media para medir el centro de los datos, la medida de dispersin ms usada es la desviacin
estndar.
o Cuando la mediana se usa como medida de tendencia central de los datos, es decir cuando las distribuciones
son sesgadas o presentan outliers, la medida de dispersin ms conveniente es el rango intercuartil.
Grfico de caja y bigotes (boxplot): este grafico nos muestra una medida de tendencia central, la Me y una medida de
dispersin a travs del rango intercuartil y el rango total. La distancia de
1
Q y
3
Q a la Me puede proveer una idea
del sesgo de la distribucin.
Como se construye un boxplot:
Los extremos de la caja son
1
Q y
3
Q .
Se dibuja una lnea dentro de la caja en la Me .
A partir de los cuartiles
1
Q y
3
Q .
se extienden lneas, llamadas bigotes, hasta el min y el max.
Algunas modificaciones que se incorporan al boxplot bsico permiten visualizar posibles outliers. (observaciones que se
escapan del patrn de los datos).
o Calculamos la cantidad 1, 5 RIC , llamado salto,
o Obtenemos los valores
1
1, 5 Q RIC y
3
1, 5 Q RIC , llamadas cercas internas,
o Las observaciones que estn fuera de estas cercas internas se consideran outliers potenciales.
Nota: Si la distribucin es simtrica, el boxplot es simtrico, la reciproca no es cierta.
Medidas de tendencia central y dispersin para datos agrupados en intervalos
Media:
1
n
i i
i
m f
x
n
=
=
_
Varianza:
, )
2
2
1
n
i i
i
m x f
n
=
=
_
Moda:
, ) , )
1
1 1
i i
i
i i i i
f f
Mo L A
f f f f
=
donde
i
L es el lmite inferior del intervalo modal y A es la amplitud.
Mediana:
1
2
i
i
i
n
F
Me L A
f
( )
= donde
i
L es el lmite inferior del intervalo mediana y A es la amplitud.
Coeficiente de variacin: se define como el cociente entre el desvo estndar y la media: . CV
x
=
El coeficiente de variacin es til para comparar distribuciones con unidades diferentes y es independiente de las
escalas.