Vous êtes sur la page 1sur 12

La mediana

Definicin: Dada una distribucin de frecuencias con los valores ordenados de menor a mayor,

llamamos mediana y la representamos por


Me al valor de la variable que deja a su izquierda
el mismo nmero de frecuencias que a su derecha.

Clculo

Distribuciones de tipo unitarias. Pueden ocurrir dos casos:

a) Que el nmero de calores de la variable sea impar, la mediana es el valor central.


b) Que el nmero de valores de la variable sea par: la mediana es la media aritmtica de
los dos valores centrales. Si la variable que se est estudiando es de naturaleza discreta
(por ejemplo el nmero de personas), y no admite decimales, las medianas seran
conjutamente los dos valores centrales

Distribuciones de frecuencias no unitarias sin agrupar:

N
i) Si
N i1< < N i M e= xi
2

N x x
ii) Si N i= M e = i i +1
2 2

Distribuciones de frecuencias agrupadas en intervalos

Una vez identificado el intervalo al que pertenece la mediana habr que determinar (aproximar) el valor
que se corresponde con la mediana, para ello interpolaremos.

Fjate en la figura, en el intervalo (li-1 , li] se encuentra la mediana, que dejar la mitad de los datos a su
izquierda. Si observamos los tringulos ABC y AB'C', nos damos cuentas que son semejantes y

aplicando el teorema de Thales podemos afirmar que


El segmento B'C' se corresponde con ni = Ni - Ni-1, frecuencia absoluta del intervalo.
AB' es la amplitud del intervalo a i = li - li-1
BC es n/2 - Ni-1
AB es Me - li-1
Sustituimos en la igualdad y queda:
despejando Me queda la frmula para el clculo de la mediana:
Propiedades de la mediana
La medina hace mnima la suma de todas las desviaciones absolutas, es decir, si representamos la
M e , tenemos que
mediana por

n n
min |x ik| ni= |x iM e|ni
k i=1 i=1

Cuando la constante respecto a la cual se toman las desviaciones, k , es igual a la

mediana
Me .

En efecto, transformamos la distribucin en otra de frecuencias unitarias, tal que

x 1 x2 x m x a1 k x a x n siendo
k>Me

Por definicin de
Me tendremos igual nmero de valores iguales o inferiores que iguales o

superiores. Supongamos que hay m1 a cada loado, tendremos que:


Podemos nombrar otros valores notables pero que no van a reflejar ninguna tendencia
central: los Cuantiles. Son valores de la distribucin que la dividen en partes iguales,
es decir, en intervalos, que comprenden el mismo nmero de valores.

Entre los Cuantiles podemos citar, por ser de uso ms frecuente, los Cuartiles, los
Deciles y los Percentiles.

Los cuartiles son los tres valores de la distribucin que la dividen en cuatro partes
iguales. Es decir, en cuatro intervalos dentro de cada cual estn incluidos el 25% de los
valores de la distribucin.

Los deciles son los nueve valores de la distribucin que la dividen en diez partes
iguales. Cda parte contendr el 10% de la distribucin.

Los percentiles son los noventa y nueve valores que dividen a la distribucin en cien
partes iguales.
Calculo
a) Para distribuciones no agrupadas en intervalos
a. Cuantiles
N
C1
i. es el valor que ocupa el lugar 4

2N
C2
ii. es el valor que ocupa el lugar 4
3N
C3
iii. es el valor que ocupa el lugar 4
b. Deciles
N
D1
i. es el valor que ocupa el lugar 10
2N
D2
ii. es el valor que ocupa el lugar 10

iii.
N
D9 9
iv. es el valor que ocupa el lugar 10

c. Percentiles
N
P1
i. es el valor que ocupa el lugar 100
2N
P2
ii. es el valor que ocupa el lugar 100

iii.
99 N
P99
iv. es el valor que ocupa el lugar 100
Para determinarlos se calculan previamente las frecuencias acumuladas, y se busca el
r
valor que ocupe el lugar k N de la distribucin, donde k eses el tipo de cuantil y

r el nmero de cuantil que se desea calcular


b) para distribuciones agrupadas en intervalos.

El problema que se presenta es el mismo que el que tenamos al calcular la mediana.


Para elegir el representante para un determinado cuantil seguiremos el criterio:

r
N N i1
k
Q r =Li1 + ci
k
ni

En donde donde
1) Para k =4 y r=1,2,3, obtenemos los cuartiles.
2) Para k =10 y r=1, 9, obtenemos los deciles
3) Para k =100 y r=1,2,. .99 obtenemos percentileser
La frmula anterior se obtiene de forma anloga a la desarrollada para la mediana.

Como ventajas e inconvenientes de estas medidas de posicin. Vuelven a repetirse las


expresadas para la moda y la mediana.

Moda

Definicin

Llamamos moda al valor de la variable que ms veces se repite, y en consecuencia, en


una distribucin de frecuencias, es el valor de la variable que viene afectada por la
mxima frecuencia de la distribucin.
Se puede diferenciar entre

Moda absoluta. Es el valor de la variable con mayor frecuencia absoluta. Si hay ms de


una moda entonces diremos que es multimodal. Si hay dos valores que se repiten por
igual, ser bimodal, con tres, trimodal, y en general, multimodal.
ni
Moda relativa. Se define la moda relativa como aquel valor de la variable cuya no
es superada por la de sus valores contiguos.

Ventajas e inconvenientes de la moda

Ventajas:

- Es la nica medida de posicin central que puede obtenerse en las variables de


tipo cualitativo que slo admiten la escala nominal ya que siempre podemos
determinar la modalidad que ms se repite en el estudio de un determinado
atributo.
- Es de sencillo clculo.
- Es de fcil interpretacin, ya que nos da directamente el valor de la variable que
ms se repite.
Inconvenientes

- No es expresable mediante una frmula matemtica sencilla.


- En su determinacin no intervienen todos los valores de la distribucin.
- No detecta cambios en la distribucin que no afecten al valor o intervalo modal.

Clculo. Para calcular la Moda, distinguiremos entre distribuciones no agrupadas en


intervalos y distribuciones agrupadas en intervalos.
a) Distribuciones no agrupadas en Intervalos. En este caso, la determinacin
Mo
de la Moda es inmediata. Se observa la columna de las frecuencias
absolutas y el valor de la distribucin al que corresponde la mayor frecuencia
ser la Moda. A veces aparecen distribuciones con ms de una moda (bimodales,
trimodales, etc.) e incluso una distribucin de frecuencias que presente una moda
absoluta y una relativa.
b) Distribuciones agrupadas en Intervalos.
a. Intervalos de la misma amplitud.
En este caso, una vez determinada la mayor frecuencia, observamos que a
sta no le corresponde un valor sino un intervalo, luego realmente no
tendremos un valor modal sino un intervalo modal.
De entre todos los valores comprendidos en el intervalo modal vamos a
seleccionar uno que desempee el papel de valor modal. Para esto,
podemos utilizar diferentes criterios, entre los cuales citamos los cuatro
siguientes:
M o=Li1
1) Tomar como valor modal el extremo inferior del intervalo.
M o=Li
2) Considerar como moda el extremo superior.
Li1+ Li
M o=x i M o=
3) Hacer la moda igual a la marca de clase. 2
4) O bien, suponiendo que:
Todos los valores del intervalo estn distribuidos uniformemente
dentro de l.
La moda estar ms cerca de aquel intervalo contiguo cuya
frecuencia sea mayor.
Mo
Lo anterior se puede resumir diciendo que las distancias de la moda a
los intervalos contiguos son inversamente proporcionales a las frecuencias de dichos
intervalos.
Pues bien, en base a 1 y 2, la moda ser
M o=Li1 +m

Pero
m n
= i +1
ci m n i1

Teniendo en cuenta las propiedas de las propirciones queda


m ni+1
=
ci m+ m ni1 +ni +1

De donde
n i+1
m= c
ni1 +ni+1 i

Por tanto
ni+1
Mo=Li1+ c
ni1 +ni +1 1

Intervalos de distinta amplitud


Si recurrimos a la definicin que hemos dado como moda (valor que ms se repite), al ser ahora los intervalos
diferentes la frecuencia absoluta no nos dir nada sobre la abundancia de valores en cada intervalo, ya que
podra suceder que el intervalo al que correspondiese la mayor frecuencia fuera muy amplio y entonces, fuera
ms denso otro intervalo con menor frecuencia pero menor amplitud. Por tanto, ahora, las frecuencias no son
significativas para resolver el problema.
Recordemos que las densidades de frecuencia se obtenan dividiendo las frecuencias absolutas por los
recorridos o amplitudes de sus correspondientes intervalos.es decir:
n
d i= i
ci

Realmente, las densidades de frecuencias nos dan el nmero de valores que hay en cada unidad de intervalo,
para cada intervalo. La mayor densidad de frecuencia nos determinar el intervalo modal.
Una vez determinado el intervalo modal, y siempre en la lnea de operar con valores y no con intervalos,
podemos aplicar cualquiera de los cuatro criterios expuestos en el caso anterior. Si seleccionamos, por parecer
el ms razonable, el cuarto, tendremos que:
d i +1
M o=Li1 + c
di 1 +d i +1 i

Observese que cuando los intervalos son desiguales operamos con densidades de
di
frecuencias; es por esto por lo que en la frmula anterior aparecen los y no
ni
los . Por otro lado, la deduccin en esta de dicha frmula es similar al caos
anterior, con la diferencia, de que ahora se consideran densidades de frecuencias

MEDIDAS DE DISPERSION

RECORRIDO

Es la diferencie entre el maour valor y el menor valor de una distribucin, es decir:


R=x nx 1=max { x n }

De modo que un valor alto indica que la diferencia entre el mayor y el menor valor de
la variable es alta lo que nos llevara a pensar que tambin lo es la dispersin; mientras
que un valor pequeo indica que la distancia ente el mayor y el menor valor es baja,
llevndonos a pensar que la dispersin tambien lo es.

Ventajas

Sencillez de clculo y de fcil interpretacion

Es til en situaciones en las que se reiuera media la dispersin con mucha fercuencia y
sobre pocos valores.

Inconvenientes

Al no *** todos los valores de la variable en su clculo puede conducir a conclusiones


equivocadas.

Excesiva influencia de los valores extremos que en el clculo puede camuflar


situaciones muy diferente.

Al no hacer referencia a ningn medida de tendencia central, difcilmente puede


considerarse como una medida vlida para indicar la representatividad de ste.

a) Total dependencia de los valores extremos de la serie de dsatos. Un outlier har


que su valor sea poco representativo
b) No puede ser calculado si el valor mximo o el mnimo no estn determnidados.
c) No tiene en cuenta los valores intermedios de la variable, as que no puede ser
muy preciso.
d) No nos dice nada sobre la forma de la distribucin ente las puntuaciones
extremas. Podemos tener distribuciones con el mismo recorrido y sus formas ser
radicalmente diferentes.

Recorrido intercutlico,

Llamamos recorrido intercuartilico a la diferencia existente entre el tercer cuartil y el


primero y en l estn comprendidos el 50% central de los valores:

RI =C3 C1

RI
Si es pequeo, siempre en trminos relativos de acuerdo con las unidades en
que venga dada la distribucin, podemos intuir una pequea dispersin.

Presenta como ventaja respecto al recorrido, la eliminacin del posible efecto que
pudieran tener algunos valores extremos.
Ya hemos definido dos promeras medidas de dispersin, pero el objetivo que
perseguimos es deteminar la presentatividad de las medidas de posicin, y estas
dos medidas contempladas, no hacen referencia especfica a ningn promedio.

Necesitamos, pues medidas de dispersin que involucren a los promedios. Ente


stas, estudiarmos lda desviacin media, la varianza y la desviacin tpica.

Supongamos que tenemos un promerio P , del que vamos a estudiar su


representatividad. Consideremos que tenemos dos distribuciones que originan este
mismo promedio P , (para mayor facilidad supongamos que estas distribuciones
son de frecuencias unitarias) y que son tales como las que representan en el grfico

Si nos preguntamos cal de los dos promedios es ms representativo, diremos que


sin duda el primero ppriqe a caracterizar la primera distribucin pro P ,

condiderando cada caso particular, el error que cometemos utilizando P es


menor, en la mayora de los valores, +++++

Desviacin media respecto a la media aritmtica

Ahora el promedio genrico P es la media aritmtica x . Vimos que si


considerbamos

Propiedades de la mediana
La medina hace mnima la suma de todas las desviaciones absolutas, es decir, si representamos la
M e , tenemos que
mediana por
n n
min |x ik| ni= |x iM e|ni
k i=1 i=1

Cuando la constante respecto a la cual se toman las desviaciones, k , es igual a la

mediana
Me .

En efecto, transformamos la distribucin en otra de frecuencias unitarias, tal que

x 1 x2 x m x a1 k x a x n siendo
k>Me

Por definicin de
Me tendremos igual nmero de valores iguales o inferiores que iguales o

superiores. Supongamos que hay m1 a cada loado, tendremos que:

a1 n

( k x i )+ ( k x i) + ( x ik )
i=m i =a
m1

|x ik|=
i=1
n


i=1

a1 n

( M e x i )+ ( x iM e ) + ( xi M e )
i=m i=a
m1

|x iM e|=
i=1
n


i=1

e2 x i
k + M


a1

( kM e ) +
i=m
n m1

|x ik||x iM e|=
i=1 i=1
n


i=1

a1

Sumando y restando (k M e) en (3):


i=m
a1 a 1
( k M e ) + ( k M e ) + ( kM e 2 x i )
i=m i=m
m 1 m1

|x ik| |xi M e|=


i =1 i=1
n


i=1