Vous êtes sur la page 1sur 22

Estadística I 38

UNIDAD III: MEDIDAS DE TENDENCIA CENTRAL


Y DE POSICIÓN.

1º. CONCEPTO Y CARACTERÍSTICAS. MEDIDAS DE TENDENCIA CENTRAL Y


DE POSICIÓN.

Aunque la recolección y posterior presentación de los datos son dos componentes esenciales
de la Estadística Descriptiva no cuentan toda la historia. Un buen análisis de los datos implica la
presentación, en gráficos o tablas de distribución de frecuencias, de los datos numéricos recolecta-
dos, la observación (estudio) de lo que los datos tratan de transmitir y también la caracterización o
resumen de los aspectos claves y la descripción o análisis de los hallazgos.

En ésta unidad vamos a examinar éstos dos últimos aspectos: el resumen, descripción y fi-
nalmente la interpretación de los datos.

Las medidas descriptivas son medidas resumen, útiles para analizar e interpretar datos agru-
pados o no agrupados.

Las propiedades o características que describen un conjunto de datos pertenecientes a alguna


variable numérica o un fenómeno de interés son:
 Posición
 Dispersión
 Forma
A B
C

La posición se refiere al punto medio de la distribución. La posición de la curva B está a la


derecha de la posición de la curva A. La posición de la curva A es la misma de la curva C.

La dispersión se refiere a la extensión de los datos de una distribución, el grado en que las
observaciones se distribuyen. La curva C es más dispersa que la A.

En cuanto a la forma, si trazamos una línea vertical que pase por el punto más alto de la
curva y divide el área en dos partes iguales, decimos que la distribución es simétrica. Cada parte es
una imagen espejo de la otra.

Es necesario comprender éstas características o propiedades de los datos numéricos y sus


medidas descriptivas de resumen como ayuda para el análisis e interpretación de los datos.

-------------------
- Año 2013 -
Estadística I 39

Si las medidas de resumen descriptivas se calculan con una muestra de datos se llaman es-
tadísticos, si se calculan a partir de toda una población de datos se denominan parámetros.

La mayor parte de los conjuntos de datos muestran una tendencia a agruparse o reunirse en
torno a cierto punto, denominado por ello medida de tendencia central, porque tiende a ubicarse
en el centro del conjunto, aunque a veces no se presenta esa ubicación central. Se denominan tam-
bién promedios porque en su cálculo intervienen todos los valores disponibles de la variable con la
que se está trabajando. Ejemplos: la media o el promedio aritmético y la media geométrica.

Las medidas de posición son valores que se calculan a partir de un conjunto de datos y tie-
nen la particularidad de ser representativos de ese conjunto. Su nombre proviene del hecho que,
siendo representativos del conjunto, indican, sobre un eje, la posición de todo el conjunto. Son
medidas en cuyo cálculo no intervienen todos los valores disponibles de la variable. Ejemplos: la
mediana; el modo y los cuantiles.

Medidas

Tendencia
Posición
Central

Media Media
Mediana Modo Cuantiles
Aritmética Geométrica

Cuartiles Deciles Percentiles

2º. MEDIA ARITMÉTICA. CÁLCULO A PARTIR DE DATOS AGRUPADOS Y NO


AGRUPADOS. PROPIEDADES.

La media aritmética es la medida de tendencia central por excelencia debido a la sencillez de


su cálculo, al fácil manejo algebraico y a las amplias e interesantes propiedades que posee.

En el caso de los datos no agrupados, la media es la suma de los valores de la muestra, di-
vididos entre el número total de valores de la muestra.
n

x
i 1
i
x
n
Ejemplos: se toma una muestra aleatoria de las edades de 6 compradores de autos de tres
concesionarias diferentes de la ciudad, obteniéndose la siguiente información:

-------------------
- Año 2013 -
Estadística I 40

1 2 3
Elemento Edad Elemento Edad Elemento Edad
x1 46 x1 49 x1 42
x2 26 x2 34 x2 42
x3 52 x3 52 x3 42
x4 46 x4 32 x4 46
x5 44 x5 45 x5 44
x6 38 x6 40 x6 36

x
i 1
i
46  26  52  46  44  38
x1    42 años
n 6

x
i 1
i
49  34  52  32  45  40
x2    42 años
n 6

x
i 1
i
42  42  42  46  44  36
x1    42 años
n 6

Vemos que los datos de la segunda muestra son menos variables que los de la primera y lo
mismo sucede entre los datos de la segunda y tercer muestra. Sin embargo, la edad promedio de los
compradores de autos de las tres concesionarias es de 42 años.

Edades de los compradores de la Concesionaria 1


10
4
4
-4 2
-16

26 30 34 38 42 46 50 54 58

En una muestra de n observaciones la media actúa como punto de equilibrio, de tal forma
que las observaciones menores compensan aquellas que son mayores. Como su cálculo se basa en
todas las observaciones, se ve afectada en gran medida por cualquier valor extremo. En estos casos
-------------------
- Año 2013 -
Estadística I 41

da una idea distorsionada de lo que los datos están tratando de transmitir, por lo que no sería la me-
jor medida para describir esos datos.

Cuando necesitamos conocer las medidas descriptivas a partir de datos agrupados porque:
 los datos provienen de fuentes secundarias y están agrupados
 no están disponibles los datos originales (datos brutos)
 son muchos los datos con que contamos y construimos una distribución de frecuencias
todos los valores caen dentro de uno de los intervalos de clase y se consideran coincidentes con los
puntos medios (xi)

La media aritmética ( x ) se define técnicamente, presentando su fórmula de cálculo:


n

x f
i 1
i i
x n
,
f
i 1
i

denominada fórmula general o ponderada, debido a que las fi, que simbolizan las frecuencias de
los valores de la variable, ponderan a cada uno de ellos.

Si retomamos la distribución de frecuencias de los precios de los autos (miles de $)

Precios
fi xi xifi
(miles de $)
60 - 71,999 8 66 528
72 - 83,999 23 78 1.794
84 - 95,999 17 90 1.530
96 - 107,999 18 102 1.836
108 - 119,999 8 114 912
120 - 131,999 4 126 504
132 - 143,999 2 138 276
80 7.380

x f
i 1
i i
7.380
x n
  92,25 mil de $
80
f
i 1
i

Las medidas resumen descriptivas calculadas a partir de datos no agrupados, producen resul-
tados reales, si se calculan a partir de datos agrupados producen resultados aproximados.

-------------------
- Año 2013 -
Estadística I 42

Si calculamos la media del ejemplo anterior con los datos brutos, el resultado sería:

x
i 1
i
7.429,8
x   92,87 mil de $
n 80

Vemos que la media aritmética obtenida a partir de datos agrupados se aproxima bastante a
la real. El precio promedio de los autos vendidos, trabajando con datos agrupados es de 92,25 mil $
y si trabajamos con los datos brutos el precio promedio de los autos vendidos es de 92,87 mil $

El cálculo de la media aritmética en distribuciones de frecuencia se realiza partiendo de las


siguientes condiciones y supuestos:
 Debe respetarse la norma que indica que en el trabajo estadístico nunca se retrocede, por lo
que corresponde realizar los pasos apropiados para evitar retornar al conjunto de datos orde-
nados.
 Los intervalos de clase tienen un Límite inferior y un Limite superior, pero éstos no pueden
ser tomados en cuenta para realizar el cálculo de la media aritmética
 Los puntos medios de los intervalos de clase se convierten en los valores de la variable que
permitirán realizar el trabajo de cálculo, aplicando la fórmula ponderada de la media aritmé-
tica, usando las fi para ponderar.
La media aritmética tiene la misma unidad de medida que la variable bajo estudio.

La media aritmética muestral y la media aritmética poblacional, tienen fórmulas de


cálculo, que si bien no son diferentes desde el punto de vista conceptual, tienen simbologías que las
distinguen entre sí.

La media aritmética muestral se simboliza con x , mientras que la media poblacional se sim-
boliza con  x , siendo el subíndice una indicación acerca de la variable con la que se está trabajan-
do.
Si se desea presentar la fórmula de cálculo simple de la media aritmética poblacional, se

x   i
x
tendría
N

lo cual permite observar que no difiere en nada de la fórmula simple de la media aritmética mues-
tral, salvo que se está tomando todos los elementos de la población (N). En los trabajos e investiga-
ciones estadísticas se parte del supuesto de que es muy poco probable que pueda calcularse una me-
dia aritmética poblacional.

Se utilizan las letras del alfabeto latino para simbolizar la información sobre las muestras y
las del alfabeto griego para simbolizar la información sobre la población.
PROPIEDADES DE LA MEDIA ARITMÉTICA

-------------------
- Año 2013 -
Estadística I 43

La media aritmética es una medida de tendencia central muy utilizada. Cuenta con algunas
propiedades importantes:

1º. La media aritmética de un conjunto definido de datos, es un valor constante. Esta propie-
dad no requiere demostraciones. Sólo resulta apropiado explicar sencillamente que, dado un
conjunto de datos, si este conjunto no se modifica, su media aritmética permanece constante.

2º. La sumatoria de los desvíos entre los valores de la variable y su media aritmética, es igual
a cero. Los desvíos se obtienen haciendo la diferencia entre los valores de la variable y algún
valor arbitrario. Si ese valor es la media aritmética convendremos en denominarlo desvío a se-
cas. Si ese valor arbitrario no fuera la media aritmética, debemos aclarar respecto de que valor
se calculan los desvíos.
Ejemplo:
Concesionaria 1
Edad
x xi  x
xi
46 46 4
26 26 -16
52 52 10
46 46 4
44 44 2
38 38 -4
0

Esta propiedad se demuestra del siguiente modo:

 x 
 x   xi   x   xi  n x   xi  n
x  x x
i
0
i i i
n
3º. La sumatoria de los desvíos al cuadrado, entre los valores de la variable y un valor cons-
tante y arbitrario A, es un mínimo si A es igual a x . Esta propiedad es complementaria de la
anterior, y prácticamente cuando se cumple aquélla se cumple también ésta.
Tomemos en el caso de la Concesionaria 1, un valor de A = 40, para verificar esta pro-
piedad
Concesionaria 1 (A = 40)
Edad
xi x xi  x x i x 
2
xi  A x i  A 2
46 42 4 16 6 36
26 42 -16 256 -14 196
52 42 10 100 12 144
46 42 4 16 6 36
44 42 2 4 4 16
38 42 -4 16 -2 4
0 408 432
Las condiciones para que exista un mínimo son:

-------------------
- Año 2013 -
Estadística I 44

 Primera derivada igual a cero


 Segunda derivada mayor que cero
Esta propiedad se demuestra construyendo una función     xi  A , que se mi-
2

nimiza aplicando las reglas correspondientes de derivación. Luego:


    xi  A
2

  2 xi  A  0
A A

Puede observarse que la derivación se ha realizado respecto de A, que es arbitrario y


puede tomar cualquier valor entre   y   . Por consiguiente, A se convierte en una va-
riable, que al valer x , hace mínima la función  . Asimismo se iguala a cero la expresión por
condición de mínimo. Luego, como –2 no es igual a cero, debe serlo la sumatoria. De allí
que
 xi  A  0   xi   A  0 .
Como A es una constante para la sumatoria

x  nA  0  A 
x i
x
i
n

En el proceso aplicado debería ahora verificarse si el resultado hallado corresponde a


un mínimo o a un máximo. Sin embargo, en este caso no resulta necesario efectuar tal veri-
ficación: se sabe que el resultado corresponde a una cota mínima porque siendo x un va-
lor ubicado en el centro del conjunto, cualquier valor de A diferente (mayor o menor que x )
conduce a resultados mayores para  , por lo que se ha demostrado esta tercera propiedad.

La suma de los cuadrados de las diferencias entre cada observación y su media debe
ser menor que la suma de las diferencias al cuadrado de cada observación y cualquier otro
valor seleccionado.

4º. Media aritmética de variables transformadas algebraicamente:


a. Si a todos los valores de una variable les sumamos o restamos un valor constante y ar-
bitrario A, obtenemos una nueva variable, cuya media aritmética será igual a la de la
variable original sumada o restada el valor de A.
En el caso de la Concesionaria 1, la edad media de los compradores es de 42 años,
Para verificar esta propiedad tomemos un valor de A = 10, para construir la nueva variable,
que si se verifica esta propiedad la media de la nueva variables debería ser de 52 años (
d  x  A)

Concesionaria 1 - (A = 10)
-------------------
- Año 2013 -
Estadística I 45

Edad
di
xi
46 56
26 36
52 62
46 56
44 54
38 48
312

d
d i

312
 52 años
n 6

Para demostrar esta propiedad, supongamos tener una variable xi que tiene una media
x , y un valor arbitrario A, con los que construimos una variable di. Entonces d i  xi  A . La
media de d se obtiene haciendo
1 1 1 1 1 nA
d   d i    xi  A   xi   A   x   x  A
n n n n n n

b. Si a todos los valores de una variable los multiplicamos (o dividimos) por un valor
constante y arbitrario c, obtenemos una nueva variable cuya media aritmética será
igual a la de la variable original multiplicada (o dividida) por c.
En el caso de la Concesionaria 1, la edad media de los compradores es de 42 años,
Para verificar esta propiedad tomemos un valor de c = 1,5, para construir la nueva variable,
que si se verifica esta propiedad debe tener una media de 63 años ( d  xc )

Concesionaria 1 - (c = 1,5)
Edad
c
xi
46 69
26 39
52 78
46 69
44 66
38 57
378

d
d i

378
 63 años
n 6
Para simplificar esta demostración, supondremos que sólo multiplicamos, aunque es
fácil verificar que convirtiendo a c en un factor divisor se cae sencillamente en el otro caso.
Tenemos que, di  cxi , por consiguiente

-------------------
- Año 2013 -
Estadística I 46

1 1 1
d  d i   cxi   c  xi  c x
n n n

c. Tomaremos ahora un caso que resulta una combinación del caso a y del caso b. Se trata de
x A
una variable. Sabiendo que ui  i ,
c
En el caso de la Concesionaria 1, la edad media de los compradores es de 42 años,
Para verificar esta propiedad tomemos un valor de A = 2 y c = 0,8, para construir la nueva
 xA
variable, que si se verifica esta propiedad debe tener una media de 50 años  u  

 c 

Concesionaria 1 - (A = 2 y c = 0,8)
Edad
ui
xi
46 55,0
26 30,0
52 62,5
46 55,0
44 52,5
38 45,0
300,0

u
u i

300
 50 años
n 6
Demostración;
1 1  x  A  1 1 11 11
u  ui    i
c 
   xi  A   xi  A   xi  nA 
n n   cn cn cn
1   xi nA  1
 
c n
  xA 
n  c
  
x A
c

con lo cual se verifica que la media de una variable transformada algebraicamente mantiene
la transformación de la variable original.

5º. La media aritmética de la suma (o de la diferencia) de dos variables, es la suma (o la dife-


rencia) de sus correspondientes medias aritméticas. Supongamos dos variables xi e yi, que
tienen sus medias aritméticas respectivamente iguales a x e y . Construimos una variable di que
resulta ser la suma (o la diferencia) de las otras dos variables. Tenemos entonces que di  xi  yi
Al calcular la media de d, tenemos
1 1 1 1 1
d   
d i    xi  yi    xi   yi   xi   yi  x  y
n n n n n
6º. Media aritmética de medias. Si f1 números tienen una media m1, f2 números tienen una media
m2,…, fk números tiene una media mk, entonces la media de todos los números es:
-------------------
- Año 2013 -
Estadística I 47

f1 m1  f 2 m2  ...  f k m k
x
f1  f 2  ...  f k

Es decir, una media aritmética ponderada de todas las medias

La media aritmética ponderara, es una media, en la que se considera a cada uno de los va-
lores de la variable de acuerdo a la importancia relativa que tienen en el grupo, utilizando como
factor de ponderación wi
n

x w
i 1
i i
x n

w
i 1
i

Ejemplo: Una empresa vende tres productos diferentes, con distintos márgenes de de utili-
dad y diferentes cantidades vendidas

Producto Margen de utilidad Ventas xiwi


A 4,2 % 30.000 126.000
B 5,5 % 20.000 110.000
C 7,4 % 5.000 37.000
D 10,1 % 3.000 30.300
Total 27,2 % 58.000 303.300

Si calculamos la media aritmética llegaríamos a la conclusión de que el margen de utilidad


promedio de la empresa es del 6,8%. Al observar las cantidades vendidas de cada producto se ob-
serva que las mayores ventas corresponden a los productos de menor margen de utilidad, por lo que
la media aritmética simple no sería una medida adecuada.
n

x
i 1
i
4,2  5,5  7,4  10,1 27,2
x    6,8%
n 4 4

En este caso se debe calcular la media ponderada, utilizando como factor de ponderación las
cantidades vendidas, obteniendo un margen de utilidad promedio del 5,2 %.

x w
i 1
i i
30.000 * 4, 2  20.000 * 5,5  5.000 * 7,4  3.000 *10,1 303.300
x n
   5,2%
30.000  20.000  5.000  3.000 58.000
w
i 1
i

La media aritmética tiene una importante cantidad de ventajas, pero tiene la siguiente des-
ventaja: está afectada por los valores extremos de la serie o conjunto de datos. En el siguiente
ejemplo se podrá verificar este hecho particular:
 En la Concesionaria 1 la edad de los compradores es: 46, 26, 52, 46, 44 y 38, con
una edad promedio de 42 años.
-------------------
- Año 2013 -
Estadística I 48

 Si tomamos una muestra de seis compradores en la Concesionaria 4, con los si-


guientes resultados: 46, 26, 76, 46, 44 y 38. Al tener un comprador de 76 años, en lugar del
de 52, la edad promedio se eleva a 46 años
.
3º. MEDIA GEOMÉTRICA.

La media geométrica de una serie n de números x1, x2, x3, ..., xn es la raíz e-nésima del pro-
ducto de los números

La Media geométrica ( x g ) se calcula aplicando las siguientes fórmulas


n
 fi
n n
xg  f
 xi para datos no agrupados, y xg   xi i para datos agrupados.
i 1 i 1

Esta medida de posición es la que se utiliza para calcular promedios en muchas variables
económicas: PBI, inversión, exportaciones, consumo, precios, etc.

Por ejemplo: si las tasas de crecimiento del PBI en los últimos 4 años fueron: 4%, 7%, -2%
y 3%; para calcular la tasa media de crecimiento corresponde calcular la media geométrica, no la
aritmética, por que el crecimiento es acumulativo, se crece por sobre el crecimiento anterior. Para
ello, en primer lugar dividimos las tasas porcentuales por cien, de manera de expresar los datos en
tanto por uno, luego les sumamos uno y multiplicamos dichos resultados entre sí.

Xg = [(1 + 0,04) x (1 + 0,07) x (1 – 0,02) x (1 + 0,03)]1/4 – 1 = 0,029485.

Dicho resultado está expresado en tanto por uno. Si al mismo lo multiplicamos por cien,
queda expresado en porcentaje. Por ende, la tasa media anual de crecimiento del producto fue del
2,95%.

4º. MEDIANA.

La Mediana (Me) es el valor de la variable que divide al conjunto de datos o a la distribu-


ción en dos partes iguales, dejando por debajo y por arriba de ella igual número de elementos. Apa-
rece en el medio de una sucesión ordenada de valores. La mitad de las observaciones del conjunto
de datos son menores que ella y la otra mitad de las observaciones son mayores.

Dado que la media aritmética se ve afectada por los valores extremos, en algunos casos no
es una buena medida de tendencia central. Siempre que se presentes valores extremos es más apro-
piado utilizar la mediana.

Para datos no agrupados, la mediana corresponde a la observación ubicada en la posición


n 1 n 1
 
2 2 2

-------------------
- Año 2013 -
Estadística I 49

Si el número de observaciones de la muestra es impar, la mediana es el valor numérico de la


n 1
observación ubicada en la posición
2
 Si tomamos una muestra de siete compradores en la Concesionaria 5, con los siguientes
resultados: 26, 38, 44, 46, 48, 52 y 58. La mediana es el valor ubicado en la posición
n 1 7 1
  4 . Por lo que Me = 46 años.
2 2
Si el número de observaciones de la muestra es par, la mediana es la media aritmética de los
dos valores centrales de los datos ordenados.
 En la Concesionaria 1 la edad de los compradores es: 26, 38, 44, 46, 46 y 52. La media-
n 1 6 1 44  46
na es el valor ubicado en la posición   3,5 . Por lo que Me =  45
2 2 2
años.
Una importante propiedad de la Mediana es que no está afectada por los valores extremos,
como la media aritmética.
 En la Concesionaria 4, la edad de los compradores es: 26, 38, 44, 46, 46, y 76. La me-
n 1 6 1
diana es el valor ubicado en la posición   3,5 . Por lo que Me =
2 2
44  46
 45 años.
2
La fórmula que permite obtener la Mediana en una distribución de frecuencias se encuen-
tra a partir del gráfico de Frecuencias Acumuladas Crecientes, o "menor que" (Fi(-))

En el gráfico se presentan los elementos que permitirán deducir la fórmula de la Mediana,


para lo cual se sigue el siguiente procedimiento:

Geométricamente, la mediana es el valor de X (abscisa) que corresponde a la recta vertical


que divide a un histograma en dos partes de igual área.

 En el eje de las ordenadas se representan las Frecuencias Acumuladas "menores que"


(Fi(-)), y los rectángulos que se observan en el gráfico corresponden a esas Frecuencias.
 Sobre ese eje se ubican tanto el valor de n como el de n/2.
 También sobre el eje de las ordenadas se indica la Frecuencia acumulada anterior al va-
lor n/2 (indicada con Fa).

-------------------
- Año 2013 -
Estadística I 50

La Mediana, que se encontrará sobre el eje de las abscisas, estará ubicada en aquel inter-
valo de clase (gráficamente, en la base de uno de los rectángulos) cuya "Frecuencia acumulada
menor que" es igual o supera por primera vez al valor n/2.

Para determinar gráficamente cuál es ese intervalo, se traza una recta paralela al eje de las
abscisas a la altura del valor n/2. En el intervalo correspondiente al rectángulo que toque por prime-
ra vez esa recta se encontrará la Mediana. En el ejemplo, es el tercer intervalo de clase, y la Media-
na se encontrará entre los Verdaderos límites inferior (VLI) y superior (VLS) de ese intervalo
en cuestión.

Se conviene en que la exacta ubicación de la Mediana en el intervalo delimitado por sus VL,
es decir ya sea más hacia la derecha o más hacia la izquierda, dependerá de la siguiente relación:
cuánta más distancia exista entre Fa y n/2, más distancia deberá existir entre VLI y Me. A
partir de este principio, la diferencia (n/2 - Fa) dividido por todo lo que puede valer esa diferencia,
es decir la frecuencia de dicho intervalo de clase fm , debe ser equivalente a la diferencia (Me - VL)
dividido todo lo que puede valer esa diferencia, es decir la amplitud de intervalo de clase c. Esto
permite construir la siguiente fórmula:
n F
2 a  Me  VLI
f c
m
De aquí se despeja Me, obteniéndose la siguiente expresión para el cálculo en distribuciones
de frecuencia:

-------------------
- Año 2013 -
Estadística I 51

n F
Me  VLI  2 ac
f
m
n F
Me  VLI  c 2 a
f
m

Se puede observar que:


n F
 Si n  Fa  f m  2 a
 1  Me  VLI  c
2 fm
n F
 Si n  Fa  0  2 a
 0  Me  VLI
2 fm

En el ejemplo del precio de los autos vendidos por una concesionaria, el cálculo de la Me-
diana se realiza de la siguiente forma:

Frecuencia
Precios Nº de Verdadero
Acumulada
(miles de $) autos Límite
Menor que

fi VL Fi(-)
60 - 71,999 8 60 8
72 - 83,999 23 72 31
84 - 95,999 17 84 48
96 - 107,999 18 96 66
108 - 119,999 8 108 74
120 - 131,999 4 120 78
132 - 143,999 2 132 80
80

1. Se obtiene el valor n/2. En este caso es igual a 40 años.

2. Se determina cuál es el intervalo cuya frecuencia acumulada "menor que", es igual o su-
pera por primera vez a n/2. Se trata del tercer intervalo, en el que Fi es igual a 48 años.

3. A partir de esa determinación, se otorga a los elementos de la fórmula los valores que le
corresponden:
VL = 84 Fa= 31 fm = 17 c= 12

80  31
Me  84  12 2  84  6,35  90,35 mil $
17
-------------------
- Año 2013 -
Estadística I 52

Si el precio mediano es de $ 90,35 mil, nos está indicando que la mitad de los autos vendi-
dos tiene un precio superior a este importe.
La mediana tiene ventajas respecto a la media:
 Los valores extremos no la afectan
 Es fácil de entender
 Se puede calcular para datos agrupados, incluso en distribuciones de frecuencia con in-
tervalos abiertos, a menos que la mediana caiga en ese intervalo
 Se puede utilizar con datos cualitativos con escala ordinal

Las desventajas respecto a la media son:


 Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que
aquellos que utilizan la media
 Hay que ordenar los datos antes de calcularla

5. MODO

El Modo (Mo) es el valor de la variable al cual le corresponde la máxima frecuencia


absoluta. La palabra Modo es, en realidad, una transformación académica de la conocida palabra
Moda, utilizada normalmente para indicar algo que se suele utilizar con gran frecuencia.

Es el valor más común. Se obtiene fácilmente de una clasificación ordenada. Es la única


medida de posición que puede utilizarse con datos cualitativos.

El Modo puede no existir, incluso si existe puede no ser único. Si hay un solo modo la dis-
tribución es unimodal. Cuando dos valores no adyacentes tienen iguales frecuencias máximas aso-
ciadas con ellos la distribución se llama bimodal.

 En la Concesionaria 1 la edad de los compradores es: 26, 38, 44, 46, 46 y 52. La edad
Modal es de 46 años.
 En la Concesionaria 2 la edad de los compradores es: 32, 34, 40, 45, 49 y 52. En este ca-
so no existe Modo
 En la Concesionaria 3 la edad de los compradores es: 26, 26, 44, 46, 46 y 52. En este ca-
so existen dos Modos: 26 años y 46 años.

Si bien siempre hay una sola Media aritmética y una sola Mediana, puede haber o no haber
uno o más de un Modo.

Se usa sólo para propósitos descriptivos porque es más variable de muestra a muestra que las
otras medidas de posición.

-------------------
- Año 2013 -
Estadística I 53

Para poder deducir la fórmula de cálculo del Modo para datos agrupados, se recurre a pro-
cedimientos gráficos, teniendo presente que el Modo se encontrará en aquel intervalo de clase que
posea la máxima frecuencia absoluta. En este caso es el valor o los valores que corresponde al
máximo o máximos de la curva. Está en el o los intervalos de clase que tienen la mayor frecuencia,
por lo tanto, primero hay que identificar dicho o dichos intervalos y después obtener el modo por
interpolación.

El gráfico siguiente se construye a partir de los siguientes principios:


 Se presenta solamente el sector del Histograma que corresponde a los siguientes tres in-
tervalos de clase: el que posee la frecuencia absoluta máxima (con grisado más oscuro) y
los dos intervalos vecinos, el anterior y el posterior (con grisado más claro).
 El Modo se encontrará en el Intervalo de clase que posee la máxima frecuencia, pero
cumplirá con la siguiente condición: si la frecuencia absoluta del intervalo anterior
( fant) es mayor que la frecuencia absoluta del intervalo posterior (fpost), el Modo es-
tará a la izquierda del punto medio del intervalo modal, es decir más cerca del Ver-
dadero Límite inferior. Si en cambio la frecuencia absoluta del intervalo posterior es
mayor que la frecuencia absoluta del intervalo anterior, el Modo estará a la dere-
cha del punto medio del intervalo que lo contiene, es decir más cerca del Verdadero
Límite superior. Este último es el caso planteado en el gráfico bajo estudio.

Para definir gráficamente la posición del Modo se trazan dos segmentos: el primero une los
puntos A y C, y el segundo une los puntos B y D, con lo cual, en la intersección, queda definido un
punto E.
 Se ve claramente que la posición del punto E dependerá de las alturas particulares de los
rectángulos anterior y posterior al rectángulo central, por lo que el punto E, proyectado
sobre el eje de las abscisas, indicará la ubicación del Modo.
-------------------
- Año 2013 -
Estadística I 54

 Por el punto E se traza una línea paralela al eje de las abscisas, con lo que se determinan
los puntos F y G, y, adicionalmente, los triángulos AED y BEC, semejantes entre sí por
ser opuestos por el vértice E entre las paralelas AD y CB
En ellos, se cumple la propiedad que dice que la relación entre su altura y su base son
EF EG
iguales, es decir que  (1)
AD BC
 Se puede ver que el segmento AD es igual a la frecuencia modal menos la frecuencia
anterior, y que el segmento BC es la frecuencia modal menos la frecuencia posterior,
y asignamos a ambos segmentos nuevos símbolos:
AD  frec.mod. frec. ant.  1
BC  frec.mod. frec. post.   2
 Se comprueba, además, que el segmento EF es igual al Modo menos el Verdadero Lími-
te Inferior de su intervalo de clase, y que el segmento EG es el Verdadero Límite Supe-
rior menos el Modo. Como el VLS es igual al VLI más la amplitud c, podemos expresar
las siguientes igualdades:
EF  Mo  VLI
EG  VLS  Mo  VLI  c   Mo
 Con estas consideraciones, se parte de la igualdad (1) para obtener la fórmula del Modo:
EF EG

AD BC
 Reemplazando adecuadamente estas expresiones, tenemos que
Mo  VLI VLI  c   Mo
 , a partir de la cual se despeja Mo.
 
1 2
Se efectúa un pasaje de los términos y :

 Mo  VLI    VLI  c  Mo 


2 1
Se eliminan los paréntesis:

 Mo   VLI   VLI   c   Mo
2 2 1 1 1

Se efectúa pasaje de términos de manera tal que en el primer miembro de la igualdad


sólo se encuentren los términos que contengan Mo:

 Mo   Mo   VLI   VLI   c
2 1 1 2 1

En el primer miembro de la igualdad, se extrae factor común Modo de (+), y en


el segundo miembro de la igualdad se extrae factor común VLI, también de (+):

-------------------
- Año 2013 -
Estadística I 55


Mo   
1 2
  VLI  1 2

  c
1

Pasando el término (+) al segundo miembro dividiendo, se obtiene:

Mo  VLI
      c  VLI   c
1 2 1 1
       
1 2
   
1 2 1 2

que resulta ser la fórmula buscada.

1
Sí 1  0   0  Mo  VLI
1   2
1
Sí  2  0   1  Mo  VLI  c
1   2
Sí 1   2  el modo estará a la derecha (porque Mo > xi) del punto medio, es decir cerca
del verdadero límite superior.

Sí  2   1  el modo estará a la izquierda (porque Mo < xi) del punto medio del intervalo
que lo contiene, más cerca del verdadero límite inferior.

En el ejemplo del precio de los autos vendidos por una concesionaria, el cálculo del Modo se
realiza de la siguiente forma:

Precios Nº de Verdadero
(miles de $) autos Límite

fi VL
60 - 71,999 8 60
72 - 83,999 23 72
84 - 95,999 17 84
96 - 107,999 18 96
108 - 119,999 8 108
120 - 131,999 4 120
132 - 143,999 2 132
80

23  8 15
Mo  72  12  72  12  72  0,71 . 12  80,57 mil $
23  8  23  17  15  6

En la concesionaria el precio de los autos que más se venden es de 80,57mil pesos.

-------------------
- Año 2013 -
Estadística I 56

Ventajas del modo:


 se obtiene fácilmente de una clasificación ordenada.
 se puede utilizar con datos cuantitativos y cualitativos.
 en el caso de datos agrupados es el valor o los valores que corresponden al
máximo o máximos de la curva.
 no se ve afectado por valores extremos.
 se puede utilizar con intervalos de clase abiertos, excepto que el modo esté en ese
intervalo.
Desventajas del modo:
 a veces no existe un valor modal debido a que el conjunto de datos no tiene valo-
res que se presenten más de una vez.
 cuando existe más de un modo es difícil de interpretar.

6. CUANTILES

Los cuantiles son aquellos valores de la variable que dividen al conjunto o serie de datos,
o a la distribución, en n partes iguales.

Son medidas de posición que se emplean particularmente para resumir o describir las pro-
piedades de grandes cantidades de datos numéricos. Se obtienen de subdivisiones de los datos.

Los cuantiles más conocidos son: los cuartilos (Qi), que dividen al conjunto de datos en
cuatro partes iguales; los decilos (Di) que lo dividen en diez partes iguales, y los centilos (Ci),
que dividen al conjunto en cien partes iguales.

Para dividir un conjunto de datos en n partes se necesitan (n-1) valores

Si una serie de datos se colocan en orden de magnitud creciente, los valores que dividen a
los datos en cuatro partes iguales se llaman cuartiles.

En el caso de datos no agrupados, para determinar la posición de los cuartiles:

Posición del Q1 (primer cuartil): (n+1)/4

Posición del Q2 (segundo cuartil): 2(n+1)/4

Posición del Q3 (tercer cuartil): 3(n+1)/4

Reglas utilizadas para obtener los valores de los cuartiles:


 Si el punto de posicionamiento resultante es un entero, se elige la observación numérica par-
ticular correspondiente a ese punto de posicionamiento para el cuartil.
 Si el punto de posicionamiento resultante está en el medio de dos enteros, el cuartil, es la
media de esos dos valores
-------------------
- Año 2013 -
Estadística I 57

 En los otros casos, se usa una regla simple para aproximar el cuartil particular que consiste
en redondear al punto de posicionamiento entero más cercano y seleccionar el valor numéri-
co de la observación correspondiente
En la Concesionaria 1 la edad de los compradores es

Edad n 1 6 1
Posición Q    1,75
xi 1 4 4
26
38  Q1 2n  1 26  1
Posición Q    3,5
44 2 4 4
 Q2 = 45
46
46  Q3 3n  1 36  1
Posición Q    5,25
52 3 4 4

Se comprueba además que la Mediana coincide con el cuartil segundo (Me=Q2) y que los
cuartiles son tres.

A partir del hecho de que la Mediana y el cuartil segundo coinciden, se puede establecer que
la fórmula de cálculo para los cuartiles en el caso de datos agrupados puede ser obtenida a partir
de la fórmula de la Mediana. En ese caso, recordando que

n F 1n
 Fa
Me  VL  2 a
c, análogamente Q2  VL  2 c
f fq
m 2
, y, del mismo modo, los cuartilos primero y tercero serán:

1n 3n
 Fa F
4 a
Q1  VL  4 c , y Q  VL  c
fq 3 f
1 q
1

Al utilizar ésta fórmula modificada, en primer lugar se determina la clase que contiene el
punto de interés de acuerdo con las frecuencias acumuladas y después se interpola como en el caso
de la mediana.

En el ejemplo del precio de los autos vendidos por una concesionaria, el cálculo de los Cuar-
tiles se realiza de la siguiente forma:
80 80
8  31
Q  72  4 12  78,26 mil $ Q  Me  84  2 12  90,35 mil $
1 23 2 17

-------------------
- Año 2013 -
Estadística I 58

3 . 80
 48
Q  96  4 12  104 mil $
3 18
Esto nos indica que el 25 % de los autos vendidos, más baratos, tienen un precio inferior a
78,26 mil pesos, la mitad de los autos vendidos tienen que superar los $ 90,35 mil y el precio más
bajo del 25% de los autos vendidos, más caros, es de $ 104 mil.
Si una serie de datos se coloca en orden de magnitud creciente, los valores que dividen a los
datos en diez partes iguales se llaman deciles. Se representan por D1, D2, D3,…, D9

En el caso de datos no agrupados, para determinar la posición de los Deciles:

Posición del Di (i-ésimo decil): i(n+1)/10

La fórmula para calcular los deciles con datos agrupados es:

n
i  Fa
Di  VL  10 c
fd
i

En el ejemplo del precio de los autos vendidos por una concesionaria, calculamos los Deci-
les tercero y sexto de la siguiente forma:

3 . 80 6 . 80
8  31
D  72  10 12  80,35 mil $ D  84  10 12  96 mil $
3 23 6 17

El decil tres nos indica que el 30 % de los autos vendidos, más baratos, tiene un precio infe-
rior a $ 80,35 mil y que el 60 % de los autos se vendieron con precios que no superan los 96 mil
pesos.

Si una serie de datos se coloca en orden de magnitud creciente, los valores que dividen a los
datos en cien partes iguales se llaman percentiles. Se representan por P1, P2, P3,…, P99

n
iF
P  VL  100
a
c
i f
p
i

En el ejemplo del precio de los autos vendidos por una concesionaria, calculamos los Per-
centiles diez y setenta de la siguiente forma:

80 80
10 0 70  48
P  70  100 12  72 mil $ P  96  100 12  101,33 mil $
10 8 70 18

-------------------
- Año 2013 -
Estadística I 59

El percentil diez nos muestra que el 10 % de los autos más baratos se vendieron a precios
que no superan los 72 mil pesos y el 30 % de los autos más caros se vendieron a precios que super-
an los 101,33 mil pesos.

PREGUNTAS TEORICAS SOBRE MEDIDAS DE POSICION:

n  Fa
1) Si la relación 2 <1/2, entonces indique si la Mediana:
fm
a) se encuentra a la izquierda del punto medio del intervalo de clase
b) se encuentra a la derecha del punto medio del intervalo de clase
c) coincide con el punto medio del intervalo de clase

2) Suponga que R > x . En ese caso, indique como son entre sí las siguientes expresiones A y B:

A = (xi- x )2 ; B= (x - R)
i
2

a) A > B
b) A < B
c) A = B

3) La Media aritmética del salario de cinco empleados es $ 250.- y la Mediana es $ 260.-. El em-
pleado que recibe el mayor ingreso tiene un aumento de $ 100.- En ese caso ¿cuáles serán los
valores de las nuevas media aritmética y mediana?

-------------------
- Año 2013 -