Académique Documents
Professionnel Documents
Culture Documents
Definiciones:
Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados según
su magnitud. Generalmente se utilizan 4 de estos valores también conocidos como estadigrafos, la media
aritmética, la mediana, la moda y al rango medio.
La media aritmética es la medida de posición utilizada con más frecuencia. Si se tienen n valores de
observaciones, la media aritmética es la suma de todos y caca uno de los valores dividida entre el total de
valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen
distorcionada de la información de los datos.
La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, de
esta manera la mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana,
resulta muy apropiada cuando se poseen observaciones extremas.
La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores
extremos, pero es más variables que la media y la mediana.
Rango Medio es la media de las observaciones menor y mayor. como intervienen solamente estas
observaciones, si hay valores extremos, se distorsiona como medida de posición, pero
ofrece un valor adecuado, rápido y sencillo para resumir al conjunto de datos.
Datos Discretos
No Agrupados
Analicemos para ello las edades que utilizamos cuando se vió la organización y presentación de datos discretos:
12 15 14 15 16
18 19 14 15 17
15 17 18 16 19
16 17 15 15 17
16 18 17 19 17
23 16 17 18 19
Estos fueron loa datos mostrados originalmente, no se han ordenado ni agrupado, determinemos ahora los
valores de la Media, la Mediana y la moda, para ello recurramos a las fórmulas de estas medidas que resumimos
en la siguiente tabla:
Para la media:
_ 12 + 15 + 14 + 15 + 16 + 18 + 19 + 14 + 15 + 17 + 15 + 17 + 18 + 16 + 19 + 16 + 17 + 15 + 15 + 17 + 16 + 18 + 17 + 19 + 17 + 23 + 16
+ 17 + 18 + 19
X = ----------------------------------------------------------------------------------------------------------------------------- ----------------------------------------------
--------------------------
30
_ 500
X = ------------ = 16.6667
30
Para la mediana debera ordenarse el grupo de datos, como n = 30, utilizaremos la posición p = (30/2) = 15, el
primer valor mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7
veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que
ordenar la información (así lo específica la definición), sin embargo podemos también observar que este
ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la
siguiente tabla:
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan
cambios en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.
Agrupados
Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos estado utilizando:
En donde podemos observar la suma de las frecuencias y de los años multiplicados por la clase que agrupa a los
datos coinciden con los datos utilizados cuando no se agruparon en la sección anterior, utilizando ahora las
formulas de la siguiente tabla:
Para la media:
_ 12 * 1 + 14 * 2 + 15 * 6 + 16 * 5 + 17 * 7 + 18 * 4 + 19 * 4 + 23 * 1 12 + 28 + 90 + 80 + 119 + 72 + 76 + 23
X = -------------------------------------------------------------------------------------------- = ---------------------------------------------------------------
30 30
_ 500
X = ------------ = 16.6667
30
Como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7
veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que
ordenar la información (así lo específica la definición), sin embargo podemos también observar que este
ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la
siguiente tabla:
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan
cambios en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.
Datos Continuos
No agrupados
Las medidas de tendencia central para datos continuos no agrupados no tienen mayor significación, ya que el
comportamiento es similar al de datos discretos no agrupados, por ello utilizaremos las mismas formúlas, pero
ahora con los datos continuos del ejercicio de la sección correspondiente:
Para la media, aplicando la formula de la media para datos no agrupados (vista en la sección de datos discretos):
_ 1.25 + 1.2 + 1.28+1.29+1.2 + 1.24 + 1.27 + 1.21 + 1.32 + 1.27 + 1.18 + 1.29 + 1.2 + 1.23 + 1.25 + 1.28 + 1.24 + 1.28 + 1.27 + 1.25 + 1.24 + 1.25 + 1.27 + 1.28 + 1.29 + 1.28 + 1.21
+ 1.24 + 1.2 + 1.23 + 1.25 + 1.27 + 1.28 + 1.24 + 1.29 + 1.21
X = --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------
30
_ 44.93
X = ------------ = 1.24805556
30
La moda estaría determinada por observación directa, y corresponderían a los valores 1.24, 1.25 y 1.27 que se
repiten en la muestra 5 veces, por lo que la característica según la moda es una muestra trimodal (normalmente
se le conoce como multimodal).
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que ordenar la
información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no
afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.
Agrupados
Retomando los cálculos realizados en la sección correspondiente a organización y presentación de datos
continuos agrupados.
En ella se pueden observar los límites superiores e inferiores de cada clase, lo que indica (de no conocer los
datos originales) que por ejemplo esos 6 valores de la clase pueden ubicarse en cualquier valor del rango,
pueden ser por ejemplo 1.17, 1.171, 1.20, 1.202, 1.18, 1.1901.
Es decir pueden tomar cualquier valor dentro del rango lo que dificulta tomar estos parametros como
elementos para el cálculo de las medidas de tendencia central, por ello se realizó el cálculo de la Mc (Marca de
Clase) que en otras palabras es el rango medio de cada clase, que servirá para el cálculo de la media como lo
establecemos en la siguiente tabla de cálculo para las medidas de tendencia central:
45.122
Media = ---------------- = 1.253388889
36
Para el cálculo de la mediana, se utiliza la formula del 5to. Decil (puede ser el 50tavo percentil), para ello
determinamos la posición de este estadígrafo, p = (36/10)*5 = 3.6 * 5 = 18.
Con este valor recurrimos a la columna de la frecuencia acumulada y observarmos que el primer elemento
mayor al valor calculado se ubica en la clase III, aplicando la fórmula obtenemos:
2
Mediana = 1.251 + ( ---------) * 0.028 = 1.251 + (0.2 * 0.028) = 1.251 + 0.0056 = 1.2566
10
La moda se encontraría en las clases II y III, son las que mayores frecuencias manifiestan, por lo tanto podemos
definir que existen una característica de multimodalida en la muestra, calculemos la primera moda (dejamos
como actividad complementaria el cálculo de la segunda moda).
( 10 – 6) 4
Mo = 1.213 + ( -------------------------) 0.028 = 1.213 + (--------) * 0.028 = 1.213 + 0.028
(2* 10 – 6 – 10) 4
Mo = 1.241
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que ordenar la
información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no
afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.
Puede en esta tabla observarse una diferencia marcada en los valores obtenidos por agrupamiento y no
agrupamiento para la media, la mediana y la moda, la última, por observación en el caso de no agrupamiento
nos presenta 3 modas, mientras que en el agrupamiento, se obtienen 2 modas, la realidad es que el agrupar
datos continuos se tiene una pérdida de valores por la aproximación que se tiene al calcular por ejemplo la
marca de clase como valor representativo medio de la misma.