Académique Documents
Professionnel Documents
Culture Documents
LA MEDIA
La media, llamada también media aritmética, es la medida de tendencia central conocida como
promedio, se denota por X́ .
Si se dispone de un conjunto de n números, tales como X 1, X2, X3,…,Xn, la media aritmética de este
conjunto de datos se define como "la suma de los valores de los ni números , divididos entre n", lo
que usando los símbolos explicados anteriormente puede escribirse como:
n
x + x + x +…+ x n
X́ = 1 2 3 , es decir
∑ xi
n x́= i=1
n
Ejemplo: si tenemos 5 estudiantes cuyas edades son: 14, 16, 15, 13 y 17 años, el promedio de
edad de estos 5 estudiantes se calcula usando la media aritmética así:
14+ 16+15+13+17 75
X́ = = =15
5 5
¿ x 1 f 1 + x 2 f 2 +⋯+ x n f n ∑ xi f i
i=1
x= =
n n
Ejemplo. Los datos de la tabla siguiente corresponden a las edades de 20 estudiantes. Calcular la
media aritmética.
Edades (xi) Frecuencia xi . f i
absoluta(fi)
13 2 26
14 4 28
15 6 90
16 5 80
17 3 51
Total 20 275
2
Intervalos de clase. Para variables cuantitativas, la agrupación de frecuencias se hace dividiendo el rango
(diferencia entre el mayor valor y el menor) de la variable en intervalos consecutivos, denominados
intervalos de clase, que se acostumbran tomar de la misma amplitud(se deben tomar entre 5 y 8 intervalos).
Cuando los datos recolectados han sido organizados en una tabla de frecuencias por
intervalos, la media se puede calcular por medio de la fórmula
n
∑ xi f i
X́ = i=1
n
Donde x i es la marca de clase que se halla sumando los extremos del intervalo y dividiéndolo
en 2
Obsérvese que es la misma fórmula que la correspondiente a los datos organizados en
tablas de distribución de frecuencias simples, en donde la única diferencia es la
interpretación de la x. En una representa el valor nominal, en ésta el punto medio del
intervalo. De hecho, esta situación se va a repetir en las otras dos medidas de tendencia
central que faltan de estudiar aún, la mediana y la moda, ya que también se estudiarán en
dos casos: cuando los datos estén organizados en tablas con frecuencias simples o cuando
estén por intervalos. Ejemplo. Organice los datos siguientes en intervalos y calcule la
media aritmética de dichos datos.
1,1,1,2,2,3,4,5,5,5,6,7,7,8,8,8,8,8,9,10,10,11,11,11,12,12,
14,15,16,16,16,16,18,19,20,21,21,22,23,24
Lo primero que hacemos es distribuir los datos en un número adecuado de intervalos que se
acostumbra a tomar entre 5 y 8, de la misma amplitud, en este caso podemos tomar 5
intervalos de amplitud 5. En los intervalos, los números correspondientes al extremo
superior del intervalo no forman parte de ese intervalo sino que son el primer elemento del
siguiente intervalo, por ejemplo: en el intervalo de 0 a 5, el 5 no entra en el primer intervalo
sino en el segundo y así sucesivamente.
Intervalos fi x i (marca de xi f i
clase)
[0,5) 7 2,5 17,5
[5,10) 12 7,5 90
[10,15) 8 12,5 100
[15,20) 7 17,5 122,5
[20,25) 6 22,5 135
Total 40 ∑ ¿ 465
n
∑ xi f i 465
X́ = i=1 = =11,625
n 40
3
MEDIANA (Me). Para una serie de datos estadísticos, la mediana es el valor para el cual el número de
observaciones mayores que él es igual al número de observaciones menores que él.
Cuando el número de observaciones es impar, la mediana se define como el valor correspondiente a las
observaciones que ocupa la posición central. Si el número de observaciones es par, el valor de la mediana se
determina como el promedio de las observaciones centrales.
Edades (xi) fi fa
1 4 4
2 5 9
3 6 15
4 8 27
5 10 37
6 18 45
7 16 50
total 67
n+1 67+1 68
d c= = = =34
2 2 2
esto significa que el dato ordinal 34, es el que está situado a la mitad de todos. Observando
la columna de las frecuencias acumuladas se ve que hasta edad 4 años, contadas desde el
principio, van apenas 27 alumnos, mientras que hasta la edad 5 años ya van 37. Esto
significa que dentro de la edad 5 años está el alumno número 34, que es el central. Por lo
tanto, la mediana es Me=5.
Ejemplo 2: Las edades de un grupo de 28 personas van de los 45 a los 58 años, mostrado
ya organizado en la siguiente tabla. Localizar la mediana de dicho conjunto de datos.
Edades (xi) fi fa
45 2 2
46 1 3
47 3 6
48 3 9
49 5 14
50 6 20
51 2 22
52 4 26
53 2 28
total 28
Solución: Debe entenderse que la tabla original consta solamente de las dos primeras
Columnas x (edades) y f .
La que aparece a la izquierda es dicha tabla original a la que ya se le añadió la columna de
frecuencias acumuladas. Este es un ejemplo para ilustrar el caso de conflicto para localizar
la mediana.
La máxima frecuencia acumulada, que es lo mismo que el número total de datos nominales,
es de 28. Es decir, la tabla corresponde a 28 datos recolectados.
Debe comprenderse que no existen datos ordinales fraccionarios, sino solamente enteros, o
sea, el dato número 14, 5 no existe, existe el puesto 14 o el puesto 15, pero el 14,5 no
existe.
Observando la columna de las frecuencias acumuladas se ve que el 14º dato fue el último
correspondiente al dato nominal x = 49 , mientras que el 15º dato es el primero que
corresponde al dato nominal x = 50, por lo que se entra en el conflicto de cuál de los dos
ha de ser la mediana. En casos así, la media aritmética de ambos se toma como la mediana,
es decir, la mediana es. Me = 49.5.
5
Para utilizar la fórmula mencionada debe añadirse primero a la tabla original una columna
de frecuencias acumuladas.
Se le llama “clase de la mediana” al intervalo en donde se encuentra la mediana. “clase”
o intervalo es lo mismo.
El resultado que se obtiene con la fórmula es un valor que se encuentra dentro de la clase de
la mediana.
La fórmula correspondiente es
n
M e =Li+
Donde
( −f
2 ( a−1)
fi ) a
Para localizar el intervalo de la mediana se procede igual que para datos no agrupados.
Ejemplo 1: Localizar la mediana del conjunto de datos organizados en intervalos, mostrado
en la siguiente tabla.
Intervalos fi fa
[1,30) 1 1
[31,60) 1 2
[61,90) 3 5
[91,120) 5 10
[121,150) 6 16
[151,180) 7 23
[181,210) 11 34
[211,240) 15 49
Total 49
La máxima frecuencia acumulada, que es lo mismo que el número total de datos nominales,
es de 49. El valor central respecto de las frecuencias, no de los datos nominales x se
obtiene sumando 1 al 49 y dividiéndolo entre dos, es decir,
n+1 49+1 50
d c= = = =25
2 2 2
6
Así que se tienen los siguientes datos para ser sustituidos en la fórmula:
Li=181
n=49
f (a−1)=23
f i =11
a=210−181=29
Obsérvese que, como se dijo antes, el valor de la mediana está adentro del intervalo de la
clase de la mediana, es decir, adentro de 181 - 210. Lo contrario sería una contradicción,
pues si se afirma que el intervalo (la clase) de la mediana es 181 - 210, precisamente dentro
de ese intervalo debe estar la mediana.
LA MODA (Mo) La moda en una serie de datos estadísticos es aquel valor que se presenta con mayor
frecuencia, es decir el dato que más se repite, por ejemplo la moda de los números 7, 4, 8, 6, 2, 7, 3, 7, es
igual a 7.
La moda puede no existir e incluso, si existe, puede no ser única: no existe cuando todos los valores se
repiten un mismo número de veces y un conjunto de datos tiene varias modas cuando hay varios números
que se repiten más que el resto en una cantidad igual de veces.
Cuando los datos recolectados han sido organizados en una tabla de frecuencias simples, la
moda se obtiene buscando en la columna de frecuencias el o los valores que tengan mayor
frecuencia. Es exactamente lo mismo cuando están organizados por intervalos.
Ejemplo: en la tabla siguiente determinar la moda
Edades (xi) fi fa
1 4 4
2 5 9
3 6 15
4 8 27
5 10 37
6 18 45
7 16 50
total 67
7
En la tabla anterior la moda es 6 años ya que es el dato con mayor frecuencia (18).