Vous êtes sur la page 1sur 12

Objetivo 3.

3 Medidas de tendencia central: Media aritmética,


geométrica y ponderada, Mediana, Moda.

Objetivo 3.4 Medidas de dispersión, Varianza, Desviación


Estándar, Desviación media, Rango.
Los estadísticos descriptivos son aquellos que constituyen el resumen de la
característica que se estudia, lo que permite tomar una decisión más rápida y
satisfactoria sin la necesidad de consultar nuevamente todas las
observaciones.

De acuerdo con sus características, los estadísticos se pueden clasificar en:

1. Medidas de tendencia central y de posición


2. Medidas de variabilidad.
3. Medida de forma y sesgo.
4. Medida de curtosis.

En este objetivo se analizarán las medidas de tendencia central y de posición.

La característica más importante de una serie de datos obtenidos de una


muestra es la posición. Todas las series de datos tienden a reunirse o
condensarse en un solo valor central (llamado promedio), en el cual se
distribuyen todos los datos muestrales.

Estas medidas tienen por objeto encontrar el punto central, o bien, un punto
específico en la distribución de un conjunto de datos. Éstas pueden clasificarse
en:

 Media aritmética
 Media ponderada
 Media geométrica
 Mediana
 Moda
 Cuartiles, deciles y percentiles.

Media aritmética para datos no agrupados.

Se define como la suma de los valores observados de una variable cuantitativa


(discreta o continua), dividida por el número total de las observaciones; se
simboliza con una x que tiene una raya en su parte superior, y se lee equis
barra (𝑥̅ ). De manera formal, se dice que, si x1, x2, x3, x4,…xn, son n
observaciones numéricas del fenómeno en estudio, entonces la media
aritmética o promedio de estas n observaciones se expresa como:

𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + ⋯ + 𝑥𝑛 ∑𝑛𝑖=1 𝑥𝑖
𝑥̅ = =
𝑛 𝑛
En donde:

𝑥̅ = media aritmética de la muestra.


n= tamaño de la muestra.
xi = i-ésima observación de la variable cuantitativa.

Cuando las observaciones del fenómeno en estudio corresponden a los datos


de una población (N), entonces la media aritmética se denomina media
poblacional, la cual constituye un parámetro que se denota como:

𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + ⋯ + 𝑥𝑛 ∑𝑛𝑖=1 𝑥𝑖
𝜇= =
𝑁 𝑁
En donde:

𝜇= media aritmética de la población (letra griega mu).


N= tamaño de la población.
xi = i-ésima observación de la variable cuantitativa.

Ejemplo 1.

En una agencia de ventas de productos de limpieza, se seleccionó una muestra


de 25 agentes de ventas, a quienes se les preguntó cuánto habían ganado de
comisiones la semana pasada, ya que se quiere conocer el promedio que
obtuvieron de éstas:
300, 420, 300, 170, 230, 130, 260, 170, 300, 260, 260, 170, 300, 420, 70, 80,
260, 260, 440, 80, 300, 420, 230, 130, 230, 300.

Para saber el promedio, es necesario calcular la media aritmética de la serie


simple de datos.

300 + 420 + 300 + 170 + ⋯ + 300 6230


𝑥̅ = = = $ 249.20
25 25
Si se compara el resultado anterior con los datos originales:
 Se puede observar que ningún agente de ventas obtuvo ganancias por
$249.20.
 También hay 11 agentes que ganaron comisiones menores y 14
mayores, respecto al valor de la media de $ 249.20.

A partir de este análisis, puede deducirse que la media aritmética siempre se


afectará por los valores extremos en la serie de observaciones obtenidas de
una muestra; por tanto, puede afirmarse que la media siempre actuará como
punto de equilibrio o balanceo, de tal modo que los valores de las
observaciones mayores equilibran a las menores. También, deben estudiarse
los datos que se encuentran alrededor o dispersos de la media, en especial los
valores extremos de la serie; siendo para el ejemplo anterior de $ 70.00 el valor
más bajo, mientras que el más alto de $ 440.00. Esta variabilidad siempre
estará presente cuando se toma de una muestra y se quiera conocer la media
aritmética de una serie de valores obtenidos de la variable cuantitativa. Esta
dispersión es otro punto de análisis de la serie de datos, para poder realizar
inferencias estadísticas a partir de los datos de la muestra.

Media ponderada.

Es el estadístico que permite obtener el promedio de un conjunto de datos, en


el cual se toma en cuenta la importancia que tiene cada dato dentro del cálculo
global.
La media ponderada, a diferencia de la media aritmética, permite asignar un
ponderador o peso específico distinto de cada dato, según la importancia en el
cálculo global; así, esta medida puede expresarse matemáticamente como:

∑𝑒𝑖=1 𝑤𝑖 (𝑥𝑖 )
𝑥𝑤 =
̅̅̅̅
∑𝑒𝑖=1 𝑤𝑖
Donde:
𝑥𝑤 media ponderada.
̅̅̅̅=
wi= peso asignado a cada elemento “i” en la media ponderada i=1,2,3,…e.
xi= cada uno de los elementos a ponderar, i=1,2,3,…,e.

Ejemplo 2.

En la Universidad Autónoma Metropolitana, Unidad Xochimilco, el sistema de


estudio es modular. El módulo está compuesto de un Seminario de Teoría y
uno o varios talleres de apoyo. Suponga que un estudiante de Administración
del quinto módulo obtuvo las siguientes calificaciones en el trimestre: nueve en
el Seminario, ocho en Matemáticas y siete en el Taller de Contabilidad.
En este caso como el módulo consta de tres partes, entonces se ponderan con
base en el siguiente criterio: 75%, el Seminario; 20%, los contenidos de
Matemáticas; y 5%, el Taller de Contabilidad. La escala de calificaciones es:
“MB” (9-10); “B” (8-8.9); “S” (7-7.9); y “NA”. Con esto último se puede
determinar que el alumno obtuvo una calificación de 8.7 puntos, la cual
equivale a “B”.
75(9) + 20(8) + 5(7)
𝑥𝑤 =
̅̅̅̅ = 8.7
75 + 20 + 5

La mayor dificultad que hay para aplicar este estadístico es determinar,


precisamente, el valor que deben tener los ponderadores para cada elemento.
Mediana.

Estadístico cuyo valor es proporcionado por el elemento central de un conjunto


de datos ordenados con respecto de la magnitud de los valores, sea en forma
ascendente o descendente. Este elemento central divide al conjunto de datos
en dos partes iguales: 50% de los datos se encuentra por debajo de este valor
y el otro 50%, por arriba de él. También, la mediana se conoce como un
promedio de posición, porque sólo se afectará por el número de observaciones
y nunca por los valores de las observaciones.

Cálculo de la mediana para variables cuantitativas.

a) Cuando el conjunto de datos ordenados contiene un número impar de


elementos, entonces, el que está en medio será la mediana. La relación
que permite ubicar el dato en el conjunto es:

(𝒏 + 𝟏)
𝑼𝒎𝒆 =
𝟐

Donde n es el número de datos en el conjunto.

Ejemplo 3.
Considere el conjunto de datos siguiente:
Posición 1 2 3 4 5 6 7 8 9
Dato 13 3 8 4 9 7 4 11 2

Primero, se ordena el conjunto en forma ascendente.


Posición 1 2 3 4 5 6 7 8 9
Dato 2 3 4 4 7 8 9 11 13

Después, se calcula la ubicación (o posición) de la mediana:


(9𝑑𝑎𝑡𝑜𝑠 + 1) 10
𝑈𝑚𝑒 = = =5
2 2

Se encuentra la posición cinco en el conjunto ordenado. En Este caso, el


valor que está ubicado en la posición cinco es el dato cuyo valor es
siete, por tanto la mediana (Me) será:
Me=7

b) Si el conjunto de datos ordenados contiene un número par de


elementos, entonces el que está en medio será la mediana. La
expresión que permite ubicar el dato en el conjunto es:
𝒏 𝒏
𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 (𝟐) + 𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 (𝟐 + 𝟏)
𝑴𝒆 =
𝟐
Ejemplo 4.
Considere el conjunto de datos del cuadro:
Posición 1 2 3 4 5 6 7 8 9 10
Dato 4 18 5 9 7 8 3 11 10 14

Se ordena el conjunto de datos en forma ascendente:


Posición 1 2 3 4 5 6 7 8 9 10
Dato 3 4 5 7 8 9 10 11 14 18

Se determinan los valores de posición:


10 10
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 ( 2 ) + 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 ( 2 + 1)
𝑀𝑒 =
2
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 5 + 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 6 8 + 9
𝑀𝑒 = = = 8.5
2 2

Cálculo de la mediana para variables cualitativas.

La mediana, es un estadístico que tiene la ventaja de poder analizar


datos no cuantitativos, a diferencia de la media aritmética, y de encontrar
su punto central.

Ejemplo 5.

Las opiniones de siete individuos acerca de un producto (en la escala:


malo, regular y bueno) son: bueno, regular, malo, malo, bueno, malo,
bueno; al ordenarlas en forma ascendente se tiene:
Malo, malo, malo, regular, bueno, bueno, bueno.
Por tanto, la mediana es regular; lo que indica que 50% de los individuos
clasifica al producto por debajo de esta categoría y el otro 50% por
arriba de ella.

Moda.
Es la característica que más se repite dentro de un conjunto de datos.
Es un estadístico útil cuando se quiere cuantificar las características de
variables cualitativas.

Moda para datos no agrupados.


El conjunto de datos se ordenan en forma descendente o ascendente. La moda
es el valor o cualidad que más se repite (de mayor frecuencia).

La moda, a diferencia de la media y mediana, no puede ser única y puede no


existir en el conjunto de datos. Por ejemplo:

Datos Moda (Mo)


a) Unimodales 2, 3, 4, 5, 5, 5, 6, 7, 8 Mo= 5
b) Bimodales 2, 3, 4, 4, 5, 5, 6, 7, 8 Mo = 4 y Mo = 5
c) Sin moda 2, 3, 4, 5, 6, 7, 8 Ninguna moda.

Media Geométrica.

Este estadístico se emplea cuando una variable presenta un comportamiento


distinto en el tiempo; es decir, si se quiere evaluar un promedio de
comportamiento para diferentes periodos, en su cálculo se conjugan dos
factores: el valor de la variable y el tiempo.

Definición: La media geométrica es la raíz n-ésima del producto de los valores


que toma la variable en el tiempo, donde n es el número de factores empleados
en el producto. Matemáticamente se expresa como:
𝑀𝐺 = 𝑛√𝑥1 ∗ 𝑥2 ∗ 𝑥3 … 𝑥𝑛
n= número de factores.
𝑥1 ∗ 𝑥2 ∗ 𝑥3 … 𝑥𝑛 datos en el tiempo usados en el cálculo de la media
geométrica.

Ejemplo
Las ganancias obtenidas por la empresa de construcción Akins en cuatro
proyectos recientes fueron de 3%, 2%, 4% y 6%, ¿cuál fue la media geométrica
de la ganancia?

La segunda característica que los investigadores estudian de una serie de


datos es la dispersión (diseminación, variabilidad o variación), la cual permite
conocer qué tan dispersas se encuentran las observaciones a cada lado del
centro en una serie de datos, o bien que tan alejadas se encuentran de la
medida de tendencia central.

En el caso de las medidas de tendencia central, éstas nos indican si la serie


tiene datos extremos que sesguen los valores de los estadísticos hacia un lado
o a hacia el otro de ésta. Por eso, todo análisis estadístico se inicia con el
cálculo de las medidas de tendencia central, y se complementa con un análisis
de la variabilidad o dispersión de los datos.

Por tanto, una medida de variabilidad es un número que indica el grado de


dispersión (esparcimiento) en un conjunto de datos con respecto a un
estadístico de tendencia central (generalmente, la media aritmética). Si este
valor es pequeño (con respecto de la unidad de medida), entonces indica poca
uniformidad; y, finalmente, si el valor es cero, entonces indica que todos los
datos son iguales.

En este objetivo se describen algunas medidas de variabilidad comunes:

 El rango
 La varianza
 La desviación estándar.

Rango.

Medida de variabilidad definida como el valor máximo menos el valor mínimo, a


veces el rango se indica dando el par de valores extremos.

Varianza.

Medida de variabilidad para un conjunto de datos, basada en las desviaciones


de los valores de los datos respecto a la media, elevadas al cuadrado.

Varianza de la población
∑(𝑥𝑖 −𝜇)2
𝜎2 = Donde: 𝑥𝑖 = valor de cada una de las observaciones
𝑁
μ = media de la población
N = número total de datos, tamaño de la población.
𝜎 2 = varianza de la población.
Varianza de la muestra
(𝑥𝑖 −𝑥̅ )2
𝑠2 = Donde: 𝑥𝑖 = valor de cada una de las observaciones
𝑛−1
𝑥̅ = media de la población
n = tamaño de la muestra.
𝑠 2 = varianza de la muestra.

Desviación Estándar.

Medida de variabilidad de un conjunto de datos; se calcula sacando la raíz


cuadrada positiva de la varianza.

La varianza y la desviación estándar tienen una limitación seria: pueden verse


gravemente afectadas en presencia de observaciones aberrantes, pues ambas
dependen de la media, que se modifica por las medidas extremas.
Ejemplo 1.
Dos modos que usan los empleados para ir a trabajar diariamente son: el
transporte público y el automóvil; a continuación se dan unas muestras de
tiempo de cada modelo. Las cifras son minutos.

Transporte 28 29 32 37 33 25 29 32 41 34
Público
Automóvil 29 31 33 32 34 30 31 32 35 33

a) Calcule la media de la muestra del tiempo que se lleva en cada modo de


transporte.

b) Calcule la desviación estándar de la muestra para cada modo de


transporte.

c) Con base en los resultados de los incisos a y b, qué modo de transporte


debe preferirse explique.

Respuestas:

a) Transporte Publico 𝑥̅ = 32 𝑚𝑖𝑛𝑢𝑡𝑜𝑠

Automóvil 𝑥̅ = 32 𝑚𝑖𝑛𝑢𝑡𝑜𝑠

b) Para el transporte público

(28−32)2 +(29−32)2 +(32−32)2 +(37−32)2 +(33−32)2 +⋯+(34−32)2


𝑠2 =
10−1

194
𝑠2 = = 21.55 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 2
9

194
𝑠=√ = √21.56 = 4.64 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
9

Para el automóvil

(29−32)2 +(31−32)2 +(33−32)2 +(32−32)2 +(34−32)2 +⋯+(33−32)2


𝑠2 =
10−1

𝑠 = 1.83 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
c) El automóvil, debido a que su desviación estándar o variabilidad es
menor.
Ejemplo 2

Suponga que con los datos siguientes se trazan los histogramas de la cantidad de días
que la compañía Díaz y la compañía Juárez necesitan para surtir pedidos.

Días para entrega de la 11 10 9 10 11 11 10 11 10 10


compañía Díaz
Días para entrega de la 8 10 13 7 10 11 10 7 15 12
compañía Juárez

Empleé el rango y la desviación estándar para sustentar la observación referente a


que la compañía Días tiene tiempo de entrego más consistentes y confiables.

Histograma de la
F compañía Díaz
r 6 5
e
c 4 3
u a
e 2 1
n
c 0
i 9 1 1
Numero de días de entrega

Histograma de la
F compañía Juárez
r
4 3
e
3 2
c
2 1 1 1 1 1
u a
1
e
0
n
1 2 3 4 5 6 7
c
i Número de días de entrega
Para la compañía Díaz

(11 − 10.3)2 + (10 − 10.3)2 + (9 − 10.3)2 + (10 − 10.3)2 + ⋯ + (10 − 10.3)2


𝑆2 =
10 − 1
4.1
= = 0.45 𝑑í𝑎𝑠 2
4
𝑠 = √0.45 = 0.67 𝑑í𝑎𝑠
𝑅𝑎𝑛𝑔𝑜 11 − 9 = 2 𝑑í𝑎𝑠

Para la compañía Juárez

(8 − 10.3)2 + (10 − 10.3)2 + (13 − 10.3)2 + (7 − 10.3)2 + ⋯ + (12 − 10.3)2


𝑠2 =
10 − 1

60.01
= = 6.67 𝑑í𝑎𝑠 2
9

𝑠 = √6.67 = 2.58 𝑑í𝑎𝑠

𝑅𝑎𝑛𝑔𝑜 = 15 − 7 = 8 𝑑𝑖𝑎𝑠

Como se observa la desviación estándar es menor para la compañía Díaz que para la
de Juárez, así como el rango. En los histogramas se observan una mayor cantidad de
barras en la compañía Juárez lo que indica una mayor variabilidad, concluyendo con
lo anterior que la compañía Díaz tiene tiempos de entrega más consistentes y
confiables.

Ejemplo 3

Se efectuó una encuesta acerca de la capacidad de los fabricantes de


computadoras para resolver con rapidez sus problemas. Se obtuvieron los
siguientes resultados:

Empresa Días para resolver el problema

Compaq 13
Packard Bell 27
Quantex 11
Dell 14
NEC 14
AST 17
Acer 16
Gateway 21
Digital 27
IBM 12
Hewlett-Packard 14
AT&T 20
Toshiba 37
Micron 17

a) Cuales son la media, la mediana y la moda de la cantidad de días


necesarios para resolver problemas

Media = 18.57 días


Mediana = 16.5 días
Moda = 14 días

b) Cuál es la varianza y la desviación estándar

𝑆2
(13 − 18.57)2 + (27 − 18.57)2 + (11 − 18.57)2 + (14 − 18.57)2 + (14 − 18.57)2 + ⋯ + (17 − 18.57)2
=
14 − 1
695.4286
= = 53.49 𝑑𝑖𝑎𝑠 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠
13

𝑠 = √53.49 = 7.31 𝑑𝑖𝑎𝑠

c) Que fabricante tiene el mejor registro:

Quantex

Problema propuesto

1. Según Forrester Research, Inc., aproximadamente 19% de los


usuarios de internet practican juegos en línea. En los siguientes
datos se observa el número de usuarios únicos (en miles) para el
mes de marzo en 10 sitios de juegos.

Sitio Usuarios únicos


AOLGames.aol 9416
Extremelotto.com 3955
Freelotto.com 12 901
Gamesville.com 4844
Iwin.com 7410
Prizecentral.com 4899
Shockwave.com 5582
Speedyclick 6628
Uproar.com 8821
Webstakes 7499

Por medio de estos datos calcule la media, la mediana, la varianza y


la desviación estándar.

Resultados:
La media= 7195.5 usuarios
La mediana= 7019 usuarios
Varianza= 7165 941 usuarios2
Desviación estándar= 2676.93 usuarios

PROBLEMAS

1. El gasto diario ($) de una muestra de 20 alumnos del Tecnológico es el


siguiente:

10.00 12.50 12.00 11.50 13.00 12.00 11.00 14.00 15.00 14.50
12.50 12.00 12.40 10.50 12.00 14.00 13.00 12.00 15.00 12.30

a) Calcule la media muestral, la mediana, la moda y la desviación


estándar.

Vous aimerez peut-être aussi