Académique Documents
Professionnel Documents
Culture Documents
x
x 1 x 2 ... x n i 1
i
X
n n
• Es intuitiva y fácil de calcular.
• Su valor puede que no coincida con ninguno de los valores
de la muestra
• La suma de las diferencias de cada valor de la muestra con la
media su resultado es cero, es decir,
(x x) 0
i 1
i
Mediana
x n 1 2 si n es impar
Me x
n 2 x ( n 2) 1
si n es par
2
• La mediana es aquel valor que deja el cincuenta por ciento de
los datos por debajo y otro cincuenta por encima.
• Cabe destacar que es preferible el uso de la mediana como
medida descriptiva del centro cuando se quiere reducir o
eliminar el efecto de valores extremos en un conjunto de
datos (muy grandes o muy pequeños).
Moda
• Es una medida de tendencia central que se puede utilizar sea
cual sea el tipo de variable a estudiar. La moda de un conjunto
de observaciones es el valor que más se repite, aquel cuya
frecuencia absoluta es máxima. Puede ser única, que haya
más de una, o que no exista.
Media geométrica
n
X G n x1.x2 ....xn n ( xi )
i 1
Media armónica
• Se define como el número de observaciones de la
muestra dividido por la suma del inverso de cada una de
las observaciones, es decir,
n
XA n
(1 / x )
i 1
i
• La localización o tendencia central de un conjunto de datos no
necesariamente proporciona información suficiente para
describirlos adecuadamente. Debido a que no todos los
valores son semejantes, la variación entre ellos se considera
importante. Se puede decir que un conjunto de datos tiene
una dispersión reducida si los mismos se aglomeran
estrechamente en torno a alguna medida de localización de
interés y se dice que tiene una dispersión grande si se
esparcen ampliamente alrededor de alguna medida de
localización de interés.
• Las medidas descriptivas más comunes de
dispersión son: el rango, la varianza, la
desviación estándar y el rango intercuartílico.
Rango
r xmax xmin
• Aunque es una medida muy fácil de calcular, ignora toda la
información de la muestra entre las observaciones más
grande y más pequeña. Sin embargo, vale la pena resaltar que
el rango se utiliza mucho en aplicaciones estadísticas al
control de calidad.
• En general, se desea una medida de variabilidad que dependa
de todas las observaciones y no sólo de unas pocas; así que
parece razonable medir la variación en términos de las
desviaciones relativas a alguna medida de localización
(generalmente esta medida es la media).
Para el conjunto de datos x1, x2,….,xn
Las diferencias ( x1 x ), ( x2 x ),....., ( xn x )
Determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es cero,
se utiliza como medida de variabilidad el
promedio de los cuadrados de tales desviaciones.
n
(x x)
i
2
s
2 i 1
n
(x i x) 2
S2 i 1
n 1
Desviación estándar
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Datos no agrupados
VENTAJAS
DESVENTAJAS
• Solo se puede aplicar en pequeñas cantidades de datos, ya que en grandes
cantidades resultaría un tanto tedioso y por lo mismo existiría más probabilidad de
equivocarse.
Datos agrupados
• Son datos que están organizados (formando grupos). Podemos formar más o
menos grupos, dependiendo de que tan exacto queramos trabajar, a cada grupo le
llamamos clase. Rara vez se emplean menos de seis clases o más de quince.
Ventajas
x = wi xi
wi
donde:
xi = valor de observación i
wi = peso de observaciòn i
Datos agrupados
• El calculo de la media pondera puede ser usado para obtener aproximaciones
al promedio, varianza, y desviación estándar de datos agrupados.
• Para calcular la media ponderada, tratamos el punto medio de cada clase
como si fuera la media de todos los elementos en la clase.
• Calculamos una media ponderada de los puntos medios utilizando las
frecuencias de la clase como pesos.
• Similarmente, al calcular la varianza y desviación estándar las frecuencias de
las clases son utilizadas como pesos.
Media para datos agrupados
• Muestra
x
fM i i
f i
• Población
fM i i
donde:
fi = Frecuencia de la clase i
Mi = punto medio de la clase i
Ejemplo: departamentos en renta
Abajo está la muestra de las rentas mensuales para departamentos de una
recamara presentados aquí como datos agrupados en la forma de distribución
de frecuencias
f ( M x ) 2
s2 i i
n 1
• Población
f ( M ) 2
2 i i
N
Ejemplo: departamentos en renta
• Varianza para datos agrupados
s2 3, 017.89
s 3, 017.89 54. 94
Esta aproximación difiere en solo $.20
de la desviación estándar de $54.74.