Vous êtes sur la page 1sur 27

MEDIDAS DE DISPERSION,

ASIMETRIA Y
APUNTAMIENTO

• Estadística para ingenieros


MEDIDAS DE DISPERSIÓN
Son medidas que se emplean para determinar el grado de
variabilidad o de dispersión de los datos numéricos con
respecto a un promedio (media aritmética)

La elaboración de tablas, graficas y la aplicación de


medidas de tendencia central, no son suficientes en el
análisis de las característica de las unidades en una
población. Se necesita de alguna medida adecuada, que
permita mostrar como se distribuyen o se dispersan los
datos alrededor del promedio.
Por ejemplo: Los valores: 5, 50, 95 tienen igual media
aritmética y mediana que los valores 49, 50, 51; sin embargo
para la primera información = 50 se encuentra muy
alejada de los valores extremos 5 y 95 cosa que no ocurre con
la segunda información.
Concluimos que la primera información es mas heterogénea o
dispersa que la segunda.

Las medidas de dispersión son:


Rango o recorrido
Desviación media
Varianza y desviación típica
Coeficiente de variabilidad
RANGO O RECORRIDO
Es la medida de dispersión mas fácil de calcular ya que solo
considera los valores extremos de una de una colección de
datos y se establece su diferencia
Rango o recorrido = Xmax – Xmin
El rango para la primera información R1 = 95 – 5 = 90
El rango para la segunda información R2 = 51 – 49 = 2
Nos podemos dar cuenta que la información 1 es mas dispersa
que la información 2
Estos resultados dan una idea cruda de la dispersión o variación
de los datos puesto que se ha aplicado una medida engañosa, al
eliminar los demás valores ubicados entre el valor mínimo y el
máximo que toma la variable; por tal razón su uso es bastante
limitado y solo se utiliza en ocasiones en donde se quiere tener
una idea rápida de la variación en un grupo de datos
DESVIACIÓN MEDIA (DM)
La desviación media es un índice que hace intervenir las
diferencias o desviaciones entre los valores de la variable (Xi) y
la media aritmética de una distribución de datos , Tomadas
en valor absoluto
∑│Xi - Ẋ│

Se denomina desviación media a la media aritmética de los


valores absolutos de las desviaciones

DM = ∑│Xi - Ẋ│ para datos sin agrupar


n

DM = ∑│Xi - Ẋ│fi para datos agrupados


n
Donde :
Dm = Desviación media
Xi = Diferentes valores de la variable X
= Media aritmética
n = Tamaño de la muestra o numero total de datos
Fi = numero de veces que se repite Xi

Calculo de la desviación media

1. Cuando la información esta sin agrupar


a) Calcular de la distribución de datos
b) Calcular la desviación (Xi - Ẋ ) entre cada dato
c) Calcular los valores absolutos de la desviación │Xi - Ẋ│
d) Sumar los valores absolutos de las desviaciones ∑│Xi - Ẋ│
e) Dividir esa sumatoria por el numero de datos
Ej: Calcular DM de la distribución de los siguientes datos

32, 32, 34, 31, 36, 33, 35, 37, 34, 38, 32

a) Ẋ = ∑ Xi =
n
los pasos b, c y d se organizan en la siguiente tabla
Xi Xi - Ẋ ∑│Xi - Ẋ│
32 32 – 34 = -2 2
32 32 – 34 = - 2 2
34 34 – 34 = 0 0
31 -3 3
36 2 2
33 -1 1
35 1 1
37 3 3
34 0 0
38 4 4
32 -2 2

Total 20
DM = ∑│Xi - Ẋ│ = 20 / 11 = 1.81
n
2. Cuando a información esta agrupada por una distribución de frecuencia
simple.

En el paso C se hay un pequeño cambio: se multiplica los valores absolutos de las


desviaciones por la frecuencia

Utilizando los datos anteriores tenemos calculamos la Ẋ = ∑ Xi fi = 34


n

Xi fi Xi - Ẋ ∑│Xi - Ẋ│fi
31 1 31 – 34 = -3 3
32 3 32 – 34 = - 2 6
33 1 33 – 34 = -1 1
34 2 0 0
35 1 1 1
36 1 2 2
37 1 3 3
38 1 4 4
Total 11 20
DM = ∑│Xi - Ẋ│fi = 20 / 11 = 1.81
n
Lo que significa que cada uno de los valores de la variable se
diferencia en promedio de la media aritmética en 1.81, como
el valor es pequeño la información es homogéneo o la
dispersión es pequeña

3. Cuando a información esta agrupada por una distribución


de frecuencia por intervalos.

Los cálculos se realizan igual que el anterior pero Xi son las


marcas de clase
LA VARIANZA (S2) – DESVIACION TIPICA (S)
La varianza es una medida muy conocida y usada, su
importancia radica especialmente en que da origen a otra
medida de dispersión mucho mas significativa, denominada
desviación típica o estándar.
La varianza obvia los signos negativos elevando las diferencias al
cuadrado lo que la hace supremamente útil en el ajuste de
modelos estadísticos que generalmente conllevan a formas
cuadráticas.
La varianza se define como la media aritmética de los cuadrados
de las desviaciones respecto a la media aritmética

S2 = ∑(Xi - Ẋ) 2fi para datos agrupados


n
S2 = ∑(Xi - Ẋ) 2 para datos sin agrupar
n
Ejemplo: Se tienen los salarios/dia de 50 obreros de la pavimentación de la
Cra 6 .

Xi (miles fi xifi Xi - Ẋ (Xi - Ẋ) 2 (Xi - Ẋ) 2fi


$)
50 1 50*1= 50 50 – 54.1= -4.1 (-4.1)2 = 16.81 16.81*1 = 16.81
51 3
52 5
53 9
54 12
55 10
56 5
57 3
58 2
Sumas 50

S2 = ∑(Xi - Ẋ) 2fi = 160.50/50 = 3.21


n
Ejemplo: Se tienen los salarios/dia de 50 obreros de la pavimentación de la
Cra 6 .

Xi (miles fi xifi Xi - Ẋ (Xi - Ẋ) 2 (Xi - Ẋ) 2fi


$)
50 1 50*1= 50 50 – 54.1= -4.1 (-4.1)2 = 16.81 16.81*1 = 16.81
51 3 51*3= 153 50 - 54.1 = -3.1 (-3.1)2 = 9.61 9.61*3 = 28.83
52 5 260 -2.1 4.41 22.05
53 9 477 -1.1 1.21 10.89
54 12 648 -0.1 0.01 0.12
55 10 550 0.9 0.81 8.10
56 5 280 1.9 3.61 10.05
57 3 171 2.9 8.41 25.23
58 2 116 3.9 15.21 30.42
Sumas 50 2075 160.50

S2 = ∑(Xi - Ẋ) 2fi = 160.50/50 = 3.21


n
• Como los datos están expresados en miles de pesos y la varianza
se encuentra en forma cuadrática obtenemos una varianza de
3´210.000 pesos, para una mayor comprensión se debe recurrir a
la desviación típica o estándar definida como la raíz cuadrada de
la varianza

• S= S2 = ∑(Xi - Ẋ) 2fi = 3´210.000


n
S = 1791

El error estándar es de 1791 pesos diarios


Para el ejercicio de la resistencia de las baldosa tenemos

Intervalo Xi fi Xi*fi (Xi - Ẋ) 2 (Xi - Ẋ) 2fi


KG/cm2
100-200 150 4 600 -298 355216

200-300 250 10 2500 -198 392040

300-400 350 21 7350 -98 201684

400-500 450 33 14850 2 132

500-600 550 18 9900 102 187272

600-700 650 9 5850 202 367236

700-800 750 5 3750 302 456020

100 44800 1959600

S= 1959600/100 = 140 kg/cm2


COEFICIENTE DE VARIACIÓN (CV)

Este coeficiente se obtiene dividiendo la desviación típica por su


media aritmética expresando el resultado en términos
porcentuales

CV = S * 100

El coeficiente de variación se emplea cuando se desea comparar
dos o mas distribuciones o variables con le fin de determinar
cual de ellas tiene mayor o menor variabilidad o dispersión

Su uso se hace necesario cuando dichas distribuciones están


dadas en unidades de medidas diferentes
Comparando la homogeneidad de las dos informaciones
anteriores las cuales tiene diferente unidad de medida

Para el caso del salario

CV = 1791 pesos/dia = 0.033 == 3.3%


54100 pesos/dia

Para la resistencia de las baldosas

CV = 140 Kg/cm2 = 0.3125 == 31.25%


448 kG/Cm2

Concluimos que es mucho mas dispersa la información


correspondiente a la resistencia de las baldosas
ASIMETRIA
Algunas distribuciones estadísticas son asimétricas, es decir falta
de simetría, lo cual se pone en evidencia efectuando la
representación grafica de la distribución (polígono o diagrama
de frecuencia)

En una distribución simétrica se tiene que Ẋ = Me = Mo

La distribución es asimétrica positiva cuando Mo < Me < Ẋ,


presentando la curva un alargamiento hacia la derecha

Sera asimétrica negativa cuando el alargamiento de la curva se


produce hacia la izquierda en este caso Mo > Me > Ẋ.
Simétrica Asimétrica positiva

• +

Me Mo Me Ẋ

Mo

Asimétrica negativa

-
X Me Mo
las formulas para calcular el grado de asimetría entre otras son

a) As = 3 (Ẋ - Me)
s

Donde:
As = Grado de asimetría
Ẋ = media aritmética
Me = mediana
S = Desviación estándar
• Los resultados al aplicar las formulas anteriores se interpretan asi:

• As = 0 la distribución es simétrica (As = 0)


• As > 0 La distribución es asimétrica positiva ( As > 0)
• As < 0 La distribución es asimétrica negativa (As < 0)

• Por ejemplo: se tienen los siguientes datos


Xi fi Xi*Fi Xi - Ẋ (Xi - Ẋ) 2 (Xi - Ẋ) 2fi

2 4 8 -3,3 10,89 43.56


4 6 24 -1.3 1,6 9.6
6 5 30 0.7 0,49 2.45
8 3 24 2.7 7,29 21.87
10 2 20 4,7 22,09 44.18
Suma 20 106 121.66
Ẋ = 106/20 = 5,3 ; Me = (4 + 6)/2 = 5;

S2 = 6,1 S = 2.47

Aplicando la primera formula tenemos:


a) As = 3 (Ẋ - Me) = 3(5,3- 5) = 0.36
s 2,47

Lo que indica que As > 0 la distribución es asimétrica positiva.


También se puede definir dado que

Mo < Me < Ẋ 4 < 5 < 5,3


APUNTAMIENTO O CURTOSIS
Una característica importante de la variación, en algunas
distribuciones, es el grado de agudeza en la cima de la curva que
la representa. Esta agudeza que por lo general se observa en la
moda, puede ser mas alta que la alcanzada en una distribución
normal

Si la curva es mas plana que la normal se dice que la distribución


es achatada o platicúrtica.
Si es mas aguda que la normal recibe el nombre de apuntada o
leptocúrtica
En el caso que sea normal se denomina mesocúrtica
• La curtosis es una medida de la altura de la curva y por tanto,
estará dada por el cuarto momento respecto a la media dividida
por la varianza elevada al cuadrado

• Ap = m4 = m4
• (S2)2 S4

• Si Ap = 3 la distribución es normal o mesocúrtica


• Ap > 3 la distribución es apuntada o leptocúrtica
• AP < 3 la distribución es achatada o platicúrtica.
• Por ejemplo: se tienen los siguientes datos

Xi fi Xi - Ẋ (Xi - Ẋ) 2 (Xi - Ẋ) 3 (Xi - Ẋ) 4 (Xi - Ẋ) 4fi

2 4 -3,3 10,89 -35,94 118,59 474,36


4 6 -1,3 1,6 -2,20 2.86 17,14
6 5 0.7 0,49 -0,34 0,24 1,20
8 3 2,7 7,29 19,68 53,14 159,43
10 2 4,7 22,09 103,82 487,96 975,93
Suma 20 1628,06
Calculo del grado de apuntamiento en la distribución dada en la
tabla anterior
La varianza para esta distribución es S2 = 6,11 y

m4 = ∑(Xi - Ẋ) 4fi = 1628,06 = 81,40


n 20
Por otra parte (S2)2 = (6,11)2 = 37,33 luego se reemplaza en la
formula
• Ap = m4 = 81,40 = 2.18
• (S2)2 37.33

Como 2.18 < 3 la curva será achatada o plasticústica


Taller
La siguiente distribución de datos corresponde a las velocidades
(Km/h) de 50 vehículos tomadas en la carretera Quibdó – Yuto.
Calcular: Desviación media, varianza y desviación típica, grado
de asimetría y apuntamiento de la curva (la simetria debe
calcular con la formula). Se debe graficar la distribución de los
datos

72 73 74 70 76 77 78 70 80 81

69 70 71 57 73 74 75 67 77 78

74 75 76 62 78 79 80 72 82 80

66 67 68 54 70 71 72 64 74 75

73 74 75 61 77 78 79 71 81 82
Muchas gracias

Vous aimerez peut-être aussi