Vous êtes sur la page 1sur 3

2=

MEDIDAS DE DISPERSIN N

Un promedio no dice nada acerca de la diseminacin de los Donde:


datos. El promedio no es representativo cuando se tiene una
amplia dispersin. Se puede comparar cun dispersas estn
2 smbolo de variancia poblacional, X valor de una
dos o ms distribuciones.
observacin de poblacin, N nmero total de observaciones
en la citada poblacin
Una medida de dispersin puede utilizarse para evaluar la
confiabilidad de dos o ms promedios.
media aritmtica de la poblacin

Medidas de dispersin:
La variancia es difcil de interpretar a causa de las unidades.

Varias medidas de dispersin:


La Desviacin Estndar Poblacional es el promedio de las
desviaciones respecto de la media, se presenta en las mismas
Amplitud de Variacin: Tal intervalo especial se unidades que los datos. Frmula:
utiliza ampliamente en las aplicaciones del control
estadstico de procesos. ( X - )2

AMPLITUD DE VARIACIN = VALOR MS GRANDE - =


VALOR MS PEQUEO
N
Desviacin media: Es la media aritmtica de los
valores absolutos de las desviaciones con respecto a ( X - X )2
la media aritmtica.
Variancia Muestral s2 =
/X-X/
n-1
DESVIACIN MEDIA DM =
Donde:
n
X valor de las observaciones en la muestra
Donde:
X media de la muestra
X valor de cada observacin , X media aritmtica de los
valores, un nmero de observaciones de la muestra
N nmero total de observaciones de la muestra

/ / valor absoluto
Puede demostrarse que:

No se consideran los signos de las desviaciones respecto de la


media dado que las desviaciones positivas y negativas se ( X - X )2 = X2 - (X)2/ n
compensaran exactamente y la desviacin media siempre
sera cero. Cero es un dato estadstico intil. Frmula operativa de la variancia muestral:

Dos ventajas: X2 - (X)2/ n

Utiliza en su clculo todos los valores de la muestra. s2 =

n-1
Fcil de comprender pues es el promedio en que los
valores se desvan con respecto a la media.
La Desviacin Estndar Muestral se utiliza como un
estimador, es la raz cuadrada de la variancia muestral:
Desventaja:

X2 - (X)2/ n
El uso de valores absolutos.
s=
Variancia y Desviacin Estndar: se basan en las
desviaciones al cuadrado con respecto a la media. n-1

Variancia: la media aritmtica de las desviaciones Medidas de dispersin para datos agrupados en
cuadrticas con respecto al a media distribucin de frecuencias:

La Variancia Poblacional para datos no agrupados o para Amplitud de Variacin: se resta el lmite inferior de
datos no tabulados en una distribucin de frecuencias se
la clase ms pequea del lmite superior de la clase
calcula como:
mayor.

" ( X - )2
Desviacin estndar: para datos no agrupados. 99,7%
Frmula:
Si una distribucin es simtrica con forma de
fX2 - (fX)2/ n campana, prcticamente todas las observaciones se
encuentran entre la media ms o menos tres
desviaciones estndares.
s=

Dispersin Relativa:
n-1

Karl Pearson (1857-1936) desarroll una medida


Donde:
relativa denominada coeficiente de variacin(CV). Es
una medida til cuando:
S desviacin estndar muestral

Los datos estn en unidades diferentes(como U$S y


X punto medio de la clase das de asistencia).

f frecuencia de clase
Los datos estn en la mismas unidades, pero las
medias muy distantes (ingresos de superiores e
n nmero total de observaciones en la muestra ingresos de empleados).

Para encontrar la desviacin de los datos agrupados o Coeficiente de variacin: es la razn


en una distribucin de frecuencias se produce:
(cociente) de la desviacin estndar a la
media aritmtica, expresada como un
Paso 1. Cada frecuencia de clase se multiplica por porcentaje:
su punto medio.
s
Paso 2. Se calcula fX2, esto podra explicarse como
fX. X.
CV = (100)

Paso 3. Se suman las columnas fX y fX2..


X

Interpretacin y usos de la desviacin Karl Pearson desarroll tb una medida para evaluar
estndar: el grado de orientacin al sesgo, denominada
coeficiente de asimetra (CA):
La desviacin estndar se emplea como una medida
para comparar la dispersin en dos o ms conjuntos 3 ( media - mediana)
de observaciones.
CA =
o Teorema de Chebyshev: Para un conjunto
cualquiera de observaciones (muestra o Desviacin Estndar
poblacin), la proporcin mnima de los
valores que se encuentran dentro de k
desviaciones estndares desde la media es Otras medidas de dispersin:
al menos 1 - 1/k2, donde k es una
constante mayor que 1.
Un mtodo es determinar la ubicacin de los valores
que dividen un conjunto de observaciones en partes
o Regla emprica: Para una distribucin de iguales. Estas medidas son:
frecuencias simtrica de campana,
aproximadamente 68% de las
observaciones estar a ms y menos una o Los cuartiles, que dividen un conjunto de
desviacin estndar desde la media, observaciones en 4 partes iguales(conjuntos
aproximadamente 95% de tales ordenados de menor a mayor). El primer
observaciones se encontrar a ms y menos cuartil (Q1) es el valor abajo del cual se
dos desviaciones estndares de la misma; y encuentra el 25% de las observaciones, y, el
prcticamente todas las observaciones tercer cuartil (Q3) es el valor por abajo del
(99,7%)se hallarn a ms y menos tres cual se encuentra el 75% de las
desviaciones con respecto a la media. observaciones. Q2 es la mediana.

Forma grfica: o Los deciles dividen un conjunto de


observaciones en 10 partes iguales.
Curva simtrica de campana que muestra las
relaciones entre la desviacin estndar y la o Los centiles se utilizan para reportar
media resultados acerca de ciertas pruebas
nacionales estandarizadas, empleado para
-3s -2s -1s X 1s 2s 3s calificar la admisin a programas.

70 80 90 100 110 120 130 Cuartiles, Deciles y Centiles ( o Porcentiles):

68% Para formalizar el procedimiento, sea Lp la


ubicacindel centil deseado.
95%
Ej: porcentil 33 L33 . El nmero de observaciones es
n. Entonces se aplica: (n +1) /2

Ubicacin de un centil Lp = (n +1) P/100

o Diagramas de caja: representacin grfica


basada en cuartiles, que ayuda a ilustrar un
conjunto de dato. Se necesitan 5 valores
estadsticos: el valor mnimo; Q1 ; la
mediana; Q3 ; y el valor mximo.

Mediana

Q1 Q3

Valor mnimo Valor Mximo

La distancia entre los extremos de la caja se


denomina amplitud cuartlica ( o intercuartlica).
Dicho intervalo es la distancia entre el primero y el
tercer cuartiles.

Se indican dos asteriscos (**) . Uno indica n dato


impropio. Un dato incongruente es un valor
inconsciente con el resto de los datos. Es como aquel
valor que ms de 1,5 veces el valor de la amplitud
intercuartlica, mayor que Q3 o bien, menor que Q1.

Dato incongruente = Q1 - 1,5 (Q3 - Q1)