Académique Documents
Professionnel Documents
Culture Documents
Medidas Descriptivas
Para condensar y describir los datos se utilizan las medidas de
tendencia central , las medidas de dispersin y las medidas de
asimetra y forma.
En una curva simtrica una lnea vertical que pase por el punto ms alto de la curva divide
el rea en dos partes iguales.
En una curva sesgada los valores de su distribucin de frecuencias estn concentrados
en el extremo inferior o en el superior de la escala de medicin horizontal.
Medidas Descriptivas
Y Posicin
Media Rango Sesgo
Mediana Desviacin Tpica Curtosis
Cuartiles Coeficiente de
Deciles Variacin
Percentiles
Tendencia Central o de Posicin
Media aritmtica
Media aritmtica ponderada
Media geomtrica
Media armnica
Media Aritmtica o Promedio Aritmtico
X
i 1
N
i
( Poblacin)
Media aritmtica para datos de una muestra
x
x
i
i 1 ( Muestra )
n
Recordando el concepto de datos agrupados..
X i fi
Para la poblacin i 1
m
i 1
fi
Para la muestra
X i fi
X i 1
m
i 1
fi
As, dados los nmeros a1,a2, ... , an, (NO AGRUPADOS) la media
armnica ser igual a:
m
f
i 1
i
M . Armnica
m 1
* fi
i 1 X i
1
M Geomtrica (( X 1 f i ) * ( X 2 f 2 ) * ........( X m f m )) n
OTROS TIPOS DE MEDIA
n1 n2 n3 nn 1
M .G. ( X 1 X 2 X 3 ........ X n ) n
Por ejemplo, la media geomtrica de 2 y 18 es
Desventajas:
o:
No presenta el problema de estar influido por los valores extremos, pero en cambio
no utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor
por el nmero de veces que se ha repetido).
CLCULO DE LA MEDIANA
d1
Mo LRI *w
( d1 d 2 )
UNIMODAL
BIMODAL
MULTIMODAL
Ventajas y desventajas de la moda:
La moda, al igual que la mediana, se puede utilizar como una posicin central para datos
tanto cualitativos como cuantitativos.
Tambin, al igual que la mediana, la moda no se ve mayormente afectada por los valores
extremos. Incluso si los valores extremos son muy altos o muy bajos, se escoge el valor
ms frecuente del conjunto de datos como el valor modal.
Se puede utilizar la moda sin importar qu tan grandes o qu tan pequeos sean los
valores del conjunto de datos, e independientemente de cul sea su dispersin.
Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene
valores que se presenten ms de una vez.
En otras ocasiones, cada valor es la moda, pues cada uno de ellos se presenta el mismo
nmero de veces.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil
es precisamente la mediana. El primer cuartil, es el valor en el cual o por
debajo del cual queda un cuarto (25%) de todos los valores de la
sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo
del cual quedan las tres cuartas partes (75%) de los datos.
Rango
Desviacin media
Varianza
Desviacin estndar
Coeficiente de Variacin
Importancia de la dispersin
Proporciona informacin adicional que permite juzgar la
confiabilidad de la medida de tendencia central. Si los datos se
encuentran ampliamente dispersos, la posicin central es menos
representativa de los datos.
N
2
(Xi )
2
Poblacin i 1
2
(X i X) 2
Muestra S i 1
n 1
Clculo de Desviacin Estndar Datos No Agrupados
N
(X i ) 2
Poblacin i 1
N
(X i X) 2
Muestra S i 1
n 1
Ecuaciones para el clculo de la
varianza y la desviacin estndar para
datos agrupados
SIMBOLOGIA
ESTADISTICAS POBLACION MUESTRA
DESCRIPTIVAS
VARIANZA
2 2
S
DESVIACION
S
STANDARD
Para un conjunto de datos de una poblacin que se agrupa en una distribucin de
frecuencias
CLASES MC (Xi) fi ( X i ) ( X i ) fi
2 2
1 X1 f1 ( X 1 ) 2 ( X 1 ) 2 f1
2 X2 f2 (X 2 ) 2
( X 2 ) 2
f2
3 X3 f3 ( X 3 )2 ( X 3 )2 f3
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
m Xm fm . .
m m
Totales f
i 1
i (X
i 1
i ) f i
2
DE LOS DATOS DE LA TABLA ANTERIOR SE
OBTIENE EL CLCULO DE LA VARIANZA DE LA
POBLACIN POR LA EXPRESIN:
m 2
(Xi ) fi
2 i 1
m
f
i 1 i
CLCULO DE LA DESVIACIN ESTNDAR
DE LA POBLACIN
m 2
(Xi ) fi
i 1
m
f
i 1 i
Para datos de una muestra
CLASES MC (Xi) fi ( X i X ) ( X i X ) fi
2 2
1 X1 f1 ( X 1 X ) ( X 1 X ) f1
2 2
2 X2 f2 ( X 2 X ) ( X 2 X )2 f2
2
3 X3 f3 ( X 3 X )2 ( X 3 X )2 f3
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
m Xm fm . .
m m
Totales f
i 1
i (X
i 1
i X ) f i
2
CLCULO DE LA VARIANZA DE LA MUESTRA
m
2
( xi x ) f i
2 i 1
S m
f 1 n 1
i 1 i
Por qu utilizamos n 1 como denominador en lugar de n? Los especialistas en estadstica
pueden demostrar que si tomamos muchas muestras de una poblacin dada, si encontramos
la varianza de la muestra para cada muestra y promediamos los resultados, entonces este
promedio no tiende a tomar el valor de la varianza de la poblacin, a menos que tomemos n
1 como denominador de los clculos.
CLCULO DE LA DESVIACIN ESTNDAR
DE LA MUESTRA
m 2
( xi x ) f i
S i 1
m
f 1
i 1 i
Usos de la desviacin estndar
Teorema de Tchebysheff
Lo que necesitamos es una medida relativa que nos proporcione una estimacin de
la magnitud de la desviacin con respecto a la magnitud de la media. El coeficiente
de variacin es una de estas medidas relativas de dispersin. Se relaciona la
desviacin estndar y la media, expresando la desviacin estndar como porcentaje
de la media.
Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.
S
Mide la desviacin tpica en forma de CV
qu tamao tiene con respecto a la media
Tambin se la denomina variabilidad relativa. x
Es frecuente mostrarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25%
(variabilidad relativa)
PARA LA POBLACION
CV
S
PARA LA MUESTRA
cv
X
SIMBOLOGI
A POBLACION
ESTADISTICAS MUESTRA
DESCRIPTIVAS
MEDIA
x
VARIANZA
2 2
S
DESVIACION
S
STANDARD
COEFICIENTE cv
CV
DE VARIACION
Otras Medidas de Dispersin
0.75
0.5
0.25
Recorrido o rango
intercuartlico
0
Las medidas de forma permiten conocer que forma tiene la curva que representa la
serie de datos de la muestra. Forma es el patrn de distribucin de los valores de los
datos a travs del rango de todos los valores.
Asimetra: mide si la curva tiene una forma simtrica, es decir, si respecto al centro de
la misma (centro de simetra) los segmentos de curva que quedan a derecha e izquierda
son similares.
Las curvas simtricas, tienen una forma tal que una lnea vertical que pase
por el punto ms alto de la curva dividir el rea de sta en dos partes iguales.
Cada parte es una imagen espejo de la otra.
g2 = 0 (distribucin mesocrtica)
.
g2 > 0 (distribucin leptocrtica)
.
g2 < 0 (distribucin platicrtica
140
300
200
120
100 200
100
80
Frecuencia
100
Frecuencia
Frecuencia
60
0
40 0
27 37 45 53 61 69 77 85 93
45 48 51 54 57 60 63 66 69 72 75 78 81 84 3 27 37 47 57 67 77 87 97 108
32 41 49 57 65 73 81 89 99
16 32 42 52 62 72 82 92 102 138
Platicrtica
Mesocrtica
Leptocrtica
Cmo seleccionar una medida de tendencia que represente los datos?
En una distribucin positivamente sesgada (es decir, sesgada hacia la derecha), la moda todava
se encuentra en el punto ms alto de la distribucin, la mediana est hacia la derecha de la moda
y la media se encuentra todava ms a la derecha de la moda y la mediana.
Cuando la poblacin est sesgada negativa o positivamente, con frecuencia la mediana resulta
ser la mejor medida de posicin, debido a que siempre est entre la moda y la media. La mediana
no se ve altamente influida por la frecuencia de aparicin de un solo valor como es el caso de la
moda, ni se distorsiona con la presencia de valores extremos como la media.
Resumiendo