Académique Documents
Professionnel Documents
Culture Documents
Mediana
Media aritmtica
L a m edia a r it m t ic a e s e l va lo r o bte ni do
al sum a r to do s lo s dat o s y dividir e l r e sultado entr e
e lnm er o to tal de dat o s .
Cuartiles
Lo s c ua rt il es so n lo s tr es va lor e s de la
var iable divide n a un c o njunt o de da to s
or dena do s e nc ua tr o pa rt e s igua le s .
.
Clculo de los cuartiles para datos agrupados
En pr ime r lu gar busca mo s la c la se do nde se
e ncue ntra
ac um ula da s .
, e n la t a bla de la s fr ec uenc ia s
Deciles
Lo s dec il es so n lo s nuev e va lo r es que divide n la se r ie
de dat o s e n diez pa r t es igua les .
Clculo de de ciles
Or de na mo s lo s dat o s de m eno r a m a yor .
B uscamo s la p untu aci n, e n la se r ie , o la clase , e n la
tabla de las fr e cue ncias acumula das, do nde se
e ncue ntra
, .
Percentiles
Desviacin media
,.
Varianza
Desviacin tpica
L a desvia c i n tpic a e s la r a z c ua dr a da de la
var ia nz a .
Para simpli ficar e l clcu lo vamo s o uti liz ar las sig uie nte s
e xpre sio ne s que so n e quivale nte s a las ante r io re s.
Puntuaciones diferenciales
Puntuaciones tpicas
L as punt ua c io nes tpic a s so n e l re sul tado
de dividir las punt ua c io ne s difer enc ia le s e ntr e
la desv ia c i n t pic a . Es te pr o ce so se llama t ipif ic a c i n .
Distribuciones bidimensionales
Covarianza
Ms formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la variable en
cuestin, el valor medio vendr dado por:
Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene
como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.
En el ejemplo anterior la varianza sera:
Sx2=
La desviacin tpica (S) es la raz cuadrada de la varianza. Expresa la dispersin de la distribucin y se
expresa en las mismas unidades de medida de la variable. La desviacin tpica es la medida de
dispersin ms utilizada en estadstica.
Aunque esta frmula de la desviacin tpica muestral es correcta, en la prctica, la estadstica nos
interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el
valor n-1.
Por tanto, la medida que se utiliza es la cuasidesviacin tpica, dada por:
Aunque en muchos contextos se utiliza el trmino de desviacin tpica para referirse a ambas
expresiones.
En los clculos del ejercicio previo, la desviacin tpica muestral, que tiene como denominador n, el valor
sera 20.678. A efectos de clculo lo haremos como n-1 y el resultado seria 21,79.
El haber cambiado el denominador de n por n-1 est en relacin al hecho de que esta segunda frmula es
una estimacin ms precisa de ladesviacin estndar verdadera de la poblacin y posee las
propiedades que necesitamos para realizar inferencias a la poblacin.
Cuando se quieren sealar valores extremos en una distribucin de datos, se suele utilizar la amplitud
como medida de dispersin. La amplitud es la diferencia entre el valor mayor y el menor de la distribucin.
Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65.
Como medidas de variabilidad ms importantes, conviene destacar algunas caractersticas de la varianza
y desviacin tpica:
Son ndices que describen la variabilidad o dispersin y por tanto cuando los datos estn
muy alejados de la media, el numerador de sus frmulas ser grande y la varianza y la
desviacin tpica lo sern.
Al aumentar el tamao de la muestra, disminuye la varianza y la desviacin tpica. Para
reducir a la mitad la desviacin tpica, la muestra se tiene que multiplicar por 4.
Cuando todos los datos de la distribucin son iguales, la varianza y la desviacin tpica son
iguales a 0.
Para su clculo se utilizan todos los datos de la distribucin; por tanto, cualquier cambio de
valor ser detectado.
Otra medida que se suele utilizar es el coeficiente de variacin (CV). Es una medida de dispersin
relativa de los datos y se calcula dividiendo la desviacin tpica muestral por la media y multiplicando el
cociente por 100. Su utilidad estriba en que nos permite comparar la dispersin o variabilidad de dos o
ms grupos. As, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es
de 69,6 kg. y su desviacin tpica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mmHg)
cuya media es de 166 mmHg y su desviacin tpica de 21,3. La pregunta sera: qu distribucin es ms
dispersa, el peso o la tensin arterial? Si comparamos las desviaciones tpicas observamos que la
desviacin tpica de la tensin arterial es mucho mayor; sin embargo, no podemos comparar dos variables
que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variacin:
CV de la variable peso =
CV de la variable TAS =
A la vista de los resultados, observamos que la variable peso tiene mayor dispersin.
Cuando los datos se distribuyen de forma simtrica (y ya hemos dicho que esto ocurre cuando los valores
de su media y mediana estn prximos), se usan para describir esa variable su media y desviacin tpica.
En el caso de distribuciones asimtricas, la mediana y la amplitud son medidas ms adecuadas. En este
caso, se suelen utilizar adems los cuartiles y percentiles.
Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posicin. El percentil
es el valor de la variable que indica el porcentaje de una distribucin que es igual o menor a esa cifra.
As, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de s al 80% del
total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de s el 25%,
50% y el 75% del total de las puntuaciones y as tenemos por tanto el primer cuartil (Q1), el segundo (Q2)
y el tercer cuartil (Q3).