Académique Documents
Professionnel Documents
Culture Documents
Estadstica I
Prof. Andrs Sandoval H
Estadstica I
2. MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN
Distribucin de frecuencias.
Distribucin de Frecuencias. Es un agrupamiento de datos en categoras
mutuamente excluyentes dando el nmero de observaciones en cada categora.
Los pasos para obtener una distribucin de frecuencia son los siguientes:
1) Determinar el nmero de clases que se quiere. Un mtodo para determinar
el nmero de clases es la regla 2 a la k. Esta regla sugiere seleccionar
como el nmero de clases el menor nmero (k), tal que 2 a la k sea mayor
que el nmero de datos (n).
2) Determinar el intervalo o la amplitud de clase. Generalmente el tamao de
la clase o del intervalo debe ser el mismo para todas las clases. Las clases
juntas deben abarcar por lo menos la distancia entre el menor valor de los
datos en bruto hasta el valor mayor. Expresado en la siguiente frmula:
i =HL/k
Donde:
i = intervalo de clase
H = mayor valor observado
L = menor valor observado
k = nmero de clases
Generalmente el resultado de la frmula se redondea a algn nmero
adecuado, como por ejemplo un mltiplo de 10 o de 100.
3) Fijar los lmites de cada clase. Se trata de fijar los lmites de cada clase de
modo que cada observacin se pueda colocar slo en una clase. Se deben
evitar los lmites de clase que sean poco claros o que se sobrepongan.
4) Poner una marca por cada observacin que quede en cada clase.
5) Contar en nmero de observaciones en cada clase (frecuencia de clase)
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
Media poblacional
= X
N
Dnde:
X
N
=
=
=
=
Media poblacional
Representa cualquier valor particular
Nmero de individuos en la poblacin
Indica la operacin de adicin
Media muestral
x = X
n
Dnde:
x
X
n
=
=
=
=
Media poblacional
Representa cualquier valor particular
Nmero de individuos en la poblacin
Indica la operacin de adicin
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
Otras medidas de tendencia central que se usa con frecuencia son la media
ponderada y la media geomtrica. A continuacin se da una breve explicacin de
ambas.
La media ponderada es un caso especial de la media aritmtica. Se presenta
cuando se tienen varios datos con un mismo valor, lo que puede ocurrir cuando
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
x = (wX)
w
Dnde:
x
X
=
=
=
=
Media poblacional
Representa cualquier valor particular
Indica la operacin de adicin
Indica el peso o nmero de repeticiones de cada valor
Media Geomtrica
GM =
Dnde:
GM = Media poblacional
X = Representa cualquier valor particular
n = Nmero de individuos en la poblacin
Esta misma medida de tendencia aplicada a problemas de incremento porcentual
promedio es como sigue:
Incremento porcentual
Promedio en el tiempo
GM =
-1
Medidas de dispersin
Las medidas de dispersin se utilizan para obtener informacin complementaria a
las medidas de tendencia central y miden la forma como se distribuyen los datos
que integran una poblacin o muestra. As, el rango se basa en la localizacin de
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
Varianza muestral
s2
( X )2
N
( X x )2
n -1
(frmula conceptual)
X
Varianza muestral
s2 =
( X )2
n
n -1
Desviacin estndar
La varianza tiene la desventaja de que sus valores son difciles de interpretar ya
que estn expresados en la unidad de medida de los datos que integran la
poblacin o muestra al cuadrado (p.e. litros al cuadrado, metros al cuadrado, aos
al cuadrado, etc.) Resulta obvio pensar que al calcular la raz cuadrada de la
varianza obtendremos valores expresados en la misma unidad de medida de que
los datos que nos interesan.
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
2
Desviacin estndar poblacional
=
Desviacin estndar muestral s
=
s2
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
Posicin de un percentil
Lp = ( n + 1 )
P
100
Donde:
P = posicin percentil que buscamos
n = nmero de observaciones
En los casos en los que frmula da como resultado un nmero no entero, la
posicin del cuartil se reportar movindose en la proporcin de la fraccin
resultante entre las posiciones correspondientes.
Asimetra y curtosis
La asimetra se refiere al grado de simetra que guarda la distribucin de un
conjunto de datos y se mide con el coeficiente de asimetra de Pearson.
Coeficiente de asimetra de Pearson
Sk = 3 ( Md )
Cuando Sk < 0, se dice que la distribucin tiene sesgo negativo y < Md < Mo
Cuando Sk > 0, se dice que la distribucin tiene sesgo positivo y Mo < Md <
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
Coeficiente de Curtosis C =
1
2
( Q3 Q1 )
( P90 P10 )
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
Universidad Panamericana
Estadstica I
Prof. Andrs Sandoval H
Regla emprica
f(z)
68%
95%
99%
-4
-3
-2
-1
0
z