Académique Documents
Professionnel Documents
Culture Documents
Sesiones 3 y 4:
Resumen numrico
de los datos
Medidas de Correlacin
Estadstica Sumaria
Descripcin Numrica de
Datos
Tendencia Central
Dispersin
Media Aritmetica
Rango
Mediana
Rango Intercuartil
Moda
Varianza
Desviacin
Estndar
Coeficiente de Variacin
Estadstica Sumaria
Tendencia Central
Media
Mediana
Moda
x
i 1
Promedio
Aritmtico
Punto medio
de los Datos
Ordenados
Valor
observado
frecuentemente
Media aritmtica
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes muestras
Desventajas:
Se ve afectada por los datos extremos.
0 1 2 3 4 5 6 7 8 9 10
Media = 3
0 1 2 3 4 5 6 7 8 9 10
Media = 4
Media ponderada
k
w X
i
i 1
i 1
w x
i 1
k
w
i 1
Media aritmtica en la
cual se considera a
cada uno de los
valores
de
las
variables de acuerdo
con su importancia
relativa en el grupo.
Media geomtrica
De n nmeros positivos
es la raz n-sima del
producto
de
los
n
nmeros.
Para
promediar
porcentajes, ndices y
cifras relativas.
Determinar el incremento
porcentual promedio en
ventas, produccin, etc.
G N X 1 X 2 X 3 .. X n
G
N 1
Valoralfinal
1
Valoralinicio
Mediana
Punto medio de
valores despus
ordenarlos.
Es un promedio
posicin.
No es afectada
valores extremos.
los
de
Med
X N2 0.5
DatosNoAgrupados
de
por
Med
Li
2 faA
i
f i
DatosAgrupados
Mediana
Reglas
1 Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
Ejemplo: 5, 10, 10, 12, 15, 17, 20, 21, 24
2 Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18 23
mediana
20.5
2
Mediana
Ventajas:
Los valores extremos no afectan a la mediana como
en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
Moda
Valor que ms se repite
en un conjunto de datos.
No es afectada por
valores extremos.
Para datos discretos es
fcil de calcular.
No puede ser calculada
exactamente en una dist.
de frecuencias.
Mo
Li
d 1
d 1 d 2
DatosAgrupados
Moda
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27
7, 12, 15, 18, 25, 30, 31, 38
14
Moda
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores externos
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribucin amodal).
En otros casos la distribucin tiene varias modas, lo
que dificulta su interpretacin.
O
B
S
E
R
V
A
C
I
N
D
A
T
O
S
2
,
2
4
,
2
5
,
2
6
,
2
7
,
2
8
,
E
D
A
D
8
9
3
0
3
1
3
3
4
,
.
2
,
9
,
1
,
,
1
2
,
IM
N
G
R
E
S
O
E
N
1
2
3
1
2
.
5
3
1
3
.
5
8
6
,
9
7
IT
L
E
S
D
E
$
3
9
,
4
0
,
4
1
,
4
,
4
1
,
4
1
A
L
A
ZPT
O
S422335
Seleccin del promedio apropiado
Formulacin
semejante a la
mediana.
F j X jn F 0.5
DatosNoAgrupados
jn faA
i
F
F j Lij
f
ij
DatosAgrupados
Medidas de dispersin
Dispersin
Rango
Desviacin
Media
Varianza
Desviacin
Estandard
Coeficiente
de Variacin
Informacin sobre la
variabilidad de los
datos.
Mismo centro,
Diferente variacin
Rango o recorrido
R V . max V . min.
DatosNoAgrupados
R
Ls ( A) Li ( B)
DatosAgrupados
Diferencia entre el
valor mayor y el
valor menor de un
conjunto de datos.
No est afectado
por los valores
comprendidos
entre los extremos.
Rango o recorrido
Ventajas
fcil de calcular
fcil de entender e interpretar
Desventajas
slo considera los valores extremos
no toma en cuenta ni el nmero de datos ni el valor
de estos
0 1 2 3 4 5 6 7 8 9 10 11 12
Rango = 14 - 1 = 13
13 14
Desviacin media
N
Xi
DM i 1
N
DatosNoAgrupados
N
f i Xi
DM i 1
N
DatosAgrupados
Varianza
N
i 1
Poblacion
n
xi x
S 2 i 1
Muestra
n1
Desviacin estndar
N
X i
i 1
Poblacion
n
xi x
i 1
Muestra
n1
Es la raz cuadrada
positiva de la varianza.
Unidades originales.
Permite medir el % de
elementos dentro de
intervalos de una curva
simtrica.
Puntaje estndar (Z).
11
12
Media = 15.5
s = 3.338
13
14
15
16
17
18
19
20 21
Datos B
Media = 15.5
11
12
13
14
15
16
17
18
19
20 21
s = .9258
Datos C
Media = 15.5
11
12
13
14
15
16
17
18
19
20 21
s = 4.57
-3
-3
-2
-2
-1
-1
+1
+1
+2
+2
+3
+3
95%
99.7%
13.60%
2.135%
2.135%
0.135%
0.135%
-3
-2
-1
68.26%
95.46%
99.73%
+1
+2
+3
Coeficiente de variacin
Indica
la
magnitud
relativa de la desviacin
estndar con respecto a
la media aritmtica.
Comparacin
de
distribuciones.
CV *100
Poblacion
S
CV *100
x
Muestra
Coeficiente de variacin
CV
Grado de Variablidad
0 < CV < 10 Datos muy homogneos
Datos regularmente
10 CV < 15 homogneos
Datos regularmente
15 CV < 20 variables
20 CV < 25 Datos variables
Datos muy variables
CV 25
CuartoCurtosis
Momento
Mesocurtica = 0
Leptocurtica > 0
Platicurtica < 0
Coeficiente de Curtosis
K>0
K=0
K<0
Y ' a bX
Y' 0 1 X
X31254
Y9571410
Y na b X ;
2
XY
a
X
b
X
a Y bX
XY nXY
b
2
2
n
X
X
Recta de regresin
Y
Valor
Efectivo
Y
Y=2.7+2.1X
Valor
Estimado
S y .x
Y Y '
S y .x
n2
2
a ( Y ) b ( XY )
n2
XY nXY
2
2
2
2
( X nX )( Y nY )
Correlacin
Negativa
Perfecta
Ninguna
Correlacin
Correlacin
Negativa
Moderada
-1
Correlacin
Positiva
Perfecta
0.5
Correlacin negativa
Correlacin
Positiva
Moderada
0
0.5
Correlacin positiva
r = -1
r = -.6
r=0
Y
X
r = +1
X
r = +.3
X
r=0
Variaciones
Variacin
Total
Variacin no
Explicada
Variacin
Explicada
Var. Total
r2
2
(
Y
'
Y
)
2
(
Y
Y
)
a Y b XY nY 2
2
2
Y
nY
0 r
9
1
9
5
9
3
9
8
9
7
9
7
8
8
9
4
8
9
9
0
9
2
9
5
Distancia
Recorrida (x)
3
3
1
2
1
8
6
6
3
7
2
9
1
5
1
0
Estadstica
Prof. Juan Narro Lavi
Diplomatura de Estudio
en
Gestin de Operaciones