Académique Documents
Professionnel Documents
Culture Documents
Medidas numricas
Medidas de Resumen
Cuartiles
Media Aritmtica Rango Sesgo
Moda Varianza
Desviacin Estndar
Coeficiente de Variacin
Media Aritmtica
X i
X1 X2 Xn
X i1
n n
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Media = 3 Media = 4
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5
Mediana
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Mediana = 3 Mediana = 3
Hallando la Mediana
La localizacin de la mediana:
n 1
Posicin de la Mediana posicin en la data ordenada
2
Si el nmero de valores es impar, la mediana es el nmero en el
medio
Si el nmero de valores es par, la mediana es el promedio de los dos
nmeros del medio
n 1
Note que no es el valor de la mediana, solo la posicin
2
de la mediana en la data ordenada
Moda
Una medida de tendencia central
El valor que ocurre ms frecuentemente
No est afectado por los valores extremos
Se utiliza tanto para datos numricos como
categricos (nominales)
Es posible que no haya una moda
Pueden haber varias modas
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
Ejemplo de Repaso
$2,000,000 $500 K
500,000 $300 K
300,000
100,000
100,000
$100 K
$100 K
Precios de las
Media: ($3,000,000/5)
casas: = $600,000
$2,000,000
500,000
300,000 Mediana: valor medio de datos
100,000
100,000 ordenados
Suma $3,000,000 = $300,000
Percentiles
Percentiles
Cuartiles
Los cuartiles dividen la data ordenada en 4 segmentos con
igual nmero de valores por segmento
Q1 Q2 Q3
Cuartiles
Ejemplo: Encuentre el primer cuartil
Datos de la muestra en arreglo ordenado:
11 12 13 16 16 17 18 21 22
(n = 9)
Q1 est en la posicin (9+1)/4 = 2.5 de la data ordenada,
entonces, utilizar el valor en medio del 2do y 3er valor,
entonces Q1 = 12.5
Cuartiles (continuacin)
Ejemplo:
Data muestral en arreglo ordenado: 11 12 13 16 16 17 18 21 22
(n = 9)
Q1 est en la posicin (9+1)/4 = 2.5 de la data ordenada,
entonces Q1 = 12.5
Variacin
Rango
Ejemplo:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Rango = 14 - 1 = 13
7 8 9 10 11 12 7 8 9 10 11 12
Rango = 12 - 7 = 5 Rango = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Rango = 120 - 1 = 119
Rango Intercuartil
Rango Intercuartil
Ejemplo:
Mediana X
X Q1 Q3 mximo
mnimo (Q2)
25% 25% 25% 25%
12 30 45 57 70
Rango Intercuartil
= 57 30 = 27
Varianza
(X X)
Varianza de la muestra: 2
i
S 2 i1
n -1
Donde X = media
n = tamao de la muestra
Xi = isimo valor de la variable X
Jos Antonio RoblesOctober 2016
Flores 1, 26
Anlisis de Datos para la Gerencia
Desviacin Estndar
n
Desviacin estndar
de la muestra:
(X X) i
2
S i1
n -1
Ejemplo de clculo:
Desviacin estndar de la muestra
Data de la
Muestra (Xi) : 10 12 14 15 17 18 18 24
n=8 Media = X = 16
Midiendo la variabilidad
Data A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 3.338
Data B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926
Data C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 4.567
Coeficiente de Variacin
S
CV 100%
X
Jos Antonio RoblesOctober 2016
Flores 1, 32
Anlisis de Datos para la Gerencia
Medidas de Distribucin
Forma de la distribucin
Valores (o puntuaciones) z
El Teorema de Chebyshev
La Regla Emprica
Deteccin de valores extremos (atpicos)
Forma de la Distribucin
.35 Sesgo = 0
.30
Frecuencia Relativa
.25
.20
.15
.10
.05
0
.25
.20
.15
.10
.05
0
.25
.20
.15
.10
.05
0
.25
.20
.15
.10
.05
0
.25
.20
.15
.10
.05
0
Valores Z
XX
Z
S
Jos Antonio RoblesOctober 2016
Flores 1, 43
Anlisis de Datos para la Gerencia
Valores Z (continuacin)
Ejemplo:
Si la media es 14.0 y la desviacin estndar es 3.0,
cul es el valor Z para el valor 18.5?
X X 18.5 14.0
Z 1.5
S 3.0
El valor 18.5 est 1.5 desviaciones estndar por
encima de la media
(un valor Z negativo significa que un valor es menor
que la media)
Jos Antonio RoblesOctober 2016
Flores 1, 44
Anlisis de Datos para la Gerencia
Al menos dentro de
(1 - 1/12) x 100% = 0% ..... z=1 ( 1)
(1 - 1/22) x 100% = 75% ........ z=2 ( 2)
(1 - 1/32) x 100% = 89% . z=3 ( 3)
La Regla Emprica
68%
1
Jos Antonio RoblesOctober 2016
Flores 1, 46
Anlisis de Datos para la Gerencia
La Regla Emprica
95% 99.7%
2 3
Ejemplo:
Minimum
Mnimo 1st
1er Median 3rd
Mediana 3er Maximum
Mximo
Minimum Quartile
1st
Cuartil Median Quartile
3rd
Cuartil Maximum
Quartile Quartile
La Forma de la Distribucin y
el Grfico de Caja y Bigote
Sesgo a la Sesgo a la
Izquierda Simtrica Derecha
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Min Q1 Q2 Q3 Max
0 2 2 2 3 3 4 5 5 10 27
00 22 33 55 27
27
La data est sesgada a la derecha, como lo
muestra el grfico
Jos Antonio RoblesOctober 2016
Flores 1, 51
Anlisis de Datos para la Gerencia
La Covarianza de la Muestra
La covarianza de la muestra:
( X X)( Y Y)
i i
cov ( X , Y ) i1
n 1
Slo se preocupa por el grado de relacin
No se implica un efecto causal (relacin causal)
Interpretando la Covarianza
Coeficiente de Correlacin
cov (X , Y)
r
SX SY
donde
n
(X X)(Y Y)
n n
i i (X X)
i
2
i
(Y Y ) 2
cov (X , Y) i1
SX i1
SY i1
n 1 n 1 n 1
Jos Antonio RoblesOctober 2016
Flores 1, 56
Anlisis de Datos para la Gerencia
Caractersticas del
Coeficiente de Correlacin, r
No tiene unidades
El rango est entre 1 y 1
A medida que se acerca a 1, ms fuerte la relacin
lineal negativa
A medida que se acerca a 1, ms fuerte la relacin
lineal positiva
A medida que se acerca a 0, ms dbil la relacin lineal
X X X
r = -1 r = -.6 r=0
Y
Y Y
X X X
r = +1 r = +.3 r=0
Jos Antonio RoblesOctober 2016
Flores 1, 58
Anlisis de Datos para la Gerencia
Interpretando el Resultado
Diagrama de Dispersin de los
r = .733 Puntajes de Examen
100
95
Puntaje Examen #2
Hay una relativa
90
relacin lineal fuerte
entre el puntaje del 85
examen #1 y el puntaje 80
del examen #2 75
70
70 75 80 85 90 95 100
Puntaje Examen #1
Consideraciones ticas
Referencias