Vous êtes sur la page 1sur 65

Anlisis de Datos para la Gerencia

CURSO: Anlisis de Datos para la Gerencia

Jos Antonio Robles Flores

Sistemas de Informacin y Mtodos Cuantitativos


ESAN Graduate School of Business
Lima - Peru

Basado en: Levine; Krehbiel & Berenson 2014.


Estadstica para Administracin 6ta Edicin.
Pearson.

Jos Antonio RoblesOctober 2016


Flores 1, 1
Anlisis de Datos para la Gerencia

CURSO: Anlisis Cuantitativo para la Gerencia

SESIN 02: Medidas Numricas Descriptivas


(Captulo 03)

Basado en: Levine; Krehbiel & Berenson 2014. Estadstica para


Administracin 6ta Edicin. Pearson.

Jos Antonio RoblesOctober 2016


Flores 1, 2
Anlisis de Datos para la Gerencia

Medidas numricas

Medidas de posicin (o localizacin)


Media
Mediana
Moda
Percentiles
Cuartiles
Medidas de Variabilidad
Rango
Rango intercuartiles (intercuartlico)
Varianza
Desviacin Estndar
Coeficiente de Variacin
Forma
Sesgo
Jos Antonio RoblesOctober 2016
Flores 1, 3
Anlisis de Datos para la Gerencia

Medidas de Resumen

Descripcin Numrica de la Data

Tendencia Central Percentiles Variabilidad Forma

Cuartiles
Media Aritmtica Rango Sesgo

Mediana Rango Intercuartiles

Moda Varianza

Desviacin Estndar

Coeficiente de Variacin

Jos Antonio RoblesOctober 2016


Flores 1, 4
Anlisis de Datos para la Gerencia

Media Aritmtica

La media aritmtica (media de la muestra) es la


medida de tendencia central ms comn

Para una muestra de tamao n: (para la poblacin:


n

X i
X1 X2 Xn
X i1

n n

Tamao de la muestra Valores observados


Jos Antonio RoblesOctober 2016
Flores 1, 5
Anlisis de Datos para la Gerencia

La Media Aritmtica (continuacin)

La medida de tendencia central ms comn


Media = suma de valores dividido entre el nmero de
valores
Se ve afectada por los valores extremos (outliers)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Media = 3 Media = 4
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5

Jos Antonio RoblesOctober 2016


Flores 1, 6
Anlisis de Datos para la Gerencia

Mediana

En un arreglo ordenado, la mediana es el nmero


en el medio (50% por arriba, 50% por debajo)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Mediana = 3 Mediana = 3

No se ve afectada por los valores extremos

Jos Antonio RoblesOctober 2016


Flores 1, 7
Anlisis de Datos para la Gerencia

Hallando la Mediana

La localizacin de la mediana:

n 1
Posicin de la Mediana posicin en la data ordenada
2
Si el nmero de valores es impar, la mediana es el nmero en el
medio
Si el nmero de valores es par, la mediana es el promedio de los dos
nmeros del medio

n 1
Note que no es el valor de la mediana, solo la posicin
2
de la mediana en la data ordenada

Jos Antonio RoblesOctober 2016


Flores 1, 8
Anlisis de Datos para la Gerencia

Moda
Una medida de tendencia central
El valor que ocurre ms frecuentemente
No est afectado por los valores extremos
Se utiliza tanto para datos numricos como
categricos (nominales)
Es posible que no haya una moda
Pueden haber varias modas

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

Moda = 9 No hay Moda


Jos Antonio RoblesOctober 2016
Flores 1, 9
Anlisis de Datos para la Gerencia

Ejemplo de Repaso

Cinco casas de playa en una loma


$2,000 K
Precios de la
Casas:

$2,000,000 $500 K
500,000 $300 K
300,000
100,000
100,000
$100 K

$100 K

Jos Antonio RoblesOctober 2016


Flores 1, 10
Anlisis de Datos para la Gerencia

Ejemplo de Repaso: Estadsticas de Resumen

Precios de las
Media: ($3,000,000/5)
casas: = $600,000
$2,000,000
500,000
300,000 Mediana: valor medio de datos
100,000
100,000 ordenados
Suma $3,000,000 = $300,000

Moda: el valor ms frecuente


= $100,000

Jos Antonio RoblesOctober 2016


Flores 1, 11
Anlisis de Datos para la Gerencia

Qu medida de ubicacin es la mejor?

La media es la que generalmente se


utiliza a menos que hallan valores
extremos (outliers).
Luego, la mediana es la ms utilizada,
puesto que la mediana no es sensible a
los valores extremos.
Ejemplo: La mediana de los precios de las
casas es un valor que se puede reportar
para una regin es menos sensible a los
valores extremos

Jos Antonio RoblesOctober 2016


Flores 1, 12
Anlisis de Datos para la Gerencia

Percentiles

Un percentil proporciona informacin sobre la


distribucin de los datos en el intervalo de los datos
(del valor menor al valor mayor).
Por ejemplo, los resultados del GMAT (o del
examen de admisin a ESAN) se reportan en
trminos de percentiles.
El p-simo percentil es un valor tal que por lo menos
p por ciento de las observaciones es menor o igual
a este valor y por lo menos (100-p) es mayor o igual
a ese valor.
Jos Antonio RoblesOctober 2016
Flores 1, 13
Anlisis de Datos para la Gerencia

Percentiles

Ordenar los datos en orden ascendente.

Computar el ndice i, la posicin del p-simo percentil


i = (p/100)n

Si i no es un entero, redondear. El p-simo percentil


es el valor en la i-sima posicin.

Si i es un entero, el p-simopercentil es el promedio


de los valores en las posiciones i e i+1.

Jos Antonio RoblesOctober 2016


Flores 1, 14
Anlisis de Datos para la Gerencia

Ejemplo para el percentil 80


Ejemplo: Alquiler de Departamentos
i = (p/100)n = (80/100)70 = 56
Promediando los valores de los datos 56avo y 57avo:
Percentil 80 = (535 + 549)/2 = 542
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Nota: Los datos estn en orden ascendente.

Jos Antonio RoblesOctober 2016


Flores 1, 15
Anlisis de Datos para la Gerencia

Ejemplo para el percentil 80


Ejemplo: Alquiler de Departamentos
Por lo menos el 80% de Por lo menos el 20% de
los tems toman un los tems toman un
valor de 542 o menos valor de 542 o ms
56/70 = .8 or 80% 14/70 = .2 or 20%
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615

Jos Antonio RoblesOctober 2016


Flores 1, 16
Anlisis de Datos para la Gerencia

Cuartiles
Los cuartiles dividen la data ordenada en 4 segmentos con
igual nmero de valores por segmento

25% 25% 25% 25%

Q1 Q2 Q3

El primer cuartil, Q1, es el valor para el cual 25% de las


observaciones son ms pequeas y 75% ms grandes
Q2 es igual a la mediana (50% ms pequeas, 50% ms
grandes)
Slo 25% de las observaciones son ms grandes que el
tercer cuartil

Jos Antonio RoblesOctober 2016


Flores 1, 17
Anlisis de Datos para la Gerencia

Frmulas para los cuartiles

Encontrar un cuartil determinando el valor en la posicin


apropiada en la data ordenada, donde

Posicin del primer cuartil: Q1 = (n+1)/4

Posicin del segundo cuartil: Q2 = (n+1)/2 (posicin de la mediana)

Posicin del tercer cuartil: Q3 = 3(n+1)/4

donde n es el nmero de valores observados

Jos Antonio RoblesOctober 2016


Flores 1, 18
Anlisis de Datos para la Gerencia

Cuartiles
Ejemplo: Encuentre el primer cuartil
Datos de la muestra en arreglo ordenado:
11 12 13 16 16 17 18 21 22

(n = 9)
Q1 est en la posicin (9+1)/4 = 2.5 de la data ordenada,
entonces, utilizar el valor en medio del 2do y 3er valor,

entonces Q1 = 12.5

Q1 y Q3 son medidas de ubicacin no-central


Q2 = mediana, una medida de tendencia central

Jos Antonio RoblesOctober 2016


Flores 1, 19
Anlisis de Datos para la Gerencia

Cuartiles (continuacin)

Ejemplo:
Data muestral en arreglo ordenado: 11 12 13 16 16 17 18 21 22

(n = 9)
Q1 est en la posicin (9+1)/4 = 2.5 de la data ordenada,
entonces Q1 = 12.5

Q2 est en la posicin (9+1)/2 = 5th de la data ordenada,


entonces Q2 = mediana = 16

Q3 est en la posicin 3(9+1)/4 = 7.5 de la data ordenada,


entonces Q3 = 19.5
Jos Antonio RoblesOctober 2016
Flores 1, 20
Anlisis de Datos para la Gerencia

Medidas de Variacin (o Variabilidad)

Variacin

Rango Rango Varianza Desviacin Coeficiente


Intercuartil Estndar de Variacin

Las medidas de variacin


brindan informacin
respecto a la dispersin o
variabilidad de los valores
de la data
Mismo centro,
diferente variacin
Jos Antonio RoblesOctober 2016
Flores 1, 21
Anlisis de Datos para la Gerencia

Rango

La medida de variacin ms simple


La diferencia entre los valores ms grande y
ms pequeo en un conjunto de datos:

Rango = Xms grande Xms pequeo

Ejemplo:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Rango = 14 - 1 = 13

Jos Antonio RoblesOctober 2016


Flores 1, 22
Anlisis de Datos para la Gerencia

Desventajas del Rango


Ignora la forma en que la data est distribuida

7 8 9 10 11 12 7 8 9 10 11 12
Rango = 12 - 7 = 5 Rango = 12 - 7 = 5

Sensible a los valores extremos


1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Rango = 5 - 1 = 4

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Rango = 120 - 1 = 119

Jos Antonio RoblesOctober 2016


Flores 1, 23
Anlisis de Datos para la Gerencia

Rango Intercuartil

Puede eliminar algunos problemas de valores


extremos utilizando el rango intercuartil

Eliminar algunas observaciones grandes y


pequeas y calcular el rango de los valores
que quedan

Rango Intercuartil = 3er cuartil 1er cuartil


= Q3 Q1

Jos Antonio RoblesOctober 2016


Flores 1, 24
Anlisis de Datos para la Gerencia

Rango Intercuartil

Ejemplo:
Mediana X
X Q1 Q3 mximo
mnimo (Q2)
25% 25% 25% 25%

12 30 45 57 70

Rango Intercuartil
= 57 30 = 27

Jos Antonio RoblesOctober 2016


Flores 1, 25
Anlisis de Datos para la Gerencia

Varianza

Promedio (aproximadamente) del cuadrado de las


desviaciones de los valores desde la media

(X X)
Varianza de la muestra: 2
i
S 2 i1
n -1
Donde X = media
n = tamao de la muestra
Xi = isimo valor de la variable X
Jos Antonio RoblesOctober 2016
Flores 1, 26
Anlisis de Datos para la Gerencia

Desviacin Estndar

La medida de variabilidad ms utilizada


Muestra la variacin sobre la media
Es la raz cuadrada de la varianza
Tiene las mismas unidades que la data original

n
Desviacin estndar
de la muestra:
(X X) i
2

S i1
n -1

Jos Antonio RoblesOctober 2016


Flores 1, 27
Anlisis de Datos para la Gerencia

Ejemplo de clculo:
Desviacin estndar de la muestra
Data de la
Muestra (Xi) : 10 12 14 15 17 18 18 24
n=8 Media = X = 16

(10 X ) 2 (12 X ) 2 (14 X) 2 (24 X ) 2


S
n 1

(10 16) 2 (12 16) 2 (14 16) 2 (24 16) 2



8 1

130 Medida de la dispersin promedio


4.3095 alrededor de la media
7
Jos Antonio RoblesOctober 2016
Flores 1, 28
Anlisis de Datos para la Gerencia

Midiendo la variabilidad

Desviacin estndar pequea

Desviacin estndar grande

Jos Antonio RoblesOctober 2016


Flores 1, 29
Anlisis de Datos para la Gerencia

Comparando Desviaciones Estndar

Data A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 3.338

Data B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926
Data C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 4.567

Jos Antonio RoblesOctober 2016


Flores 1, 30
Anlisis de Datos para la Gerencia

Ventajas de la Varianza y la Desviacin Estndar

Todos los valores en el conjunto de datos se utilizan


en el clculo

Los valores distantes de la media tienen un peso


extra
(porque las desviaciones de la media estn elevadas al
cuadrado)

Jos Antonio RoblesOctober 2016


Flores 1, 31
Anlisis de Datos para la Gerencia

Coeficiente de Variacin

Mide la variacin relativa


Siempre en porcentajes (%)
Muestra la variacin relativa a la media
Puede utilizarse para comparar dos o ms
conjuntos de datos medidos en diferentes unidades

S
CV 100%
X
Jos Antonio RoblesOctober 2016
Flores 1, 32
Anlisis de Datos para la Gerencia

Comparando coeficientes de variacin


Accin A:
Precio promedio el ao pasado = $50
Desviacin estndar = $5
S $5

CVA 100% 100% 10%
X $50 Ambas
Accin B: acciones tienen
la misma
Precio promedio el ao pasado = $100 desviacin
estndar, pero
Desviacin estndar = $5 la accin B es
menos variable
S $5
CVB 100%
en relacin a su
100% 5% precio
X $100
Jos Antonio RoblesOctober 2016
Flores 1, 33
Anlisis de Datos para la Gerencia

Medidas de Distribucin

Forma de la distribucin
Valores (o puntuaciones) z
El Teorema de Chebyshev
La Regla Emprica
Deteccin de valores extremos (atpicos)

Jos Antonio RoblesOctober 2016


Flores 1, 34
Anlisis de Datos para la Gerencia

Forma de la Distribucin

Describe cmo est distribuida la data


Medidas de la forma
Simtrica o sesgada
Sesgada a la Simtrica Sesgada a la
Izquierda Derecha
Media < Mediana Media = Mediana Mediana < Media

Jos Antonio RoblesOctober 2016


Flores 1, 35
Anlisis de Datos para la Gerencia

Forma de la Distribucin: Sesgo

Una medida importante de la forma de una distribucin


es llamada sesgo.
La frmula para el sesgo de una muestra de datos es:
3
n xi x
Sesgo
(n 1 )(n 2 ) s

El sesgo es computado por un paquete estadstico.

Jos Antonio RoblesOctober 2016


Flores 1, 36
Anlisis de Datos para la Gerencia

Forma de la Distribucin: Sesgo


Simtrica (no hay sesgo)
Sesgo es cero.
La media y la mediana son iguales.

.35 Sesgo = 0
.30
Frecuencia Relativa

.25
.20
.15
.10
.05
0

Jos Antonio RoblesOctober 2016


Flores 1, 37
Anlisis de Datos para la Gerencia

Forma de la Distribucin: Sesgo


Moderadamente sesgada a la izquierda
Sesgo es negativo.
La media ser usualmente menos que la mediana.

.35 Sesgo = .31


.30
Frecuencia Relativa

.25
.20
.15
.10
.05
0

Jos Antonio RoblesOctober 2016


Flores 1, 38
Anlisis de Datos para la Gerencia

Forma de la Distribucin: Sesgo


Moderadamente sesgada a la derecha
Sesgo es positivo
La media usualmente ser ms que la mediana.

.35 Sesgo = .31


.30
Frecuencia Relativa

.25
.20
.15
.10
.05
0

Jos Antonio RoblesOctober 2016


Flores 1, 39
Anlisis de Datos para la Gerencia

Forma de la Distribucin: Sesgo


Altamente sesgada a la derecha
El sesgo es positivo (usualmente mayor a 1.0).
La media usualmente ser ms que la mediana.

.35 Sesgo = 1.25


.30
Frecuencia Relativa

.25
.20
.15
.10
.05
0

Jos Antonio RoblesOctober 2016


Flores 1, 40
Anlisis de Datos para la Gerencia

Forma de la Distribucin: Sesgo


Ejemplo: Alquiler de Departamentos
Setenta departamentos fueron aleatoriamente
muestreados. El precio de alquiler mensual para los
departamentos aparece abajo en orden ascendente.
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615

Jos Antonio RoblesOctober 2016


Flores 1, 41
Anlisis de Datos para la Gerencia

Forma de la Distribucin: Sesgo


Ejemplo: Alquiler de Departamentos

.35 Sesgo = .92


.30
Frecuencia Relativa

.25

.20
.15

.10
.05
0

Jos Antonio RoblesOctober 2016


Flores 1, 42
Anlisis de Datos para la Gerencia

Valores Z

Una medida de la distancia hacia la media (por ejemplo, un


valor Z de 2.0 significa que un valor est a 2.0 desviaciones
estndar de la media)
La diferencia entre un valor y la media, dividida entre la
desviacin estndar
Un valor Z por encima de 3.0 o por debajo de -3.0 se
considera un valor extremo (outlier)

XX
Z
S
Jos Antonio RoblesOctober 2016
Flores 1, 43
Anlisis de Datos para la Gerencia

Valores Z (continuacin)

Ejemplo:
Si la media es 14.0 y la desviacin estndar es 3.0,
cul es el valor Z para el valor 18.5?

X X 18.5 14.0
Z 1.5
S 3.0
El valor 18.5 est 1.5 desviaciones estndar por
encima de la media
(un valor Z negativo significa que un valor es menor
que la media)
Jos Antonio RoblesOctober 2016
Flores 1, 44
Anlisis de Datos para la Gerencia

El Teorema (la regla) de Chebyshev

Independientemente de cmo est distribuida la


data, al menos (1 - 1/z2) x 100% de los valores
estarn dentro de z desviaciones estndar de la
media (para z > 1)
Ejemplos:

Al menos dentro de
(1 - 1/12) x 100% = 0% ..... z=1 ( 1)
(1 - 1/22) x 100% = 75% ........ z=2 ( 2)
(1 - 1/32) x 100% = 89% . z=3 ( 3)

Jos Antonio RoblesOctober 2016


Flores 1, 45
Anlisis de Datos para la Gerencia

La Regla Emprica

Si la distribucin de la data tiene


aproximadamente la forma de campana,
entonces el intervalo:
1 contiene aproximadamente el 68% de los
valores en la poblacin o la muestra

68%


1
Jos Antonio RoblesOctober 2016
Flores 1, 46
Anlisis de Datos para la Gerencia

La Regla Emprica

2 contiene aproximadamente el 95% de


los valores en la poblacin o la muestra
3 contiene aproximadamente el 99.7% de
los valores en la poblacin o la muestra

95% 99.7%

2 3

Jos Antonio RoblesOctober 2016


Flores 1, 47
Anlisis de Datos para la Gerencia

Anlisis Exploratorio de la Data

Grfico de Caja y Bigote: Una representacin visual


de la data utilizando el resumen de 5 nmeros:

Mnimo -- Q1 -- Mediana -- Q3 -- Mximo

Ejemplo:

25% 25% 25% 25%

Minimum
Mnimo 1st
1er Median 3rd
Mediana 3er Maximum
Mximo
Minimum Quartile
1st
Cuartil Median Quartile
3rd
Cuartil Maximum
Quartile Quartile

Jos Antonio RoblesOctober 2016


Flores 1, 48
Anlisis de Datos para la Gerencia

Forma del Diagrama (Grfico) de Caja

La Caja y la lnea central estn centradas entre los


puntos finales si la data es simtrica alrededor de la
mediana

Min Q1 Mediana Q3 Max

Un grfico de caja puede mostrarse tanto en el


formato vertical como en el horizontal

Jos Antonio RoblesOctober 2016


Flores 1, 49
Anlisis de Datos para la Gerencia

La Forma de la Distribucin y
el Grfico de Caja y Bigote
Sesgo a la Sesgo a la
Izquierda Simtrica Derecha

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

Jos Antonio RoblesOctober 2016


Flores 1, 50
Anlisis de Datos para la Gerencia

Ejemplo de un grfico de caja y bigote

Grfico de caja para la siguiente data:

Min Q1 Q2 Q3 Max
0 2 2 2 3 3 4 5 5 10 27

00 22 33 55 27
27
La data est sesgada a la derecha, como lo
muestra el grfico
Jos Antonio RoblesOctober 2016
Flores 1, 51
Anlisis de Datos para la Gerencia

Diagrama de Caja (comparacin entre grupos)

Jos Antonio RoblesOctober 2016


Flores 1, 52
Anlisis de Datos para la Gerencia

Medidas de Asociacin entre dos variables

Hasta ahora hemos utilizado mtodos numricos


para una sola variable
Pero usualmente estamos interesados en conocer
la relacin entre dos variables para tomar
decisiones
Dos medidas de descripcin de las relaciones entre
dos variables son la covarianza y el coeficiente de
correlacin.

Jos Antonio RoblesOctober 2016


Flores 1, 53
Anlisis de Datos para la Gerencia

La Covarianza de la Muestra

La covarianza de la muestra mide el grado de relacin


lineal entre dos variables (llamado data bivariada)

La covarianza de la muestra:

( X X)( Y Y)
i i
cov ( X , Y ) i1
n 1
Slo se preocupa por el grado de relacin
No se implica un efecto causal (relacin causal)

Jos Antonio RoblesOctober 2016


Flores 1, 54
Anlisis de Datos para la Gerencia

Interpretando la Covarianza

Covarianza entre dos variables aleatorias:

cov(X,Y) > 0 X e Y tienden a moverse en la misma


direccin

cov(X,Y) < 0 X e Y tienden a moverse en direcciones


opuestas

cov(X,Y) = 0 X e Y son independientes

Jos Antonio RoblesOctober 2016


Flores 1, 55
Anlisis de Datos para la Gerencia

Coeficiente de Correlacin

Mide el grado relativo de relacin lineal entre


dos variables
Coeficiente de correlacin de la muestra:

cov (X , Y)
r
SX SY
donde
n

(X X)(Y Y)
n n
i i (X X)
i
2
i
(Y Y ) 2

cov (X , Y) i1
SX i1
SY i1
n 1 n 1 n 1
Jos Antonio RoblesOctober 2016
Flores 1, 56
Anlisis de Datos para la Gerencia

Caractersticas del
Coeficiente de Correlacin, r
No tiene unidades
El rango est entre 1 y 1
A medida que se acerca a 1, ms fuerte la relacin
lineal negativa
A medida que se acerca a 1, ms fuerte la relacin
lineal positiva
A medida que se acerca a 0, ms dbil la relacin lineal

Jos Antonio RoblesOctober 2016


Flores 1, 57
Anlisis de Datos para la Gerencia

Diagramas de Dispersin de Data con


Varios Coeficientes de Correlacin
Y Y Y

X X X
r = -1 r = -.6 r=0
Y
Y Y

X X X
r = +1 r = +.3 r=0
Jos Antonio RoblesOctober 2016
Flores 1, 58
Anlisis de Datos para la Gerencia

Utilizando Excel para encontrar


el Coeficiente de Correlacin
Seleccione Datos / Anlisis de Datos
Elegir Coeficiente de Correlacin del men de seleccin
Clic Aceptar . . .

Jos Antonio RoblesOctober 2016


Flores 1, 59
Anlisis de Datos para la Gerencia

Utilizando Excel para encontrar


el Coeficiente de Correlacin (continuacin)

Ingresar el rango de datos y


seleccionar la opcin
correspondiente
Clic Aceptar para obtener el
resultado
Jos Antonio RoblesOctober 2016
Flores 1, 60
Anlisis de Datos para la Gerencia

Interpretando el Resultado
Diagrama de Dispersin de los
r = .733 Puntajes de Examen
100

95

Puntaje Examen #2
Hay una relativa
90
relacin lineal fuerte
entre el puntaje del 85

examen #1 y el puntaje 80

del examen #2 75

70
70 75 80 85 90 95 100

Puntaje Examen #1

Los estudiantes que lograron un puntaje alto en el primer


examen tienden a obtener un puntaje alto en el segundo y
los estudiantes que obtuvieron un puntaje bajo en el primer
examen tienden a obtener puntajes bajos en el segundo
examen
Jos Antonio RoblesOctober 2016
Flores 1, 61
Anlisis de Datos para la Gerencia

Trampas y peligros en las


Medidas Numricas de Descripcin

El anlisis de datos es objetivo


Se debe reportar el resumen de medidas que mejor
describe los supuestos sobre el conjunto de datos

La interpretacin de la data es subjetiva


Debe realizarse de manera justa, neutral y clara

Jos Antonio RoblesOctober 2016


Flores 1, 62
Anlisis de Datos para la Gerencia

Consideraciones ticas

Las medidas numricas de descripcin:

Deben documentar resultados tanto buenos como


malos
Deben presentarse de manera justa, objetiva y
neutral
No debe utilizarse medidas de resumen
inapropiadas que distorsionen los hechos

Jos Antonio RoblesOctober 2016


Flores 1, 63
Anlisis de Datos para la Gerencia

Resumen del Captulo

Se describi las medidas de tendencia central


Media, mediana, moda, media geomtrica
Se discuti el concepto de cuartiles
Se describi las medidas de variabilidad
Rango, rango intercuartil, varianza y desviacin estndar, coeficiente de
variacin, valores Z
Se ilustr las formas de la distribucin
Simtrica, sesgada, grficos de caja y bigotes
Se discuti la covarianza y el coeficiente de correlacin
Se trataron las trampas y peligros en el uso de medidas numricas de
descripcin y algunas consideraciones ticas

Jos Antonio RoblesOctober 2016


Flores 1, 64
Anlisis de Datos para la Gerencia

Referencias

Levine; Krehbiel & Berenson 2014. Estadstica para


Administracin 6ta Edicin. Pearson.

Jos Antonio RoblesOctober 2016


Flores 1, 65

Vous aimerez peut-être aussi