Académique Documents
Professionnel Documents
Culture Documents
INDICE
Captulo 1: Introduccin. 5
1.1 Introduccin. 5
1.2 Clasificacin de la estadstica. 5
1.3 Poblacin y muestra. 6
1.4 Unidad elemental. 7
1.5 Variables. 7
1.6 Medidas de resumen. 8
1.8 Parmetro y estadgrafo 9
1.9 Ejercicios 10
2.1 Introduccin.
14
2.2 Resumen de datos cualitativos. 14
Diagrama de Pareto. 16
2.3 Resumen de datos cuantitativos. 18
2.4 Diagrama Tallo- Hojas 25
2.5 Problemas. 25
3.1 Introduccin. 37
3.2 Medidas de tendencia central. 37
3.2.1 Media aritmtica. 37
Media ponderada. 39
Media geomtrica. 42
3.2.2 Mediana. 45
3.2.3 Moda. 47
Anexo: Herramientas del Excel para el anlisis estadstico. 52
3.2.4 Cuantiles 54
Cuartiles. 54
Deciles. 54
Percentiles. 55
Procedimiento para el clculo de cuantilas (Datos no agrupados). 55
Procedimiento para el clculo de cuantilas (Datos agrupados). 56
3.3 Medidas de asimetra y curtosis 60
3.4 Diagrama de cajas. 62
3.3 Medidas de dispersin. 64
Rango 64
Rango intercuartil. 64
Varianza. 64
Desviacin estndar 65
Coeficiente de variacin. 66
Captulo 4: Regresin lineal 75
ESTADSTICA DESCRIPTIVA
Datos no Tabulados Datos Tabulados
X n1 n impar
2 n
2 Fi 1
1 Mediana
Me
21 X n X n n par
Me L i c
2 1
2 fi
d1
2 Moda El valor que ms se repite M 0 L i c
d1 d 2
d1 fi fi1
d 2 fi fi1
n k
3 Media Aritmtica xi x f i i
x i 1
x i 1
n n
n1x1 n 2 x 2 .... n k x k
4 Media Total xT
n1 n 2 .... n k
n
5 Media Geomtrica X G t FC1 x FC 2 x ... FCt Val proyect: Xp = (ultimo dato)(XG)
kn
i(n 1) 100 Fi 1
6 Percentiles Posicin del Percentil:
100 Pk L i c
fi
Li parte decimal ( Ld Li )
n k
7 Varianza Muestral:
x i2 nx 2 x 2
i f i nx 2
(S2)
S2 i 1
S2 i 1
n1 n1
k
11 Varianza Total
n (x i
2
i Vi (x))
VT (X) I 1
x T2
n
S
12 Coeficiente de CV *100
Variacin x
Estadstica 1
Captulo 1
1.1 Introduccin
El trmino estadstica se deriva de la palabra latina status, que significa estado. Los
primeros usos de la estadstica tienen que ver con la recopilacin de datos y la elaboracin
de grficas para describir diversos aspectos de un estado o un pas. En 1662, Jhon Graunt
public informacin estadstica acerca de los nacimientos y los decesos. Al trabajo de
Graunt siguieron estudios de tasas de mortalidad y de enfermedad, tamao de poblaciones,
ingresos y tasas de desempleo. En la actualidad los hogares, gobiernos y empresas se
apoyan en la estadstica para dirigir sus acciones.
Estadstica inferencial
La estadstica inferencial comprende un conjunto de mtodos y tcnicas que hacen posible
estimar una o ms caractersticas de una poblacin basados en el resultado de muestras. En
un procedimiento de esta naturaleza siempre existe la posibilidad de error, nunca podr
tenerse el 100% de seguridad sobre una afirmacin que se base en la inferencia estadstica.
Sin embargo, lo que hace que la estadstica sea una ciencia, separndola del arte de
adivinar la fortuna, es que existe una medida de confiabilidad medida en trminos de
probabilidad.
PROCESO ESTADSTICO
1.5 Variables
Una variable es una caracterstica observable que vara entre las unidades elementales
de una poblacin. La informacin que disponemos de cada unidad elemental es
resumida en variables.
Tipos de variables
7
Prof. Ing. Jorge Serna Fernndez
8
POBLACIONAL MUESTRAL
(Parmetro) (Estadstico
o Estadgrafo)
-Media x
Variables Cuantitativas: -Varianza 2 s2
-Desviacin estndar s
-Proporcin p
- etc
MEDIDAS DE RESUMEN
8
Prof. Ing. Jorge Serna Fernndez
9
Ejemplo:
9
Prof. Ing. Jorge Serna Fernndez
10
Variable Tipo
Banco preferido por un cliente X.
Prstamo bancario otorgado a un cliente (S/.).
Nmero de clientes que incurren en mora.
Tipo de tarjeta de crdito (clasic, gold, oro, platinum)
Ejemplos
Alpha Soft es una compaa que brinda servicios informticos a los bancos que
deseen tener una presencia firme en la red. Se dedica al tendido de redes LAN (Local
area network), instalacin de equipos, servidores, etc. Como parte de un estudio, se
analiza la informacin correspondiente a las siguientes variables:
Variable Tipo
I.
II.
III.
IV.
1.8 Ejercicios
1. La empresa BETA BUSINESS BANK llev a cabo un estudio entre los usuarios de
Banca por Internet en Lima para poder analizar el mercado de posibles compradores
a travs de este servicio. Como parte del estudio realizado se analiz la informacin
correspondiente a una muestra de 1500 usuarios con relacin a las siguientes variables:
variable.
2. WALLMART, la ms importante cadena de supermercados del mundo realiz un
estudio para determinar algunos indicadores socioeconmicos de los peruanos antes de
instalarse en el pas. El estudio se llev a a cabo aplicando encuestas a una muestra de
400 ciudadanos. Algunas de las preguntas del cuestionario fueron las siguientes:
11. Se realiza una votacin en el Distrito de SAN ISIDRO, donde el 50% de la poblacin
electoral son hombres, para determinar las preferencias de los electores durante una
eleccin presidencial. Con este fin se entrevistan 1600 electores registrados. De ellos el
40% estn a favor del Candidato A.
Del enunciado responda lo siguiente:
a) Qu constituye la muestra?
b) Indique la poblacin .
c) Identifique un parmetro :
d) Identifique un estadstico:
e) Cul es la variable en estudio? Indicar su tipo.
Captulo 2
Organizacin de Datos
2.1 Introduccin
Este captulo presenta algunos procedimientos bsicos para resumir un conjunto de
datos cualitativos y cuantitativos. Estos resmenes tabulares y grficos pueden verse en
informes anuales, artculos periodsticos y estudios de investigacin. De alguna manera
estamos familiarizados con este tipo de presentaciones por lo que es importante
comprender como se preparan y aprender a interpretarlos de forma correcta.
Diagrama de barras
Un diagrama de barras es una grfica para representar un conjunto de datos cualitativos
que se han resumido en una distribucin de frecuencias absolutas, relativas o
porcentuales. En uno de los ejes de la grfica, por lo general el eje horizontal, se
colocan las categoras de la variable y en el otro eje de la grfica (por lo general el eje
vertical) se pueden usar las frecuencias absolutas, relativas o porcentuales. Luego, se
construye una barra de ancho fijo en cada categora y cuya altura corresponda a la
frecuencia utilizada en el grfico. Las barras deben estar separadas para enfatizar el
hecho que las categoras no se superponen.
Ejemplo 2.2: El
diagrama de barras para
los datos del Ejemplo 2.1
se muestra a
continuacin.
Tanto la Tabla de frecuencias como cualquiera de los grficos, nos muestran que el banco
preferido es Scotiabank.
Prof. Ing. Jorge Serna Fernndez 16
17
X fi hi pi FI HI PI
1 4 0.1 10% 4 0.1 10%
2 14 0.35 35% 18 0.45 45%
3 10 0.25 25% 28 0.7 70%
4 8 0.2 20% 36 0.9 90%
5 2 0.05 5% 38 0.95 95%
6 2 0.05 5% 40 1 100%
TOTAL 40 1 100%
H3=
p4 =
F5 =
f3 =
P5 =
Diagrama de lneas
El diagrama de lneas, tambin llamado grfico de bastones o varas, es una
representacin grfica para un conjunto de datos cuantitativos discretos resumidos en
una distribucin de frecuencias. En el eje horizontal se colocan los diferentes valores
ordenados de la variable y en el eje vertical se pueden utilizar las frecuencias
absolutas, relativas o porcentuales. Este grfico se construye de manera similar al
diagrama de barras con la diferencia que en lugar de columnas se utilizan lneas.
Ejemplo 2.6: El diagrama de lneas para los datos del Ejemplo 2.5 se muestra a
continuacin.
4. Para evitar que una observacin pueda ser considerada en ms de un intervalo, cada
uno de los intervalos se considera abierto a la izquierda y cerrado a la derecha.
5. Finalmente, dado que los datos originales se pierden, ser necesario calcular un
valor que sea representativo de todas las observaciones que pertenecen a un
intervalo. A este valor se le denomina marca de clase y su clculo es:
Xi = (LIi + LSi) / 2
Ejemplo 2.8: La Superintendencia de Banca y Seguros hace un estudio sobre el monto
adeudado (en miles de soles) por los clientes del sistema financiero. Para ello selecciona
una muestra preliminar de 70 clientes.
8.05 8.51 8.65 8.68 8.72 8.78 8.80 8.80 8.82 8.82
8.83 9.14 9.19 9.27 9.35 9.36 9.37 9.39 9.43 9.48
9.49 9.54 9.55 9.55 9.60 9.63 9.64 9.70 9.70 9.73
9.75 9.80 9.80 9.84 9.84 9.85 9.87 9.87 9.87 9.95
9.95 9.97 9.98 10.00 10.01 10.01 10.02 10.03 10.03 10.05
10.05 10.05 10.05 10.09 10.10 10.12 10.12 10.12 10.15 10.15
10.15 10.15 10.25 10.26 10.26 10.28 10.29 10.31 10.32 10.55
Prof. Ing. Jorge Serna Fernndez 19
20
R 10, 55 8, 05 2, 5
7.1294 7 intervalos de clase
w 2, 5 7 0, 3571 0, 36
1. X2 , f3 , F4 , H5 , F6
X2 : 8,59 es el valor representativo del segundo intervalo.
f3 : 6 de los encuestados tienen una deuda mayor a S/.8,77 y a menor a S/.9,13.
F4 :20 de los encuetados tienen una deuda menor a S/.9,49 .
H5 :
F6 :
2. Cuntos personas tienen una deuda mayor a S/. 9,49 y menor o igual a S/. 10,21 ?
15 + 27 = 42 registros
Prof. Ing. Jorge Serna Fernndez 20
21
3. Se desea estimar que porcentaje de personas tienen una deuda mayor a S/.10,21?
1- H6= 1- 0,8857 = 0,1143 => 11,43%
TUTORIAL EN INTERNET PARA LA CONSTRUCCIN DE UNA TABLA DE FRECUENCIA DE
VARIABLE CUANTITATIVA CONTNUA:
http://youtu.be/zgZAS0HLz9s
Histograma
El histograma es la representacin por medio de barras rectangulares cuya base de cada
barra proporcional a la amplitud de la clase, su centro es la marca de clase y la altura
la su frecuencia absoluta o relativa simple. En el eje horizontal se coloca la variable
de inters y en el vertical la frecuencia correspondiente.
MONTO ADEUDADO
101,3 105,4 105,4 107,1 107,6 108,6 108,6 110,5 112,9 113,2
114,7 115,0 115,1 115,9 117,8 117,8 120,0 120,0 121,8 123,8
123,8 124,8 127,5 128,2 132,8 133,6 134,2 135,3 136,3 136,6
139,2 139,2 139,4 140,1 141,6 145,7 145,9 148,5 149,5 149,5
150,2 150,3 150,4 150,8 154,0 158,0 158,4 158,6 159,1 163,7
164,1 165,3 166,3 168,7 168,8 169,9 170,8 172,9 174,5 178,0
179,7 179,8 179,9 180,0 181,5 183,0 183,3 184,9 186,6 186,7
187,0 187,9 188,0 188,2 189,6 190,0 194,4 196,4 198,3 198,5
Prof. Ing. Jorge Serna Fernndez 21
22
Polgono de frecuencias
El polgono de frecuencias es una representacin grfica por medio de una figura
poligonal cerrada. Se obtiene uniendo con segmentos de recta el punto de interseccin
de cada marca de clase y su frecuencia relativa simple correspondiente.
El polgono de frecuencias para los datos agrupados del Ejemplo 2.8 se muestra a
continuacin.
40% 39%
Porcentaje
30%
21%
20% 13%
6% 9% 11%
10%
0% 1%
0% 0%
7.87 8.23 8.59 8.95 9.31 9.67 10.03 10.39 10.75
Monto adeudado (miles de S/.)
Fuente: Alpha System
Ojiva
La Ojiva es la representacin grfica para las frecuencias relativas acumuladas. Se
obtiene uniendo con segmentos de recta el punto de interseccin del lmite superior
de cada intervalo y su frecuencia relativa acumulada respectiva. La Ojiva permite
obtener, de manera aproximada, la proporcin de los datos que pertenece a un intervalo
cualquiera.
Ejemplo 2.11:La Ojiva para los datos agrupados del Ejemplo 2.8 se muestra a
continuacin.
60% 50.0%
40% 28.6%
15.7%
20% 7.1%
0.0% 1.4%
0%
8.05 8.41 8.77 9.13 9.49 9.85 10.21 10.57
MEDIDAS ESTADSTICAS
Frecuencias
simples: Absoluta
(fi), relativa (hi), Bastn
porcentual (pi).
Cuantitativa
Discreta
Frec. Acumuladas:
Varianza
Absoluta (Fi), Escalonada Coeficiente de
relativa (Hi), o escalera Moda Asimetra
porcentual(Pi) Desviacin
Estndar
Mediana Curtosis
Frecuencias
simples: Absoluta Histograma
Cuantitativa (fi), relativa (hi), Polgono de Media Coeficiente
Continua o porcentual (pi) frecuencias de
muchos y marca de clase Variacin
valores (X)
discretos
Frecuencias
Acumuladas:
Absoluta, relativa, Ojiva
porcentual y marca
de clase
24
DIAGRAMA TALLO-HOJAS
2.4 Problemas
Bajar la hoja de Excel en :
https://docs.google.com/file/d/0B5yYjHMGRyCCSHBmU0htSlVP
OWc
1. Los sistemas de cmputo colapsan por muchas razones, entre ellas las fallas de
hardware o software, errores del operador, sobrecargas del sistema mismo y a otras causas.
Los resultados obtenidos en un estudio acerca de las causas de colapso en una muestra
de 200 sistemas de cmputo se encuentran en la hoja Colapso. Suponga que se debe
priorizar entre las dos principales causas de colapso de los sistemas de cmputo. Elaborar
un grfico adecuado que permita establecer una estrategia apropiada.
a. Construir el polgono de frecuencias para los datos agrupados del turno maana y tarde
en un solo grfico.
25
4. Se quiere comparar los resultados obtenidos por tres operadores, en cuanto a los
tiempos (en minutos) utilizados en el restablecimiento de servicio de redes en el sistema
de una importante entidad bancaria. Los resultados obtenidos se encuentran en la hoja
Operador.
a. Construir las tablas de distribucin de frecuencias para los tres operadores por
separado. Use la regla de Sturges.
b. Construir los histogramas respectivos. Use la frecuencia relativa simple para cada
grfico.
c. Elaborar un informe sustentado en los grficos obtenidos en el punto anterior.
5. El jefe del rea de sistemas de una empresa realiz un estudio para analizar el
tiempo que demoran los empleados en detectar y resolver un problema informtico de
software o hardware. El estudio trata de estudiar las diferencias de tiempos en los turnos
de trabajo A y B de una empresa. La hoja Tiempo muestra los datos obtenidos
para una muestra de 40 problemas informticos presentados en el turno A y 100
problemas informticos presentados en el turno B.
35
N de pares vendidos
30
25
20
15
10
5
0
36 37 38 39 40
N de zapato
a) La variable X es ..
b) La muestra est formada por.
c) Construir una tabla de frecuencias para representar este conjunto de datos.
d) Representar al conjunto de datos con un grfico de barras.
3 4 1 2 1 2 2 5 2 1 2 3 0 1 0 3 3 2 0 2 1 3 4 1 2
Construya una tabla de frecuencia y en base a esta tabla responda a las siguientes
preguntas:
a. Cul es la variable y de que tipo es?
b. Cuntos meses VISA realiz entre 2 y 4 colocaciones?
c. Cuntos meses VISA realiz menos de 3 colocaciones?
d. Qu porcentaje de los meses realiz ms de 4 colocaciones?
e. Qu porcentaje de los meses realiz ms de 2 colocaciones?
15. Las calificaciones obtenidas por los 32 alumnos de una clase de GERENCIA en una
prueba de Matemticas vienen dadas por la siguiente tabla:
Nota 2 3 4 5 6 7 8 9 10
Alumnos 1 2 4 5 4 6 5 4 1
a. Cul es la variable y de que tipo es?
b. Elabora la tabla de frecuencias completa.
c. Qu porcentaje de alumnos aprueba la materia?
d. Qu porcentaje obtiene ms de 8 puntos?
e. Dibuja un diagrama de barras de frecuencias relativas.
f. Dibuja un polgono de frecuencias acumuladas.
28
19. La comisara de LINCE desea establecer los niveles de velocidad que corresponderan
al pasar por la garita de control, para tal fin establecen un punto de control de
velocidad y miden las velocidades de 30 vehculos que transitan por dicho punto de
control, estas
60 30 38 60 45 20 35 20 40 54 38 35 40 10 45
velocidades
son: 60 49 30 55 46 29 38 80 40 28 15 82 72 105 85
a. Construya la tabla de distribucin de frecuencias absolutas y relativas.
b. Cul es la variable y de qu tipo es?
c. Grafique el histograma y el polgono de frecuencias correspondiente
d. A partir de la tabla construida calcule e interpretar f2 , h4, p3, F4, H2 y P5.
a) Identifique la variable.
b) Luego de construir la tabla de frecuencias, Interprete f2 , h4, p3, F4, H2 y P5
29
21. La gerencia del restaurante MC DONALDS desea implementar acciones que motiven
a sus clientes a aumentar el monto de sus consumos los fines de semana, por tal
motivo desea analizar el monto de las 40 facturas correspondientes a los consumos
realizados en el ltimo fin de semana, estos son:
121 130 138 140 141 201 251 388 401 410
414 417 451 459 476 479 484 486 510 518
518 549 571 575 576 648 655 676 679 702
710 749 749 750 755 784 875 948 978 981
Construya una tabla de frecuencia y en base ella responda a las siguientes preguntas:
a. Cul es la variable y de qu tipo es?
b. A partir de la tabla construida calcule e interprete f2 , h4, p3, F4, H2 y P5.
22. El gerente del hotel MARRIOTT desea llevar un mayor control sobre el tiempo de las
llamadas internacionales que realiza su personal de promocin. Preliminarmente se
plantea la idea que estas 1 1 1 1.2 1.5 2.1 2.1 2.2 3.1 3.1
llamadas deben tener un lmite 3.2 3.2 3.3 4 4 4 4 4 4 4.1
de 10 minutos. Para examinar 4.5 4.5 5 5.1 5.1 5.1 5.1 5.2 5.4 6
ms esta idea la gerencia 6 6.1 6.1 6.2 6.2 6.4 6.5 7 7.1 7.1
solicita le alcancen la relacin 8 8.5 9 9 10 11 12 12.1 14.2 16
de tiempos utilizados por las
50 llamadas internacionales realizadas por el hotel durante el mes de Febrero 2010 El
listado de estos tiempos (en minutos) usados por cada llamada es:
a. Construya una tabla de frecuencia clasificando estos datos en 5 intervalos.
b. Cul es la variable y de qu tipo es?
c. Construya el histograma de frecuencia y el polgono respectivo.
d. Qu porcentaje de llamadas duraron entre 4 y 10 minutos?
Responda aproximadamente:
e. A partir de la tabla construida calcule e interpretar f2 , h4, p3, F4, H2 y P5.
23. En la primera prctica de ESTADSTICA DESCRIPTIVA del ciclo anterior, las notas de
los 50 alumnos fueron:
5.5 6 6.5 7 7.5 7.5 8 8 8.5 8.5
a. Cul es la variable y de qu
tipo es? 8.5 9 9 9 9.5 9.5 9.5 9.5 10 10
b. Construya una tabla, 10 10 10.5 10.5 10.5 10.5 11 11 11 11
histograma y polgono de 11.5 11.5 11.5 11.5 12 12 12 12 12.5 12.5
frecuencia clasificando estos 12.5 13 13 13 13.5 13.5 14 14 14.5 17.5
30
24. Los siguientes datos representan los aos laborados en una empresa de SERVICIOS
FINANCIEROS
ingreso marca f h F H
1581.87 1667.74 1624.805 9 0.018 9 0.018
1667.74 1753.61 1710.675 19 0.038 28 0.056
1753.61 1839.48 1796.545 42 0.084 70 0.14
1839.48 1925.35 1882.415 70 0.14 140 0.28
1925.35 2011.22 1968.285 122 0.244 262 0.524
2011.22 2097.09 2054.155 108 0.216 370 0.74
2097.09 2182.96 2140.025 71 0.142 441 0.882
2182.96 2268.83 2225.895 43 0.086 484 0.968
2268.83 2354.70 2311.765 11 0.022 495 0.99
2354.70 2440.57 2397.635 5 0.01 500 1
a) Identifique la variable.
b) Si en total hay 2000 trabajadores, construya la tabla de frecuencias e identifique e
interprete: f2, F5, h4, h9, F4,F9, H2 y F3.
5 5
5
Nmero de estudiantes
4
4
3
3
2
2
0
6,0 8,1 10,2 12,3 14,4 16,5 18,6
Calificaciones obtenidas
28. La gerencia del restaurante ASTRID Y GASTN desea implementar acciones que
motiven a sus clientes a aumentar el monto de sus consumos los fines de semana, por
tal motivo desea analizar el monto de las 50 facturas (en Soles) correspondientes a los
consumos realizados en el ltimo fin de semana, estos son:
121 130 138 140 141 201 251 388 401 410
414 417 451 459 476 479 484 486 510 518
518 549 571 575 576 648 655 676 679 702
710 749 749 750 755 760 770 800 910 925
990 1000 1020 1050 1075 1080 1085 1085 1090 1105
32
30. El gerente del hotel WESTIN desea analizar el perfil de los clientes que prefirieron al hotel
durante el mes pasado, por tal motivo solicita a la recepcin informacin de los clientes
atendidos durante la ltima semana del mes pasado. La informacin solicitada es:
31. La gerencia general del hotel CONQUISTADORES, preocupada por la calidad del
servicio que estn recibiendo los 95 clientes atendidos actualmente, dispone que se
consulte la opinin sobre la calidad del servicio a una muestra de 20 clientes hospedados:
Numero de Opinin sobre el servicio
Cliente Nacionalidad Edad Sexo atenciones en Nivel de Educacin recibido en la ltima atencin
el ao
1 Peruana 25 Masculino 2 Superior Buena
2 Peruana 23 Femenino 3 Superior Buena
3 Peruana 50 Masculino 2 Superior Buena
4 Americana 48 Femenino 1 Secundaria Mala
5 Americana 28 Masculino 1 Secundaria Mala
6 Peruana 28 Femenino 2 Secundaria Regular
7 Americana 36 Masculino 1 Superior Regular
8 Americana 35 Femenino 1 Superior Regular
9 Argentina 25 Masculino 1 Superior Buena
10 Argentina 23 Femenino 1 Superior Buena
11 Europea 39 Masculino 2 Secundaria Regular
12 Americana 43 Femenino 2 Superior Buena
13 Europea 55 Femenino 1 Secundaria Mala
14 Americana 28 Masculino 2 Superior Regular
15 Americana 41 Masculino 2 Superior Buena
16 Peruana 33 Femenino 3 Secundaria Buena
17 Europea 48 Masculino 1 Superior Regular
18 Americana 50 Femenino 1 Superior Regular
19 Europea 36 Femenino 2 Secundaria Buena
20 Americana 42 Femenino 2 Superior Mala
Con respecto al conjunto de datos.
g. Nmero de clientes segn su opinin del servicio por nacionalidad del cliente
h. Nmero de clientes segn su opinin del servicio por sexo del cliente
i. Nmero de clientes segn su opinin por el nmero de atenciones recibidas de hotel
32. Para estudiar las principales caractersticas descriptivas de los 850 clientes que est
atendiendo el gimnasio GOLDS GYM se elige una muestra de 25 clientes y a cada
cliente elegido se le solicita la informacin siguiente: Nacionalidad, sexo, edad (aos),
34
peso (kg), das que trabaj la semana anterior, nmero de veces que vino al gimnasio en
el mes anterior y si est haciendo dieta.
33. Para caracterizar a los 120 estudiantes matriculados en Estadstica General de ESAN se
eligen 20 estudiantes y se les pide la informacin siguiente: Especialidad, colegio de
procedencia, edad, promedio ponderado, nmero de cursos en que est matriculado, horas
de clase a la semana que debe asistir y si repite el curso.
35. La representacin tallo hoja del tiempo (en minutos y con un decimal) requerido por los
estudiantes para responder cierta pregunta de razonamiento matemtico es :
N Tallo Hoja
17 1 00012233334444444
44 1 555556666666667777888899999
76 2 00000011111111222222222222333333
106 2 555556666666666666777778889999
(29) 3 00000000011111111222233333344
90 3 55566666667788888899999999
64 4 0001111112222222333444
42 4 55555667778888
28 5 000001111122233444
10 5 5567899
3 6 04
1 7 0
( La suma de los tiempos registrados es: 713.3 minutos)
Captulo 3
Estadstica Descriptiva: Mtodos
numricos
3.1 Introduccin
En este captulo se presentan algunos mtodos numricos de la estadstica descriptiva
que proporcionan algunas alternativas para resumir datos. Las medidas numricas de
tendencia central y dispersin se calculan a partir de los valores de los datos. Si estos
datos pertenecen a una muestra se denominan estadsticos mientras que si se
calculan a partir de los datos de una poblacin se denominan parmetros.
x j x j
j 1
j j
j 1
x
j 1
x
N n n
donde f representa la frecuencia
n = tamao de la muestra y x los valores de la variable o
N = tamao de la poblacin las marcas de clase, esto ltimo
si estn por intervalos.
37
Ejemplos:
1. Datos no tabulados:
Las notas de un alumno son: 14, 17, 8, 13, 16. Encuentre la media de sus notas
n
X i
14 17 8 13 16
X i 1
13.6 puntos
n 5
Suponga que existen dos secciones que llevan el curso de Estadstica, una seccin con
una nota media de 15 con 3 alumnos y otra seccin con nota media 13 y 2 alumnos.
Media(k) = k
3. La media de una variable a la que se le suma o resta una constante equivale a la
media de la variable ms o menos dicha constante:
38
Media(X k) = Media(X) k
4. La media de una variable multiplicada por una constante equivale a la media de la
variable multiplicada por dicha constante:
Media(kX) = kMedia(X)
Media(aX b) = aMedia(X) b
Ejemplo 3.1: Se sabe que los ingresos mensuales que perciben los empleados de la
Caja Municipal Piura tienen un promedio de 2800 nuevos soles, determine el
nuevo ingreso promedio que se obtendra luego de realizar los siguientes aumentos:
Solucin
En cada caso el ingreso se denotar por X y el nuevo ingreso ser representado por Y.
a) Y = X + 250
Media (Y) = Media(X) + 250
Media (Y) = 2800 + 250 = 3050 nuevos soles.
b) Y = X + 0,20X = 1,2X
Media (Y) = Media (1,2X)
Media (Y) = (1,2)(2800) = 3360 nuevos soles.
c) Y = 1,12X + 125,
Media (Y) = Media (1,12X +125)
Media (Y) = (1,12)(2800)+ 125 = 3261 nuevos soles.
Media ponderada
Se utiliza cuando los datos a promediar no tienen la misma importancia relativa dentro
del conjunto total, es decir, algunos datos tiene mayor importancia, peso ponderacin
dentro del conjunto de observaciones. Se usar la siguiente expresin para su clculo:
xi : Dato individual.
wi : Peso asignado a cada dato
39
Solucin
Ejemplo 3.3: Scotiabank tiene tres turnos de trabajo en sus dos formatos:
Crediscotia y Banco Scotiabank. Los trabajadores de la agencia principal en cada uno de
estos turnos participan de acuerdo a la siguiente tabla:
25 50 35 20 38 10
Crediscotia: x w 29.13 nuevos soles
50 20 10
25 40 35 35 38 25
Banco Scotiabank: x w 31.75 nuevos soles
40 35 25
40
Ejemplo 3.4: Un artculo es producido en tres etapas, cortado, armado y acabado. Para
la etapa de cortado se requiere dos horas, cuatro para el armado y tres para el acabado;
los costos por hora en cada etapa son de 2, 4,5 y 6,5 dlares.
a) Calcule el costo promedio de produccin por hora de dicho artculo
b) Cada artculo se vende a un precio de 6,2 dlares; cul es la utilidad promedio si
se producen y venden 5000 de estos artculos?
Duracin (aos) X f
1,2 1,8 12
1,8 2,4 18
2,4 3,0 36
3,0 3,6 42
3,6 4,2 31
4,2 4,8 17
4,8 5,4 8
Duracin (aos) X f
1,2 1,8 1,5 12
1,8 2,4 2,1 18
2,4 3,0 2,7 36
3,0 3,6 3,3 42
3,6 4,2 3,9 31
4,2 4,8 4,5 17
4,8 5,4 5,1 8
Media Geomtrica
Se emplea frecuentemente para promediar variables tales como porcentajes, tasas de
crecimiento, nmeros ndices, tipos de inters anuales, inflacin, etc.
Ejercicios:
1.- El gerente PLAZA VEA decidir abrir una sucursal solo si el incremento promedio de
sus ventas mensuales es superior al 10%, para tomar esta decisin, tiene los
siguientes datos:
Solucin.-
MES VENTAS F.C.
MARZO 4352 ------------
ABRIL 4713 1.08295
MAYO 4420 0.93783 **
JUNIO 5370 1.21493
JULIO 5649 1.05195
AGOSTO 6320 1.11878
** Indica una tasa de crecimiento negativa, en efecto las ventas han disminuido de un mes
al otro.
42
5
1.08295 x0.93783 x1.21493 x1.05195 x1.11878
1.0775
Tasa crec. prom : (1.0775 1)100 7.75%
Entonces el Gerente no abrira la sucursal.
XG=
3
1.10 *1.20 *1.30 = 1.1647
Ao Ventas F.C.
2003 2 -----
2004 4 2
2005 8 2
2006 6 0.75
4. El nmero de intentos de fraude en todos los cajeros del BCP en el mes de Diciembre
del 2006, fue de 165. Calcule e interprete la tasa promedio de crecimiento mensual del
nmero de intentos de fraude, en el perodo de Junio a Diciembre del 2006, si en el
mes de junio del mismo ao se registraron 148 intentos de fraude.
Se emplear la media geomtrica.
165
X G 6 1.018
148
%promedio = 1.8%
5- La Poblacin de una ciudad en 1994 era de 2 700 000 habitantes y el 2004 alcanz a
24 000 000 habitantes, suponiendo una tasa de crecimiento constante, calcular:
a) El factor de crecimiento promedio anual
b) La tasa de crecimiento promedio anual.
c) La Poblacin para el 2010.
Solucin:
P2010 P2004 (1 0.244)6 24 000 000 (1.244)6 8 8 947 454 habi tan tes
5. Estime e interprete el nmero de intentos de fraude para el mes de Setiembre del 2007.
Asuma que la tasa promedio de crecimiento mensual, permanece constante.
Nro prom.Set.2007 165 x(1 1.8%) 9 193.74 int .
NOTAS:
a) Una tasa de crecimiento puede ser negativa, pero los factores decrecimiento
siempre son positivos.
Ej: Las ventas de Enero son 30 mil dlares y las de Febrero son 15 mil dlares, la
tasa de crecimiento es -50 %, pero el factor de crecimiento es : 15/30=0.5 (factores
de crecimiento menores a 1, indican tasa de crecimiento negativa.
3.2.2 Mediana
La mediana es el valor del dato que ocupa la posicin central una vez que todo el
conjunto de valores se encuentra ordenado de forma ascendente. Con un nmero impar
de datos siempre es posible encontrar un valor que ocupa la posicin central. Cuando el
nmero de datos es par existen dos valores ocupando las posiciones centrales.
a) Datos no agrupados
Como primer paso, los datos deben ser ordenados en orden creciente decreciente,
luego se bebe determinar el valor que se ubica en la posicin central. En caso de no
coincidir el valor central con un dato, se tomar el promedio de los datos centrales. Si
denotamos las observaciones ordenadas por x[1], x[2], x[3], ... , x[n], entonces:
Para un nmero par de datos, la mediana es el promedio de los dos valores que
ocupan las posiciones centrales.
1
me x n x n Si n es par, la mediana es el promedio de los datos que se
2 2 2 1
encuentran en las posiciones [n/2] y [(n/2)+1]
76 80 82 82 83 88 89 92 92 93 95 95
El 50% de los clientes tiene ao de nacimiento mayor a 1988,5 y el otro 50% es menor
1988,5.
45
El 50% de los clientes tiene ao de nacimiento mayor a 1989 y el otro 50% es menor a
1989.
b) Para datos tabulados en tablas de frecuencia por intervalos
n= Nmero de datos
c= Ancho de clase.
Propiedades de la mediana
1. Divide a un conjunto de observaciones de dos partes iguales. El 50% con valores
mayores a la mediana y el otro 50% con valores menores a la mediana.
2. La mediana no se ve afectada por valores extremos.
46
3.2.3 Moda
Una tercera medida de tendencia central es la moda y se define como el valor del dato
que se repite o presenta con mayor frecuencia.
a) Para datos no agrupados:
1) 4, 7, 6, 6, 9, 8, 10, 15, 6, 7
Mo = 6
2) 8, 4, 7, 8, 4, 6, 9, 8, 6, 10, 15, 4, 8, 6, 4, 8, 9, 3
Mo= 8 (se repite cinco veces)
4) 4, 7, 6, 4, 6, 7, 7, 6, 4
Tres modas, 4, 6 y 7 (Todos se repiten tres veces, distribucin multimodal)
Ejercicio: EDAD fi
Propiedades de la moda
1. No se ve afectada por valores extremos.
2. Se aplica tanto a informacin de variable cuantitativa como a cualitativa.
3. Es una medida inestable puesto que cambia de valor de una muestra a otra.
47
Ejemplo:
3.- Un informe en 2013 deca lo siguiente: En lo que va del ao pudo observarse la trayectoria
de la produccin agropecuaria (PBI agropecuario) peruana encontrndose que los
resultados de su evolucin se deben principalmente a factores como el fenmeno del
nio, la escasez de crdito y las plagas, todo ello ocasion la disminucin de la
produccin en dicho sector. Los datos muestran lo siguiente:
5.- El gerente DINERS CLUB DEL PER ha determinado que el nivel de colocaciones de las
tarjetas de crdito DINERS CLUB MILES han tenido las siguientes tasas de crecimiento,
durante el ao 2013: en Agosto con respecto a Julio 12%, en Septiembre con respecto a
Agosto 14%, en Octubre con respecto a Septiembre 18%, en Noviembre con respecto a
Octubre 22% y en Diciembre con respecto a Noviembre 26%.
a) Cul es la tasa promedio de crecimiento de las colocaciones de esta compaa?.
b) Si en el mes de Julio se colocaron 1000 tarjetas y suponiendo que la tasa promedio
calculada se mantiene, Cul ser el nivel de colocaciones para abril del prximo
ao?.
c) Indique la variable y su tipo.
6.- En una empresa productora de cosmticos EBEL se tiene una mquina Inyectora que ha
tenido baja produccin desde que fue adquirida,. El Gerente recibi del Jefe de
Mantenimiento la promesa de que durante el ao 2010 se incrementara la produccin
por lo menos en un 5% mensual, al mes de Septiembre, l desea saber si se ha cumplido
con lo ofrecido, para ello ha solicitado las producciones de los primeros 6 meses del
2010.
Mes Enero Febrero Marzo Abril Mayo Junio
Produccin (Ton) 7 8.2 8.6 9.2 8.3 9.5
7.- La empresa DAEWOO lleva un registro del kilometraje de todos sus vehculos. A
continuacin presentamos registros del kilometraje semanal:
810 450 756 789 210 657 589 488 876 689
1 450 560 469 890 987 559 788 943 447 775
8.- La gerencia del hotel LOS DELFINES ha dispuesto efectuar un mayor control sobre el
tiempo de las llamadas internacionales que utiliza el personal del rea de promocin; por
tal motivo, el gerente solicita la informacin sobre los tiempos utilizados durante las
ltimas 50 llamadas internacionales que realiz el personal de promocin.
9.- Las remuneraciones de los empleados de las tiendas EWONG y METRO que pertenecen
a la empresa CENCOSUD se presentan en las tablas de frecuencia siguientes:
Tiendas EWONG Tiendas METRO
Sueldo Nmero Sueldo (soles) Nmero
(soles) Empleados Empleados
400-800 60 500-1000 10
800-1200 35 1000-1500 30
1200-1600 5 1500-2000 10
Total 100 Total 50
10.- Un examen de aptitud acadmica de la PUCP (con una puntuacin de 0 a 100) fue
rendido por 3 secciones A, B y C, los promedios fueron 52, 75 y 90 respectivamente.
Posteriormente se decidi incrementar la nota a los alumnos de la seccin A en un 5%,
otorgar 5 puntos adicionales a los alumnos de la seccin B, y a los de la seccin C no
modificarles la nota. Determine el promedio de notas de todos los alumnos luego de las
modificaciones si se sabe que el nmero de alumnos en las secciones A, B y C fue 30,
40 y 45 respectivamente.
11.- La agencia de viajes de PROMPER compr la primera semana del mes de Abril 40
pasajes areos Lima- Bogot a $ 60 cada pasaje, la segunda semana 10 pasajes
areos Lima- Caracas a $ 62 cada pasaje, la tercera semana 10 pasajes Lima
Santiago a $ 65 y la cuarta semana compr 5 pasajes Lima Montevideo a $ 61.
Cul es el precio promedio que se pag por estos pasajes areos?.
50
12.- Complete:
a. Si un encuestador pregunta por los sueldos de un grupo de personas y estos le
responden: 3800, 900, 3200, 3400, 760, 3900, 10000,3850 y 15000 nuevos soles;
entonces el promedio que mejor representara a estos nmeros es:
b. La media que se utiliza cuando se quiere determinar el incremento o disminucin
promedio porcentual en casos de inflacin, ventas mensuales o anuales, tasas de
mortalidad o natalidad, etc. es:..
13.- En el distrito SAN MARCOS en Cajamarca hay 13 hoteles cuyo nmero de habitaciones
es:
10 11 11 12 12 13 13 13 14 15 17 18 20
a) Halle el nmero de habitaciones promedio, mediano, modal .
14.- En la siguiente tabla se recoge el nmero de transacciones que los clientes hacen en un
banco SCOTIABANK durante el ao 2013. N de transaciones N de personas
hechas en el banco
a) Cuntas personas han hecho 7
transacciones en el ltimo ao?Cuntas han 1 10
hecho 4 transacciones? 3 25
b) Qu porcentaje de personas ha hecho ms 5 43
de 6 transacciones? 7 31
c) Calcular la moda y el nmero medio de
10 12
transacciones hechas en el ao.
d) Dibujar un diagrama correspondiente. 12 4
16. Parece ser que una mquina automtica que llena recipientes, est trabajando de
manera errtica. Una verificacin de los pesos del contenido de un cierto nmero de
latas revel lo siguiente:
Peso (gr) 130-140 140-150 150-160 160-170 170-180 180-190 190-200 200-210
Nmero de latas 2 8 20 15 9 7 3 2
a. Estime la media aritmtica del peso del contenido de una lata e interprete.
b. Encuentre la mediana y moda e interprete el resultado.
17. Los ahorros en 2 bancos: BCP y Scotiabank estn distribudos de la Sgte. manera:
BCP Scotiabank
Nota Nmero alumnos Nota Nmero alumnos
500-1000 4 400-450 8
1000-1500 16 450-500 10
1500-2000 5 500-550 16
Total 25 550-600 6
Total 40
Determine el monto promedio ahorrado.
51
20. El hotel SHERATON compr la primera semana del mes de Abril 40 pasajes areos Lima-
Chiclayo a $ 60 cada pasaje, la segunda semana 10 pasajes areos Lima- Chiclayo a $
62 cada pasaje, la tercera semana 10 pasajes a $ 65 y la cuarta semana compr 5
pasajes a $ 61.
Cul es el precio promedio que se pag por estos pasajes areos?. Rpta. $ 61.1538
Ejemplo 3.9: Considerar el problema 5 del Captulo 2. El jefe del rea de sistemas de
una empresa realiz un estudio para analizar el tiempo que demoran los empleados en
detectar y resolver un problema informtico de software o hardware. El estudio trata de
estudiar las diferencias de tiempos en los turnos de trabajo A y B de una empresa. La
hoja Tiempo muestra los datos obtenidos para una muestra de 40 problemas
informticos presentados en el turno A y 100 problemas informticos presentados en el
turno B.
https://docs.google.com/file/d/0B5yYjHMGRyCCc2pqYnRTUDJwQk0
En Excel ir a Opciones
Haga clic en Ir
https://docs.google.com/file/d/0B5yYjHMGRyCCc2pqYnRTUDJwQk0
3.2.4 Cuantiles
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5
coincide con la mediana.
54
Percentiles
Los percentiles representan los valores de la variable que estn por debajo de un
porcentaje, el cual puede ser un valor de 1% a 100% (en otras palabras, el total de los
datos es divido en 100 partes iguales).
Li parte decimal x ( Ld Li )
Ejercicio:
Dado el siguiente conjunto de datos, calcular los tres cuartiles:
LUGAR 1 2 3 4 5
DATO 2 4 13 15 19
Q2 X 2 ( 51) X 3 13
4
Ejercicio:
Dados los siguientes datos, calcular: D2, D9, P50, P80
LUGAR 1 2 3 4 5 6 7 8 9 10 11 12
DATO 0 3 3 4 4 8 9 10 10 15 18 20
PROBLEMAS.-
3.- Se tiene los resultados de los estadsticos descriptivos en el software Minitab de los
costos en dlares de un cierto producto fabricado por tres tecnologas diferentes A, B y C
5.- La tabla de frecuencias correspondiente a los hoteles del distrito San Isidro clasificados
segn el nmero de sus empleados es la siguiente:
57
Nmero de hoteles del distrito San Isidro segn el nmero de empleados en Enero
2009
Nmero de empleados Nmero de hoteles
De 6 a menos de 8 4
De 8 a menos de 10 6
De 10 a menos de 12 25
De 12 a menos de 14 30
De 14 a menos de 16 23
De 16 a menos de 18 8
De 18 a 20 4
a) Determine el promedio, mediana y moda para el nmero de empleados por hotel
de la ciudad. Rpta: 13.04, 13, 12.83.
b) El municipio de la ciudad ha dispuesto que todos los hoteles que tengan un nmero
de empleados menor al primer cuartil no pagarn impuesto predial Cul es este
nmero de empleados?. Rpta: 11
c) El municipio de la ciudad ha dispuesto que todos los hoteles que tengan un nmero
de empleados mayor al octavo decil pagar el impuesto selectivo Cul es este
nmero de empleados?. Rpta: 15.3
6.- El histograma adjunto muestra la distribucin del tiempo que demoran 32 personas para
leer el diario PUBLMETRO.
a) Calcule e interprete la media, mediana y moda
b) Encuentre cual es el tiempo mximo para pertenecer al 30% de los lectores ms
rpidos
7.- Los ahorros en 2 bancos: BCP y Scotiabank estn distribudos de la Sgte. manera:
BCP Scotiabank
Nota Nmero alumnos Nota Nmero alumnos
500-1000 4 400-450 8
1000-1500 16 450-500 10
1500-2000 5 500-550 16
Total 25 550-600 6
Total 40
a) Qu monto limita el 20% superior de los ahorros en los 2 bancos?
b) Qu monto limita el 10% inferior de los ahorros en los 2 bancos?
c) Qu monto limita el 50% central de los ahorros en los 2 bancos?
58
8.- La gerencia del restaurante ASTRID Y GASTN desea implementar acciones que
motiven a sus clientes a aumentar el monto de sus consumos los fines de semana, por tal
motivo desea analizar el monto de las 50 facturas (en Soles) correspondientes a los
consumos realizados en el ltimo fin de semana, estos son:
121 130 138 140 141 201 251 388 401 410
414 417 451 459 476 479 484 486 510 518
518 549 571 575 576 648 655 676 679 702
710 749 749 750 755 760 770 800 910 925
990 1000 1020 1050 1075 1080 1085 1085 1090 1105
9.- El gerente del hotel MARRIOTT desea llevar un mayor control sobre el tiempo de las
llamadas internacionales que realiza su personal de promocin. Preliminarmente se
plantea la idea que estas llamadas deben tener un lmite de 10 minutos. Para examinar
ms esta idea la gerencia solicita le alcancen la relacin de tiempos utilizados por las 50
llamadas internacionales realizadas por el hotel durante el mes de Febrero 2010 El listado
de estos tiempos (en minutos) usados por cada llamada es:
a) Cul es el tiempo que comprende al 20% de las llamadas que duraron ms?
b) Cul es el tiempo que comprende al 50% de las llamadas que duraron menos?
10.- A continuacin se presenta el histograma de las calificaciones obtenidas por un grupo
de estudiantes del curso de ingles del instituto de idiomas BRITNICO:
Histograma de calificaciones
7
7
6
6
Numero de estudiantes
5
5
4
4
3
3
0
68.0 73.4 78.8 84.2 89.6 95.0
Calificaciones obtenidas
a) Si el 5% de los estudiantes con las mayores calificaciones recibirn una beca. Cul es
la calificacin mnima para estar considerado dentro de este grupo?
b) Si el 20% de los estudiantes con las menores calificaciones sern eliminados. Cul
es la calificacin mxima para estar considerado dentro de este grupo?
59
EN EXCEL:
Ejemplo 3.11: Calcular el percentil 20 en el conjunto de datos no agrupados
del Ejemplo 3.7. La tabla Sgte. muestra el ao de nacimiento de un grupo de 12 clientes
de Interbank.
92 88 95 76 80 82 89 92 93 95 83 82
Cul es el valor mnimo para estar considerado dentro del 30% superior de los aos de
nacimiento?
3( Me )
Paramtrico : As
3(x me )
Muestral : as
s
As < 0 As = 0 As > 0
60
Distribucin simtrica: Me Mo
Distribucin asimtrica positiva o a la derecha: Me Mo
Distribucin asimtrica negativa o a la izquierda: Me Mo
P75 P25
KU
2( P90 P10 )
1. Los datos en la hoja Supermercados corresponden a los montos y el tipo de
pago (cheque, efectivo y tarjeta) realizados por una muestra de clientes de una
cadena de supermercados. Los directivos de esta empresa pidieron tomar la
muestra para conocer el comportamiento de los pagos de sus clientes.
a. Construya en un mismo grfico los diagramas de cajas para los montos
segn el tipo de pago indicando la presencia de datos atpicos en la muestra.
Rpta. Cheque: Dos valores atpicos 5 y 95; Efectivo: No hay valores
atpicos; Tarjeta: Un valor atpico 94,36
b. Determinar el tipo de simetra que presentan los montos segn el tipo de
pago segn lo observado en el grfico anterior.
Rpta. Cheque: Asimtrica positiva; Efectivo: Asimtrica positiva; Tarjeta:
Asimtrica Negativa
c. Obtenga las medidas de tendencia central y de dispersin para los montos
pagados en cheque, efectivo y tarjeta e intrprete.
61
5. Si no existen valores atpicos, los bigotes van desde los extremos de la caja hasta los
valores menor y mayor dentro de los lmites calculados en el paso anterior.
Si existen valores atpicos, estos se ubican primero y luego los bigotes van desde los
extremos de la caja hasta los valores menor y mayor (excluyendo los valores atpicos).
Ejemplo 3.15:
El grfico de cajas para conjunto de datos del problema 4 del captulo 2 se
muestra a continuacin.
Los valores calculados para el grfico fueron
Para el caso del operador 2, el bigote inferior se extiende hasta el valor mnimo
mayor o igual al LI = -8,456 (para este caso el tiempo no puede ser negativo por lo
que se puede considerar como LI= 0 minutos). El bigote superior se extiende hasta
18.73 (ordenar de mayor a menor la base de datos y observar este registro) que es
el dato mximo menor o igual al LS = 18,913. Existe tres valores mayores a 18,913
estos son: 19,5 ; 24,7 ; 31,91. Estos tres datos con marcados como valores
extremos con los asteriscos. Para los operadores 1 y 3 los datos se encuentran
dentro del LI y LS.
63
Rango
El rango o amplitud es la medida de dispersin ms elemental. Se define como la
diferencia entre el dato ms grande y el ms pequeo.
Una medida de dispersin que elimina la influencia de los valores extremos o atpicos
de los datos es el rango intercuartil (RIC). Esta medida se define como la diferencia
entre el tercer y primer cuartil. En otras palabras, el rango intercuartil mide la amplitud
en el 50% central de los datos
RIC = Q3 Q1
Datos no agrupados
Datos agrupados:
Ejemplo 3.14.- Los montos depositados de los 500 clientes VIP del Banco de Comercio se
encuentran ordenados en la Sgte tabla:
Halle la varianza.
Desviacin estndar
Las unidades al cuadrado asociadas con la varianza hacen difcil una interpretacin de
su valor numrico. La desviacin estndar se define como la raz cuadrada positiva de
la varianza y, por consiguiente, tiene las unidades originales de los datos.
65
Coeficiente de variacin
El coeficiente de variacin es una medida relativa de variabilidad por que evala la
desviacin estndar en relacin con la media. Esta medida sirve para
comparar dispersin en conjuntos de datos aun cuando las unidades fuesen
diferentes.
s
Coeficiente de variacin muestral: CV 100%
x
Turno A
s 0,36805
El coeficiente de variacin es CV = x100 2,460 |
x 14,957
Turno B
S 0,06514
El coeficiente de variacin es CV =
X 14,698 X 100 0,4431
67
2. La central telefnica de una empresa desea conocer el gasto mensual en que incurre
debido a las llamadas que efectan sus empleados luego de las 6 p.m., hora en que
finalizan las labores. Para esto registra al azar y durante el mes de enero el
tiempo de duracin (en minutos) de las llamadas efectuadas entre las 6 p.m. y las
7 p.m. Los datos obtenidos, segn el tipo de telfono al que se llama, se encuentran
en la hoja Llamadas.
https://drive.google.com/file/d/0B5yYjHMGRyCCal9hQzViNzR4NnM/
a. Cul es la duracin mnima de una llamada hacia un telfono celular para
considerarla dentro del grupo del 15% de las llamadas que le ocasionan mayor
gasto a la empresa? Rpta. 10 minutos
Tiempo (min) 0.5 1.5 1.5 2.5 2.5 3.5 3.5 4.5 4.5 5.5
Frec. Absoluta 6 9 12 9 6
68
10 10 10
14. En una empresa el jornal diario de sus obreros tiene una media de $10 y una desviacin
estndar de $2. Si se hace un incremento de 20% a cada jornal con una bonificacin
adicional de $3, Se increment la variabilidad de los salarios?.
15. El siguiente reporte de Minitab muestra las estadsticas de resumen de los costos
unitarios de produccin de tres diferentes empresas A, B y C
Descriptive Statistics: CostoA, CostoB, CostoC
Total
VariableCount Mean StDev Variance CoefVar Q1 Media Q3
CostoA 27 21.360 2.661 7.082 12.46 19.710 21.330 22.275
CostoB 33 26.639 1.757 3.086 6.59 25.000 26.000 27.500
CostoC 20 13.530 1.556 2.421 11.50 13.000 14.000 14.400
a) Ordene estas empresas segn sus costos de la menos homognea a la ms
homognea.
b) En la empresa A, cual es el monto del cuarto superior de los costos unitarios de
produccin.
b) Si en la muestra 1, del primer sector, los valores de la variable sueldo mensual, son
incrementados en 7.5% ms una bonificacin de $12. Determine e interprete el
coeficiente de variacin de los sueldos que se obtiene luego de realizadas las
modificaciones en este sector.
17. Si en la muestra 1 los valores de la variable, sueldo mensual, se incrementan en 10%
ms una bonificacin de $15, en la muestra 2 se disminuye en 5% y en la muestra 3
se aumenta en 10% y se hace un descuento de $20. Determine e interprete un solo
valor que represente el coeficiente de variacin que se obtiene luego de realizadas las
modificaciones.
18. En una empresa el jornal diario de sus obreros tiene una media de $10 y una
desviacin estndar de $2. Si se hace un incremento de 20% a cada jornal con una
bonificacin adicional de $3, Se increment la variabilidad de los salarios?.
19. La distribucin de los ingresos obtenidos diariamente por una entidad recaudadora en
un ao ha sido la que se muestra en la primera tabla. Al ao siguiente se introdujo una
modificacin en el sistema de tramitacin de los recibos, consistentes, bsicamente en
emitirlos y enviarlos a los clientes a lo largo del tiempo. La distribucin en el ao de la
modificacin es la que se muestra en la segunda tabla.
Tabla 1 Tabla2
Miles S/. N de das 295 295
recaudados fi X i 2 947937500 ; X i 517750
0 500 92 i 1 i 1
500 1000 26 n=295
1000 1500 25
1500 2000 19 a) Calcular el coeficiente de variacin de los
ingresos antes de la modificacin en el
2000 2500 15
sistema de tramitacin de los recibos.
2500 3000 35
b) Ha cambiado la variabilidad?
3000 - 3500 83
20. Dos empresas del mismo rubro, que cuentan con igual nmero de trabajadores en el
rea de produccin, estn interesadas en obtener algunas caractersticas numricas
de los sueldos de sus trabajadores. Para esto, cada una toma una muestra de igual
tamao y obtienen los siguientes resultados:
Empresa 1 Empresa 2
Sueldo promedio ( x ) 1500 1600
Desviacin estndar (s) 120 120
21.- La gerencia del hotel WESTIN ha dispuesto efectuar un mayor control sobre el tiempo
de las llamadas internacionales que utiliza el personal del rea de promocin; por tal
motivo, el gerente solicita la informacin sobre los tiempos utilizados durante las
ltimas 50 llamadas internacionales que realiz el personal de promocin. Estos
tiempos tienen la distribucin siguiente:
Nmero de llamadas internacionales segn el tiempo utilizado
71
22. Una sucursal bancaria del BCP emplea ocho trabajadores. Los aos de experiencia de
cada trabajador son: 1, 7, 9, 15, 9, 17, 15, 5.
a. Calcule la desviacin estndar y el coeficiente de variacin. Qu indica el coeficiente
de variacin?
b. Cmo cambia la desviacin estndar si al grupo de 8 trabajadores se incorpora otro
que tiene 8 aos de experiencia?
24. La distribucin actual de ingresos de los 150 trabajadores de una empresa es tal que el
ingreso promedio mensual es S/.1200, el ingreso mediano S/.1100 y la desviacin
estndar S/.200. Con base en esta informacin se puede afirmar que:
a) La planilla mensual asciende a ________________________ soles.
b) El 50% de los trabajadores tienen un ingreso mensual menor que _______________
soles.
c) El actual coeficiente de variacin de la distribucin de ingresos es
____________________.
d) Si el mes siguiente se incrementa en el 10% el sueldo de cada trabajador, y adems a
cada uno se le otorga una bonificacin de S/.100, la planilla se habr incrementado en
______________________ soles y la nueva distribucin de ingresos ser ms
_________ que la actual.
[1500, 1700[ 4
[1700, 1900[ 5
[1900, 2100[ 26
[2100, 2300[ 35
[2300, 2500] 10
a) Calcule e interprete la media y la mediana.
b) Calcule la desviacin estndar y el coeficiente de variacin. La distribucin de sueldos
en dicha empresa es homognea? Por qu?
c) Calcule e interprete el valor del coeficiente de asimetra de Pearson.
d) La empresa decide incrementar el sueldo de cada empleado en el 20%, ms una
bonificacin de S/.400. Calcule e interprete el coeficiente de variacin de la nueva
distribucin de sueldos.
26. La siguiente tabla de frecuencias corresponde a los jornales, en soles, de los obreros de
una fbrica que cuenta con 500 obreros:
Jornal (soles) xi fi Fi hi Hi
[ 80 90 [ 0.10
[ 90 100[ 110 0.22
[100 110[ 120
[110 120[ 80
[120 130[ 70
[130 140[ 60 490
[140 150]
a) Calcule la desviacin estndar de los sueldos de las personas encuestadas que vivan
en Surco.
b) Calcule el coeficiente de variacin de los sueldos de las mujeres encuestadas.
c) Calcule la desviacin estndar de los sueldos de los hombres encuestados que vivan
en San Isidro.
d) Calcule el coeficiente de variacin de los sueldos de las mujeres encuestadas que vivan
en La Molina.
28. Una central de riesgo crediticio va elegir a cul de los 2 bancos que se presentan otorgar
la calificacin +BBB
Banco A BancoB
Monto(mil $) Nro. Acreedores Monto($) Nro. acreedores
[12 16[ 2 [10 14[ 1
[16 20[ 4 [14 18[ 4
73
29. En una fbrica, el personal de planta est dividido en supervisores, operarios calificados y
asistentes. Se cuenta con la siguiente informacin:
30. En la agencia INTERBANK del Jockey Plaza hay 15 empleados cuyo sueldo promedio es
S/.4200 con una desviacin estndar de S/.300. En la agencia de SCOTIABANK del
mismo centro comercial hay 30 empleados que tienen un sueldo promedio de S/.3900 con
una desviacin estndar de S/.250. Mediante una negociacin los de INTERBANK
obtienen un aumento del 10% ms una bonificacin de S/.50, mientras que los DE
SCOTIABANK obtienen un incremento de S/.120. Calcule el coeficiente de variacin de
los sueldos, tanto para los de INTERBANK como para los de SCOTIABANK, qu grupo
de trabajadores tiene los sueldos ms homogneos?
31. Las edades en aos de los asistentes a cierto curso fueron: 39, 37, 35, 41, 37, 40, 38, 25,
39., despus de dos aos volvieron a reunirse.
a) Qu cambio han sufrido las edades de estas personas?
b) Qu cambios han sufrido la media y las medidas de variabilidad, despus de los 2 aos?
Los resultados se muestran a continuacin:
Variable Mean StDev Variance CoefVar Minimum Q1 Median Q3 Variable Maximum
edades 36.78 4.76 22.69 12.95 25.00 36.00 38.00 39.50 edades 41.00
edades1 38.78 4.76 22.69 12.29 27.00 38.00 40.00 41.50 edades1 43.00
74
Captulo 4
Regresin Lineal.
Introduccin.-
Una empresa quiere evaluar el consumo en miles de kilowatts-hora, para una casa de seis
habitaciones. El sabe que hay relacin entre el consumo de energa y el nmero de
habitaciones de las residencias unifamiliares.
Una importante aerolnea piensa que hay relacin entre el nmero de pasajeros y el peso
total del equipaje almacenado en el compartimiento correspondiente. Puede concluirse
que existe una relacin positiva entre las dos variables.
75
EL COEFICIENTE DE CORRELACIN
Un curso de estadstica tiene tres horarios y el coordinador del curso y los profesores
estn interesados en construir grficos que le permita analizar las notas de las distintas
evaluaciones y en los distintos horarios. Los datos se encuentran en el archivo:
Base_Datos_2.xlsx.
Solucin
1) En una investigacin se desea conocer en que medida el peso de una persona depende
de su estatura, para ello se tomaron las estaturas redondeadas en pulgadas y los pesos
en libras de una muestra de 12 estudiantes tomada al azar entre los estudiantes de 1er
ao en la escuela de administracin:
Estatura (pulg.) 70 63 72 60 66 70 74 65 62 67 65 68
Pesos (lb.) 155 150 180 135 156 168 178 160 132 145 139 152
. Obtener un diagrama de dispersin para esos datos.
Clientes 907 926 506 741 789 889 874 510 529 420
Ventas 11,2 11,05 6,84 9,21 9,42 10,08 9,45 6,73 7,24 6,12
a) Realice el diagrama de dispersin y analcelo.
b) Calcule la recta de regresin lineal. Interprete el significado de la pendiente de la recta
en el problema.
Sol: Y = 0,009X + 2,21
c) Pronostique las ventas semanales para las tiendas que tienen 600 clientes.
79
ANEXO
MTODOS DE MUESTREO
Ejemplo1:
Suponga que estamos investigando sobre el porcentaje de alumnos que
trabajan de una poblacin de 20 alumnos de la Universidad de Lima.
Base de datos de la poblacin:
Nombre Alumno Trabaja? Nombre Alumno Trabaja?
Juan SI Mara NO
Alicia NO Fernanda NO
Pedro NO Julio SI
Marcos NO Rosa NO
Alberto SI Fabin NO
Jorge SI Ana NO
Jos NO Laura NO
Carlos NO Enrique NO
Miguel NO Carmen SI
Victoria SI Marcelo SI
Nombre Nombre
Nmero Trabaja? Nmero Trabaja?
Alumno Alumno
1 Juan SI 11 Mara NO
2 Alicia NO 12 Fernanda NO
3 Pedro NO 13 Julio SI
4 Marcos NO 14 Rosa NO
5 Alberto SI 15 Fabin NO
6 Jorge SI 16 Ana NO
7 Jos NO 17 Laura NO
8 Carlos NO 18 Enrique NO
9 Miguel NO 19 Carmen SI
10 Victoria SI 20 Marcelo SI
Segundo:
Buscamos en la tabla de nmeros aleatorios 4 nmeros, de dos
80
Los nmeros seleccionados son: 10, 1, 11, 20. Por lo tanto, la muestra est
compuesta por:
*10: Victoria que SI trabaja.
*1: Juan que SI trabaja.
*11: Mara que NO trabaja.
*20: Marcelo que SI trabaja.
Respuesta:
Para elegir una muestra estratificada, primero se dividen los
81
Por lo tanto, la muestra del estrato de mujeres queda constituida por Alicia y
Fernanda. Alicia y Victoria NO trabajan.
82
Por lo tanto, la muestra final queda constituida por Fabin, Juan, Alicia
y Fernanda.
Finalmente, la proporcin de alumnos que trabaja en la muestra
estratificada es de 25%.
Primero:
Asignamos etiqueta a cada persona del 1 al 22:
Etiqueta Nombre Droga Etiqueta Nombre Droga
01 Felipe Alcohol 12 Antonio Alcohol
02 Wilma Marihuana 13 Gerardo Marihuana
03 Jos Pasta Base 14 Carmen Alcohol
04 Viviana Cocana 15 Pamela Cocana
05 Pablo Alcohol 16 Mara Pasta Base
06 Rodrigo Marihuana 17 Alejandra Extasis
07 Carlos Extasis 18 Eduardo Neoprn
08 Catherine Alcohol 19 Ronal Relevon
09 Claudia Marihuana 20 Susana Herona
10 Valentina Neoprn 21 Hugo Marihuana
11 Enrique Marihuan 22 Hernn Alcohol
Segundo:
Buscamos en la tabla de nmeros aleatorios 6 nmeros, de dos
dgitos, entre el 1 y el 22, sin repetir. Se parte de la fila 10 y
columna 21.
83
columna
1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-60 61-65 66-70
fila
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570 91291 90700
2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095 52666 19174 39615 99505
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655 63348 58629
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917 97758 16379
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927 01263 54613
6 77921 06907 11008 42751 27756 53498 18602 70659 90665 15053 21916 81825 44394 42880
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903 42508 32307
9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 44947 05585 56941
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458 18593 64952
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 97610 78188
12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 90511 33703 90322
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156 30613 74952
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285 29975 89868
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461 28551 90707
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990 75601 40719
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05944 55157
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915 92747 64951
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749
20 07056 97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 19509 25625 58104