Vous êtes sur la page 1sur 26

ESTADSTICA DESCRIPTIVA

Recopilacin de problemas de pruebas y controles anteriores


-------------------------------------------------------------------------------------------------------------
Pregunta 1
Una compaa internacional ha perfeccionado un producto de consumo especialmente
apropiado para pases en desarrollo. La firma desea fabricar su producto en los pases que
haya un milln o ms de hogares con ingresos anuales de $400 o ms. Se recolectan datos
iniciales en cinco pases para determinar cuales de ellos, si los hay, cumplen los requisitos
mnimos. La investigacin inicial revela los datos que se dan luego. Qu pas o pases se
debern recomendar para que se instale la firma? Justifique su respuesta.
PAIS MEDIA
$
MEDIANA
$
MODA
$
VARIANZA
$
N DE
HOGARES
A 500 137 125 5625 5000000
B 435 159 147 2704 6000000
C 403 402 348 100 2000000
D 415 390 360 400 2000000
E 417 410 408 324 1900000

Solucin
La condicin impuesta por la compaa para instalarse en un pas es una condicin de
cantidad de hogares que tienen ciertos ingresos. No es una condicin sobre el ingreso
medio o sobre el ingreso ms repetido o sobre la variabilidad de los ingresos.
As, el pas en el que con claridad debe instalarse la compaa es el pas C porque tiene 2
millones de habitantes con una mediana para los ingresos de $ 402. Esto quiere decir que la
mitad de los hogares (1 milln) gana $402 ms
-------------------------------------------------------------------------------------------------------------
Pregunta 2
La siguiente figura muestra la distribucin de
frecuencias acumuladas de una variable estadstica X.
a) Calcule su media y desviacin estndar.
b) Qu porcentaje de los valores de X estn en
el intervalo [ ] S X S X + , ?
X es el promedio
S es la desviacin estndar (con n )


Solucin
Del dibujo se puede reconstruir la tabla de frecuencias que aparece ms abajo. A partir de
esa tabla se pueden hacer los clculos.
a) X =12.65
S =5,03
b) [ ] ] 68 . 17 ; 62 . 7 [ , = + S X S X
Usando percentiles se tiene que el porcentaje de datos acumulados hasta 17.68 es
i = ((17,68-17)*16/3+80)*100/100 = 83.63%
El porcentaje de datos acumulados hasta 7.62 es
i = ((7,62-5)*9/3+12)*100/100 = 19.86%

Luego, en el intervalo [ ] ] 68 . 17 ; 62 . 7 [ , = + S X S X hay 83.63%-19.86% = 63.77%
de los valores de X
Intervalo Xi ni Ni ni(xi-12,65)^2
[2 - 5[ 3,50 12 12 1004,67
[5 - 8[ 6,5 9 21 340,4025
[8 - 11[ 9,5 11 32 109,1475
[11 - 14[ 12,5 22 54 0,495
[14 - 17[ 15,5 26 80 211,185
[17 - 20[ 18,5 16 96 547,56
[20 - 23[ 21,5 4 100 313,29
100 25,2675

media 12,65
varianza 25,27
desv estndar 5,03 % acumulado Diferencia de %
X-S 7,62 19,86
X+S 17,68 83,63 63,77
-------------------------------------------------------------------------------------------------------------
Pregunta 3
La siguiente tabla corresponde a la distribucin de frecuencias del tiempo en minutos que
una muestra de operarios de una fbrica demora en armar cierto producto:
Tiempo Nmero de operarios
10 20 7
20 30 15
30 40 19
40 50 9
a) Se ha decidido enviar a un curso de capacitacin al 21% de los operarios ms lentos
en el tiempo de armado. Si un operario demor 37 minutos, ser enviado al curso?
b) Si se sabe que el tiempo de armado del producto disminuy en 15%, cul era el
tiempo de armado promedio anterior?
c) Identifique la variable medida e indique su tipo.
Solucin Para resolver este problema se requiere conocer:
Tablas de frecuencias
Percentiles
Transformacin de datos
Medias o promedios
Clasificacin de variables estadsticas
a) La tabla de frecuencia con los datos necesarios es
Tiempo
i
X
i
n
i
f
i
N
i
F
10 20 15 7 0.14 7 0.14
20 30 25 15 0.30 22 0.44
30 40 35 19 0.38 41 0.82
40 50 45 9 0.18 50 1
Total 50 1

El tiempo a partir del cual estn el 21% de los operarios ms lentos corresponde
al percentil 79. Este nmero se encuentra en el intervalo 30-40 y se calcula como

79
P = 10
19
22 79
100
50
30

+ = 39.21 minutos.
Entonces, el 21% de los operarios ms lentos demora ms de 39.21 minutos. Por
tanto, un operario que se demora 37 minutos en armar el producto no necesita ser
enviado a capacitacin.
b) El tiempo promedio de armado de los trabajadores est dado por
X =
n
X n
k
i
i i
=1
= (7(15)+15(25)+19(35)+9(45))/50= 31 minutos.
Si X es el tiempo de armado actual e Y el tiempo de armado anterior, entonces la
relacin entre estos tiempos es Y X 85 . 0 = . Los promedios sufren la misma
transformacin lineal, entonces Y X 85 . 0 = Luego, el tiempo promedio de armado
anterior era de,
47 . 36 85 . 0 / 31 85 . 0 / = = = X Y minutos.
c) Variable: Tiempo de armado de un producto en minutos
Tipo: Cuantitativa continua
-------------------------------------------------------------------------------------------------------------
Pregunta 4.
A causa de una recesin econmica los precios actuales de tres artculos son A=$50.35,
B=$5,48 y C=$0,03. Antes de la recesin los precios tenan las siguientes caractersticas:
Artculo Promedio Desviacin estndar
A $45,20 $3,432
B $5,31 $0,574
C $0,02 $0,003
Qu artculo ha sido ms afectado por la recesin?. Justifique su respuesta
Solucin Para resolver este problema se requiere conocer:
El concepto de promedio y desviacin estndar
Variacin relativa.
Una forma de analizar el efecto de la recesin es hacer una comparacin de la variacin en
el precio con la desviacin estndar.
Variacin =
anterior estndar desviacin
anterior promedio actual precio

Artculo A: Variacin = (50.35-45.20)/3.432 = 1.5
Artculo B: Variacin = (5.48-5.31)/0.574 = 0.3
Artculo C: Variacin = (0.03-0.02)/0.003 = 3.3

El artculo ms afectado por la recesin es el artculo C porque su precio ha sufrido la
mayor variacin relativa disminuyendo 3.3 veces su desviacin estndar.
-------------------------------------------------------------------------------------------------------------
Pregunta 5
La siguiente figura, llamada diagrama de caja y bigote, presenta el comportamiento de la
rentabilidad de cuatro acciones, VTR, CAS, ACS y TEL, durante los ltimos 10 meses.
En qu accin sera razonable invertir? Por qu?
Max
Min
Mean+SD
Mean-SD
Mean
Diagrama de Caja y Bigote
ACCION
R
e
n
t
a
b
i
l
i
d
a
d

(
%
)
2
4
6
8
10
12
14
16
18
VTR CAS ACS TEL

Max = rentabilidad mxima. Min = rentabilidad mnima.
Mean = rentabilidad media. SD = desviacin estndar.
Solucin
Este problema no tiene respuesta nica.
Un inversor arriesgado invertira en las acciones CAS porque tienen mayor rentabilidad
promedio aunque poseen mayor variabilidad (riesgo)
Un inversor conservador invertira en las acciones ACS, la segunda en rentabilidad media,
pero ms segura (las de menor variabilidad).
-------------------------------------------------------------------------------------------------------------
Pregunta 6
La siguiente tabla muestra los volmenes enviados al exterior y los retornos generados por
las exportaciones de productos del mar, en el perodo enero-junio de 1997 y 1998, segn
inform la Sociedad Nacional de Pesca.
EXPORTACIONES PESQUERAS
Toneladas
Ene!un Ene!un
"illones de US#
Ene!un Ene!un
Producto $%%& $%%' $%%& $%%'
Harina
Aceite
Congelados
Conservas
Fresco refrigerado
Algas
Otros
445.590
77.796
79.266
22.356
17.598
22.216
1.966
352.340
39.133
67.945
20.221
17.331
16.075
1.194
171,5
21,9
267,5
47,9
82,7
32,9
7,7
145,5
10,1
248,7
58,3
80,3
25,5
5,1
Totales 666.788 514.239 632,1 573,5


En qu porcentaje vari, entre 1997 y 1998, el precio promedio por tonelada, de los dos
principales productos de exportacin de este sector?
Solucin
Basados en los volmenes y en los retornos, los dos principales productos de exportacin
de este sector son Harina y Congelados. Los precios promedio por tonelada descendieron
en 6,8% y 7,8% respectivamente. Los detalles de los clculos aparecen en la siguiente
tabla.
Toneladas Millones de USD USD/Tonelada Variacin %
Producto Ene-Jun Ene Jun Ene Jun Ene Jun
1998 1997 1998 1997 1998 1997
Harina 445590 352340 171,5 145,5 384,88 412,95 -6,8
Congelados 79266 67945 267,5 248,7 3374,71 3660,31 -7,8
-------------------------------------------------------------------------------------------------------------
Pregunta 7
La siguiente tabla corresponde a la distribucin de las ventas diarias (en miles de pesos) de
un grupo de empleados de una tienda que tiene dos sucursales.
Sucursal 1 Sucursal 2
Ventas Frecuencia Ventas Frecuencia
200 300 6 200 -300 4
300 400 15 300 - 400 12
400 500 13 400 - 500 18
500 600 9 500 - 600 13
a) Represente estos datos en un grfico de barras conjunto para ambas sucursales.
b) Calcule la media y la desviacin estndar de las ventas diarias para cada sucursal.
c) Usando b), compare las ventas diarias de ambas sucursales.
d) Obtenga la media y la desviacin estndar de las ventas diarias totales de la tienda.
e) Estime las ventas diarias totales de la tienda.
Solucin
a) Se presentan dos soluciones. La ms natural es la primera.








b)

SUCURSAL 1 SUCURSAL 2
i
X
i
n
i
X
i
n
250
6
250
4
350
15
350
12
450
13
450
18
550
9
550
13
n 43 47
Media 408,140 435,106
Desv Estndar 97,008 92,204
VENTAS POR SUCURSAL
0
5
10
15
20
200 300 300 400 400 500 500 600
Ventas (miles de $)
F
r
e
c
u
e
n
c
i
a
Sucursal 1
Sucursal 2
VENTAS POR SUCURSAL
0
5
10
15
20
25
30
35
200 300 300 400 400 500 500 600
Vantas (miles de $)
F
r
e
c
u
e
n
c
i
a
Sucursal 2
Sucursal 1



c) El promedio de ventas por empleado es mayor en la Sucursal 2 que en la Sucursal 1
(435,106>408,140)
La variabilidad en las ventas de los empleados es similar en ambas sucursales
(34,19)
d)
Media total 422,222
Varianza Dentro 8935,840343
Varianza Entre 181,443608
Varianza Total 9117,283951
Des. Est Total 95,484470

e) Ventas totales = 422,222*(43+47)=38000 (miles de $)
-------------------------------------------------------------------------------------------------------------
Pregunta 8
Un editor de libros necesita rapidez en el manejo de las pruebas de pgina de los libros que
est por editar. Estas pruebas se tienen que enviar a los autores para una revisin final de la
composicin, los errores tipogrficos y otros aspectos. Dado que en los programas de
publicacin muy ajustados la rapidez es esencial, el editor est considerando utilizar un
Servicio expreso de entregas. Los ltimos 90 envos de pruebas se distribuyeron
aleatoriamente entre tres Servicios distintos y se registr el nmero de horas que requiri
cada entrega. Los resultados aparecen en la siguiente tabla

Servicio n Media Mediana Desv. Est Min Max Q1 Q3
1 30 40.07 40.00 4.53 32 50 37.75 42.50
2 30 37.17 36.00 7.25 24 55 31.75 41.50
3 30 44.60 45.50 13.55 20 74 34.00 50.50

a) Qu Servicio debera escoger el editor para enviar las pruebas de pgina?
b) Alguno de los tiempos de entrega mnimos y mximos observados puede ser
considerado un valor atpico?
Respuesta
a) El editor debera escoger el Servicio que demora menos tiempo en la entrega
En este caso, el Servicio 2 tiene el tiempo medio de entrega menor (37.17
hrs.). Tambin la mediana del tiempo de entrega es menor en el Servicio 2
(36 hrs.).
Desde el punto de vista de la variabilidad de los tiempos de entrega, el Servicio 1
es ms conveniente porque tiene la menor desviacin estndar (4.53hrs.), el menor
rango (18 hrs.) y el menor RIC (4,75). Sin embargo, el Servicio 1 tiene menor Q1
(31.75 hrs.) y menor Q3 (41,50 hrs.) lo que hace que la caja en el diagrama de
caja y bigote est ms a la izquierda que en los otros Servicios. En definitiva, el
editor debera escoger el Servicio 2.
b) Se necesita calcular el RIC y las barreras interiores que aparecen en la siguiente
tabla.
Servicio Min Max Q1 Q3 RIC BII BSI
1 32,00 50,00 37,75 42,50 4,75 30,625 49,63
2 24,00 55,00 31,75 41,50 9,75 17,125 56,13

1 3
Q Q RIC =
RIC Q BII 5 . 1
1
=
RIC Q BSI 5 . 1
3
+ = .




Se observa que todos los valores mnimos y mximos se encuentran entre BII y BSI,
excepto el mximo de 50 hrs. observado en el Servicio 1. Por tanto, slo este valor puede
ser considerado como candidato a valor atpico.
-------------------------------------------------------------------------------------------------------------
Pregunta 9 La siguiente tabla resume la informacin entregada por 3 supermercados
respecto al precio de los 50 artculos ms consumidos por las familias chilenas.
SUPERMERCADO1 SUPERMERCADO2 SUPERMERCADO3
289 = X 15750 =
i
X 16500 =
i
X
S = 60

= 5086250
2
i
X
2424 . 0 = CV
n = 50 n = 50 n = 50

a) Compare los precios cobrados por los supermercados por estos 50 productos.
b) Cul es el promedio y la varianza total de los precios de los 50 productos,
considerando los tres supermercados en conjunto?
Respuesta
a) En promedio, el Supermercado 3 cobra ms que los otros por estos 50 productos
(330>315>289)
La variabilidad en los precios de estos 50 artculos es menor en el Supermercado 2
(50<60<80)
b) Se requiere calcular medias y varianzas de los precios para cada Supermercado

Supermercado 1 Supermercado 2 Supermercado 3
Media
i
X
289 315 330
Desv.Est
i
S
60 50 80
Varianza
2
i
S
3600 2500 6400

i
n
50 50 50

Luego, se requiere usar las formulas para medidas totales a partir de una muestra
estratificada.
Media Total:
T
r r
T
n
X n X n
X
+ +
=
...
1 1
=
50 50 50
330 50 315 50 289 50
+ +
+ +

= 311,33
Varianza dentro:
T
r
j
j j
n
S n

=1
2
= 67 , 4166
50 50 50
6400 50 2500 50 3600 50
=
+ +
+ +

3 20,00 74,00 34,00 50,50 16,5 9,25 75,25

Varianza entre:
T
r
j
T j j
n
X X n

1
2
) (
=

50 50 50
) 33 , 311 330 ( 50 ) 33 , 311 315 ( 50 ) 33 , 311 289 ( 50
2 2 2
+ +
+ +
=
= 89 , 286
Varianza Total:
T
r
j
T j j
T
r
j
j j
T
n
X X n
n
S n
S

= =

+ =
1
2
1
2
2
) (
= 89 , 286 67 , 4166 + = 56 , 4453
Nota: 1. La desviacin estndar total resulta ser 73 , 66 56 , 4453 = =
T
S
2. Los resultados se muestran en la siguiente tabla

Media Total 311,33
Varianza Dentro 4166,67
Varianza Entre 286,89
Varianza Total 4453,56
Des Est Total 66,73
-------------------------------------------------------------------------------------------------------------
Pregunta 10
Se tiene la siguiente informacin relativa a los ingresos percibidos por tres grupos sociales
GRUPO SOCIAL
A B C
n 25 45 30
X
300 500 600
CV 0,35 0,35 0,35

a) Calcule el CV (coeficiente de variacin) de los ingresos totales.
b) Si todos los ingresos se reajustan en un 20%, calcule el nuevo CV de cada grupo social y
el CV de los ingresos totales. Qu concluye?
Solucin
a) Como CV= X S / , entonces la varianza de cada grupo es
2 2
) ( CV X S = . Estas se
muestran en la siguiente tabla
GRUPO SOCIAL
A B C
n 25 45 30
X
300 500 600
CV 0,35 0,35 0,35
2
S
11025 30625 44100

Para calcular el
T
CV total se requieren la media y la varianza totales dadas por
T
r r
T
n
X n X n
X
+ +
=
...
1 1
= 480
100
) 600 ( 30 ) 500 ( 45 ) 300 ( 35
=
+ +



T
r
j
T j j
T
r
j
j j
T
n
X X n
n
S n
S

= =

+ =
1
2
1
2
2
) (
+
+ +
=
100
) 44100 ( 30 ) 30625 ( 45 ) 11025 ( 25


100
) 480 600 ( 30 ) 480 500 ( 45 ) 480 300 ( 25
2 2 2
+ +
+
= 29767.5+12600 = 42367.5

Entonces, 833671 . 205 5 . 42367 = =
T
S y el coeficiente de variacin total es
T T T
X S CV / = = 4288 . 0 480 / 833671 . 205
b) En este caso se trata de una transformacin lineal de datos del tipo
i i
bx a y + = , con
0 = a y 2 . 1 = b Las nuevas medias son X Y 2 . 1 = y las nuevas desviaciones estndar
x y
S S 2 . 1 =
Por tanto, al hacer la divisin de la nueva desviacin estndar con el nuevo promedio,
el factor 1.2 se cancela y en consecuencia se obtiene el mismo CV por grupo y el
mismo CV total.

-------------------------------------------------------------------------------------------------------------
Pregunta 11
Suponga que los datos de dos muestras son
Muestra 1: 18 19 21 25
Muestra 2: 14 17 18 19 19 20 20 20 21 21 22
a) Encuentre el rango de cada muestra
b) Encuentre la media y la desviacin estndar de cada muestra.
c) Use los clculos de la parte b) para comentar las diferencias y/o similitudes en las dos
muestras.
----------------------------------------------------------------------------------------------------------------
Pregunta 12
La gerencia de un banco, preocupada por el servicio al cliente, desea estimar, entre otras
cosas, el nmero medio de clientes que atiende por hora uno de sus cajeros (el seor XX).
Para tal efecto, durante una semana observar la variable de inters.
a) Identifique claramente la poblacin bajo estudio.
b) Identifique la muestra. Cul es el tamao de esta muestra?
c) Identifique la variable relevante a su estudio. Clasifique esta variable.
-------------------------------------------------------------------------------------------------------------
Pregunta 13
Los resultados de la muestra del Problema 12 fueron procesados en Excel, obteniendo la
planilla siguiente:



a) Interprete, en trminos del problema, el valor de la mediana.
b) Interprete, en trminos del problema, el valor de la desviacin estndar.
c) Dibuje aproximadamente la forma del polgono de frecuencias.
d) Existe algn valor atpico? Justifique.
----------------------------------------------------------------------------------------------------------------
Problema 14
La siguiente tabla muestra las caractersticas demogrficas y de servicio social de 7
ancianos de un asilo.

(I)
Edad
(II)
Visitas al mdico
en el ltimo ao
(III)
Ingreso mensual
$
(IV)
Gnero
74
81
83
77
76
79
79
8
7
11
4
5
13
7
2347
2434
1636
1963
2358
1968
2683
M
M
F
M
F
F
M

Suponga que usted es un trabajador social en una agencia que ofrece servicios de asistencia
a los 7 ancianos. Se le pide proporcionar algunas estadsticas descriptivas para los archivos
de la agencia a partir de la tabla anterior.
a) Calcule el promedio X y la desviacin estndar S de las edades (columna I)
b) Qu porcentaje de las edades est en el intervalo ] ; [ S X S X + ?
c) Calcule e interprete la mediana de los ingresos mensuales (columna III)
d) Represente grficamente el gnero de los ancianos (columna IV)
e) Compare el nmero de visitas al mdico en el ltimo ao de hombres (M) y
mujeres (F)
----------------------------------------------------------------------------------------------------------------
Problema 15
Columna1
Media 18,0662514
Error tpico 0,63419484
Mediana 18,5376324
Moda #N/A
Desviacin estndar 4,01100037
Varianza de la muestra16,088124
Curtosis 3,9007229
Coeficiente de asimetra -1,25431505
Rango 22,4714626
Mnimo 3
Mximo 25,4714626
Suma 722,650055
Cuartil 1 16,1859537
Cuartil 2 18,5376324
Cuartil 3 20,4492272

Los siguientes datos corresponden a la rentabilidad diaria de una carpeta de acciones
0,9 0,8 0,6 0,5 0,6 0,7 0,8 0,5 -0,1 -0,8
a) Determine
1
Q ,
2
Q , RIC y las barreras interiores y exteriores del mtodo de
Tukey para determinar si existen datos atpicos Si los hubiera, cules son?
b) Grafique estos datos mostrando las barreras e identificando claramente all los
valores atpicos si los hubiera
Solucin
a) Los datos ordenados de menor a mayor son
-0,8 -0,1 0,5 0,5 0,6 0,6 0,7 0,8 0,8 0,9

La posicin de
1
Q es 0 , 3 75 , 2 4 / ) 1 ( = + n Entonces, 5 , 0
1
= Q
La posicin de
2
Q es 0 , 6 5 , 5 2 / ) 1 ( = + n Entonces, 6 , 0
2
= Q
La posicin de
3
Q es 0 , 8 5 , 7 4 / ) 1 ( 3 = + n Entonces, 8 , 0
3
= Q

3 , 0 5 , 0 8 , 0
1 3
= = = Q Q RIC

4 , 0 ) 3 , 0 ( 3 5 , 0 3
1
= = = RIC Q BIE
05 , 0 ) 3 , 0 ( 5 , 1 5 , 0 5 , 1
1
= = = RIC Q BII
25 , 1 ) 3 , 0 ( 5 , 1 8 , 0 5 , 1
3
= + = + = RIC Q BSI
70 , 1 ) 3 , 0 ( 0 , 3 8 , 0 0 , 3
3
= + = + = RIC Q BSE
Slo el dato -0,8 es atpico porque es menor que 4 , 0 = BIE
b)

----------------------------------------------------------------------------------------------------------------
Problema 16
La siguiente tabla muestra las caractersticas demogrficas y de servicio social de 7
ancianos de un asilo.
Edad Visitas al mdico en el ltimo ao Ingreso mensual $ Gnero
74
81
83
77
76
79
79
8
7
11
4
5
13
7
2347
2434
1636
1963
2358
1968
2683
M
M
F
M
F
F
M

a) Determine cul de las variables, edad o ingresos, permite predecir mejor el nmero
de visitas al mdico el ltimo ao.
b) Encuentre una recta de regresin que permita predecir el nmero de visitas al
mdico el ltimo ao.
Solucin

a) La correlacin entre la Edad y el Nmero de Visitas es 0,454
La correlacin entre Ingreso y el Nmero de Visitas es-0,455
Las correlaciones son similares en magnitud. Da lo mismo usar Edad o Ingresos
para predecir el Nmero de Visitas al mdico. Se escoge Ingresos.
b) Visitas=16,783-0,004*Ingresos

Problema 17
Se mide el tiempo de secado de 55 superficies de 1 metro cuadrado cada una utilizando la
pintura A y 70 superficies de 1 metro cuadrado cada una utilizando la pintura B. Las
salidas Excel que se anexan muestran las estadsticas para el tiempo de secado de dos tipos
de pintura.


a) Compare los tiempos de secado de las pinturas A y B utilizando medidas de
tendencia central y de dispersin.
b) Utilice los resultados obtenidos para determinar si existe la posibilidad de observar
valores atpicos en alguna de las dos muestras.
c) Qu pintura utilizara usted? Explique.
-------------------------------------------------------------------------------------------------------------
Problema 18 Los siguientes resultados corresponden a las ventas diarias de un
articulo en tres supermercados de la regin. En cada caso, qu medida de tendencia
central es ms adecuada para describir la centralidad de las ventas. Justifique su respuesta.
Supermercado A: 2, 3, 5, 7, 22
INGRESOS
2800 2600 2400 2200 2000 1800 1600
V
I
S
I
T
A
S
14
12
10
8
6
4
2
Pintura A Pintura B
Media 54,8381818 Media 59,7257143
Error tpico 3,6137788 Error tpico 2,12941218
Mediana 51,3 Mediana 61,55
Moda #N/A Moda 81,2
Desviacin estndar 26,8005009 Desviacin estndar 17,8159405
Varianza de la muestra 718,266848 Varianza de la muestra 317,407735
Curtosis -0,88600324 Curtosis -0,47529562
Coeficiente de asimetra 0,13375375 Coeficiente de asimetra -0,32597859
Rango 104,9 Rango 78,5
Mnimo 3 Mnimo 15,5
Mximo 107,9 Mximo 94
Suma 3016,1 Suma 4180,8
Cuenta 55 Cuenta 70
cuartil 1 34,15 cuartil 1 46,725
cuartil 3 76,1 cuartil 3 73,525

Supermercado B: 2, 4, 6, 18, 28, 34
Supermercado C: 2, 6, 18, 54, 162
--------------------------------------------------------------------------------------------------------------
Problema 19 Calcule la media, mediana, desviacin estndar y rango percentil
usando el siguiente histograma
Problema 20
La empresa ILUMINA est realizando un estudio de la duracin de las ampolletas que
produce para uso domstico. A causa de un virus en su red, la empresa slo pudo
recuperar parte de los datos. Estos aparecen en la siguiente tabla con varias celdas
perdidas.
Duracin
horas
i
a
i
X
i
n
i
f
i
N
i
F
0,040
50-80 28
80-100 62
55
120-150 0,825
0,100
200 15
TOTAL 200

a) Repare la tabla.
b) Calcule la media, moda y mediana de la duracin de las ampolletas.
c) Calcule la desviacin estndar.
d) Qu tiempo de garanta se debe dar si no se quiere reemplazar ms del 15% de las
ampolletas?
----------------------------------------------------------------------------------------------------------------
Problema 21
La siguiente tabla presenta los resultados del proceso de admisin a una Escuela de
Graduados de cierta Universidad

Programa Hombres Mujeres
Postulantes Aceptados % Postulantes Aceptados %

A
B
C
D
E
F
825
560
325
417
191
373
62
63
37
33
28
6
108
25
593
375
393
341
82
68
34
35
34
7

a) Represente en un grfico adecuado el nmero de postulantes qu concluye?
b) Represente en un grfico adecuado el porcentaje de aceptados qu concluye?
c) Compare el porcentaje total de hombres aceptados con el porcentaje total de
mujeres aceptadas en esa Escuela de Graduados qu concluye?
----------------------------------------------------------------------------------------------------------------
Problema 22
Gale Marrs, gerente de personal de la compaa Baxter Richfield sospecha que los
trabajadores de ms edad pierden ms das de trabajo al ao por enfermedad que los
trabajadores jvenes. Gale elige al azar los registros de 10 empleados de 40 aos o ms y
de 10 empleados de menos de 40 aos. Los datos obtenidos se procesaron en Excel y en
SPSS y corresponden al nmero de das laborales en los que el respectivo trabajador estuvo
ausente el ltimo ao. A continuacin se entregan las salidas de inters:
menos de 40 40 o ms menos de 40 40 o ms
() *'
)( $% "edia $'+* (*+(
$& ($ Error t,pico *+-)*-*&'( -+'%.$.'*(
$- *- "ediana $.+- (/
/ $. "oda 0N1A 0N1A
% ) 2es3iacin est4ndar $$+(/-.-** $&+*(%/%/)
$/ / 5arian6a de la muestra $(-+-....' **-+%----.
(/ $( Curtosis (+$%&)-% $+)'%'*..)
(( .* Coe7iciente de asimetr,a /+%$))/(%. $+/*-$*&*.
$* (- Ran8o )( .*
",nimo / /
"49imo )( .*
Suma $'* (*(
Cuenta $/ $/
Das ausentes



a) Analice las salidas entregadas y, fundamentado en estas salidas, presente un informe
que considere los aspectos ms importantes observados respecto al nmero de das de
ausencias por motivo de enfermedad en estos dos grupos de trabajadores. (Su informe
no debe contener ms de 25 lneas.)
Respuesta
Se esperara que un trabajador menor de 40 aos se ausente aproximadamente 17,3
das. La mitad de este grupo se ausenta 16,5 das o menos aproximadamente.
Se esperara que un trabajador de 40 aos o ms se ausente aproximadamente 23,2
das laborales. La mitad de estos se ausentan a los ms 20 das laborales.
La distribucin de los trabajadores menores de 40 aos es asimtrica con valores entre
0 y 24 das aproximadamente, salvo por la presencia de un dato atpico (42) que
produce un coeficiente de asimetra positivo y hace crecer la dispersin de este grupo.
Sin este dato atpico la distribucin seria asimtrica negativa y la dispersin menor.
La distribucin de los trabajadores de 40 aos o ms es asimtrica con valores entre 0
y 63 das, se observa claramente sesgo hacia la derecha (este resultado se confirma con
el coeficiente de asimetra obtenido).
La dispersin es diferente en ambos grupos, siendo mayor en el grupo de trabajadores
de 40 aos o ms. En este sentido la ocurrencia de observaciones mayores a 24 das
ausentes es probable en el grupo de trabajadores de 40 aos o ms e improbable en el
grupo de menos de 40 aos.

b) Gale ha pedido calcular la mediana de cada grupo, despus de eliminar valores
atpicos detectados por medio de los diagramas de caja. Obtenga estos nuevos valores
de medianas y decida si estos valores producen cambios de importancia en lo ya
observado.
Respuesta

Mediana (menores de 40 aos) = 15
Mediana (40 aos o mas) = 20
El cambio en la mediana de menores de 40 aos es menor. No hay cambios de
importancia asociados a este valor de mediana.
----------------------------------------------------------------------------------------------------------------
Problema 23
El chef en jefe del restaurante Parisien acaba de recibir dos docenas de tomates de un
proveedor pero todava no los acepta. Sabe por la factura que el peso promedio de un
tomate es 7.5 onzas, pero insiste en que todos tengan un peso uniforme. Aceptar los
tomates slo si el peso promedio es 7.5 onzas y la desviacin estndar es menor que 0,5
onzas. Los pesos de los tomates son los siguientes
6.3 7.2 7.3 8.1 7.8 6.8 7.5 7.8 7.2 7.5 8.1 8.2
8.0 7.4 7.6 7.7 7.6 7.4 7.5 8.2 7.4 7.6 6.2 7.4
a) Calcule la media X y la desviacin estndar S del peso de los tomates
b) Cul debera ser la decisin del chef y por qu?
c) Qu porcentaje de los tomates recibidos tiene un peso en el intervalo
] ; [ S X S X +
d) Usando c) da una interpretacin de la desviacin estndar S en trminos del peso de
los tomates.
Solucin
a) La media y la desviacin estndar son 7,49166667 7,5 y 0,5032533 0,5
b) La decisin del chef debera ser aceptar la partida de tomates puesto que se
cumplen sus exigencias en cuanto a la media y en cuanto a la desviacin estndar
del peso de los tomates.
c) El intervalo es ] ; [ S X S X + = [7,5- 0,5 ; 7,5+0,5]= [7,0 ; 8,0]
Aqu hay 17 pesos de tomates lo que corresponde al (17/24)*100=71% de ellos
d) El 71% de los tomates tiene un peso alrededor de la media de 7,5 onzas y no ms
all de una desviacin estndar.


Problema 24
Para los datos del problema 24 haga lo siguiente:
a) Calcula e interpreta la mediana en trminos del peso de los tomates.
b) Presenta los datos en una tabla de frecuencia de 5 intervalos
c) Usando b) presenta grficamente los datos.
d) Calcula el sesgo y decide cul de las tres medidas del centro, media, mediana o
moda, es ms apropiada para representar el peso de los tomates Justifica tu
respuesta.
Solucin
a) La mediana es 7,5 e indica que el 50% de los tomates tiene un peso menor que 7,5
onzas y el otro 50% de ellos tiene un peso superior a 7,5 onzas
b)
Intervalo Amplitud
i
X
i
n
i
f
i
N
i
F

[6,2 6,6[ 0,4 6,4 2 0,083
[6,6 7,0[ 0,4 6,8 1 0,042
[7,0 7,4[ 0,4 7,2 3 0,125
[7,4 7,8[ 0,4 7,6 11 0,458
[7,8 8,2] 0,4 8,0 7 0,292

24
c)

d) 050 , 0
5033 , 0
) 5 , 7 4917 , 7 ( 3 ) ( 3
=

=
S
Mediana X
P
La mediana es ms adecuado debida al sesgo negativo. Sin embargo, con un
decimal, la media es igual a la mediana.
----------------------------------------------------------------------------------------------------------------
Problema 25
Una compaa de seguros califica los modelos de automviles en base a la cantidad de
accidentes en carretera y en base a los montos de las prdidas debidas a estos accidentes.
Un ndice de de calificacin de 100 se considera normal. Un ndice menor que 100 es
mejor porque estos ndices estn asociados a autos ms seguros. A continuacin se
presentan las calificaciones de una muestra de 20 automviles medianos y de una muestra
de 20 automviles pequeos. Tambin se presentan algunas salidas del programa SPSS.

Mediano 81 91 93 127 68 81 60 51 58 75
91 93 127 68 81 60 51 58 75 91
Pequeo 73 100 127 100 124 103 119 108 109 113
108 118 103 120 102 122 96 133 80 140

a) Para cada muestra, calcule el porcentaje de autos con ndice menor o igual a 100.
Compare estos porcentajes. Qu concluye?
Respuesta
Auto Mediano: 16 de 20 corresponde a un 80% de los autos en la muestra
Auto Pequeo: 5 de 20 corresponde a un 25% de los autos en la muestra

El porcentaje de autos con ndice menor o igual a 100 es mayor para los autos
medianos que para los autos pequeos. Por tanto, esta muestra sugiere que los autos
medianos son ms seguros.

b) Interprete la mediana de las calificaciones, para cada tipo de auto. Qu concluye?
Respuesta
El 50% de los autos medianos tiene un ndice de calificacin menor o igual a 81,5
El 50% de los autos pequeos tiene un ndice de calificacin menor o igual a 108,5

0
2
4
6
8
10
12
[6,2 - 6,6[ [6,6 - 7,0[ [7,0 - 7,4[ [7,4 - 7,8[ [7,8 - 8,2]

La mediana indica que en la muestra los autos medianos tienden a tener ndices
menores que los autos pequeos. Por tanto, la mediana tambin sugiere que los autos
medianos son ms seguros que los pequeos.

c) Para cada uno de los conjuntos de datos, qu tipo de sesgo pareciera apreciarse en los
respectivos diagramas de caja? Se confirma cada posible sesgo, con la ubicacin
relativa de la media y la mediana? Explique.

Respuesta
Auto Media Mediana Diferencia Asimetra Asimetra
(media-mediana) Fisher Pearson
Pequeo 109,90 108,50 1,40>0 -0,410 0,250
Mediano 85,75 81,50 4,25>0 0,571 0,593

Para los datos de seguridad automotriz los valores para el coeficiente de asimetra
estn cercanos a 0 (alrededor de 0.5). Por esto, la asimetra que se observa en los
grficos es leve aunque un poco ms marcada para los autos medianos. En este grupo
el 60% de los ndices estn por debajo de la media de 85,75 (12 de 20 es un 60%). En
los autos pequeos, 11 de 20 un 55% de ellos tiene un ndice est abajo de la media.

Lo anterior sera confirmado por SPSS si este programa usara el coeficiente de
asimetra de Pearson dado por S Mediana X P / ) ( 3 = .
En cambio, SPSS usa el coeficiente de asimetra de Fisher con la formula e
interpretaciones siguientes.

(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la media. Este
valor es difcil de conseguir por lo que se tiende a tomar los valores que son
cercanos ya sean positivos o negativos ( 0.5).
(g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a
reunir ms en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a
reunir ms en la parte derecha de la media.

El ndice de Fisher es mucho ms sensible a valores atpicos debido a que trabaja con
el cubo de las desviaciones. En los datos para autos pequeos el que tiene ndice 73
(aunque no es atpico) hace que ese coeficiente resulte levemente negativo.

d) Cul de los dos conjuntos de datos presenta una mayor variabilidad? Justifique su
respuesta.
Respuesta En las salidas SPSS se observa que la varianza y los rangos son
menores para los autos pequeos que para los autos de tamao mediano. Por tanto, hay
mayor variabilidad en los ndices de seguridad de los autos de tamao mediano.

e) Qu porcentaje de autos pequeos en la muestra tiene una calificacin entre 81,6 y
132,4?

Respuesta
En la tabla de percentiles, se observa que el 10% de los autos pequeos tiene una
calificacin menor o igual 81,6 y que el 90% de ellos tiene una calificacin menor o igual
que 132,4.
Por tanto, el 80% de los autos pequeos en la muestra tiene una calificacin entre 81,6 y
132,4

Salidas SPSS para el Problema 25



Percentiles
73,3500 81,6000 100,5000 108,5000 121,5000 132,4000 139,6500
51,3500 58,2000 69,7500 81,5000 98,2500 126,2000 127,9500
101,0000 108,5000 121,0000
71,5000 81,5000 96,5000
tipo
pequeo
mediano
pequeo
mediano
indice
indice
Promedio
ponderado(definicin 1)
Bisagras de Tukey
5 10 25 50 75 90 95
Percentiles
Descriptivos
109,9000 3,68060
102,1964
117,6036
110,2778
108,5000
270,937
16,46016
73,00
140,00
67,00
21,00
-,410 ,512
,389 ,992
85,7500 4,80618
75,6906
95,8094
85,3333
81,5000
461,987
21,49388
51,00
128,00
77,00
28,50
,571 ,512
-,103 ,992
Media
Lmite inferior
Lmite superior
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Lmite inferior
Lmite superior
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
tipo
pequeo
mediano
indice
Estadstico Error tp.


Problema 26
Sea
1 2
, ,...,
n
x x x una muestra. Se define
i
i
x
y
x
= para 1, 2,..., i n = . Demuestre que
a) 1 y =
b)
2
100
) (
) (

=
x CV
y Var , donde % 100 ) ( =
x
S
x CV
Respuestas
a) y =
n
y
n
i
i
=1
=
n
x x
n
i
i
=1
/

= 1
1 1
1
= =

=
x
x n
x
x
n
i
i


b) = ) ( y Var
n
y y
n
i
i
=

1
2
) (
=
n
y y
n
i
i
=

1
2
) (
=
n
x x
x n
x x
n
i
i
n
i
i
= =

=

1
2
2
1
2
) (
1
) 1 / (

=
2
2
1
x
S
x

=
2
2
2
2
100
100
x
S
x
=
2
100
) (

x CV

-------------------------------------------------------------------------------------------------------------
Problema 27
Un conjunto de datos consiste de dos grupos de observaciones:
1 2
1 1
, , , , ,
n n
x x y y K K .
Denote por pt al promedio de todas estas observaciones.

a) Encuentre una relacin entre pt y los promedios:
pequeo mediano
tipo
40,00
60,00
80,00
100,00
120,00
140,00
i
n
d
i
c
e

1
1
1
1
n
i
i
x x
n
=
=

,
2
1
2
1
n
i
i
y y
n
=
=

.
Respuesta
i i
x y
pt
n
+
=

, con
2 1
n n n + =
1 1 2 2
/ /
i i
n x n n y n
pt
n
+
=


1 2
1
n n
pt x y
n n
= +
b) Suponga que
1
1, 1, 2,...,
i
x i n = = y que
2
0, 1, 2,...,
i
y i n = = . Interprete el promedio pt
de todas las observaciones como una proporcin (o porcentaje).
Respuesta
Como
2 1
, , 2 , 1 , 0 e , , 2 , 1 , 1 n i y n i x
i i
K K = = = = , entonces
n
n
n
n n
pt
1 2 1
0 1
=
+
=
En consecuencia, pt corresponde a la proporcin de unos en el conjunto de todas las
observaciones.

Problema 28
La distribucin de frecuencia siguiente muestra los precios de 30 acciones del Dow Jones
(The Wall Street Journal, 16 de enero del 2006).

Precio por accin :recuencia
#(/ a */ '
#*/ a )/ .
#)/ a -/ .
#-/ a ./ *
#./ a '/ )
#'/ a &/ *
#&/ a %/ $

a. Calcule la desviacin estndar del precio en dlares, por accin.
b. Encuentre el valor de la mediana del precio por accin. Interprete en el contexto del
problema
c. Grafique adecuadamente estos datos. Explique la asimetra.
-------------------------------------------------------------------------------------------------------------
Problema 29
En un estudio sobre suscriptores Business Week de Estados Unidos se recogen dato de una
muestra de 2.888 suscriptores. Cincuenta y nueve por ciento de los encuestados sealaron
tener un ingreso anual de 85.000 dlares o ms y 40% indicaron poseer una tarjeta de
crdito de American Express.
a. Cul es la poblacin de inters en este estudio?
b. Es el ingreso anual una variable cualitativa o cuantitativa? Por qu?
c. Es la posesin de una tarjeta de crdito de American Express una variable
cuantitativa o cualitativa? Por qu?
-------------------------------------------------------------------------------------------------------------

Problema 30
Las siguientes tablas presentan estadsticas descriptivas correspondientes a los retornos de
dos acciones diferentes A y B durante los ltimos 100 das.

a. Establezca la poblacin de estudio, la variable en estudio y el tipo de variable.
b. En qu accin A o B conviene invertir? Presente su justificacin ms abajo
comentando alguna medida de tendencia central y alguna medida de dispersin.
Medidas de tendencia central:
Medidas de dispersin:
-------------------------------------------------------------------------------------------------------------
Problema 31
La distribucin de frecuencia siguiente muestra los precios de 30 acciones del Dow Jones
(The Wall Street Journal, 16 de enero del 2006).
Precio por accin :recuencia
#(/ a */ '
#*/ a )/ .
#)/ a -/ .
#-/ a ./ *
#./ a '/ )
#'/ a &/ *
#&/ a %/ $

a) Calcule la desviacin estndar del precio en dlares, por accin.
b) Encuentre el valor de la mediana del precio por accin. Interprete en el contexto del
problema
c) Grafique adecuadamente estos datos. Explique la asimetra.
-------------------------------------------------------------------------------------------------------------
Problema 32
En un estudio sobre suscriptores Business Week de Estados Unidos se recogen dato de una
muestra de 2.888 suscriptores. Cincuenta y nueve por ciento de los encuestados sealaron
tener un ingreso anual de 85.000 dlares o ms y 40% indicaron poseer una tarjeta de
crdito de American Express.
a) Cul es la poblacin de inters en este estudio?

b) Es el ingreso anual una variable cualitativa o cuantitativa? Por qu?
c) Es la posesin de una tarjeta de crdito de American Express una variable
cuantitativa o cualitativa? Por qu?
-------------------------------------------------------------------------------------------------------------
Problema 33
Suponga que en un estudio se est describiendo y tratando de comparar los salarios de los
obreros de la construccin de dos pases. Se obtienen los resultados correspondientes:

Salarios anuales Pas A Pas B
Promedio 2684 bolivares 42000 pesos
Desviacin estndar 650 bolivares 8900 pesos

Utilice estos resultados para concluir en qu pas la dispersin de los salarios es menor.
Utilice una medida estadstica adecuada.
-------------------------------------------------------------------------------------------------------------
Problema 34
Una asociacin de comercio busca informacin acerca de las utilidades mensuales en pesos
de pequeas empresas por sus ventas en local e internet. Para esto, se cont con datos de
18 pequea empresas. Se midi la utilidad mensual en millones de pesos (1$1.000.000).
Se procesaron los datos en SPSS obteniendo:



a. Son las ventas en local ms homogneas que las ventas en internet?
Respuesta
c. :(I) =

6,S82
S,8SSS
1uu = 6S,9u%
c. :(I) =
1S,9u8
8,SSS6
1uu = 46,62%

b. Usando los resultados de SPSS, calcule el promedio y la varianza de las ventas por
empresa.

Respuesta
SPSS utiliza: x =
x
i
n
i
n
s
2
=
x
i
2
-nx
2 n
i
n-1

Ocupando las sumas:
x =
x

n
=
69 +164
18
= 12,94

c. Tambin se obtuvo el siguiente diagrama de dispersin entre las dos variables venta de
local vs Venta por Internet.


A simple vista se puede sugerir alguna relacin entre las utilidades de una empresa
por ventas en local o internet? Por qu?
Respuesta
A simple vista no se puede observar exactamente alguna relacin. (pueden
comentar tambin una muy leve (baja) relacin positiva)
------------------------------------------------------------------------------------------------------------
Problema 36
Antes de una recesin econmica los precios de tres acciones transadas en la Bolsa de
Comercio tenan las siguientes caractersticas en USD.

Accin Valor promedio Desviacin estndar
Aceros 180,80 13,72
BankT 21,20 2,27
Fish 0,08 0,01
Despus de la recesin los precios de las tres acciones fueron respectivamente:

Accin Precio
Aceros 160,34
BankT 20,5
Fish 0,04

Qu accin fue ms afectada por la recesin? Justifique su respuesta.
Respuesta

La forma de analizar el efecto de la recesin con la informacin disponible es hacer una
comparacin relativa de la variacin en el precio de una accin con su propia desviacin
estndar lo que es equivalente a una estandarizacin de la variacin.

vaiiacion =
:olor - mcJio
Jcs:. cstnJor


vaiiacion Aceios =
16u,S4 -18u,8u
1S,72
= -1,49

vaiiacion BankT =
2u,Su - 21,2u
2,27
= -u,S1

vaiiacion Fish =
u,u4 - u,u8
u,u1
= -4,uu

La accin ms afectada en su valor es la accin Fish porque disminuy 4 veces su desviacin
estndar respecto al valor medio que tena antes de la recesin (variacin atpica)
------------------------------------------------------------------------------------------------------------------
Problema 37
Los datos correspondientes a los retornos de dos acciones diferentes (A y B) durante 100
son analizados descriptivamente en SPSS. Estos resultados se muestran a continuacin:


a. Establezca la poblacin de estudio, la variable en estudio y el tipo de variable.
b. Si el riesgo es medido por la variabilidad de los retornos, mas heterogneos los datos
mayor riesgo En qu accin hay menor riesgo? Justifique usando una medida relativa
de dispersin.
c. Determine la asimetra de los datos en cada una de las muestras. Justifique su
respuesta.
-------------------------------------------------------------------------------------------------------------
Problema 38
Los salarios (u.m) de un grupo de 74 empleados hombres y 46 empleados mujeres se
analizan en estudio hecho por una revista importante. Son procesados en SPSS, los
resultados grficos, se muestran a continuacin:



a. Son verdaderas o falas las siguientes afirmaciones:
El cuartil 1 de los salarios de los hombres es mayor en las mujeres ..
La mediana en las mujeres es menor en los hombres ..
Mayor dispersin se puede observar en los salarios de los hombres ..
El salario ms alto de los hombres es 90 unidades monetarias .....

b. Si los salarios versus edad son graficados mediante un diagrama de dispersin:

Qu puede concluir de la forma y el grado de la relacin?
-------------------------------------------------------------------------------------------------------------
Recopilado por Jos Tapia Caro
Docente de la Facultad de Ingeniera y Ciencias
Universidad Adolfo Ibaez