Académique Documents
Professionnel Documents
Culture Documents
Estadística Descriptiva
2.1.Conceptos Básicos.
Cuando queremos estudiar una variable, es importante tener claro cuales son aquellos
elementos de los que queremos saber su valor. Al conjunto de estos elementos los
llamaremos población y al número de elementos de este conjunto lo llamaremos tamaño
de la población, el cual suele denotarse por la letra N. El uso de la palabra población tiene
aquí un significado técnico. En efecto, los elementos de la población no son necesariamente
personas. Así en los ejemplos precedentes, aparecen poblaciones de personas, familias,
empresas y envase de vidrio. No es difícil pensar en otras situaciones donde las poblaciones
estén constituidas por huevos, automóviles o componentes electrónicos.
Es conveniente clasificar las variables de acuerdo al conjunto de valores posibles que ellas
puedan tener. Los valores de las variables edad, capital, número de hijos, se expresan en
forma numérica. En cambio presencia de defectos, sabor, posición política muestran una
cualidad del elemento y no pueden expresarse numéricamente, salvo de manera artificial.
Entonces podemos distinguir dos tipos de variables:
Las variables edad y número de hijos, son cuantitativas. Sin embargo, el número de hijos
puede tomar los valores 0,1,2,..., vale decir, un entero no negativo. No tiene sentido hablar
de valores intermedios como 1.3 hijos. Por el contrario, si bien la
edad se expresa en años cumplidos, esto lo podemos refinar usando meses, días, horas,
minutos, segundos, etc. O sea, entre dos valores cualesquiera de la variable edad, por
cercanos que sean, existe siempre un valor intermedio.
Esto nos sugiere, que las variables cuantitativas pueden ser clasificadas según los valores
que tomen. Por tanto si una variable cuantitativa toma valores en un conjunto finito o
infinito numerable, careciendo de sentido valores intermedios, la denominaremos variable
discreta. Ahora si una variable cuantitativa toma valores en un rango o intervalo (es decir,
si dados dos valores cualesquiera de la variable, siempre existe un valor intermedio)
diremos que ella es una variable continua.
Por otro lado, las variables sexo y grados en él ejercito son variables cualitativas. La
variable sexo toma los valores masculino y femenino, en cambio la variable grados del
ejercito puede tomar los valores soldado, suboficial, oficial. La diferencia entre ambas
variables es que en grados del ejercito existe un orden jerárquico, propio de la variable. De
esta manera, si una variable cualitativa toma valores en un conjunto donde los valores son
solo nombres, la llamaremos variable nominal, y si además estos nombres tienen un orden
propio o jerarquía la llamaremos variable ordinal.
Hay situaciones en que necesitamos información sobre los valores de ciertas variables de
interés en cada uno de los elementos de la población. Por ejemplo, la estructura exacta de
las edades en la población chilena, sólo puede conocerse determinando la edad de cada uno
de los habitantes de Chile. La determinación de los valores de una o más variables de
interés, en cada uno de los elementos de una población, es una actividad que llamaremos
censo.
Además de las dificultades ya señaladas, los censos sólo miden variables de tipo general.
Por ejemplo, poco aportan los resultados del último censo que se haya realizado, a la
predicción del comportamiento de los votantes en una próxima elección. La discusión
anterior indica, que muy raramente, es posible recolectar información completa. Tenemos
que contentarnos, entonces, con información incompleta o parcial, lo que significa que los
valores de las variables que nos interesan, se miden sólo en algunos elementos de la
población. Se puede preguntar la edad sólo a algunas personas, determinar el capital de sólo
algunas empresas, revisar sólo algunos envases, etc. Cuando compramos fruta es posible,
con buena suerte, que podamos probar algunas de ellas. Es ilusorio pensar que podríamos
probar toda la fruta antes de comprarla. Las personas a las cuales se les pregunta la edad,
las empresas cuyo capital se determinan, los envases que se revisan, o las frutas que se
prueban, constituyen ejemplos de lo que denominaremos muestra. La definición formal de
este concepto es particularmente sencilla, ya que una muestra es un subconjunto de la
población. El tamaño de la muestra es el número de elementos que ella contiene y se denota
por n.
Los resultados de la prueba ¿representan el rendimiento del curso? Como se puede ver, en
realidad, los resultados obtenidos no representan el rendimiento del curso. Llamamos a este
problema sesgo de selección.
El método más sencillo para la selección de una muestra es el muestreo aleatorio simple,
en el que todos los elementos de la población tienen la misma posibilidad de pertenecer a la
muestra. Ahora, si la población se clasifica en un cierto número de grupos (llamados
estratos) y luego, al interior de cada estrato, se obtiene una muestra por muestreo aleatorio
simple, este método de selección de una muestra se denomina muestreo estratificado. En
la práctica, los métodos de selección empleados suelen ser más complejos, pero la idea
básica de uso del azar sigue siendo la misma.
Como hemos mencionado anteriormente, la edad es una variable, en el sentido que cambia
de una persona a otra. Sin embargo, una vez seleccionada la persona cuya edad queremos
determinar, su edad es un número fijo. Para aclarar esta idea supongamos que Claudia
Reyes pertenece a cierta población y tiene 17 años. Diremos entonces que el valor de la
variable edad (expresada en años) para el elemento Claudia Reyes es 17. A este valor lo
llamaremos el dato de Claudia Reyes.
El número de veces que se repite cada valor de la variable, nos indica cuan frecuente es
cada uno de estos valores. A esta cantidad la llamaremos frecuencia absoluta ( ni ).
Notemos que si m es la cantidad de valores posibles de la variable, entonces
n1 n2 nm n que es el total de datos. La proporción, corresponde a lo que
ni
llamaremos frecuencia relativa ( f i ) y es calculada como fi . La suma de las
n
frecuencias relativas debe dar 1. El porcentaje no es más que f i *100% y la suma de
estos debe dar 100%.
La tabla anterior se aplica a variables cualitativas, tanto nominales como ordinales, como a
variables cuantitativas discretas. En cambio para variables cuantitativas continuas, la tabla
se frecuencias se construye de manera diferente. Para aclarar ideas, consideremos el
siguiente ejemplo:
Vale la pena recordar que una variable continua toma valores en un intervalo o rango de
valores. En el ejemplo de las notas de los 20 alumnos, este intervalo es de 3,1 a 7,0. La
idea natural es dividir este intervalo, en intervalos más pequeños. Para realizar esto, se
deben contestar las siguientes preguntas: ¿En cuántos intervalos debemos dividir el
intervalo? y ¿Cuál es la amplitud o largo de cada uno de estos intervalos?. La respuesta a la
primera pregunta debiese ser dada por el investigador. Si no es así se puede usar alguna de
las siguientes aproximaciones:
a) Algunos autores consideran que una buena aproximación para la cantidad de intervalos
es dada por m n.
b) Otros autores prefieren usar la fórmula de Sturger (1926) para obtener la cantidad de
Máximo Mínimo
c
m
donde c es la amplitud de cada intervalo.
No siempre, la amplitud de los intervalos es constante. Hay muchas situaciones en las que
la asignación de los largos de los intervalos es dada por el investigador.
7,0 3,1
c 0,78 . Con esta información se construyen los intervalos:
5
De esta manera, en la tabla de frecuencias, los valores que toma la variable son los
intervalos que se han construido. Las frecuencias absolutas corresponden a la cantidad de
datos que caen en cada intervalo. La columna de frecuencias relativas sigue igual que antes.
Pero se incorporan dos nuevas columnas, correspondientes a las frecuencias acumuladas
Al común de las personas, les es muy difícil la comprensión e interpretación de una tabla de
frecuencias. Por esto se recurre a la representación gráfica. Los métodos gráficos poseen la
ventaja de hacer más rápida la comprensión de la información y es sólo una forma distinta
de mostrar lo que se desprende de la tabla de frecuencias. Es importante destacar que
cuando se elabora una representación gráfica no existe solamente una respuesta correcta. El
juicio del analista y las circunstancias que rodean el problema desempeñan un papel
primordial en el desarrollo de esta.
Una empresa tabacalera realiza un estudio de mercado, para determinar cual es el tipo de
cigarrillo que prefieren los consumidores (fumadores). Para este estudio se considera una
muestra de 110 fumadores y se examina la marca del cigarrillo. La información es resumida
en la siguiente tabla de frecuencias:
Este gráfico recibe el nombre de gráfico de barras separadas. Como se aprecia el eje
horizontal es el eje de los valores de la variable, mientras que el eje vertical es el eje de la
frecuencia absoluta ó frecuencia relativa ó el porcentaje. Es importante recalcar que los
anchos de las barras debe ser el mismo, ya que puede distorsionar la información que se
quiere mostrar. Otro gráfico útil para este tipo de dato, es el gráfico circular ó de torta:
Porcentaje de fumadores según marca de cigarro
KENT
VICEROY
20%
27%
BELMONT
25%
DERBY
28%
Este gráfico, como el de barras separadas, indica que los cigarrillos preferidos por este
grupo de fumadores son el Derby y el Viceroy (55,45%), mientras que el menos preferido
es el Kent.
Para el caso de una variable cuantitativa agrupada en intervalos, como el ejemplo de las
notas de los 20 alumnos visto anteriormente, se realizan los siguientes gráficos:
A diferencia del gráfico de barras separadas visto anteriormente, este es un gráfico de
barras juntas. Este gráfico recibe el nombre técnico de histograma, donde el eje horizontal
del gráfico se colocan los intervalos y en el eje vertical la frecuencia absoluta ó la
frecuencia relativa ó el porcentaje, siendo la altura de la barras la frecuencia
correspondiente a cada intervalo. Nótese que los anchos de los intervalos son iguales, esto
se debe a que por construcción la amplitud de los intervalos es la misma. Otro gráfico que
presenta la misma información que el histograma, es la poligonal de frecuencia, la que es
mostrada en la siguiente figura:
La construcción de esta figura se basa en unir los puntos medios de la parte superior de
cada una de las barras. Es importante dejar que baje a cero y esto se puede realizar de la
siguiente manera, se construye un intervalo a la derecha del máximo (de igual amplitud que
el último intervalo) y se une el punto medio de la última barra con el punto medio de este
intervalo. Análogamente, se construye un intervalo a la izquierda del mínimo (de igual
amplitud que el primer intervalo) y se une el punto medio de la primera barra con el punto
medio de este intervalo. Como se menciono en el párrafo anterior, esta figura contiene la
misma información que el histograma y se debe a la forma en que se construye.
En este escrito, se estudiaran las medidas de tendencia central y posición como las medidas
de dispersión. Los otros tipos de medidas se dejan al lector.
Las medidas de tendencia central, como su nombre lo indica, nos describen el centro de la
información. Dentro de estas medidas la más conocida es el promedio o media aritmética.
La moda Mo , es aquel valor de la variable en estudio, que más se repite o que tiene
mayor frecuencia. En el ejemplo de nivel de instrucción de los 20 trabajadores, se observa
que lo más frecuente es el nivel de instrucción medio, por lo tanto la moda es nivel de
instrucción medio. En el ejemplo de la marca de cigarrillo la moda es la marca Derby.
Ahora, en el ejemplo de las 20 notas, lo que se obtiene es un intervalo modal, que en este
caso es el tercer intervalo [4.66, 5.44). Entonces, en el caso de datos agrupados en
intervalos la moda es una aproximación. La pregunta natural es cual aproximación se debe
usar. En la mayoría de los libros de textos la moda es aproximada de la siguiente manera:
(ni ni 1 )
Mo Lim Inf i ci ,
i
( n n i 1 ) ( ni ni 1
)
donde Lim Inf i es el límite o cota inferior de intervalo modal, ni es la frecuencia
ci es la amplitud del intervalo modal. Así, la moda en el problema de las notas de los 20
(6 3)
alumnos es Mo 4.66 0.78 5.128 .
( 6 3) ( 6 4)
Una observación importante es que la moda puede no existir. Considere los siguientes datos
recopilados a 8 estudiantes de la universidad sobre la cantidad de hijos en su grupo
familiar: 1, 1, 2, 2, 3, 3, 4, 4. Como se aprecia, bajo la definición de moda, en este caso, no
existe moda. Además puede ocurrir que exista más de una moda, y en estos casos se hablara
de multimodalidad.
dividiendo por el total de datos. Formalmente, si x1 , x2 ,, xn son los valores observados
n
x i
¿Qué pasa si los datos están agrupados en intervalos, como el ejemplo de las notas de los 20
alumnos?. Recordemos la información:
marca clase n i i
X i 1
n
donde m es la cantidad de intervalos.
La mediana Me , es aquel valor de la variable que ocupa la posición central cuando los
datos están ordenados de menor a mayor. En forma técnica se define como aquel valor de la
característica en estudio que deja bajo sí al 50% de la información. La siguiente figura
muestra la definición anterior:
Sean x1 , x2 ,, xn los valores observados de una variable X . Generalmente los datos
vienen desordenados, así que lo primero que se debe realizar es ordenarlos de menor a
mayor digamos min x1 x2 xn max . Entonces la mediana se define
como:
2
Imagine que la información observada es 6, 3, 8, 5 y 3. Ordenando la información de menor
a mayor queda 3, 3, 5, 6 y 8. Como la cantidad de datos es impar debemos encontrar aquel
n 1 51
dato que ocupa la posición 3 , que corresponde al valor 5, por lo tanto la
2 2
Mediana 5 . Ahora considere la siguiente información: 9, 6, 7, 9, 10 y 8. Ordenando
los datos de menor a mayor queda 6, 7, 8, 9, 9 y 10. Como la cantidad de datos es par
n 6 n 6
debemos encontrar los datos que ocupan las posiciones 3 y 1 1 4,
2 2 2 2
89
que corresponden a los datos 8 y 9, así la mediana es Mediana 8.5 . En el
2
caso de datos agrupados en intervalos, la mediana será calculada usando el siguiente
algoritmo:
Para aprender a aplicar el algoritmo anterior, se verá con detalles en el ejemplo de las notas
de los 20 alumnos. En el paso i. Se tiene que la posición que le corresponde a la mediana es
10. En el paso ii. recordemos la tabla de frecuencias. Como se aprecia, la posición 10 cae
Con esto, se define el percentil % P como aquel valor de la variable en estudio que
procedimiento:
i. Determinar la posición que le corresponde al percentil % Posición n
100
ii. Determinar en que intervalo cae el percentil %, comparando la posición
obtenida en i) y la columna de las frecuencias absolutas acumuladas.
c
iii. El percentil % es calculado por: P lim Inf i n N i 1 i , donde
100 ni
lim Inf i es el límite o cota inferior del intervalo en que esta el percentil %
Para aprender a aplicar el algoritmo anterior, se verá con detalles en el ejemplo de las notas
de los 20 alumnos. Imagine que se quiere calcular la nota mínima del 40% de las mejores
notas. Así al aplicar el algoritmo anterior se tiene que en el paso i. la posición que le
corresponde al percentil 60% es 12. En el paso ii. recordemos la tabla de frecuencias.
Como se aprecia, la posición 12 cae en el tercer intervalo, por lo tanto el percentil 60% es
Las medidas de dispersión o de variabilidad, como su nombre lo indica, son cantidades que
describen cuan cercanos o alejados están los datos, es decir cuan homogéneos o
heterogéneos son los datos. La siguiente figura muestra este problema.
Como se puede apreciar, para determinar cuan separado está el conjunto de datos, las
medidas de dispersión, deben estar relacionadas con la idea de distancia. Porque, a menor
distancia, los datos son homogéneos y a mayor distancia los datos son heterogéneos.
La medida más simple para medir dispersión es el rango R , que ya se ha estudiado. Una
de las dificultades del rango es que depende de los valores extremos y por lo tanto no
siempre refleja adecuadamente la dispersión existente en los datos ya que tiende a sobre
estimarla. Para evitar de sobre estimar la dispersión, se utiliza el rango intercuartílico
RI que es el rango del 50% central de los datos, es decir, es la distancia entre P75 y P25 ,
como se muestra en la siguiente figura.
Por lo tanto, el rango intercuartílico es calculado por RI P75 P25 . Así, en el ejemplo de
las notas de los 20 alumnos, el rango es R 3.9 y el rango intercuartílico es RI 1.63 .
Otra medida de dispersión es la varianza S 2 , que mide la heterogeneidad de los datos
n n xi2 2 x i2
n
cantidad se puede calcular como S
2
X , donde es el
n 1 i 1 n i 1 n
promedio de los cuadrados. Para aclarar ideas considere los siguientes datos: 1, 3, 5, 6 y 10.
1 3 5 6 10
El promedio de estos datos es X 5 y el promedio de los cuadrados
5
5
xi2 12 32 5 2 6 2 10 2
es
i 1 5
5
34.2 . Por lo tanto la varianza es
S2
5
4
2
34.2 5 11.5 . En el caso de datos agrupados en intervalos la varianza es
n xi - X n m ni xi2 2
2
m
S i
2
X , donde m es la cantidad de
i 1 n 1 n 1 i 1 n
intervalos y x i es la marca de clase del i-ésimo intervalo. En el ejemplo de las notas de los
20 alumnos:
Entonces la varianza es S
2 20
19
2
27.7489 5.167 1.10633 .
Una de las grandes dificultades de las medidas de dispersión, que hasta el momento se han
estudiado, es que dependen de la unidad de medida de la variable en estudio. Debido a esta
dificultad, se inventa el coeficiente de variación. El coeficiente de variación se define
S
como CV . Como se aprecia, esta medida de dispersión es adimensional y si
X
multiplicamos 100 por el coeficiente de variación, tenemos el porcentaje de variabilidad, es
decir, CV 100% . Algunos autores, proponen la siguiente clasificación para determinar
si los datos son homogéneos o heterogéneos:
Existen situaciones donde las cantidades calculadas no son las que se utilizan. Considere la
siguiente situación: “...Usted realiza un estudio sobre el calentamiento global, utilizando
como unidad de medida grados Celsius. Ahora, un importante investigador lo invita con
todos los gastos pagados a Estados Unidos, para que en un congreso internacional, que trata
sobre el calentamiento global, usted exponga los resultados obtenidos en su trabajo.
Lamentablemente, como se puede dar cuenta, en Estados Unidos se utilizan grados
Fahrenheit, lo que implicaría rehacer todo el trabajo...”. A continuación se entregan
resultados, cuando se realiza una transformación lineal a los datos.
Sean x1 , x 2 ......x n , las observaciones de una variable X , la pregunta es, ¿Qué pasa con las
cantidades calculadas, si a los datos, se les multiplica por una constante y luego se les suma
otra?, es decir, xi se transforma en a xi b (con a 0) en todas las observaciones. Por
Promedio X 174,25 cm
El siguiente cuadro, resume el cambio de los indicadores, si las observaciones sufren una
transformación lineal.
Promedio X a Xb
Moda Mo a Mo b
Percentil % P a P b
xi
se transforma en Varianza S2 a2 S 2
a * xi b Desviación
S a S
Estándar
Coeficiente de S a S
CV CV
variación
X | a X b |
Gastos
Número de empresas
(en millones de pesos)
2–5 6
5–8 10
8 – 11 14
11 – 14 12
14 – 17 8
17 - 20 5
entonces la moda es Mo = 8
14 - 10 4
3 8 3 10 , Luego el
14 - 10 14 - 12 6
gasto mensual que más se repite es de 10 millones de pesos.
5584 3
d) P84 14 ( - 42) 15.575 , así el 84% de las empresas realizan un gasto
100 8
mensual en publicidad menor a $15.575.000 pesos
55 * y 3
de la variable), entonces 12.7 11 ( - 30) , de lo que se desprende, que
100 12
y=66.9%. finalmente el 66.9% - 18.2% = 47.7%, es decir, un 47,7% de las
empresas gastan entre 6.2 y 12.7 millones, lo es equivalente decir que, 26 empresas
(0.47*55) gastan entre 6.2 y 12.7 millones
2. Una línea Aérea transportaba, en término medio, en cada vuelo 72 pasajeros. Para
aumentar la cantidad media de pasajeros, hace seis meses atrás , contrato a una Agencia
de Publicidad para realizar un nuevo comercial para Diarios y Televisión. Para verificar
la llegada del comercial, se recopiló la siguiente información:
Cantidad de Número de
Pasajeros Vuelos
50 – 60 3
60 – 70 7
70 – 80 18
80 – 90 12
90 – 100 8
100 – 120 2
Marca
Cantidad de Fi
de ni Ni fi Fi f i *100
Pasajeros *100
clase
50 – 60 55 3 3 0,06 0,06 6 6
60 – 70 65 7 10 0,14 0,20 14 20
70 – 80 75 18 28 0,36 0,56 36 56
80 – 90 85 12 40 0,24 0,80 24 80
90 – 100 95 8 48 0,16 0,96 16 96
100 – 120 110 2 50 0,04 1.00 4 100
Total 50 1.00 100
3 * 55 7 * 65 18 * 75 12 * 85 8 * 95 2 *110
a) X 79.4
50
Suponiendo, que no existen otros factores que afecten la cantidad de pasajeros,
podríamos decir, que el comercial ha tenido efecto, que se observa en el aumento
promedio de 72 a 79,4.
1,0
Frecuencias relativas
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
55 65 75 85 95
Marca de Clase
(Cantidad de Pasajeros)
Monto
destinado a y i* ni Ni fi Fi
fi Fi
*100 *100
gastos
0 – 100 50 19 19 0,17 0,17 17 17
100 – 150 125 28 47 0,25 0,42 25 42
150 – 300 225 45 92 0,40 0,82 40 82
300 – 450 375 21 113 0,18 1 18 100
Total 113 1.00 100
Número de fi Fi
ni Ni fi Fi
personas *100 *100
1 21 21 0,19 0,19 19 19
2 29 50 0,26 0,44 26 44
3 32 82 0,28 0,73 28 73
4 31 113 0,27 1,00 27 100
Total 113 1.00 100
21 *1 29 * 2 32 * 3 31 * 4
X 2,65
113
Luego, el número promedio de personas que viajan dentro de los vehículo es 2,65.
70
(Cantidad de vehículos)
Frecuencias absolutas
60
50
40
30
20
10
0
Propio Arrendado
Marca de Clase
(Tipo de vehículo)
Monto Marca
destinado a de ni Ni fi Fi f i *100 Fi *100
gastos clase
0 – 100 50 2 2 0,14 0,14 14 14
100 – 150 125 5 7 0,36 0,50 36 50
150 – 300 225 7 14 0,50 1,00 50 100
Total 14 1.00 100
2 * 50 5 *125 7 * 225
Y 164,3
14
Luego, la cantidad promedio destinados a gastos es de 164.300 pesos para los que en
vehículos arrendados viajan hasta con tres personas
La varianza muestral par el monto en miles de pesos destinado a gastos para los que en
vehículos arrendados viajan hasta con tres personas es S 2 4587.9 , y por lo tanto, la
Se espera que el coeficiente de variación para el próximo año sea menor que el actual
0.348 vs. 0.412, es decir, los datos actuales son más heterogéneos que los que se
esperan el próximo año
e) Los valores donde fluctúa el 50% de la variación central de las observaciones del
monto dedicado a gastos para los que viajan en vehículo arrendado, son entre el
percentil 25 (cuartil 1) y el percentil 75 (Cuartil 3)
51 * 25 50
El percentil 25 es P25 100 ( - 9) 110,4 . El percentil 75 es
100 18
51 * 75 150
P75 150 ( - 27) 226,7 . Luego el 50% de los datos se encuentra entre
100 22
110400 y 226700.
3. El coordinador de Estadística quiere determinar, ¿cuál de dos libros deben utilizar los
dos profesores del curso “Introducción a la Estadística” ?. Para llegar a una decisión,
se seleccionan 20 alumnos en cada uno de las dos secciones (81 y 82) y cada sección
entregar 10 de cada libro. La información que se recolectara de los estudiantes será:
Sexo, Edad (en años), nota Final del semestre y libro utilizado.
a) ¿Que dos variables son imprescindibles para el estudio?.
b) ¿Que v ariables son cuantitativas?.
c) ¿Que variables son cualitativas?.
d) ¿Qué variables son discretas?.
e) ¿Qué variables son continuas?.
Empleados
Número de Días
ausentes
20-30 5
30-40 9
40-50 8
50-60 10
60-70 12
70-80 11
80-90 8
90-100 3
10. En una empresa se han tabulado los sueldos diarios de 180 empleados:
Sueldos en Frecuencia
miles de $ Acumulada
15 – 20 35
20 – 25 75
25 – 30 130
30 – 35 160
35 – 40 180
11. Las distribuciones de sueldos mensuales de 200 obreros de dos Empresas A y B del
mismo rubro son las siguientes (100 obreros en cada una):
Empresa A Nº Trabajadores Empresa B Nº Trabajadores
(miles de $) (miles de $)
18 – 22 45 17 – 23 38
22 – 26 25 23 – 29 22
26 – 30 15 29 – 35 12
30 – 34 7 35 – 41 3
34 – 38 3 41 – 47 13
38 – 42 3 47 – 53 7
42 – 46 2 53 – 59 5
a) ¿En qué empresa es más uniforme la distribución de los sueldos de los obreros?.
b) En la Empresa A, al 40% de los obreros con sueldos más bajos se les otorgará una
bonificación. ¿Cuál es el sueldo máximo que recibirá tal beneficio?.
c) En la Empresa B, ¿Qué porcentaje de los obreros ganan más de $44500?.
d) Después de algún tiempo los obreros de la Empresa A recibirán un reajuste de
$3000 y los de la empresa B un reajuste del 30%. ¿Cómo se ven afectados los
coeficientes de variación y los resultados de las partes (b) y (c)?.
12. Las primas directas en miles de pesos (X) en 100 contratos de seguros se encuentran
clasificadas en la siguiente tabla:
Primas (miles de $) Nº de contratos
0 – 50 7
50 – 100 28
100 – 150 20
150 – 200 18
200 – 250 12
250 – 300 8
300 – 350 5
350 – 400 2
14. En una empresa comercial se estudiaron los montos de las compras efectuadas
durante el año anterior (divididos en trimestres) de 100 clientes.
1. Trimestres