Vous êtes sur la page 1sur 13

Unidad 1.

Fundamentos de estadística descriptiva aplicada a los


negocios
Estadística para negocios

Medidas de tendencia central y dispersión


Las medidas de tendencia central son valores que se calculan a partir de un conjunto de datos referidos al punto medio
de una distribución. Las medidas de tendencia central también son conocidas como medidas de posición.

Mientras que las medidas de dispersión miden el grado de variación o variabilidad de los datos alrededor del punto medio
de una distribución, es decir, el grado en que las observaciones se separan.

El siguiente diagrama muestra cómo se clasifican las medidas de tendencia central y dispersión para datos no agrupados
y agrupados.

Medidas de Tendencia Central para datos no agrupados


Existen tres medidas comunes para identificar el centro de un conjunto de datos: la media, mediana y moda. En cada
caso, se ubican alrededor del punto en donde se aglomeran los datos.

1
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

Media: Medida de tendencia central usualmente llamada promedio, se define como la división de la suma de todos los
valores entre el número de datos.

Media poblacional 
 Xi
N

Media muestral X 
 Xi
n

Mediana: Del conjunto de datos obtenidos es el valor que al organizar los datos en orden ascendente o descenderte a la
mitad o centro de los mismos. La posición que ocupa la mediana puede ser determinada mediante la siguiente fórmula:

Mediana =X[(n/2)+1/2]

Ejemplo: Dados los siguientes 8 datos ordenados de manera ascendente: 5, 8, 8, 11, 11, 11, 14, 16, encuentra la
mediana.

Utilizando la fórmula para ubicar la posición del dato que representa la mediana, indica que:

Mediana =(8/2)+1/2 = 4.5

Por lo que la mediana está ubicada entre el dato 4 y 5; el valor del dato 4 es “11” y del dato 5 es “11”, por lo que al sacar
el promedio, da que la mediana de la muestra estudiada es 11.

Moda: Es el dato que ocurre con mayor frecuencia en un conjunto de elementos estudiados. Del ejemplo anterior, donde
los datos recopilados son: 5, 8, 8, 11, 11, 11, 14, 16, el dato que ocurre con mayor frecuencia es el valor 1, siendo este
valor la moda.

Media ponderada: es una media aritmética, en la cual se considera a cada uno de los valores de acuerdo con su
importancia en el grupo.

Mediana Ponderada Xp 
 pX
p
En donde:

X = Observación individual
p= el peso o ponderación asignada a cada observación

Media Geométrica: La media geométrica proporciona una medida precisa de un cambio porcentual promedio en una
serie de números.

MG  n X 1 X 2 X 3 X 4 ..... X n

2
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

Comparación entre la media, mediana y moda


La media es la medida más común de tendencia central. Sin embargo, ésta se ve afectada de acuerdo a la distribución
de los datos, cuando estos son valores extremos o valores atípicos. En este caso, cuando los valores son extremos una
medida que no se ve afectada es la mediana por lo que es mejor utilizarla como medida de tendencia central.

En el caso de la moda, ésta también se ve afectada en menor grado que la media cuando existen observaciones atípicas
o extremas.

Medidas de Dispersión para datos no agrupados


Las medidas de dispersión o también llamadas de variabilidad se ocupan de describir la variación entre los valores con
respecto al centro del conjunto de datos. Indican cuánto se desvían las observaciones alrededor de la media.

Rango: Es la medida más simple y es la diferencia entre la observación de mayor valor y la de menor valor.
Rango = Valor Máximo – Valor Mínimo.

Varianza: Es el promedio de diferencias de cuadrados entre las observaciones y su media. Lo que implica que
encuentra la cantidad por la cual cada observación se desvía de la media.

 ( Xi  X )
2

Varianza Muestral s 2

n 1

 ( Xi   )
2

Varianza Poblacional  2

N

Desviación Estándar: Es la raíz cuadrada de la varianza..

Desviación estándar muestral s= s2


Desviación estándar poblacional   2
Ejemplo:

Debido a que las tasas de interés cayeron a comienzos de 1997, se mostró que una muestra de la tasa hipotecaria para
hipotecas a 15 años de las instituciones era de crédito en Peoria, Illinois:

7.1%, 7.3%, 7.0%, 6.9%, 6.6%, 6.9%, 6.5%,7.3%,6.85%

a) Calcule e interprete la media, mediana y moda.


b) Calcule e interprete el rango, la varianza y desviación estándar.

a) Calcule e interprete la media, mediana y moda

Para calcular la media se utiliza la media muestral dada por:

3
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

X 
 Xi
n
Donde al sustituir los datos queda de la siguiente manera:

7.1  7.3  7.0  6.9  6.6  6.9  6.5  7.3  6.85


X   6.94
9
Mediana: Primero hay que ordenar los datos en una serie ordenada:

6.6%,6.5%,6.85%,6.9%,6.9%7.0%,7.1%,7.3%,7.3%

Utilizando la fórmula para ubicar la posición de la mediana es (n/2)+ ½ = (9/2)+ ½ =5. Por lo que la mediana está en la
posición 5 de los datos ordenados, siendo 6.9%.

Moda: Es el valor que ocurre con más frecuencia en el conjunto de datos, se puede observar que tiene 2 modas: 6.9% y
7.3%, ya que ambos repiten igual número de veces en el conjunto de datos.

Interpretación: De acuerdo a los resultados obtenidos se puede observar que en promedio las tasa hipotecarias a 15
años están en 6.94% y encontrándose con más frecuencia las tasas entre 6.9% y 7.3%.

b) Calcule e interprete el rango, la varianza y desviación estándar

Debido a que la tasa hipotecaria tiene en promedio un 6.94%, conviene elegir una tasa con un menor grado de riesgo,
por lo que se requiere medir la varianza y desviación estándar.

Rango = Valor Máximo – Valor Mínimo. = 7.3% - 6.6% = 0.7%


Varianza
(6.6  6.94)2  (6.5  6.94)2  (6.85  6.94)2  (6.9  6.94)2  (6.9  6.94)2  (7.0  6.94)2  (7.1  6.94)2  (7.3  6.94)2  (7.3  6.94)2
s2 
9 1
s 2  0.076

Desviación Estándar:

s  0.076  0.27

Interpretación:

Si en promedio la tasa hipotecaria es de 6.94%, se pueden encontrar en Illinois tasa a variar por encima o debajo de
dicho valor en 0.27%.

Medidas de Tendencia Central para datos agrupados


Cuando se trabaja con datos que han sido agrupados en una distribución de frecuencias, no se sabe con certeza los
valores individuales de cada dato. Por lo que se utilizan métodos alternos para aproximar los valores de las medidas
descriptivas.

4
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

Media para datos agrupados: Al calcular la media para datos agrupados, se supone que las observaciones en cada clase
son iguales al punto medio de la clase:

XM 
 fM
n
f  frecuencia
M  Punto medio ó marca de clase
n  tamaño de muestra

Mediana: Primero se encuentra la clase mediana, la cual es la clase cuya frecuencia acumulada es mayor o igual a n/2 y
puede determinarse mediante la siguiente fórmula:

n 
2 F
Mediana  Lmd  C
 f md 
 
Lmd  limite inferior de la clase mediana
F  Frecuencia acumulada de la clase que antecede a la clase mediana
f md  frecuencia de la clase mediana
C  intervalo de clase
La moda es la observación que ocurre con mayor frecuencia, por lo que es necesario identificar la clase modal, ésta se
localiza encontrando la clase que tenga más frecuencia.

 Da 
Moda  Lmo   C
 Da  Db 
Lmo  Límite inferior de la clase modal
D a  Diferencia entre la frecuencia de la clase modal y la clase que le antecede
D b  Diferencia entre la frecuencia de la case modal y la clase precedente
C  Intervalo de clase

Medidas de Dispersión para datos agrupados


Cuando los datos se encuentran agrupados en un diagrama de frecuencias, la varianza y desviación estándar se
calculan de la siguiente manera:

Varianza:

  f (M  X ) 
2

s 2

n 1

5
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

Desviación Estándar:

s  s2

Rango: Es la diferencia entre el límite superior de la última clase y el límite inferior de la primera clase.

Teorema de Chebyshev
2
El Teorema de Chebyshev indica que en todo conjunto de datos, por lo menos 1-1/K % de las observaciones están
dentro de K desviaciones estándar de la media.

Expresándose como:
2
1-[1/K ]

Regla empírica

La desviación estándar permite determinar, con buen grado de precisión, donde están localizados los valores de una
distribución de frecuencias con relación a la media. Por lo que el Teorema de Chebyshev establece que
independientemente de la forma de distribución de los datos:

1. Aproximadamente 68% de los valores de la población caen dentro de una 1 desviación estándar a partir de la
media.
2. Aproximadamente 95% de los valores de la población caen dentro de 2 desviación estándar a partir de la media.
3. Aproximadamente 99% de los valores de la población caen dentro de 3 desviación estándar a partir de la media.

Ejemplo

Tomando como referencia la tabla de frecuencias construida para el ejemplo de la compañía High Performance Bicycle
Products de Chapel Hill, se tiene:

Registros de embarque Frecuencia


5-9 7
10-14 8
15-19 2
20-24 2
25-29 1
Total 20

a. Calcule e interprete la media, mediana y moda.


b. Calcule e interprete el rango, la varianza y desviación estándar.
c. De acuerdo al Teorema de Chebychev, ¿cuántos registros se encuentran entre 10 y 24?

Media: Para calcular la media se requiere obtener el punto medio o marca de clase de los registros de embarque.

Registros de
Frecuencia Punto Medio (M)
embarque
5-9 7 7
10-14 8 12
15-19 2 17
20-24 2 22

6
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

25-29 1 27
Total 20

Se aplica la fórmula:

XM 
 fM 
7  7  8  12  2  17  2  22  1  27
 12.5
n 20
Mediana: Primero hay que localizar la clase que contiene la mediana, la cual es en donde se ubique el dato n/2 en la
columna de la frecuencia acumulada:

Dato: n/2 = 10

En la fila que se encuentra con amarillo podemos localizar la clase que contiene a la mediana.

Registros de embarque Frecuencia Frecuencia Acumulada Punto Medio (M)


5-9 7 7 7
10-14 8 15 12
15-19 2 17 17
20-24 2 19 22
25-29 1 20 27
Total 20

Por lo que se puede aplicar la fórmula:


n 
2 F
Mediana  Lmd  C
 f md 
 

En donde Lmd  7; F  15; f md  8 . Para obtener el intervalo de clase se resta el valor del límite inferior de la clase
mediana del límite inferior de la clase anterior o posterior.

C= 10-5 = 5

Aplicando la fórmula se obtiene que el valor de la mediana es:

n   20 
2 F  2  7 3
Mediana  Lmd    C  10     5  10     5  10  1.875  11.875
 f md   8  8 
   

Moda : La moda es el valor que se presenta con mayor frecuencia por lo que es necesario localizar la clase que contenga
la frecuencia más alta.

La parte en color verde contiene a la clase mediana.

7
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

Registros de Frecuencia Frecuencia Punto medio (M) Clase antecedente


embarque acumulada
5-9 7 7 7
10-14 8 15 12
Clase precedente 15-19 2 17 17
20-24 2 19 22
25-29 1 20 27
Total 20

En este caso coincidió que la clase modal es igual a la clase mediana, pero no en todos los casos ocurre esto.

Para este caso es importante localizar la información necesaria para encontrar la moda:

Lmo  10; Da  8  7  1; Db  8  2  6; C  5
Sustituyendo estos valores en la fórmula:
 Da   1 
Moda  Lmo     C  10     5  10  0.714  10.71
 a
D  Db  1  6

Interpretación: De acuerdo con los datos obtenidos, el promedio de embarques por día es de 12.5, siendo algunos días
de 11.875 y presentándose con mayor frecuencia 10.71 embarques.

Rango= 29-5 = 24

Varianza: Para calcular la varianza es necesario realizar algunos cálculos antes de sustituir en la fórmula, en donde la
media X=12.5.

Registro Frecuencia Punto (M-X) (M-X)2 F(M-X)2


de Medio
embarque (M)
5-9 7 7 - 5.5 30.25 211.75
10-14 8 12 -0.5 0.25 2
15-19 2 17 4.5 20.25 40.5
20-24 2 22 9.5 90.25 180.5
25-29 1 27 14.5 210.25 210.25
Total 20 645

Sustituyendo en la fórmula se obtiene:

  f (M  X )   645  33.94
2

s 2

n 1 19

Por lo que la desviación estándar está dada por:

s  33.94  5.82

8
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

Interpretación: Como el promedio de embarques por día es de 12.5, existiendo una variación de 5.82 embarques por día
arriba o por debajo de la media.

c) De acuerdo al Teorema de Chebychev, ¿cuántos registros se encuentran entre 10 y 24?

Siendo la media de 12.5 y la desviación estándar de 5.82. Para los embarques entre 10 y 24 se tiene:
Valores para una desviación estándar

12.5  5.82 Por arriba 12.5+5.82 = 18.32


12.5  5.82 Por abajo 12.5-5.82 = 6.68

Como los valores de 10 y 24 no caen dentro la desviación estándar, se calcula para dos desviaciones estándar.

12.5  2(5.82) Por arriba 12.5 + 11.64 =24.14


12.5  2(5.82) Por abajo 12.5- 11.64 = 0.86

Por lo que es necesario obtener la diferencia entre los valores, ya que el valor inferior está por debajo de 10.

Diferencia = 24-10 = 14

Y despejar el valor de K:

2Ks = 14
14
K  1.2
2(5.82)
Sustituyendo K=1.2 en la fórmula
2 2
{1-[1/K ]} * 100 = { 1-[1/(1.2) ]}*100 = 30.55%

Se puede concluir que el 30.55% se encuentra entre 10 y 24, es decir 6 valores.

Ahora, como se puede observar en un polígono de frecuencias, los valores se comportan normalmente, por lo que en
este caso se puede aplicar la regla empírica, para lo cual, como el valor es aproximadamente de una desviación
estándar, el 68% de los valores estarían entre 10 y 24; es decir, aproximadamente 14 valores.

EJERCICIOS ADICIONALES
1. La revista Fortuna efectuó una encuesta para sus suscriptores en Estados Unidos y Canadá. Una pregunta de la
encuesta pedía el valor de los portafolios del suscriptor (acciones, bonos, fondos hipotecarios y certificados de
depósito). La siguiente distribución de frecuencias porcentuales fue preparada con las respuestas.

Valor de las inversiones Frecuencia (%)


Menos de $25,000 17
25,000-49,999 9
50,000-99,999 12
100,000-249,999 20
250,000-499,999 13
500,000-999,999 13
1,000,000 y más 16

9
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

a. ¿Qué porcentaje de suscriptores tiene inversiones menores de $100,000 dólares?


b. ¿Qué porcentaje de suscriptores tienen inversiones en el intervalo de $100,000 a $499,999 dólares?
c. ¿Qué porcentaje de suscriptores tienen inversiones de $500,000 dólares o más?
d. La distribución porcentual de frecuencias se basa en 816 respuestas. ¿Cuántos encuestados dijeron tener
inversiones entre $100,000 y $249,999 dólares?
e. Estime la cantidad de encuestados que aseguran tener inversiones menores a $100,000 dólares.

2. Millones de estadounidenses se levantan cada mañana y trabajan en sus propias casas. Se sugiere que el uso
creciente de computadoras es una de las razones por la que las personas pueden trabajar en empresas
caseras. A continuación vemos una muestra de datos sobre las edades de esas personas.

22 58 24 50 29 52 57 31 30 41
44 40 46 29 31 37 32 44 49 29
a) Calcule la media y la moda.
b) La mediana de la edad de la población.
c) Desviación estándar y Varianza.
d) Coeficiente de Variación.

3. La Asociación Norteamericana de Agencias de Publicidad registra datos sobre los minutos no dedicados a
programación por cada media hora de transmisión durante el horario estelar de TV. A continuación vemos unos
datos representativos de programas de horario estelar en las principales cadenas, a las 8:30 P.M.

6 6.6 5.8 7.0 6.3 6.2 7.2 5.7 6.4 7.0


6.5 6.2 6.0 6.5 7.2 7.3 7.6 6.8 6.0 6.2

a. C

a) Calcule la media y la moda.


b) La mediana de la edad de la población.
c) Desviación estándar y Varianza.
d) Coeficiente de Variación.

4. Una muestra de 20 obreros de una pequeña empresa obtuvo los siguientes salarios por una semana dada,
redondeados al dólar más cercano y dispuestos en orden ascendente: $ 240, 240, 240, 240, 240, 240, 240, 140,
255, 255, 265, 280, 290, 300, 305, 325, 340.
a) Determina el rango y la media de la muestra.
b) La varianza.
c) La desviación estándar.

10
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

5. En una población de 25 familias se ha observado la variable X= nº de coches que tiene la familia y se han
obtenido los siguientes datos. 0,1,2,3,1,0,1,1,1,4,3,2,2,1,1,2,2,1,1,1,2,1,3,2,1.

a) Construya la tabla de frecuencias de la distribución X.


b) Construya el diagrama de barras y explique si es simétrica la distribución.
c) Calcule la moda, la media y la mediana.

6. Un jugador de baloncesto anota, cada domingo, el número de puntos que encesta en el partido de la liga. Las
anotaciones de los 10 últimos encuentros, jugados por su equipo, se muestran en el siguiente cuadro.

a. Calcular la media y la moda de las anotaciones.


b. Calcular el coeficiente de variación y representar el diagrama de barras, utilizando las frecuencias
relativas

7. A continuación se presenta una distribución de frecuencias de la duración de 20 llamadas telefónicas de larga


distancia, en minutos. Calcule la media, la varianza y la desviación estándar de los datos.
Duración de la Frecuencia
llamada (minutos)

4-7 4
8-11 5
12-15 7
16-19 2
20-23 1
24-27 1

8. Las cuentas por comida en el restaurante francés La Mairon tienen la distribución de frecuencias de la tabla
siguiente. Calcule la media, la varianza y la desviación estándar de esos datos.
Cuenta por la comida ($) Frecuencia
25-34 2
35-44 6
45-54 4
55-64 4
65-74 2
75-81 2

9. En una tienda de ropa deportiva se pretende hacer un estudio de mercado acerca de las compras que hacen los
clientes en un fin de semana normal. A partir de una muestra de 40 clientes se obtuvieron los siguientes datos:

Ventas Frecuencia
200-350 3
350-500 5

11
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

500-650 7
650-800 11
800-950 8
950-1100 6

A partir de esta información determine:


a) El promedio de ventas por fin de semana.
b) El valor que representa el 50% de las ventas.
c) El monto que se repite con mayor frecuencia.
d) La desviación estándar y el coeficiente de variación.
e) El porcentaje de ventas que representa una variación de una desviación estándar.

10. En referencia a la siguiente tabla de distribución de frecuencias de tasas de renta mensual por departamento de
200 departamentos - estudios:

Tasa de Renta Número de departamentos


($)
350 – 379 3
380 – 409 8
410 – 439 10
440 – 469 13
470 – 499 33
500 – 529 40
530 – 559 35
560 – 589 30
590 – 619 16
620 – 649 12
Total 200
Determinar:
a) ¿Cuáles son los límites exactos inferior y superior de la primera clase?
b) ¿Cuál es el tamaño del intervalo?
c) Determina la media de la tasa de rentas mensuales de esta muestra.
d) Determina el punto medio o mediana de la distribución de frecuencias.
e) Determina la moda de las tasas de renta.
f) Grafica el resultado.

11. La siguiente tabla representa la distribución de las calificaciones finales obtenida por 150
estudiantes de un curso.

12
Unidad 1. Fundamentos de estadística descriptiva aplicada a los
negocios
Estadística para negocios

a) ¿Qué tipo de variable es?


b) Halle la media y la desviación típica de esa variable.
c) Represente el histograma de frecuencias absolutas.
d) Calcule la mediana y el primer cuartil.
e) Calcule los percentiles 33 y 66.
f) Calcule el porcentaje de calificaciones inferior a 3,5 puntos.
g) Represente el polígono de frecuencias acumuladas.

12. Una fábrica empaqueta en lotes de 100 unidades los tornillos que produce. Se establece un plan de inspección
por muestreo consistente en examinar, de cada lote, 20 tornillos elegidos al azar y rechazar el lote si de los 20
aparecen más de 4 defectuosos; almacenar el lote como “revisable” si el número de defectuosos es menor que 5
pero mayor que 1, y aceptarlo en otro caso. Se inspeccionan 52 lotes y resulta el siguiente número de tornillos
defectuosos de cada muestra:

a) Construye la tabla de frecuencias absolutas y relativas del resultado de la inspección.


b) Dibuja el diagrama de barras para los resultados de la inspección.
c) Dibuja el diagrama acumulativo de frecuencias.
Agrupa los resultados por lotes: Rechazados, revisables y aceptados, y
d) Construye la tabla de frecuencias para los lotes.
e) Determina la proporción de lotes rechazados.
f) Representa la distribución de frecuencias mediante un histograma.
g) Dibuja el diagrama acumulativo de frecuencias.
h) Comenta las diferencias entre los resultados de los apartados c) y g).

Fuentes de referencia
Webster, M. (2000). Estadística aplicada a los negocios y la economía. Ed. McGraw-Hill, México, pp. 40-63.

13

Vous aimerez peut-être aussi