Vous êtes sur la page 1sur 47

Aplicaciones del Cálculo y

Estadística

Medidas de Tendencia
Central y Posición
Introducción
Resumir los datos de una muestra o población en un solo
valor o en algunos pocos valores podría ser de mayor utilidad
que el tener todos los datos en su conjunto. Este resumen
sería de mayor interés para analizar el comportamiento de
las variables en estudio.
En esta parte del curso aprenderemos a utilizar las medidas
de tendencia central, las cuales resumen los datos en un solo
valor y tratará de posicionarse en el centro de las distribución
de los datos, es por eso, que se denomina «tendencia
central».
También aprenderemos las medidas resumen que no
necesariamente están en el centro de la distribución de los
datos, como por ejemplo los cuartiles o quintiles, estos
pueden resumir el conjunto de los datos en 4 o 5 valores
respectivamente.
Capacidad general:
Calcula e interpreta la medidas de posición y aplica
según la escala de medición de la variable.

Capacidades específicas:
• Calcula e interpreta la Media, Mediana y Moda para
datos sin agrupar y agrupados.
• Aplica las propiedades de la Media.
• Calcula e interpreta los Percentiles para datos sin
agrupar y agrupados.
• Realiza e interpreta el diagrama de cajas.
• Analiza los valores extremos.
MEDIDAS DE RESUMEN
Las medidas de resumen se
pueden clasificar de acuerdo a la
característica de los datos que se
desea evaluar:

-Medidas de Tendencia Central.


-Medidas de variabilidad.
-Medidas de posición.
Medidas de tendencia central:
Media, Mediana y Moda
• Son aquellas medidas que localizan el centro de una
distribución, indicando el valor alrededor del cual tienden a
concentrarse o distribuirse las demás observaciones.
• El objetivo es conseguir un valor que sea representativo del
conjunto total de datos que se está analizando.
Medidas de tendencia central :
La media, la mediana, la moda.
Propiedades de la media
• La media aritmética de una cantidad constante es la misma
constante. M(k) = k

• La media de una variable a la que se le suma o resta una


constante equivale a la media de la variable más o menos
dicha constante. M(X  k) = M(X)  k

• La media de una variable multiplicada por una constante


equivale a la media de la variable multiplicada por dicha
constante.
M(kX) = kM(X)

• En general, para dos constantes a y b tenemos.


M(aX  b) = aM(X)  b
Medidas de tendencia central si los
datos son No Agrupados
Media aritmética
La media aritmética (media o promedio) de un conjunto de valores de una
variable. Se le asocia con el centro de gravedad o punto de equilibrio de un
ത en caso
conjunto de datos . En caso se trate de muestras, se le simboliza con 𝑋;
se trate de poblaciones se le simboliza con µ

Ejemplo:
Un centro meteorológico tiene registrado los porcentajes de humedad de una zona
industrial observados en 12 días. Calcule el porcentaje medio de humedad de
dicha zona basado en la siguiente información:

92  88  95  76  .......  82
X  87.5
12
La media aritmética
Ejercicio

Los ingresos mensuales que perciben los empleados


administrativos de una empresa tienen un promedio de
2500 nuevos soles, determine el nuevo ingreso
promedio si:
a) Los ingresos de los empleados se incrementan en
300 nuevos soles.
b) Los ingresos se incrementan en un 48%.
c) Los ingresos se incrementan en un 35% más una
bonificación de 75 nuevos soles.
SOLUCIÓN.-

a) = 2500

nueva= 2500+300 = 2800

b) nueva= 2500+ 48%*(2500)= 2500*(1+48%) = 2500*1.48= 3700

c) nueva= 2500*(1.35)+75 = 3450.


PARA RAZONAR:
Analicemos el siguiente caso……

No todas las carretillas


transportan la misma carga

¿Cuántos ladrillos carga en promedio


cada una de las carretillas del grupo?

Número de ladrillos por


Variable
carretilla
Mediana
• Es el valor que ocupa la posición central en un
conjunto de datos ordenados. Por tanto es el valor
que divide en dos partes a dicho conjunto de datos.
• Es la medida más adecuada cuando hay presencia
de valores extremos. Se calcula para variables de
medida en escala intervalo o razón.
• El 50% de los datos tienen valores que son menores
o igual al valor de la mediana.
La mediana
Cálculo de la mediana para datos no agrupados:
• Ordene los datos (en forma creciente o decreciente)
• Ubique el valor central de las observaciones: Si el
número de observaciones es impar, la mediana es la
observación que ocupa el valor central; si el número
de observaciones es par la mediana es la semisuma
de los valores centrales.
xn  xn
Para me  x n 1 para 1
n n par me  2 2
2 2
impar
Ejemplo: Se ha medido la vida útil en meses de 12
pilas y se obtenido los siguientes resultados:
92 88 95 76 80 82 89 92 93 95 83 82
Determine el tiempo de vida útil debajo del cual está el 50% de
los datos y por encima esté el 50% de los datos.

Solución

Primero ordenar los datos

76 80 82 82 83 88 89 92 92 93 95 95

El total de observaciones es 12 (número par)

El 50% de los clientes tiene año de nacimiento mayor a 1988,5 y el otro


50% es menor 1988,5.
Moda

• Es el dato que más se repite ó el que tiene mayor


frecuencia. Puede existir o no existir.
• El valor de la moda no se ve afectado por valores
extremos.
• Se usa tanto para variables cualitativas como para
variables cuantitativas.
• Un conjunto de datos puede tener mas de una moda
(mul-timodal).
La Moda
Ejemplo
La moda de los datos:

a) 7 9 7 8 7 4 7 13 7

Es igual a 7. Esta serie de datos es unimodal (una


moda)

b) 5 3 4 5 7 3 5 6 3
Es igual tanto a 3, como a 5.
Esta serie de datos es bimodal (dos modas).

c) 5 4 6 11 7 2 15 9 1

No existe moda.
La Moda
Ejemplo:
Los productos declarados con problemas de
funcionamiento en una fábrica de artefactos eléctricos
durante los últimos 6 meses se muestran a continuación:
Producto Cantidad
Televisores 25
Radio 107
grabadoras
Licuadoras 45
Otros 12
¿Cuál es el artefacto más frecuente con problemas de
funcionamiento? Interprete el resultado.
Medidas de tendencia central si los
datos son Agrupados
Media aritmética

Para una población Para una muestra


k

 i fi
k
x /
 x f i i k
 i 1 x i 1
n
  x h i i
N i 1
Media aritmética: Cuantitativa
discreta
Interrupciones f
El número de interrupciones
semanales en el sistema de red de 0 20
una prestigiosa empresa registrado 1 15
el último año. La tabla de 2 8
distribución de frecuencias para 3 6
estos datos se muestra 4 2
continuación. 5 1
Calcule el promedio del número de Total 52
interrupciones semanales.
Interprete el resultado.
Solución:
0𝑥20+1𝑥15+2𝑥8+3𝑥6+4𝑥2+5𝑥1
X= = 1.19 es el promedio del
20+15+8+6+2+1

número de interrupciones semanales


Media aritmética: Cuantitativa
continua
Los terminales de computadora tienen una pila que
mantiene su configuración. Esta pila debe reponerse de
vez en cuando. Se ha medido la vida útil en meses de
80 de estas pilas y se obtenido los siguientes
resultados:
DURACION Xi fi
Calcule la duración [90-120] 105 11
[120-150] 135 13
media de las pilas. [150-180] 165 20
Interprete el resultado. [180-210] 195 17
[210-240] 225 15
[240-270] 255 3
X= 105𝑥11 + 135𝑥13 + 165𝑥20 … … . +285𝑥1 [270-300] 285 1
11 + 13 + 20 + ⋯ . . +1 80

X= 174.38 meses/pila La duración promedio de cada pila es de 174.38 meses.


La mediana
Cálculo de la mediana para datos agrupados:
• 1er método: Interpolación.- Es el más recomendable. Se
interpola ubicando en la marca de clase el valor correspondiente
a Pi=50% 15 - 28%
EDAD fi hi pi Fi Pi
50% X - 50%
[ 5-10> 3 0.083333 8% 3 8% 20 - 69%
[10-15> 7 0.194444 19% 10 28%
𝑋 −15 50% −28%
[15-20> 15 0.416667 42% 25 69% =
[20-25> 9 0.25 25% 34 94% 20 −15 69% −28%
[25-30> 2 0.055556 6% 36 100%
X= 17.68 El 50% de las
• 2do método: Fórmula: 1 personas tienen menos
c ( n  Fi 1 ) de 17.68 años y el otro
Me  Li  2
1. Calcule n / 2 f i 50% tiene más
2. Baje por la columna Fi, buscando el valor que iguale o exceda a ( n / 2)
, una vez que encontremos un valor con esas características hay que
marcar el intervalo que se encuentra en esa fila, se le llamará clase
mediana, porque la mediana pertenece a ese intervalo.
Propiedades de la mediana
1. Divide a un conjunto de observaciones en dos partes de igual
número de datos. El 50% con valores mayores a la mediana y
el otro 50% con valores menores a la mediana.

2. La mediana no se ve afectada por valores extremos.


La moda
Cálculo de la moda para datos agrupados:

1. Halle la CLASE MODAL (Busque el intervalo con la mayor frecuencia absoluta).


2. Use la fórmula:

Donde: L i = Límite inferior de la clase modal


d 1 = Exceso de la frecuencia modal sobre la frecuencia de la clase pre-modal.
d 2 = Exceso de la frecuencia modal sobre la frecuencia de la clase post-modal.
d1
Mo  Li  c ( ) d1  f i  f i 1 ; d 2  f i  f i 1
d1  d 2
Ejemplo:
EDAD fi
Indique la moda de las edades del
conjunto de personas: [3-5> 7
[5-7> 3
La frecuencia máxima es 15, [7-9> 15
entonces la clase modal [9-11> 7
se encuentra en el intervalo [7  9  [11-13< 5

Mo  7  2 12128   8.2 años


Percentiles, Diagrama
de Cajas y valores
extremos
Analicemos el siguiente caso……

Se desea hallar la estatura mínima a partir del


cual se encuentra el 20% de los jugadores
con mayores estaturas.

estatura mínima
¿Qué medida estadística debemos utilizar?
Los Percentiles dividen
un conjunto de datos en
100 partes
porcentualmente iguales.

Dado un percentil Pk, el K% de los datos son menores o


iguales al valor de Pk y el otro (100-k)% superiores al
valor de Pk
Cuartiles dividen un conjunto
de datos en 4 partes
porcentualmente iguales. Se
denotan por Q1, Q2 , Q3.

Deciles dividen un conjunto de


datos en 10 partes
porcentualmente iguales. Se
denotan por D1, D2, ... , D8 , D9.
TABLA DE EQUIVALENCIAS

CUARTIL PERCENTIL DECIL


P10 D1
P20 D2
Q1 P25
P30 D3
P40 D4
Q2 P50 D5 Me
P60 D6
P70 D7
Q3 P75
P80 D8
P90 D9
Percentiles para datos no
agrupados
• Ordene los datos de manera ascendente
• Calcule la posición i del percentil:
k n  1
i  E, d E: parte entera
100 d: parte decimal

Si es entero, el valor Si es decimal, el valor


del percentil será el del percentil se
dato que ocupe dicha obtendrá:
posición.

Pk  X ( E )  0, d * ( X ( E 1)  X ( E ) )
Ejercicio:
Dados los siguientes datos: 0 , 20, 18 , 3, 3, 4 ,15 ,10 ,10 ,9 ,8 , 4,
Calcular: D2, D9, P50, P80
SOLUCION
1er paso.- Ordenar los datos de menor a mayor.

LUGAR 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° 11° 12°


DATO 0 3 3 4 4 8 9 10 10 15 18 20
2do paso.- Ubicar la posición.
3er paso.- Hallar el valor del percentil.

D2  X 2 (121)  X 2.6  3  0.6(3  3)  3


10

D9  X 9 (121)  X 11.7  18  0.7(20  18)  19.4


10

P50  X 50 (121)  X 6.5  8  0.5(9  8)  8.5


100

P80  X 80 (121)  X 10.4  15  0.4(18  15)  16.2


100
Percentil para datos agrupados en
intervalos
1er método
• Interpolación
Ejemplo: Hallar P30
Tecnología
h% p% F H P%
LAN
f
108 111 3 0.014 1.4 3.0 0.0 1.4
114 -------- 17.3%
111 114 35 0.159 15.9 38.0 0.2 17.3 X -------- 30%
114 117 66 0.300 30.0 104.0 0.5 47.3 117 -------- 47.3%
117 120 57 0.259 25.9 161.0 0.7 73.2
120 123 29 0.132 13.2 190.0 0.9 86.4 𝑋−114 30%−17.3%
123 126 16 0.073 7.3 206.0 0.9 93.6 =
117−114 47.3% −17.3%
126 129 9 0.041 4.1 215.0 1.0 97.7
129 132 3 0.014 1.4 218.0 1.0 99.1
132 135 2 0.009 0.9 220.0 1.0 100.0
Total 220 P30 = X= 115.27
Percentil para datos agrupados en
intervalos
2do método
• Identificar el intervalo de clase al que
pertenece el percentil Pk

• calcular: nk
100
nk
buscar un Fi   ]Li , Ls ] es la clase percentil
100
w  nk 
Pk  Li    Fi 1 
fi  100 
Diagrama de Cajas

Indica el grado de dispersión interna de


los datos
¿Cómo se pueden resumir los
sueldos en un gráfico?

Valores
Extremos
(outliers).- Son
aquellos
valores que
están fuera de
LI LS los límites.

P25 P50 P75


Q1 Me Q3
Q2
D5
Sueldos (nuevos soles)
700 10000

RIC (Rango Intercuartil).- RIC= P25 – P75: Indica la dispersión del 50%
central de los datos.
Diagrama de Cajas (Boxplot)
Construcción
1. Se calcula: Q1, Q2 , Q3 , RIC y 1,5RIC.
2. Se traza una línea de referencia horizontal o
vertical (para la escala)
3. Se traza un rectángulo con los extremos en el
primer y tercer cuartil y se traza una recta
vertical en la mediana.
4. Se dibujan los límites a 1,5 rango intercuartil
de los cuartiles 1 y 3, Se considera que los
datos fuera de estos límites son atípicos:
Li  Q1 1.5( RIC ) Ls  Q3  1.5( RIC )
5. Las líneas antes y después de las cajas se llaman
bigotes, se traza desde los extremos de la caja
hasta el mínimo y máximo dentro de los límites
inferior y superior.
6. Se marcan con un asterisco los valores fuera de
los límites (valores atípicos).

bigote
Diagrama de cajas

Diagrama de Cajas

Permite

Apreciar el tipo de El nivel de


Distribución de los dispersión
datos

La identificación de
los valores extremos
“outliers”
Ejemplo 1
Un ingeniero desea analizar la resistencia a la ruptura (en
onzas) de una muestra de 36 hilos de cáñamo para lo cual
obtuvo los siguientes datos:

20,6 21,2 21,8 23,5 24 24,3 24,5 24,6 24,6


24,6 24,8 24,9 25 25,2 25,4 26,3 27,1 27,3
27,5 28,3 28,4 28,6 29,3 29,4 29,5 29,5 29,5
29,6 30,4 30,4 30,9 31,5 32,4 32,5 32,7 37,6

Realice un diagrama de cajas con esta información,


comente el resultado.
• Q1=24,6; Q2 = 27,4 Q3 = 29,575
• RIC = 4,975 1,5*RIC = 7,4625
• LI = 24,6 – 7,4625 = 17,1375
• LS = 29,55+7,4625 =37,0375

Diagrama de caja de la Resistencia

20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Resistencia
Dos modos que usan los empleados para ir a
trabajar diariamente son el transporte público y
privado (automóvil), A continuación vemos unas
muestras de tiempos en minutos de cada modo:

Público 28 29 32 37 33 25 29 32 41 34
privado 29 31 33 32 34 30 31 32 35 33

Trace un diagrama de caja para cada modo y en base a


los resultados obtenidos, ¿Qué modos de trasporte debe
preferirse?, Explique sus razones.
Solución
Con respecto al 50% de los
valores centrales
1.¿Quién de
Distribución de las notas PC1 los grupos es
más Variable?
20 ¿Por qué?

2.¿Quién de
15 los grupos es
más
homogéneo?
Notas

10
3. ¿Algún
grupo posee
notas
5
4 atípicas?

4. ¿Qué
0 forma de
H1 H2 H3
asimetría
poseen los
Fuente: Estadística Aplicada a los Negocios UPC-2011 02
grupos?
Bibliografía

• George B. Thomas, Jr. Cálculo una


Variable
• Larson, Ron (2006). Cálculo. México D.F:
McGraw-Hill. (515/L25)
• Stewart, James (2012). Cálculo de una
variable . México D.F: Cengage Learning.
(515/S79C)