Vous êtes sur la page 1sur 26

Programa del Curso

DESCRIPCIÓN DE DATOS: PRINCIPALES INDICADORES


Indicadores de posición: Percentiles y cuartiles.
Indicadores de tendencia central: Moda, mediana y media aritmética.
Propiedades.
Indicadores de dispersión: Rango, rango intercuartil, varianza y desviación
estándar. Coeficiente de variación. Puntuación estandarizada Z.
Indicadores de asimetría: Coeficiente de asimetría de Pearson.
Medidas de tendencia central
Las medidas de tendencia central son medidas resumen que se usan
como valores que representan al conjunto de datos de una variable.
Existen varias medidas de tendencia central, como por ejemplo:

Moda Mediana Media Media ponderada


Medidas de tendencia central

Moda
La moda de un conjunto de datos
observados de una variable es el
valor que se presenta con mayor
frecuencia.
Medidas de tendencia central

Moda Características
 La moda se puede calcular para datos
La moda de un conjunto de datos medidos en cualquier escala de medición.
observados de una variable es el  El valor de la moda no se ve afectado por
valor que se presenta con mayor valores extremos.
frecuencia.  La moda no siempre es un valor único. Una
serie de datos puede tener dos modas
(bimodal) o más modas (multimodal).
Ejercicio
En la empresa A, se midió el número de errores por día que cometieron 158 obreros
al ensamblar un determinado producto.

Empresa A. Distribución de obreros por el


Calcule e interprete número de errores al ensamblar el producto
la moda del ni :
número de xi : Número
Número
errores por obrero. de errores
de obreros
0 25
3 45
5 60
8 28
Fuente: Gerencia de Producción. Empresa A
Reflexión
Si un histograma aparentemente no tiene moda y sus barras tienen
aproximadamente la misma altura, entonces decimos que su distribución es
Uniforme:
Tiempo para mantenimiento de
retroexcavadoras
Reflexión 12
10

Cantidad
8
6
4
2
0
Supongamos que el histograma arriba 75 85 95 105 115 125 135 145 155

muestra el tiempo para mantenimiento Tiempo (días)

de retroexcavadoras, en días de Tiempo para mantenimiento de


utilización. 12
retroexcavadoras
- Suelos Rocosos -
10
Probablemente, las 2 modas son indicios 8

Cantidad
de que hay dos distribuciones 6
4

superpuestas, cada una representando 2


0

la utilización de las retroexcavadoras en 75 85 95 105 115


Tiempo (días)
125 135 145 155

suelos de diferente dureza. Tiempo para mantenimiento de


En estos casos, es aconsejable que los 12
retroexcavadoras
- Suelos Blandos -
datos del tiempo para mantenimiento se 10
8

Cantidad
represente separadamente por tipo de 6

suelo en que se utiliza. 4


2
0
75 85 95 105 115 125 135 145 155
Tiempo (días)
Mediana
• Es el valor que ocupa la posición central en un conjunto de datos
ordenados. Por tanto es el valor que divide en dos partes a dicho
conjunto de datos. También sirve para datos ordinales.
• Es la medida más adecuada cuando hay presencia de valores
extremos, pues no se ve afectada por valores atípicos.
• Es el valor de 𝑎 que minimiza:
Mediana
Cálculo de la mediana para datos no agrupados:
• Ordene los datos (en forma creciente o decreciente)
• Ubique el valor central de las observaciones: Si el número
de observaciones es impar, la mediana es la observación
que ocupa el valor central; si el número de observaciones es
par la mediana es la semisuma de los valores centrales.
xn  xn
Para me  x n 1 para 1
n impar
2 n par me  2 2
2
Ejemplo – Calidad del aire
Una forma de evaluar la calidad del aire en un ambiente es medir la cantidad de material particulado
menor de 10 micrómetros, el cual puede ser nocivo. Suponga que se tienen las siguientes mediciones en
μ𝑔/𝑚3 (microgramo/metro cúbico), durante 6 días en una ciudad:
39.39 39.12 32.08 29.85 48.25 36.09
Reordenando los datos:

En R:

> x = c(39.39, 39.12, 32.08, 29.85, 48.25, 36.09)


> quantile(x,0.5,type=2)
50%
37.605
> median(x)
[1] 37.605
Medidas de tendencia central
Características
 Se puede calcular para datos cuantitativos con
Media Aritmética escala de intervalo o razón.
La media aritmética es el  El cálculo de la media es sencillo y es la medida
de tendencia central más conocida.
valor que se obtiene al dividir  La media puede verse fuertemente afectada por
la suma total de los datos por la presencia de valores atípicos (observaciones
que son muy grandes o muy pequeñas con
el número de datos. respecto al resto de observaciones).
n

x
0 1 2 3 4 5 6

i 0 1 2 3 4 5 40

x i 1
 Es el valor de 𝑎 que minimiza
n
Medidas de tendencia central
Propiedades
Media Aritmética n

x

i  nx
La media aritmética es el i 1
valor que se obtiene al dividir n
la suma total de los datos por
el número de datos.
  x  x   0
i 1
i

x i
 Si cada uno de los 𝑛 valores 𝑥𝑖 es
transformado en: 𝑦𝑖 = 𝑎 𝑥𝑖 + 𝑏,
siendo 𝑎 y 𝑏 constantes, entonces la
x i 1
media de los 𝑛 valores 𝑦𝑖 es:
n
y  ax  b
Ejemplo – Calidad del aire
Una forma de evaluar la calidad del aire en un ambiente es medir la cantidad de material particulado
menor de 10 micrómetros, el cual puede ser nocivo. Suponga que se tienen las siguientes mediciones en
μ𝑔/𝑚3 (microgramo/metro cúbico), durante 6 días en una ciudad:
39.39 39.12 32.08 29.85 48.25 36.09
La media muestral será:

En R: En R:

> x = c(39.39, 39.12, 32.08, 29.85, 48.25, 36.09) > x = c(99.39, 39.12, 32.08, 29.85, 48.25, 36.09)
> mean(x) > mean(x)
[1] 37.46333 [1] 47.46333
Observe que un único valor extremo grande
puede tener un gran impacto en el valor de la
media.
Ejercicio
Un comerciante ha comprado 30 computadores y ha pagado un precio medio de 450
dólares por las computadoras. El comerciante planea revender estas computadoras para
obtener ganancias.
𝑋=precio de compra de una computadora, 𝑋ത = 450 US$
Si decide fijar el precio de venta de tal manera que gane 80 dólares sobre el costo de cada
computadora, ¿cuál sería el precio medio de venta de las computadoras?
𝑌=precio de venta de una computadora, 𝑌 = 𝑋 + 80
𝑌ത = 𝑋ത + 80 = 450 + 80 = 530
Si decide fijar el precio de venta aumentando un 10% sobre el costo de cada computadora
más un monto fijo de 50 dólares, ¿cuál sería el precio medio de venta de las computadoras?
𝑍=nuevo precio de venta de una computadora, 𝑍 = 1.1 𝑋 + 50
𝑍ҧ = 1.1 𝑋ത + 50 = 1.1 × 450 + 50 = 545
Medidas de tendencia central

Media aritmética para Sean x1, x2,…, xk los valores observados


de una variable discreta X
datos en una distribución con frecuencias absolutas respectivas
de frecuencias para n1, n2,…, nk.

variable discreta La media aritmética de estos datos es:

x n i i k
x i 1
n
 x f
i 1
i i
Ejemplo
En la empresa A, se midió el número de errores que cometieron 158 obreros al
ensamblar un determinado producto. Calcule la media del número de errores por
obrero.
xi: Número de ni: Número de fi: Proporción
errores obreros de obreros
0 25 0.16
3 45 0.28
5 60 0.38
8 28 0.18
158
0  25  3  45  5  60  8  28 659
x   4.1708
25  45  60  28 158

x  0  0.16  3  0.28  5  0.38  8  0.18  4.1708


Medidas de tendencia central
Media aritmética En ese caso, se obtiene un valor
aproximado de la media aritmética de
aproximada para datos en los datos usando las marcas de clase de
una distribución de los intervalos.
El valor aproximado de la media
frecuencias por intervalos aritmética para 𝒏 datos organizados en
una distribución de frecuencias con 𝒌
intervalos o clases, con marcas de clase
𝑚1, 𝑚2, … , 𝑚𝑘 y frecuencias absolutas
𝑛1, 𝑛2, … , 𝑛𝑘 respectivamente es:

m n i i k
x i 1
n
 m f
i 1
i i
Ejercicio
En el distrito A se tomó una muestra aleatoria de jóvenes y se les preguntó por su
estatura, en centímetros, obteniéndose los siguientes resultados.
Distrito A. Distribución de una muestra de 800 jóvenes según estatura
Estatura (en centímetros) mi ni fi Ni Fi
 150 ,  0,48
 , 166  0,32
 ,  0,95
 ,  800
Fuente: Gerencia de Desarrollo Humano. Municipalidad del distrito A

Complete la tabla de distribución de frecuencias y calcule la estatura media para la


muestra de jóvenes.
Ejercicio
En el distrito A se tomó una muestra aleatoria de jóvenes y se les preguntó por su
estatura, en centímetros, obteniéndose los siguientes resultados.
Distrito A. Distribución de una muestra de 800 jóvenes según estatura
Estatura (en centímetros) mi ni fi Ni Fi
 150 , 158  154 0,48
 158 , 166  162 0,32
 166 , 174  170 0,95
 174 , 182  178 800
Fuente: Gerencia de Desarrollo Humano. Municipalidad del distrito A

Complete la tabla de distribución de frecuencias y calcule la estatura media para la


muestra de jóvenes.
Ejercicio
En el distrito A se tomó una muestra aleatoria de jóvenes y se les preguntó por su
estatura, en centímetros, obteniéndose los siguientes resultados.
Distrito A. Distribución de una muestra de 800 jóvenes según estatura
Estatura (en centímetros) mi ni fi Ni Fi
 150 , 158  154 384 0.48 384 0.48
 158 , 166  162 256 0.32 640 0.80
 166 , 174  170 120 0.15 760 0.95
 174 , 182  178 40 0.05 800 1.00
Fuente: Gerencia de Desarrollo Humano. Municipalidad del distrito A

Complete la tabla de distribución de frecuencias y calcule la estatura media para la


muestra de jóvenes. ത
154 × 384 + 162 × 256 + 170 × 120 + 178 × 40
𝑋= = 160.16
800

𝑋ത = 154 × 0.48 + 162 × 0.32 + 170 × 0.15 + 178 × 0.05 = 160.16


Ejercicio
En los reportes estadísticos de una empresa, correspondientes al período de los
últimos 100 días, se lee la siguiente información sobre el número de facturas diarias
emitidas por la empresa en dicho período.
X Proporción de días
Número de facturas
[30 ; 60] 0,25
]60 ; 90] 0,40
]90 ; 120] 0,20
]120 ; 150] 0,10
]150 ; 180] 0,05

Calcule el valor aproximado de la media y la mediana del número de facturas diarias emitidas por la
empresa en dicho período, compare los valores y comente cuál le parece más adecuado para
representar este conjunto de datos.
Calcule aproximadamente el porcentaje de días en los que fueron emitidas más facturas que la
media.
Distribución del número de facturas diarias
0.5
Ejercicio 0.4
0.40

Proporción
0.3 0.25
X Porcentaje 0.20
Proporción de 0.2
Número de mi acumulado de 0.10
días 0.05
facturas días 0.1
0 0.00
[30 , 60] 45 0.25 25% 0
30 45 75 105 135 165 180
]60 , 90] 75 0.40 65% Número de facturas
]90 , 120] 105 0.20 85%
]120 , 150] 135 0.10 95%
]150 , 180] 165 0.05 100%
Media:
x  45  0.25  75  0.40  105  0.20  135  0.10  165  0.05  84
Distribución del número de facturas diarias
0.5
Ejercicio 0.4
0.40

Proporción
0.3 0.25
X Porcentaje 0.20
Proporción de 0.2
Número de mi acumulado de 0.10
días 0.05
facturas días 0.1
0 0.00
[30 , 60] 45 0.25 25% 0
30 45 75 105 135 165 180
]60 , 90] 75 0.40 65% Número de facturas
]90 , 120] 105 0.20 85%
]120 , 150] 135 0.10 95%
Distribución del número de facturas diarias
]150 , 180] 165 0.05 100%
100% 95% 100%

Porcentaje acumulado
80% 85%
Media:
60% 65%
x  45  0.25  75  0.40  105  0.20  135  0.10  165  0.05  84 50%
40%
Mediana: 20% 25%

k = 50  i=2  Li=60 , fi=0.40 , Fi-1=0.25 , A=30 0% 0%


60 P50 90 120 150 180
A k  30  50 
Pk  Li    Fi 1  P50  60    0.25   78.75 Número de facturas
fi  100  0.40  100 
Distribución del número de facturas diarias
0.5
Ejercicio 0.4
0.40

Proporción
0.3 0.25
X Porcentaje 0.20
Proporción de 0.2
Número de mi acumulado de 0.10
días 0.05
facturas días 0.1
0 0.00
[30 , 60] 45 0.25 25% 0
30 45 75 105 135 165 180
]60 , 90] 75 0.40 65% Número de facturas
]90 , 120] 105 0.20 85%
]120 , 150] 135 0.10 95%
Distribución del número de facturas diarias
]150 , 180] 165 0.05 100%
100% 95% 100%

Porcentaje acumulado
80% 85%
Media: 84
60% 65%
k%
Mediana: 78.75 40%
20% 25%
Porcentaje de días en los que fueron emitidas más facturas que la media: 0% 0%
60 90 120 150 180
Número de facturas
Pk=84  i=2  f2=0.40 , L2=60 , F1=0.25 , A=30
f   0.40
k   i Pk  Li   Fi 1  100   84  60  0.25 100  57% 84
A   30 
Porcentaje de días en los que fueron emitidas más facturas que la media: 100 - k = 100 - 57 = 43%
Medidas de tendencia central

Media aritmética Dados n datos x1, x2,…, xn


con pesos w1, w2,…, wn
ponderada
la media aritmética ponderada de los
datos es:
n

w x
i i
i i
xp  n

w
i 1
i
Ejercicio
Calcule la nota final de un alumno del curso de Estadística de Estudios
Generales Letras que tiene las siguientes notas:
práctica calificada 1 = 18,
práctica calificada 2 = 10,
práctica calificada 3 = 12,
práctica calificada 4 = 15,
examen parcial = 14 y
examen final = 9.
Los pesos del promedio de prácticas, examen parcial y examen final son 3, 3 y 4,
respectivamente. La práctica con menor nota se anula.
18+12+15 45
Promedio de las 3 mejores prácticas= = = 15
3 3
15×3 + 14×3 + 9×4 123
Promedio del curso = = = 12.3
3+3+4 10