Vous êtes sur la page 1sur 27

CLASE03: MEDIDAS DE RESUMEN

Mg: German Elías Pomachagua Perez

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


MEDIDAS DE RESUMEN

• Entre las medidas que permiten resumir


información proveniente de una población,
podemos considerar las medidas de
posición, medidas de dispersión y medidas
de forma, como se resume en el siguiente
diagrama.

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


MEDIDAS ESTADISTICAS DE RESUMEN

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


Medidas de Tendencia Central

• Estas medidas tienden a ubicarse en el centro


del conjunto.
• Proporcionan un valor simple y representativo
que resume un gran volumen de información.

• Media Aritmética • Moda


• Promedio Ponderado • Mediana

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


MEDIA ARITMÉTICA
• Se le denomina también media y comúnmente se le conoce co
promedio.
• Se denota:

x i Se caracteriza por:
X i 1
media muestral  Ser única
n  Fácil de calcular
N
 Es afectada por todos los
x i valores
 i 1
media poblacional
N

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


Media Aritmética


x

 x
población 
muestra
x
x
N n

x x
N n

x  x  ...  x x  x  ...  x

i


i
i 1 1 2 N
x i 1
 1 2 n

N N n n
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
Procedimiento de Calculo
I. Datos sin agrupar
Ejemplo1: Los siguientes datos corresponden a las
notas de 6 alumnos de un curso de matemáticas
x1 x2 x3 x4 x5 x6
6 7 8 12 15 17

x
n

i
x x x x x x
x i 1
 1 2 3 4 5 6

n n

x
n

i
6  7  8  12  15  17 65
x i 1
   10.83
n 6 6
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
Procedimiento de Cálculo
Ejemplo 2: Sea el tiempo en minutos que se demoran en
instalar un software un grupo de 10 estudiantes
1.7 2.8 3.2 3.4 5.3 5.9 6.2 7.2 9.3 83
• La media aritmética
10

x
n

x i
x i 1
i

x  i 1
10
n
128
x  12.8
10
Los estudiantes se demoran en promedio12.8 minutos en
instalar un software
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
MEDIANA (Me):

• Sea x1, x2, ....xn un conjunto de n datos, la mediana es aquel valo


que divide en dos partes al total de observaciones.
I. Mediana para datos no agrupados

 X n 1 si n es impar
 2

Me   X n  X n
 2 2
1
si n es par
 2

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


Procedimientos de Cálculo
• Sean las edades: 10, 18, 25, 32, 12, 5, 7, 7
Solución:
• Ordenando los datos de menor a mayor
5 7 7 10 12 18 25 32
• Como n = 8, que es un número par, utilizamos
la expresión X X
10  12
n n
1
Me  2 2
  11
2 2
Esto significa que el 50% de las personas tiene entre 5 y 11
años y el 50% restante tiene entre 11 y 32 años.

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


NOTA
1. Los valores extremos no tienen efecto importante sobre
la mediana, lo que si ocurre con la media aritmética.

Ejemplo: Sean los datos 4,5,6,7,8 luego, la media aritmética


y la mediana son X M 6 e

Pero si en lugar de 8 fuera 80 entonces la media sería Me =6


pero la media aritmética
X  20.4

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


Moda (Mo)
La moda es el valor de la distribución de mayor
frecuencia (el que más se repite)

I. Datos no agrupados:
Los siguientes datos corresponden a las edades
de 6 alumnos del curso de Estadística Aplicada:
x1 x2 x3 x4 x5 x6
26 30 30 29 28 30

Mo = 30
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
Medidas de Asimetría
Asimetría negativa Simétrica Asimetría positiva
As<0 As=0 As>0
 <Me  =Me  >Me

0.20
0.5
0.20

0.4

0.15
0.15

0.3

0.10
0.10

0.2

0.05
0.05

0.1
x s x s
x s
66 % 78 %
78 %
0.00

0.00
0.0

8 10 12 14 16 18 20 -2 -1 0 1 2 3 0 2 4 6 8 10 12 14

x x x

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


MEDIDAS DE POSICION

CUARTILES: Divide a un conjunto de datos en 4 partes


iguales.
Se denota como Q1, Q2, Q3

DECILES: Dividen al conjunto de datos ordenados en diez


partes iguales
Se denota como: D1, D2,……………, D9
PERCENTILES: Dividen al conjunto de datos ordenados en
100 partes iguales
Se denota como: P1, P2,……………, P99
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
EQUIVALENCIAS
PERCENTIL Pi DECIL Di PERCENTIL Pi CUARTIL Qi
P10= D1 Decil 1
P25= Q1 Cuartil 1
P20= D2 Decil 2
P50= Q2 Cuartil 2
………………….

P90= D9 Decil 9 P75= Q3 Cuartil 3

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


PROCEDIMIENTO DE CALCULO
Datos no agrupados:
k ( n  1)
Si Z  PK  X K ( n 1)
100 100

k (n  1)
Si  E.d  Z  PK  X E  d ( X E 1  X E )
100

Donde: k = 1,2,3,…99 es el percentil que se busca


n = numero de observaciones
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
Datos no agrupados:
Ejemplo1: Los siguientes datos corresponden a las notas de 7
alumnos de un curso de Epidemiologias
13, 6, 7, 16, 12, 15, 8
a) Calcular el Percentil P25 ~ Q1
Solución: Primero se ordena los datos
x1 x2 x3 x4 x5 x6 x7
6 7 8 12 13 15 16
k (n  1) 25(7  1)
Si   2  Z  P25  X 2
100 100
P x k k ( n 1 )
x 25 ( 7 1 )
x 72
100 100

Lo que significa que el 25% de las notas son menores que 7


Material de Clases © Germán Pomachagua Perez 17-Jun.-19
b) Calcular el Percentil 33 P33
x1 x2 x3 x4 x5 x6 x7
6 7 8 12 13 15 16
Solución:
k ( n  1) 33(7  1)
Si   2.64  Z  hacer interpolación
100 100
Significa que el Percentil 33 se encuentra entre la 2da y 3era
observación.
INTERPOLANDO se tiene:
P33 = x2 + 0.64 (x3 – x2)
Remplazando se tiene:
P33 = 7 + 0.64 ( 8 – 7 ) = 7.64
Lo que significa que el 33% tiene notas menores a 7.64 puntos.
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
MEDIDAS DE DISPERSIÓN
Una de las características importantes en el análisis de los
datos es la DISPERSIÓN ó VARIABILIDAD.
La dispersión es la cantidad de variación, de los datos en
torno al promedio.
Las medidas de Dispersión más usadas son:

 RANGO
 RANGO INTERCUARTILIC0
 VARIANZA
 DESVIACION ESTANDAR
 ERROR ESTANDART
 COEFICIENTE DE VARIACION
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
1 : RANGO INTERCUARTILICO

 Permite ubicar 50% de los datos


que se encuentran en el centro de
la distribución

0.05
Mín. P25 P50 P75 Máx

R.I.= Q3 – Q1

0.04
 Mide la dispersión en la parte

0.03
central de los datos, así que no se
ve influenciada por los valores 25% 25% 25% 25%

0.02
extremos.
Rango intercuartílico

 Es una medida resistente en el

0.01
Rango
sentido de ser poco sensible a las

0.00
observaciones extremas
150 160 170 180 190

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


Ejemplo 1: Sean los puntajes de un grupo de trabajadores. Calcular el RI y ver si y
ver si hay datos atípicos
150 151 150 147 155 145 151 152 150 149
166 142 158 153 144 190 145 147 151 156

SOLUCION: Primero ordenar los datos


ORDEN PUNTAJES
1 142
2 144
3 145
4 145
5 147
6 147
7 149
8 150
9 150
10 150
Boxplot of PUNTAJES
11 151
12 151
13 151
14 152 166 190

15 153
16 155
17 156
18 158 1 40 1 50 1 60 1 70 1 80 1 90
PUNTAJES
19 166
20 190 Material de Clases © Germán Pomachagua Perez 17-Jun.-19
2. VARIANZA: La varianza se define como la media de las diferencias
cuadráticas de todas las observaciones con respecto a su media
aritmética.
Se denota S2 si es de una muestra, y si es de una población 𝜎 2
Se usa
n
• Para comparar dos o más poblaciones.  ( x i  x ) 2

• En inferencia estadística S 2  i 1
• Para calcular el tamaño de muestra n 1

3. DESVIACIÓN ESTÁNDAR (TÍPICA): Mide el grado de dispersión de


todos los individuos que forman la muestra (s) o la población (σ).
Es la raíz cuadrada de la varianza
n
 2
 i )
( x  x
S i 1
n 1
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
• PROCEDIMIENTO DE CALCULO :
Calcular la varianza y desviación típica de las edades
5, 9, 11, 7
5  9  11  7
 Primero calculamos el promedio x  8 n
4  (x  xi

 Entonces la varianza será S2  i 1


n 1
(5  8) 2
 (9  8) 2
 (11  8) 2
 (7  8) 2
9 1 9 1
S 
2
  6.667
3 3
S2 = 6.667años 2

 La desviación típica S= 𝑆2

𝑆 = 6.67 = 2.58 𝑎ñ𝑜𝑠


Interpretación: Aproximadamente el
68.26% de los niños tuvieron
8±2.58 𝑎ñ𝑜𝑠
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
5. COEFICIENTE DE VARIACIÓN: Es una medida de variabilida
relativa de los datos, permite comparar la variabilidad de dos o má
conjuntos de datos.
Es la medida que expresa homogeneidad de un conjunto de datos
Si el Coeficiente de Variación es:
< 5% ----> datos muy homogéneos, Media
s
CV = × 100 aritmética muy representativa

X
5%  CV  20% ----> datos con homogeneidad
aceptable. La media aritmética es representativa

Si el CV  20% ----> datos heterogéneos, la media


aritmética es poco representativa
Del ejemplo anterior
2.58
CV = × 100 = 38.6%
6.667
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
ANALISIS EXPLORATORIO DE DATOS
El análisis exploratorio de datos es el proceso de utilizar herramientas estadístic
(como gráficas. medidas de tendencia central y medidas de variación)
con la finalidad de investigar conjuntos de datos para comprender sus característic
importantes
Antes de proceder a cualquier análisis se debe hacer un Análisis Exploratorio que nos
permita ver la naturaleza de los datos.
El Análisis exploratorio se usa para detectar valores atípicos (outliers) es decir valores
que no son igual al resto

Material de Clases © Germán Pomachagua Perez 17-Jun.-19


PROCEDIMIENTO DE CALCULO

 Es un dato atípico si cae fuera del intervalo

<P25 -1.5xR.I. , P75+1.5xR.I.>


en la grafica se indica como °

 Es un dato atípico extremo si cae fuera del


intervalo

<P25 -3xR.I. , P75+3xR.I.>


en la grafica se indica como *
Material de Clases © Germán Pomachagua Perez 17-Jun.-19
Ejemplo2: Se desea saber si un programa de capacitación en la empresa Royal S.A. mejoró
los tiempos en desarrollar una tarea. Para ello se observa el nivel de las habilidades antes
del programa y después del programa en una muestra de 47 empleados, obteniéndose los
siguientes resultados.
Hacer un análisis e interpretación de los resultados usando el MINITAB
Antes
146 160 182 186 186 190 200 200 202 210 214 216
218 218 220 220 220 226 234 234 236 236 238 240
242 244 244 248 248 258 266 270 270 272 276 276
278 278 282 288 288 294 294 350 385 401 420
Después
142 156 160 162 164 166 168 170 178 178 182 182
182 182 182 182 184 186 188 188 196 198 198 198
198 200 200 204 204 206 212 214 216 218 230 232
236 238 242 242 248 256 256 264 264 280 294

TRABAJO: Hacer un análisis e interpretación de los resultados usando el


MINITAB, tomando como base el archivo HERRAMIENTAS
27
Material de Clases © Germán Pomachagua Perez 17-Jun.-19

Vous aimerez peut-être aussi