Académique Documents
Professionnel Documents
Culture Documents
ACTIVIDAD COLABORATIVA
INTEGRANTES
Tutor
DANIEL FRANCISCO CHICA
La actividad está dirigida a una gran variedad de datos con mucha información
recolectada, dando soluciones por medio de un estudio descriptivo con reglas y fórmulas
para hallar la solución a cada problema, obteniendo óptimos resultados estadísticos, para
predecir o descifrar cualquier estudio en específico.
OBJETIVOS
Objetivo General
Objetivos Específicos
5,193,946
4,437,638 Mediana 5,888,935
Dato mínimo Q1 Q2 Q3 Dato máximo
2,282,953 25% 50% 75% 7,874,204
Frecuencia
Nº Clases Límite Límite Marca de Frecuencia
absoluta f*x
(intervalos) inferior superior clase(x) absoluta f
acumulada
1 7,27 8,21 7,7 6 6 46,2
2 8,21 9,15 8,7 24 30 208,8
3 9,15 10,09 9,6 25 55 240
4 10,09 11,03 10,6 27 82 286,2
5 11,03 11,97 11,5 34 116 39,1
6 11,97 12,91 12,4 28 144 347,2
7 12,91 13,85 13,4 14 158 187,6
8 13,85 14,79 14,3 18 176 257,4
9 14,79 15,73 15,3 9 185 137,7
185 1750,2
N 185
Min 7,27
Max 15,77
Rango 8,5
K=Nº
Intervalos 8,531544482 9
A 0,94
GRAFICO -TABLA DE
Clase Frecuencia FRECUENCIAS
7,27 1 4
9,776666667 2
12,28333333 3 2
y mayor... 3
0
7,27 9,776666667 12,28333333 y mayor...
Polígono de frecuencias.
FRECUENCIA ABSOLUTA
ACUMULADA
3.5
3
2.5
2
1.5
1
0.5
0
1 2 3 4
En las presentes graficas se analiza que se lleva una frecuencia de datos ascendentes
en el cual el dato mayor es 12.2833, por otro lado cuando se realizó el histograma y
el polígono de frecuencia para cada uno de los datos presentes en la tabla de
frecuencias daba lo mismo, por ende se deja un histograma y polígono de frecuencia,
el porqué de la aparición de estos datos así, es porque están ordenados de menor a
mayo y tienden todos a tener valores similares.
MEDIA_9,46
Desde el año 2001 hasta el año 2017, el promedio de la tasa de desempleo en Colombia
fue de 9,46%.
MODA
fk-1 27
fk+1 28
Ak 0,94
Lk 11,03
Moda= 11,5
Desde el 2001 hasta el 2017 la tasa de desempleo que más se repitió en esos años fue de
11,5 algunos meses o algunos años estuvieron por encima y otro por debajo pero el que
más se repitió fue 11,5.
MEDIANA
n/2 92,5
n 185
Fk-1 82
fk 34
Ak 0,94
Lk 11,03
Mediana = 11,32
EL 50% de esos 185 meses en donde se estudió el desempleo en Colombia, presento una
tasa de desempleo entre 7,27% y 11,32%, el otro 50% de esos 185 meses presento una
tasa de desempleo entre 11,32% y 15,77%.
CUARTILES y PERCENTILES
k(n/100) 46,25 𝐾[
𝑛
] − 𝐹𝑘−1
100
n 185 𝑄1 = 𝑓𝑘
∗ 𝐴𝑘 + 𝐿𝑘
FK 30
185
fk 25 25[
100
] − 30
𝑄1 = ∗ 0,94 +9,15=9,8
A 0,94 25
LK 9,15
Q1 9,8
k(n/100) 92,5
n 185
FK 82
fk 34
A 0,94
LK 11,03
Q2 11,32
k(n/100) 138,75
n 185
FK 116
fk 28
A 0,94
LK 11,97
Q3 12,73
P25 Q1 9,8
P50 Q2 11,32
Q3 12,73
Tanto el Q1, Q2, P25 Y P50 contienen los mismos resultado puesto que representa
el 25% y 50% de la variable continua, estos son los cortes que se realizaran para el
listado de Tasa de desempleo (%), incluyendo también el corte del Q3.
DECILES 5 y 7.
𝐾𝑛
FK 82 [ ] − 𝐹𝑘−1
10
D5= ∗ 𝐴𝑘 + 𝐿𝑘
𝑓𝑘
fk 34
A 0,94 [5] ∗ 185
− 𝐹𝑘−1
LK 11,03 D5= 10
∗ 𝐴𝑘 + 𝐿𝑘
𝑓𝑘
D5 11,32
92,5 − 82
D5= 34
∗ 0,94 +11,03 =11,32
D5 11,39
D7 12,42
El decil 5 es el misma cuartil 2 y percentil 50, por ende tienen los mismo valores. El
decil 7 es el 70% de los datos contenidos en la variable tasa de desempleo (%).
Variable discreta
Desarrollo
Columna1
Media 44808391.83
Error típico 177320.5802 NUMERO
Mediana 44808392
DE DATOS
195
Moda #N/A
Desviación estándar 2476147.147
Varianza de la muestra 6.1313E+12
Curtosis -1.200000006
Coeficiente de asimetría 1.1785E-08
MEDIANA 44,808,392.00
Rango 8511840
Mínimo 40552472
Máximo 49064312
Suma 8737636406
Cuenta 195
CALCULAR CUARTILES
CALCULO D5 CALCULO D7
D5 44,808,392.00 D7 46,519,535.00
PERCENTIL
DATO 59 DATO 98
59 43,097,249.00 98 44,808,392.00
Donde tenemos 195 datos, espesamos con el primer estudio que es la mediana, y nos
arroja 44,808,392.00 es el dato intermedio durante la investigación en cantidad de
población, el Q1 el primer bloque de la investigación desde el 1 dato recolectado
40,552,472 hasta el dato 49 42,658,494, que equivale el 25%. El Q2 equivale al
segundo bloque de la investigación y comprende desde el dato 50_ 42,702,370 al 98_
44,808,392 y equivale a un 50% de la investigación, lo mismo el Q3 es el 75% de la
investigación, esta es la manera de hacer particiones significativas en una investigación
según la cantidad de datos recolectadas.
N 195
DATO
136.8
MAYOR
DATO
62.6
MENOR
RANGO 74.1
No
INTERVALOS 8.6074950 9
AMPLITUD
8.235
(ai)
Tabla de frecuencia
Histograma de frecuencia
Clase Frecuencia
7 1
48.87930883 8
90.75861767 3
y mayor... 6
INDICE DE PRECIOS
10
8
6
4
2
0
7 48.87930883 90.75861767 y mayor...
Polígono de frecuencias
FA DE INDICE DE PRECIOS
10
8 8
6 6
4
3
2
1
0
1 2 3 4
Aquí podemos apreciar mediante gráficas, concluir las frecuencias de los datos están dentro
índices de la investigación variados o inestables 7, 48.87930883, 9075861767, estos
resultados fueron cambiantes durante la investigación de índice de precios,
MEDIDAS DE TENDENCIA CENTRAL
MEDIA 98.811
La media es el índice
estadístico durante los años
de investigación en este caso
sería desde el 2001 al 2017 y
el promedio fue de 98.8%
MEDIANA 99.53
N/2 97.5
n 195
fi-1 86
fi 24
ai 8.235
La mediana es el resultado que obtiene la tendencia central nada más que la ubicación del centro de un
grupo de números en una distribución estadística donde obtuvo la partición de los datos, con un 99.53%
MODA 89.20
fi-1 7
fi+1 24
ai 8.235
Li 87.345
MEDIDAS DE DISPERSIÓN
COEFICIENTE DE
VARIANZA 98.81108445 VARIACIÓN
CV 0.100599812
DESVIACIÓN
ESTÁNDAR 9.940376474
Las medidas de dispersión es la variabilidad de los datos. Las medidas de dispersión más
utilizadas son el rango, la desviación estándar y la varianza. 98.81108445, 0.100599812,
9.940376474 estos los resultados durante los años encuestados de variación y desviación de
los 195 datos del índice de precios
K 3 K 7 K 50
K*N/4 146 K*N/10 137 K*N/100 98
Li 96 Li 87 Li 79
fi-1 86 fi-1 48 fi-1 41
fi 24 fi 38 fi 7
ai 8.235 ai 8.235 ai 8.235
Como podemos observar tenemos los resultados de los cuartiles desiles y percentiles de la
variable continúa obteniendo los siguientes resultados 116.25, 106.5243, 145.58 resultados
muy diferentes a la variable discreta. En cuanto a las particiones.
Aporte estudiante: FIDEL YESIT ARAMBULA
Columna1
Media 5633846.258
Error típico 101911.0482
Mediana 5544586.268
Moda #N/A No hay
Desviación estándar 911520.1255
Varianza de la muestra 8.30869E+11
Curtosis 0.189136323
Coeficiente de asimetría 0.272827532
Rango 4808386.363
Mínimo 3060315.366
Máximo 7868701.729
Suma 450707700.6
Cuenta 80
CALCULO QDP
CUARTILES
CALCULO DE D5 CALCULO DE D7
n 195 n 195
k 5 k 7
L 97.5 L 136.5
Dato 40 Dato 56
40 42,263,615 56 42,965,622
41 42,307,490 57 43,009,498
D5 42,285,553 D7 42,987,560
PERCENTILES
n 195 n 195
k 25 k 50
L 48.75 L 97.5
Dato 24 Dato 40
24 41,561,607 40 42,263,615
25 41,605,483 41 42,307,490
CALCULO DE P9
n 195
k 9
L 17.55
Dato 8
P9 40,859,600
TABLA f AGRUPADOS
N 195
Dato Mayor 49064312.00
Dato Menor 40552472.00
Rango 8511840.00
N° Intervalos 8.60749 8
Amplitud (ai) 1063980.00
Tasa de
L inf L Sup xi fi fr F fi*xi fi*xi^2
desempleo
40552472.00 41616452.00 [9,96;10,94) 41084462 6 0.030769231 6 246506772 1.01276E+16
41616452.00 42680432.00 [10,94;11,93) 42148442 12 0.061538462 18 505781304 2.13179E+16
42680432.00 43744412.00 [11,93;12,92) 43212422 15 0.076923077 33 648186330 2.80097E+16
43744412.00 44808392.00 [12,92;13,91) 44276402 13 0.066666667 46 575593226 2.54852E+16
44808392.00 45872372.00 [13,91;14,90) 45340382 17 0.087179487 63 770786494 3.49478E+16
45872372.00 46936352.00 [14,90;15,89) 46404362 9 0.046153846 72 417639258 1.93803E+16
46936352.00 48000332.00 [15,89;16,88) 47468342 5 0.025641026 77 237341710 1.12662E+16
48000332.00 49064312.00 [16,88;17,87] 48532322 3 0.015384615 80 145596966 7.06616E+15
TOTAL 80 0.41025641 3547432060 1.57601E+17
MEDIDAS DE DISPERSIÓN
CV 26234770.07
K 3 K 7 K 30
K*N/4 146.25 K*N/10 136.5 K*N/100 58.5
Li 44808392.00 Li 44808392.00 Li 42680432.00
Fi-1 46 Fi-1 46 Fi-1 18
fi 17 fi 17 fi 15
ai 1063980.00 ai 1063980.00 ai 1063980.00
MEDIANA 49023389.69
Li 43744412.00
N/2 97.5
Fi-1 33
fi 13
ai 1063980.00
MODA 45163052.00
Li 44808392.00
fi 17
fi-1 13
fi+1 9
ai 1063980.00
HISTOGRAMA DE FRECUENCIAS
18
16
14
12
10
8
6
4
2
0
[9,96;10,94) [10,94;11,93) [11,93;12,92) [12,92;13,91) [13,91;14,90) [14,90;15,89) [15,89;16,88) [16,88;17,87]
POLÍGONO DE FRECUENCIAS
20
15
10
0
[9,96;10,94) [10,94;11,93) [11,93;12,92) [12,92;13,91) [13,91;14,90) [14,90;15,89) [15,89;16,88) [16,88;17,87]
Columna1
Media 44808391.83
Error típico 177320.5802
Mediana 44808392
Moda #N/A No existe
Desviación estándar 2476147.147
Varianza de la muestra 6.1313E+12
Curtosis -1.200000006
Coeficiente de asimetría 1.1785E-08
Rango 8511840
Mínimo 40552472
Máximo 49064312
Suma 8737636406
Cuenta 195
Calculo QDP
CUARTILES
n 195 n 195 n
k 1 k 2 k
L 48.75 L 97.5 L 14
MEDIANA 44,808,392
DECILES
CALCULO DE CALCULO DE
D5 D7
n 195 n 195
k 5 k 7
L 97.5 L 136.5
PERCENTILES
CALCULO DE CALCULO DE
P30 P50
n 195 n 195
k 30 k 50
L 58.5 L 97.5
CALCULO DE P9
n 195
k 9
L 17.55
Dato 18
P9 40,859,600
Aporte estudiante: DIANA KAROLINA FONSECA SIERRA
POBLACIÓN CANTIDAD DE PERSONAS
Variable discreta
Desarrollo
Columna1
Media 44808391.83
Error típico 177320.5802
Mediana 44808392
Moda #N/A
Desviación estándar 2476147.147
Varianza de la muestra 6.1313E+12
Curtosis -1.200000006
Coeficiente de asimetría 1.1785E-08
Rango 8511840
Mínimo 40552472
Máximo 49064312
Suma 8737636406
Cuenta 195
Percentil 1 Percentil 2
Datos total 195 Datos total 195
P 30 P 50
L 58.5 L 97.5
Dato 59 Dato 98
59 43,097,249 98 44,808,392
Para esta variable discreta concluimos que el total de datos contados es de 195, donde se
puede ver el valor de la moda la cual no existe, la mediana 44, 808,392.00. también
observamos que se arroja para el dato del 25% un resultado de 49 42,658,494 para el q1.
Para q2 vemos dato del 50_42.702.370 al 98_ 44, 808,392 que es para el 50% y por último
es el de 75% el cual arrojo un dato igualitario al de 50%.
Variable Continua
N 195
Dato mayor 136.8
Dato menor 62.6
Rango 74.1
N° intervalos 8.607494979 9
Amplitud 8.234999
Clase Frecuencia
7 1
48.87930883 8
90.75861767 3
Y mayor 6
INDICE DE PRECIOS
9
8
7
6
5
4
3
2
1
0
7 48.87930883 90.75861767 Y mayor
INDICE DE PRECIOS
8
Estos gráficos calculados, nos ayuden a entender de mejor manera y fácilmente las
frecuencias de la investigación
CONCLUSION
Con este trabajo podemos concluir que al tener pleno conocimiento en la temática de
medidas univariantes estamos en la capacidad de desarrollar ejercicios prácticos donde
interpretamos los resultados de la base de datos propuestos en este caso El desempleo en
Colombia, con el cual se determinó a través de tablas de frecuencia y graficas representativas
los resultados para la moda, media, mediana, los cuartiles, deciles, percentiles que son
indispensables para el análisis de una información estadística.
La cual nos permite conocer de forma porcentual las cifras de desempleo, además de
conocer datos exactos sobre la cantidad y cualidades de la problemática para tener claridad
sobre el objeto de estudio.
BIBLIOGRAFIA