Vous êtes sur la page 1sur 22

Paso 3.

Análisis de la Información

Ana Maritza Pineda Soto. Cod. 39.558.508

Sergio Andrés Murcia Cod.1071.987.432

Jerson David Grande. Cod. 79.095.319

Yhoan Faryd Martinez Cod.

Grupo 204040_63

Tutor

Manuel Francisco Cifuentes

Universidad Nacional Abierta y A Distancia Unad

Girardot.

Abril 18 2018
INTRODUCCIÓN

Continuamos sumergiéndonos en ese tema apasionante, complejo e indispensable para

reunir datos, analizar, visualizar y formular soluciones a todo tipo de problemática como lo

la estadística.

En esta oportunidad conocimos la utilización de Medidas Univariantes de tendencia central

y Medidas Univariantes de Dispersión.

Nos adentramos en la forma de obtener la media, mediana, cuartiles, deciles, percentiles,

amplitud, rango, varianza, variación estándar, número de intervalos, frecuencias, tipos de

asimetrías, su representación gráfica más adecuada y la manera de interpretar estos datos

para formular soluciones.


JUSTIFICACIÓN

En este trabajo quisimos analizar las variables de datos que se basan en el algo tan importante
como lo es el desempleo en Colombia, en esta investigación se podrán identificar los
resultados estadísticos que arrojan frente a diferentes aspectos de esta problemática.

Analizamos a fondo algunas variables para sacar conclusiones y exponer sus resultados.
Haciendo esto pusimos en práctica todo loa aprendido hasta el momento en la unidad dos.

Al ser un documento veraz expuesto por el Dane, nosotros como colombianos nos sentimos
aludidos pues ha sido nuestra historia económica por trece años. Lo hemos vivido, y analizar
estos datos nos ayuda de cierta forma a comprender de una forma más técnica y organizada
los baches económicos de nuestra sociedad.
OBJETIVOS
El primer objetivo es hacer una práctica provechosa para nosotros como estudiantes, con
datos reales y situaciones precisas dentro del ámbito económico.
Se quiere estudiar a lo largo de 13 años de recolección de datos, las variables significativas
de la economía del país

Teniendo en cuenta que el desempleo en Colombia ha sido una gran problemática a lo largo
de la historia se han realizado cálculos tomados de acuerdo a una base de datos.

Dar cuenta de los factores que han influido en esta problemática como ha sido el promedio
de determinadas variables

Escudriñar y analizar las variables más significativas y comprender su forma y valor


estadístico.
Hacer un resumen a conciencia de las variables escogidas
Cálculo e interpretación de las medidas univariantes de tendencia
central y de dispersión para la variable discreta.
Estudiante: Jerson David Grande
Variable: discreta
Tasa de interés que pagan los bancos

frecuencia
frecuencia frecuencia frecuencia
No De relaticva
variables absoluta relativa acumulada
Datos acumulada
fi Ni Fi Ni
1 3,48% 12 0,0754717 12 8%
2 4,03% 12 0,0754717 24 15%
3 4,04% 12 0,0754717 36 23%
4 4,47% 12 0,0754717 48 30%
5 5,12% 12 0,0754717 60 38%
6 5,13% 12 0,0754717 72 45%
7 5,74% 12 0,0754717 84 53%
8 6,14% 12 0,0754717 96 60%
9 6,81% 12 0,0754717 108 68%
10 6,94% 3 0,01886792 111 70%
11 7,67% 12 0,0754717 123 77%
12 7,98% 12 0,0754717 135 85%
13 9,12% 12 0,0754717 147 92%
14 9,69% 12 0,0754717 159 100%
total 159 1

media 6,12%
moda 0,0348
mediana 5,74%

rango 6,21%
varianza 0,00037035
desviación

Std 0,01924441
Cuartil valor
Q1 0,0447
Q2 0,0574
Q3 0,0767

percentiles valor
P30 0,0473
P50 0,0574

deciles valor
D5 0,0574
D7 0,0767

200
159
147
150 135
123
108111
96
100 84
72 Series1
60
48
50 36
24
12
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14

12.00%
9.69%
10.00% 9.12%
7.98%
7.67%
8.00% 6.94%
6.81%
6.14%
5.74%
6.00% 5.13%
5.12%
4.47%
4.04%
4.03% Series1
3.48%
4.00%
2.00%
0.00%
1 2 3 4 5 6 7 8 9 10 11 12 13 14
 Cálculo e interpretación de las medidas univariantes de tendencia
central y de dispersión para la variable continúa.

 Análisis e interpretación de la información obtenida


Variable discreta: tasa de interés que pagan los bancos
Jerson David Grande
 El promedio de tasa de interés que pagaron los bancos durante 12 años fue el
6,12%
 El mayor interes que pagaron los bancos fue de 9,69%
 El menor interes que pagaron los bancos fue de 3,48%

frecuencia
frecuencia frecuencia frecuencia
No De relaticva
facilidad de creditos bancos absoluta relativa acumulada
Datos acumulada
fi Ni Fi Ni
1 Media 24 0.1509434 24 15%
2 Alta 63 0.39622642 87 55%
3 Baja 24 0.1509434 111 70%
4 Muy alta 48 0.30188679 159 100%
total 159 1

80
63
60
48
40 24
24 Series1
20
0
Media Series1
Alta
Baja
Muy alta
200

150 159

87 111
100
50 24 Series1

0
Media Series1
Alta
Baja
Muy alta

Estudiante: Sergio Andrés Murcia Garzón.


Variable: discreta
Personas sin empleo
 A partir de la base de datos suministrada, cada estudiante o cada par de estudiantes
debe elegir como mínimo, una variable discreta y calcular las medidas univariantes de
tendencia central más adecuadas, aquellas que consideren relevantes para el problema
de estudio.

Medidas univariantes
Media 4,945,286
Mediana 4,946,357
Moda No aplica
R/No aplica moda para la variable
discreta seleccionada
Rango 5,591,251
Varianza 1130956737132.89

Máximo 7,874,204
Mínimo 2,282,953

 Elegir una variable cuantitativa discreta que sea representativa y elaborar una tabla de
frecuencias para datos no agrupados, representarla gráficamente, calcular las medidas
de tendencia central: Media, mediana y moda, deciles 5 y 7; percentiles 30 y 50 e
interpretar sus resultados.
 Variable: Población cantidad de personas
 No se realiza tabla y por lo tanto tampoco se realiza grafico ya que se dijo en el
foro que no era necesario.
Medidas univariantes
Media 45,313,162
Mediana 45,598,150
Moda No aplica

Calculo cuartiles Posición Cuartil definido


cuartil1 39.75 43,799,256
cuartil2 79.5 45,554,275
cuartil3 119.25 47,309,293

Calculo Deciles Deciles Cuartiles


Decil5 79.5 50000000
Decil7 111.3 40000000
30000000
20000000
Calculo Percentiles
10000000
percentil 30 47.7
0
percentil 50 79.5 cuartil1 cuartil2 cuartil3

Posicion Cuartil definido

R/El primer cuartil es 43799256 e indica que 25% de los datos es menor que o igual a este valor
R/El segundo cuartil es 45554275 e indica que 50% de los datos es menor que o igual a este valor
R/El tercer cuartil es 47309293 e indica que 75% de los datos es menor que o igual a este valor

 Elegir una variable cuantitativa continua que sea representativa y siguiendo los
lineamientos, diseñar una tabla de frecuencia para datos agrupados a partir del
(rango, numero de intervalos, amplitud), representarla gráficamente por medio de
un histograma de frecuencias, un polígono de frecuencias, calcular las medidas de
tendencia central, determinar el tipo de asimetría, los cuartiles, deciles 5 y 7:
percentiles 25,50 (interpretar resultados).
R/Variable cuantitativa tasa de desempleo.

Valor Max 17.00


Valor Min 7.27
Rango 9.73
Medidas de tendencia central
Media 0.05
Mediana 10.91
Moda #N/A

N° Intervalos (K) 8,31=9


Regla de sturges Como el número de intervalos tiene que ser impar
K=1+3,322Log159 lo aproximamos a 9
Amplitud (i) 1.081344637

F
Clases X Frecuencia absoluta Fr acumulada
7,27-8,35 15.00148148 8 0.050314465 8
8,35-9,43 17.08148148 27 0.169811321 35
9,43-10,51 19.16148148 26 0.163522013 61
10,51-11,59 21.24148148 31 0.194968553 92
11,59-12,67 23.32148148 28 0.176100629 120
12,67-13,75 25.40148148 14 0.088050314 134
13,75-14,83 27.48148148 8 0.050314465 142
14,83-15,91 29.56148148 9 0.056603774 151
15,91-16,99 31.64148148 8 0.050314465 159

histograma
180
N° TOTAL DE DATOS

160
140
120
100
80
60
40
20
0

RANGO TASA DE DESEMPLEO

X Frecuencia absoluta Fr F acumulada


Poligono de Frecuencias
0.25

0.2
FRECUENCIA RELATIVA

0.15

0.1

0.05

0
1 2 3 4 5 6 7 8 9 10
N°INTERVALOS

Tipo de asimetría: Negativa


Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la
media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es
decir, la distribución de los datos tiene a la izquierda una cola más larga que a la derecha.
Cuartiles posicion quartil porcentaje
Cuartil1 39.75 9.5 25%
Cuartil2 79.5 10.9 50%
Cuartil3 119.25 12.00 75%

Deciles
5 123.861
7 130.221

Percentiles
25 14.2623
50 15.7251

2. Medidas univariantes de dispersión.


Elegir una variable cuantitativa discreta y calcular las medidas de dispersión más
adecuadas, a aquellas que consideren sea relevantes para el problema de estudio. Con la
variable cuantitativa discreta elegida calcular: rango, varianza, desviación típica y
coeficiente de variación, interpretar los resultados obtenidos y asociarlos con el problema
de estudio.

Medidas univariantes de dispersión


Rango
7,874,204 Valor Max
2,282,953 Valor Min
5,591,251 Rango

Desviación media
853515.2316

Varianza
1130956737132.89

Desviación típica
1063464.497

Coeficiente de variación
0
Aportes Ana.

Columna1

Media 4,945,286.18

Error típico 84,338.22

Mediana 4,946,357
AMODAL Moda #N/A

Desviación estándar 1,063,464.50

Varianza de la muestra 1,130,956,737,132.89

Curtosis (0.18)

Coeficiente de asimetría (0.02)

Rango 5,591,251

Mínimo 2,282,953

Máximo 7,874,204

Suma 786,300,502
Cuenta 159

CUATRIL POSICION VALOR


Q1 40 4,968,004.00
Q2 80 6,339,259.00
Q3 119 5,348,569.00

DECIL POSICION VALOR


D5 80 6,339,259.00
D6 95 4,303,562.00

PERCENTIL POSICION VALOR


P30 48 5,613,941.00
P50 80 5,428,691.00

BOWLEY
AS=Q1+Q3-2Q2/Q3-Q1

AS= 0.52

PEARSON
AS=X-Mo
X=Media
Mo=Moda
8,000,000

7,000,000

6,000,000

5,000,000

4,000,000
Series1
3,000,000

2,000,000

1,000,000

-
1 2 3 4 5 6 7 8

N 159.0

L.inf. 717,590.0

L.sup. 5,010,430.0

R 4,292,840.0
K 8

A 536,605.0

R+ 4,292,840.0

R-R+ -

A-1 536,604.00

INTERVALOS f h F H X1
3 2 3 2
717,590.0 1,254,195.00 1,344,688
24 15 27 17
1,254,195.00 1,790,800.00 2,149,595
12 8 39 25
1,790,800.00 2,327,405.00 2,954,503
36 23 75 48
2,327,405.00 2,864,010.00 3,759,410
36 23 111 71
2,864,010.00 3,400,615.00 4,564,318
0 0 111 71
3,400,615.00 3,937,220.00 5,369,225
0 0 111 71
3,937,220.00 4,473,825.00 6,174,133
48 30 159 101
4,473,825.00 5,010,430.00 6,979,040
159
CUATRIL POSICION VALOR

Q1 40 2,499,278

Q2 80 2,998,435

Q3 119 4,571,396

DECIL POSICION VALOR

D5 80 2,998,435

D7 111 3,309,445

PERCENTIL POSICION VALOR

P25 40 2,499,278

P50 80 2,998,435

Columna1

Media 3,162,252.54

Error típico 97,064.75

Mediana 2,998,435.26

Moda 1,399,027.32

Desviación estándar 1,223,939.91

Varianza de la muestra 1,498,028,914,050.60

DECIL 6 Curtosis (1.11)

Coeficiente de asimetría 0.19


Rango 4,292,840.00

Mínimo 717,590.50

Máximo 5,010,430.49

Suma 502,798,154.37

Cuenta 159.00

APORTES YHOAN FARYD MARTINEZ

Variable exportaciones en millones

xi fi hi Fi Hi %

1.399.027 12 0,07 12 0,07 7

1.765.870 12 0,07 24 0,14 7

2.032.581 12 0,07 36 0,21 7

2.499.278 12 0,07 48 0,28 7

3.135.490 12 0,07 60 0,35 7

2.737.194 12 0,07 72 0,42 7

3.309.445 12 0,07 84 0,49 7

4.742.912 12 0,07 96 0,56 7

5.010.430 12 0,07 108 0,63 7

4.902.198 12 0,07 120 0,7 7

4.571.396 12 0,07 132 0,77 7

2.998.435 12 0,07 144 0,84 7

2.616.193 12 0,07 156 0,91 7

717.590 3 0,01 159 0,92 1

total 159

grafica
Chart Title
6,000,000

5,000,000

4,000,000

3,000,000

2,000,000

1,000,000

-
1 2 3 4 5 6 7 8 9 10 11 12 13 14

xi fi

Medidas de tendencia central

media 3.031.289
mediana no aplica
moda no aplica

Cuartiles
159
𝑥1 = 39,75
4
39,75−36
Q1 = 2.499.278 + 12
=0,52

159
∗ 2 = 79,5
4!
79,5−72
𝑄2 = 3.309 + 12
=0,90

159
∗ 3 = 119,25
4
119,25 − 108
Q3 = 4.902.119 + = 1,34
12
DECILES
159
∗ 5 = 79,5
10
(79,5 − 72)
𝑄5 = 3.0309.445 + = 36,5
12
159
∗ 7 = 111,3
10
(111,3 − 108)
Q7 = 4.902.198 + = 4,36
212
PERCETILES
159
∗ 30 = 47,7
100
(47,7 − 36)
Q30 = 2.499.278 + = 3,47
12
159
∗ 50 = 79,5
100
(79,5−72)
Q50 = 3.309.445 + =3,93
12

Elegir una variable cuantitativa Continua que sea representativa y


siguiendo los lineamientos, diseñar una tabla de frecuencia para datos
agrupados a partir del (rango, número de Intervalos, amplitud),
representarla gráficamente por medio de un histograma de frecuencias,
un polígono de frecuencias, calcular las medidas de tendencia central,
determinar el tipo de asimetría, los cuartiles, deciles 5 y 7; percentiles
25, 50 (Interpretar sus resultados).

IMTERVALOS
LIMITE INFEROIOR
LIMITE SUPEROIR
MARDCA DE CLASEXI
fi Fi hi Hi
76,6 83,7 80,2 20 20 0,12578616 0,12578616
83,3 90,7 87,2 18 38 0,11320755 0,23899371
90,3 97,7 94,2 15 53 0,09433962 0,33333333
97,7 104,7 101,2 30 83 0,18867925 0,52201258
104,7 111,1 108,2 17 100 0,10691824 0,62893082
111,1 118,7 115,2 32 132 0,20125786 0,83018868
118,7 125,7 122,2 11 143 0,06918239 0,89937107
125,7 132,7 129,2 7 150 0,04402516 0,94339623
132,7 139,7 136,2 9 159 0,05660377 1
TOTAL 159
N 159
MIN 76,6
MAX 136,8
RANGO 83,7
K 60
A 83,7
CONCLUSIONES

Con el desarrollo del presente trabajo podemos evidenciar la importancia que tienen las
medidas de tendencia central para comprender e interpretar de manera más sencilla,
una base de datos suministrada para el análisis de la misma, y basándonos en los
conocimientos adquiridos en el recorrido del curso nos ayudan, para seguir utilizando
herramientas como los gráficos y los polígonos para simplificar los procesos de análisis.
REFERENCIAS BIBLIOGRÁFICAS.

 García, J.E (2005).Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo.


Página 26 -51 Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1
 Montero, J. M. (2007). Características de Una Distribución de Frecuencias.
Statistical Descriptive. Cengage Learning Paraninfo, S.A. Paginas 18-57.
Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0
 García, M.S.(2004).Introducción a la estadística económica y
empresarial. Paraninfo. Páginas 74 – 98. Recuperado
de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900012&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=4a9b0a469e755a4327207c94b4c0d549
 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas.
130 – 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. Mexico City:


Cengage Learning. Páginas 675 – 686 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41
 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados.
Mexico City: Cengage Learning. Páginas 686 – 695.Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r&p=GV
RL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9
 Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo. Páginas
191 – 225. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

Vous aimerez peut-être aussi