Vous êtes sur la page 1sur 20

Unidad 2: Paso 3 - Análisis de la Información

PRESENTADO POR:
HERZON ALEXIS CRISTANCHO CORDOBA
CC. 1003880656
204040_25

FECHA
31/10/2019

PRESENTADO A:
LEIDI MILDREC ROJAS

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD


ESCUELA DE CIENCIAS BASICAS TECNOLOGIA E INGENERIA
TECNOLOGIA EN DESARROLLO DE SOFTWARE
2019
BOGOTA
Introducción

La estadística descriptiva se constituye por un conjunto de técnicas , que tienen como

objetivo el describir, clasificar, presentar, resumir y analizar cada uno de los datos

relativos a ciertas características de los individuos dentro de una población, a partir de la

información que es suministrada de los mismo de manera estricta. Para cubrir estos

objetivos la estadística descriptiva se vale de gráficos, tablas y resúmenes estadísticos.

La estadística descriptiva univariante que es la que trataremos en este trabajo

colaborativo con ayuda del aprendizaje significativo y el evento educativo virtual, la cual es

distinguida por centrarse en el análisis de una cualidad del individuo o una única

característica .A su vez dependiendo del tipo de modalidad , como las características,

podemos llegar a separar cada una de este tipo de variables entre : cualitativas también

llamadas atributos o cuantitativas, que se conocen como variables , las cuales son las que

se analizaran en nuestro paso 3.


Mapa mental

Desarrollo de la Actividad 2: Laboratorio Medidas Univariantes

Este ejercicio práctico, pretende hacer la transferencia del conocimiento


adquirido a partir de la elaboración del laboratorio de medidas univariantes, el cual
se realizará utilizando el software gratuito INFOSTAT, que podrá descargar
ingresando a Laboratorios Estadística Descriptiva: Infostat, Tutoriales, (Entorno de
aprendizaje práctico).

Los ejercicios prácticos también los podrán desarrollar utilizando la herramienta


EXCEL, la cual aparece instalada por defecto en el Office de su computador.

MEDIDAS UNIVARIANTES PARA VARIABLE CUANTITATIVA DISCRETA

A partir de la base de datos “Indicadores socioeconómicos 115 municipios


(2019) 16-4”, encontrada en el entorno de aprendizaje Colaborativo Paso 2–
organización y presentación, cada estudiante deberá resolver para una variable
cuantitativa discreta diferente, los ejercicios que aparecen a continuación y
socializarlos en el foro.

Variable Cuantitativa Discreta Escogida: Cantidad de servicios públicos


disponibles

1. Medidas Univariantes de Tendencia Central.

a. Para la variable elegida, se deberán calcular las medidas univariantes de


tendencia central:

 Media,
 Mediana,
 Moda.

Solución:

Una vez que hacemos uso del simulador con nuestros datos ordenados de menor
a mayor, hemos calculado la media, la mediana y la moda que se encuentra en la
siguiente tabla generada:

NOMBRE DE LA
MEDIDA VALOR
Media 3,23478261
Error típico 0,15977217
Mediana 3
Moda 2
Desviación estándar 1,7133656
Varianza de la muestra 2,93562166
Curtosis -0,43091274
Coeficiente de asimetría 0,39365363
Rango 7
Mínimo 0
Máximo 7
Suma 372
Cuenta 115
b. Calcular:

 Todos los cuartiles


 Deciles 5 y 7;
 Percentiles 25, 50 y 75.

Solución:

Gracias a la aplicación del simulador hemos calculado los cuartiles, deciles 5 y 7,


junto a los percentiles 25, 50 y 75, los cuales son anexados a continuación:

Todos los Cuartiles:


Deciles 5 y 7:

Percentiles 25,50 y 75:


c. Interpretar sus resultados

Solución:

Analizando los resultados podemos apreciar que por lo general dentro de los 115
municipios estudiados, la gran mayoría ha de tener disponible 2 servicios públicos,
lo cual es una dato desalentador en cuanto al desarrollo de infraestructura
territorial a nivel nacional. Este análisis lo confirma la moda y la mediana, por un
lado tenemos la moda con 2 servicios público, la media de 3,23 y la mediana con
3.

Seguidamente , esta información la podemos seguir confirmando con ayuda del


percentil 50,segundo cuartil y quinto decil, el cual nos indican que menos del 50%
de los municipios ha de tener menos de 3 servicios públicos disponibles , esto
quiere decir que 75 municipios solo tienen 2 servicios a su disposición.

Por ultimo tenemos que por encima del 75% de los municipios evaluados ha de
tener 4 o más servicios públicos disponibles, dato que no deja de ser tan negativo
como los anteriores en cuanto el enfoque del desarrollo integral de dichos
municipios.

2. Medidas unvariantes de dispersión:


a. Para la variable elegida, se deberán calcular las medidas univariantes de
dispersión:

 Rango,
 Varianza,
 Desviación típica y
 Coeficiente de variación.

Solución:

Una vez hacemos uso de la herramienta didáctica que se dispone en el curso,


el cual nos facilita el trabajo de los cálculos del rango, la varianza, la desviación
típica y el coeficiente de variación:
NOMBRE DE LA
MEDIDA VALOR
Coeficiente de Variación 52,7361533
Media 3,23478261
Error típico 0,15977217
Mediana 3
Moda 2
Desviación estándar 1,7133656
Varianza de la muestra 2,93562166
Curtosis -0,43091274
Coeficiente de asimetría 0,39365363
Rango 7
Mínimo 0
Máximo 7
Suma 372
Cuenta 115

b. Interpretar los resultados obtenidos y asociarlos con el problema objeto de


estudio

Inicialmente tenemos el rango, el cual nos indica que la diferencia entre en


mínimo valor y el máximo valor de servicios disponibles, el cual en este caso es
7, ya dentro de los datos logramos encontrar valores entre 0 servicios disponibles
o 7.

Seguidamente con ayuda del cálculo de la desviación típica, la cual nos indica
que tan dispersos están los datos respecto a la media, podemos apreciar que
tenemos un valor no tan alto ni tan bajo, por ende deducimos que la dispersión de
los datos no es tan homogénea alrededor de la media en la medida que están
muy dispersos a lo largo de cada uno de los intervalos evaluados. Esto es
evidente y lo comprobaremos más adelante cuando tengamos en cuenta el
coeficiente de variación y su análisis de variabilidad efectiva.

Por definición, cuando encontramos un CV > 50%, este valor nos indica una
variabilidad excesiva, por tanto para nuestro caso de la variable cuantitativa
discreta tenemos un CV de 52,74%, lo cual quiere decir que encontramos
efectivamente una variabilidad excesiva dentro del rango 7 que hemos manejado.
Es importante mencionar que el coeficiente de variabilidad es uno de los datos
más efectivos a la hora de investigar acerca de la dispersión de un conjunto de
datos.

Desarrollo de la Actividad 3: Variable Cuantitativa Continua

Para el desarrollo de esta actividad, es necesario que el estudiante revise en el


Entorno de conocimiento (Unidad 2), las siguientes referencias:

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo.


Página 26 -42

Montero, J. M. (2007). Características de Una Distribución de Frecuencias.


Statistical Descriptive. Cengage Learning Paraninfo, S.A. Páginas 41-50
Descripción de la Actividad:

A partir de la base de datos “Indicadores socioeconómicos 115 municipios


(2019) 16-4”, encontrada en el entorno de aprendizaje Colaborativo, cada
estudiante deberá elegir una variable cuantitativa continua distinta, manifestarlo en
el foro Unidad 2 paso 3 y calcular las medidas de tendencia central y de
dispersión.

Posterior a la consulta resolver los siguientes ejercicios:

Variable Cuantitativa Continua Escogida: % de viviendas con piso de tierra

a. Tabla de frecuencia datos agrupada. Cada estudiante deberá elegir una


variable cuantitativa continua y diseñar una tabla de frecuencia para datos
agrupados, a partir de ella elaborar un histograma de frecuencias y un polígono de
frecuencias.

Solución:

Con ayuda del simulador en Excel suministrado en el foro, se procede a elaborar la


tabla de frecuencia datos agrupados, el cual se anexara a continuación:
Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
clases inferior superior clase absoluta f
acumulada

1 0,31 4,99 2,65 77 77


2 4,99 9,67 7,33 26 103
3 9,67 14,34 12,01 8 111
4 14,34 19,02 16,68 2 113
5 19,02 23,70 21,36 0 113
6 23,70 28,37 26,04 0 113
7 28,37 33,05 30,71 1 114
8 33,05 37,73 35,39 1 115
Total 115

Seguidamente anexo los gráficos respectivos:


b. Medidas de tendencia central. Para la variable cuantitativa continúa elegida,
cada estudiante deberá calcular las medidas de tendencia central (media, mediana,
moda), cuartiles, Decil 5 y percentil 50, determinar el tipo de asimetría y curtosis e
interpretar los resultados y asociarlos con la problemática: “¿En qué condiciones
de desarrollo territorial, social y humano se encuentran las comunidades con
mayor pobreza extrema en Colombia?”

Solución:
A continuación se anexaran las medidas de tendencia central, calculadas gracias
a la herramienta de simulación brindada por el curso.
Media
Mediana

Moda

Cuartiles
Decil 5

Percentil 50

Curtosis

Resumen Estadístico
Error típico 0,469316015
Desviación estándar 5,032853566
Varianza de la
muestra 25,32961502
Curtosis 20,53746097
Coeficiente de
asimetría 3,893948372
Rango 37,41216577
Mínimo 0,314748201
Máximo 37,72691397
Suma 565,5172335
Cuenta 115

Tipo de asimetría
Si el coeficiente de curtosis es positivo como en nuestro caso, la distribución se
llama leptocúrtica. Por ende se deduce, que hay una mayor concentración de los
datos en torno a la media.

Analizando la problemática ¿En qué condiciones de desarrollo territorial, social


y humano se encuentran las comunidades con mayor pobreza extrema en
Colombia? , iniciamos enunciado la variable que he tomado para esta actividad que
es el % de viviendas con piso de tierra, de la cual podemos decir al analizar por
ejemplo el percentil 50 que un 3,8% de las viviendas por debajo de los 75 municipios
ha de tener piso de tierra en sus viviendas lo cual puede que no sea un gran avance,
pero en cuanto a infraestructura y desarrollo territorial puede dar buenos indicios,
de que a pesar que algunas comunidades se encuentren en pobreza extrema ,
muchas de estas han de tener un lugar digno en donde vivir. Por otra parte la
mediana, nos indica lo mismo que el percentil 50 y el decil 5 ya que apuntan al
mismo valor en cuanto al comportamiento de los datos.

Por último es importante aclarar, que a pesar de que los resultados son
alentadores para la variable cuantitativa continua que he escogido, esto no quiere
decir que las condiciones en las que se encuentran las comunidades de extrema
pobreza sean del todo positiva , ya que para realizar un deducción de este tipo de
circunstancias es importante analizar un sinfín de variables cuantitativas de tipo
continua y discreta, las cuales para el caso de nuestra variable cuantitativa discreta
en la activada dos , se logró evidenciar como este tipo de comunidades carecen de
servicios públicos.

c. Medidas de Dispersión. Para la variable cuantitativa continúa elegida calcular:


Rango, varianza, desviación típica, coeficiente de variación, posteriormente
interpretar los resultados y asociarlos con la problemática: “¿En qué condiciones
de desarrollo territorial, social y humano se encuentran las comunidades con
mayor pobreza extrema en Colombia?”
Socializar los cálculos y la interpretación de los resultados en el foro paso 3 -
Análisis de la Información.
Solución:

Gracias al simulador de Excel, logramos calcular cada una de las medidas de


dispersión que son solicitadas en el numeral c, las cual están resaltadas en la
siguiente tabla.

Resumen Estadístico
Coeficiente de
Variación 98,10630733
Desviación
estándar 5,032853566
Varianza de la
muestra 25,32961502
Curtosis 20,53746097
Coeficiente de
asimetría 3,893948372
Rango 37,41216577
Mínimo 0,314748201
Máximo 37,72691397
Suma 565,5172335
Cuenta 115

Una vez que se han calculado las diferentes medidas, se prosigue con el análisis
de resultado y la relación con la problemática ¿En qué condiciones de desarrollo
territorial, social y humano se encuentran las comunidades con mayor pobreza
extrema en Colombia? Ya cuando analizamos los datos desde el punto de vista de
la dispersión, es evidente que la variabilidad de estos datos es alta, pero el rango
nos expresa que por lo menos más del 37% de cada una de estas comunidades ha
de vivir bajo condiciones aceptable con su debido piso de concreto, u otro material
que no sea tierra.

Por último se evidencia un valor de la desviación estándar por encima de la


media, y esto es un hecho que era de suponerse en la medida que aparece la
distorsión debido a los valores extremos, que están tan separados de la media.
Otro hecho más sumado a esta dispersión tan exagerada lo ha de consolidar el
CV>50% que hemos obtenido, casi llegando a un valor del 100%.

Pero bueno a pesar de todos estos comportamientos, la variable siguió


arrojando hechos positivos en cuanto a la relación con la problemática en la
medida que el rango se mantiene en 37, 41216577 , lo cual nos permite concluir
que se debe bajar el rango de este tipo de variable para lograr obtener una
distribución homogénea en el comportamiento de los datos y llegar a
contrarrestar de manera directa la pobreza extrema en Colombia, y esto se
evidenciará cuando se alcance por lo menos un CV<50%. Aquí lograremos decir
que las familias tienden un techo digno y una infraestructura digna en donde vivir.
Conclusión
En el siguiente
Referencias Bibliográficas

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26 -

42). Recuperado de

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=unad&it

=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical

Descriptive. Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado de

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it

=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0

Vous aimerez peut-être aussi