Vous êtes sur la page 1sur 19

Visualización de Datos

Módulo 1 – Algunas definiciones

Curso de Data Science


Historia y contexto.

Curso de Data Science


¿Qué es Ciencia de Datos?
Muchas definiciones
• “La ciencia de datos es lo que hacenlos
científicos de datos.”
• El objetivo de la ciencia de datos es generar
conocimiento a partir de los datos para poder
responder a preguntas formuladas.
• Esun campo interdisciplinario conformado
por métodos, procesos y sistemas.

Curso de Data Science


¿Qué hacen los Científicos de
Datos?
• Los científicos de datos recolectan, analizan y
modelan datos para generar herramientas
para el aprendizaje y la toma de decisiones
(insights).
• Para analizar y compartir la información se
deben utilizar técnicas de publicación de
información modelada.
• La visualización de datos es una parte
fundamental de la ciencia de datos.
Curso de Data Science
Proceso de la Ciencia de Datos
El proceso que sigue un Data Scientist para responder a las
cuestiones que se le plantean se pueden resumir en estos 5
pasos:
• Extraer los datos, independientemente de su fuente (webs,
csv, logs, APIs, etc.) y de su volumen (Big Data o Small Data).
• Limpiar los datos, para eliminar lo que distorsiona lasmismas.
• Procesar los datos usando diferentes métodos estadísticos
(inferencia estadística, modelos de regresión, pruebas de
hipótesis, etc.).
• Diseñar nuevos tests o experimentos en casonecesario.
• Visualizar y presentar gráficamente los datos.

Curso de Data Science


Fuente: https://inlab.fib.upc.edu/es/blog/que-es-un-data-scientist

Curso de Data Science


El camino hacia la
Ciencia de datos.

Fuente: http://nirvacana.com/thoughts/becoming-a-data-scientist/

Curso de Data Science


Curso de Data Science
Curso de Data Science
Curso de Data Science
Data Visualization - Definicion
El uso de la percepción para amplificar la
cognición, a través de herramientas
computacionales, usualmente visuales e
interactivas; y el desarrollo
de tales herramientas.

Curso de Data Science


Perfiles dentro de la Ciencia deDatos

Curso de Data Science


Perfiles dentro de la Ciencia deDatos

• Científico de datos: Sulabor principal será extraer información útil de los


almacenes de datos disponibles.

• Analista de datos: Su labor principal será obtener, procesar y realizar análisis de


datos.

• Arquitecto de datos: Son los responsables de diseñar, definir la estructura y


mantener los datos, garantizando su seguridad, calidad, fiabilidad y accesibilidad.

• Ingeniero de datos: Seencargarán de garantizar que los diferentes entornos de


recogida y procesado de datos son escalables, repetibles y seguros además de
servir para cubrir las necesidades corporativas.

• Estadístico: Su labor consistirá en obtener, analizar y e interpretar datos


cualitativos y cuantitativos utilizando diferentes métodos estadísticos (medias,
histogramas, desviaciones, regresiones, test-X, test-Z)

• Administrador de bases de datos: Su labor seguirá siendo la misma que lleva


realizando durante muchos años con bases de datos relacionales, pero añadiendo
Curso de hDaabtailSdcaideenscerelacionadascon bases de datos No-SQL y orientadas a objetos entre
otras.
¿Qué debe ser y hacer un Data Scientist?

– Explorar
– Descubrir
– Analizar
– Tomar decisiones
– Presentar
– Explicar

Curso de Data Science


Condiciones de Visualización
Cuando las condiciones de visualización
de datos son las adecuadas, los usuarios
pueden interactuar con los datos de
forma mucho más efectiva:
• Explorando las relaciones entre los
datos.
• Identificando los vínculos entre la
información presentada y fuentes
comerciales y demográficas estándar.
• Integrando fuentes no tradicionales,
tales como los datos geo-espaciales.
• Dotando a su trabajo de mayores dosis
de creatividad, que les permiten
explorar nuevos horizontes.

Curso de Data Science


Beneficios
• Las visualizaciones ayudan a los usuarios a darse cuenta de
realidades que no eran obvias para ellos antes.
• Los patrones se pueden observar de forma rápida y sencilla.
• Transmiten la información de una manerauniversal.

Curso de Data Science


¿Para qué hacemos Ciencia de Datos?
Para convertir los datos en conocimiento.

DATO INFORMACION CONOCIMIENT


S O

Curso de Data Science


Buenas Prácticas

• Adecuar permanentemente los métodos de


visualización a los formatos de datos.
• Combinar creativamente las técnicas.
• Adaptar la visualización al usuario menos experto.

Curso de Data Science


LAB1
• Presentación de la propuesta práctica
A lo largo del curso ustedes serán los analistas de datos de una
compañía de venta de insumos tecnológicos al público. Alo largo
de los labs se harán cargo de la información de la empresa y
realizarán el proceso completo de diagnóstico, captura, limpieza,
análisis, documentación, explotación y publicación de
resultados. Todos los labs emularán situaciones reales y exigirán
soluciones creativas. En las dinámicas de trabajo tendremos
reuniones, haremos presentaciones y mostraremos resultados.
La clase final emulará una presentación ejecutiva, la
presentación oral de la misma no es obligatoria aunque los
invitamos a realizar la experiencia para defender lo trabajado tal
como si fuera una presentación en un ámbito laboral.
Curso de Data Science

Vous aimerez peut-être aussi