Vous êtes sur la page 1sur 5

Que son metadatos?

Los metadatos son información que describe a otro conjunto de datos. En general, se pueden
definir como un directorio que nos ayuda a ubicar datos y al mismo tiempo nos facilita su
descripción. Los metadatos se pueden clasificar en tres grandes categorías:

 Metadatos de negocios, que dan soporte a los usuarios finales (como analistas y
gerentes) e incorporan la información semántica sobre la propiedad de los datos, la
definición del negocio y el cambio de políticas.
 Metadatos técnicos, dirigidos a dar soporte a los usuarios de TI que implementan y
operan el Data Warehouse: espacios de nombres de las bases de datos, nombres y
tamaños de tablas y columnas, tipos de datos y valores permitidos, etc.
 Metadatos operacionales: incluyen la información sobre la vigencia de datos (si están
activos, archivados o purgados) y sobre el linaje de datos (migraciones y
transformaciones aplicadas).

Además, los metadatos se pueden distinguir entre estáticos – utilizados para la documentación
o navegación del sistema – y dinámicos – generados en tiempo real.

DataWarehouse

Un Data Warehouse, o almacén de datos, es un repositorio de datos integrados desde una o


varias fuentes heterogéneas, como: soluciones ERP o CRM, desde SDK o aplicaciones, o
inclusos dato de sensores o de dispositivos de Internet de las Cosas. Un Data Warehouse
puede contener datos históricos o en tiempo real, que se explotan con la finalidad de realizar
análisis y producir informes.

Un Data Warehouse se construye generalmente con un proceso ETL (extract, trasnform, load),
mediante el cual los datos se extraen de las fuentes, se transforman en el formato deseado y
se cargan en el almacén. Mediante ETL, los datos heterogéneos se vuelven homogéneos.

Un Data Warehouse tiene cuatro características clave:

 Contiene datos orientados a temas relacionados con el negocio.


 Integra datos desde múltiples fuentes, a través de una herramienta ETL.
 Nos ayuda a analizar los cambios a lo largo del tiempo, desde una perspectiva
histórica.
 No es volátil, por lo cual, una vez que los datos son cargados, no cambian.

Un Data Warehouse nos permite realizar operaciones tan valiosas como: obtener información
sobre nuestros KPI, crear informes comerciales y utilizar algoritmos avanzados de aprendizaje
automático para predecir eventos futuros.

Data Mart

Un Data Mart no es otra cosa que un subconjunto de un Data Warehouse, diseñado para
satisfacer la necesidad de un determinado grupo de usuarios, ya que, a menudo, es creado y
controlado por un único departamento dentro de una organización.
Dado su enfoque monotemático, un Data Mart suele extraer los datos de una fuente
determinada, habitualmente el Data Warehouse central. Por el contrario, un Data Warehouse
reúne datos de múltiples sistemas de origen y abarca distintas áreas temáticas.

Los metadatos y los datawarehouse

Los metadatos permiten una administración eficiente de un Data Warehouse y juegan un


papel central en todos los procesos de un proyecto de Data Warehousing: desde los procesos
ETL (extracción, transformación y carga de datos) hasta los procedimiento de visualización y
generación de informes.

Los beneficios de los metadatos son enormes para todos los actores involucrados en un
proyecto del Data Warehousing:

 Los metadatos reducen drásticamente la carga de trabajo de los profesionales técnicos


en tareas de mantenimiento.
 Les ayudan a evaluar el impacto de cualquier tipo de cambio en las estructuras de
datos y en los procesos de carga y transformación de datos, proporcionando
referencias cruzadas que se notifican a todos los usuarios.
 Los usuarios de negocio pueden comprender mejor el origen de los datos, ya que los
metadatos les proporcionan información sobre las fuentes de las cuales provienen.
Además, estos usuarios encuentran información sobre las reglas y transformaciones
que se aplicaron antes de que los datos estuvieran disponibles en el almacén, y
pueden guardarlas y volverlas a utilizar como plantillas. En este sentido, los metadatos
empoderan a los perfiles de negocio y aceleran su curva de aprendizaje en el uso del
Data Warehouse.

En definitiva, los metadatos son el elemento esencial del flujo de datos dentro de una
compañía, constituyen una interfaz entre los desarrolladores y los perfiles de negocio, y por lo
tanto, conducen a una toma de decisiones más rápida, clara, precisa y en el momento
adecuado.

Metadatos y herramientas ETL

Para beneficiarse de los metadatos, es necesario elegir una herramienta ETL que los incorpore
a la base de todos sus procesos. Gracias a una herramienta ETL es posible establecer reglas de
negocio para definir mapeos y transformaciones de datos a nivel abstracto. Además nos
proporciona interfaces altamente usables de navegación de metadatos para visualizar de
forma sencilla las dependencias, los linajes, los mapas de flujo de datos y las referencias
cruzadas.

Los metadatos son una parte fundamental de un proceso ETL. Sin embargo, junto a muchos
beneficios, introducen también importantes retos, que van desde su riesgo de dispersión en la
organización, la dificultad de aplicación a datos particulares – como archivos de texto o
multimedia – y la falta de estándares aceptados en toda la industria.
Representación conceptual
Roles de la metadata

Propuesta de implementación:

Herramienta: Crono Metadata

Caso: Una empresa que quiere permitir a sus empleados realizar consultas de manera fácil e
intuitiva, además de poder generar reportes y tablas de Excel con los datos recopilados por la
empresa a través de las ventas, compras, tipos de producto, etc.

Solución: A través de Crono metadata se crea un catalogo nuevo, debe estar conectado a la
base de datos ya que se creará la capa semántica.

 Se deben crear diagramas y definir las dimensiones del negocio


 Se crea el copo de nieve a través de una sentencia sql con las tablas y sus relaciones
(JOINS)
 Crono dibuja automáticamente el diagrama de las tablas
 Se crean carpetas para cliente, producto, fechas y se ponen los campos necesarios
 Se borran campos innecesarios y se pueden arrastrar campos de otras tablas que se
requieran
 Se puede indicar al sistemas que columnas de la tabla son indicadores que se deben
sumar
 Los datos deben estar ordenados y con la terminología correcta de negocio (nombres
descriptivos de las columnas)
 Se debe establecer el formato numérico adecuado en cada caso
 Finalmente se prueba la consulta para ver si se realiza correctamente
Fuentes:

 https://blog.mdcloud.es/que-son-los-metadatos-y-por-que-son-clave-para-un-data-
warehouse/
 https://blog.mdcloud.es/data-mart-que-es-y-por-que-necesitas-
implementarlo/#Que_es_un_Data_Warehouse
 http://www.redalyc.org/pdf/114/11400802.pdf
 https://www.tutorialspoint.com/dwh/dwh_metadata_concepts.htm
 https://www.youtube.com/watch?v=zxDY5vtLTTM&t=358s&index=74&list=WL

Vous aimerez peut-être aussi