Académique Documents
Professionnel Documents
Culture Documents
Agosto 2019
Bogotá Cundinamarca
Tabla de contenido
Introducción………………………………………………………………………..3
Objetivo General…………………………………………………………………...4
Objetivo Especifico………………………………………………………………..5
Herramientas ETL….……………………………………………………………...6
Página 3 de 21
Introducción
Las herramientas ETL son de gran ayuda e importancia en un proceso que lleve una
empresa porque nos permiten extraer información sin importar el sistema manejador,
Muchas de las empresas apuestan por herramientas que contribuyan de manera oportuna y
sobre todo con la mayor precisión posible al momento de realizar limpieza, cargue y
reformateo de los datos que se encuentran dentro de una organización esto con el fin de
Objetivos Generales
cargue de base de datos en empresas con alto flujo de información que requiere de su
Objetivos Específicos
Numerar herramientas ETL que ayuden a los procesos de las bases de datos para
efectividad.
estabilidad.
Saber que tan compatibles es cada herramienta con los distintos sistemas
Es una técnica muy utilizada en procesos de migración de datos, consiste en hacer que
dos bases de datos sean equivalentes en el mismo tiempo. Se logra mediante la copia de
datos y metadatos de una base de datos origen a una base de datos destino mediante una
con las bases de datos origen y la base de datos destino, parametrizando la ubicación de
Para las actividades de migración de datos es muy común utilizar archivos para el
movimiento de los datos. Se pueden utilizar diferentes tipos de archivos, pero los formatos
más usados son los archivos de texto, llamados archivos planos, que guardan la
información sin formato usando solo caracteres. Los sistemas de codificación más comunes
Los archivos de texto pueden tener formato delimitado utilizando coma (,), punto y
coma (;) o Tabulaciones para delimitar los campos definiendo de esa forma columnas y
filas. También pueden tener formato de ancho fijo para los campos, que se utiliza para
español Valores Separados por Coma), donde el delimitador usado es una coma.
Página 7 de 21
Muy usado para movimientos de datos con hojas de cálculo. Otro formato útil para la
metalenguaje extensible de etiquetas las cuales sirven como estándar para intercambio de
Sentencias DML
Una posibilidad de los SMBD es la utilización de sentencias DML para generar scripts
base de datos.
Los procesos se orientan al uso de las sentencias DML, para realizar el paso de datos de
Carga)
• Perfilado de datos: Permite explorar los propios datos, agregando a los de origen
las reglas necesarias. Esta técnica hace posible también el obtener resultados acerca
de duplicidades o errores en los datos.
• Limpieza de datos: Puede llevarse a cabo empleando para ello una herramienta de
Data Quality que ayude a eliminar errores, incorrecciones o duplicidades, entre
otras inconsistencias; y que, al mismo tiempo, enriquezca y homologue los datos,
preparándolos para el sistema de destino.
• Conexión a distintas fuentes de datos: Técnica que precisa de una herramienta ad
hoc que garantice el hacerlo en condiciones de simultaneidad.
Las ventajas que proporciona el usar estas tecnologías se traducen en un aumento de la
precisión, reducción del índice de errores, mayor agilidad y optimización del tiempo; ya
que su automatización evita los procesos manuales, algo que supone su principal beneficio.
DE ETL
Existen muchas herramientas de ETL diferentes, como también hay infinidad de bases
proyecto es decisiva. Una decisión correcta pasa por la automatización y en base a ella
quedan garantizados:
múltiples servidores, te aseguras que los datos van a estar disponibles incluso en el
caso de que una de las máquinas tenga un fallo grave de hardware. El sistema
distribuido de gestión de bases de datos debe ser capaz de enrutar a los usuarios
múltiples accesos no saturan los servidores. Esto es importante sobre todo en el caso
datos aumentas la seguridad de los datos ya que las actualizaciones están siendo
CPU’s, etc. son utilizadas para asegurar que tus datos estarán a salvo en algunos
ventajas
base de datos.
Ventajas ETL
(Metadata Manager).
administración.
diferentes especialistas.
BITOOL
Característica Definición Pantalla
Fácil Administración de BiTool Permite mantener ordenado las
Proyectos. carpetas de proyectos.
BiTool Server
Fácil conexión a Base de Permite conectarse a cualquier motor de base
Datos. de datos, entre los que también incluyen
archivos de texto y hojas de cálculo.
Varias Conexiones
Uso de Constantes El uso de variables permite al administrador
Globales de Base de Datos tener mayor seguridad
sobre la base de datos ya que solo le entrega
el nombre de la variable de conexión al Creación de Variables
Programador.
tos técnicos
ción de
proceso
Página 16 de 21
El SSIS Import/Export Wizard permite mover datos de origen a destino sin modificar los
datos del origen y permitiendo hacer iteraciones y cambios de información antes de llegar
al destino dentro de tablas de ETL. Se pueden importar datos de fuentes diferentes a SQL
Server.
Página 18 de 21
Los paquetes, que son las unidades de almacenamiento de estas tareas de migración se
pueden guardar en archivos dtsx o en la base de datos en formato XML.
Caracteristicas SSIS
• Requerimientos Técnicos:
La opción empresarial ETL (Enterprise ETL Option) para Warehouse Builder es una
opción que puede ser adquirida con Oracle Warehouse Builder como parte de la edición
empresarial del motor de base de datos (Oracle DB Enterprise Edition).
Página 19 de 21
Como parte de la Enterprise ETL Option, Warehouse Builder permite ejecutar cargas de
datos usando métodos rápidos y eficientes tales como el Oracle Data Pump y transportable
tablespaces. Esta es una aproximación completamente diferente al movimiento de datos que
se realiza por medio de conjuntos de datos controlados por el motor de base de datos. Los
incrementos en velocidad de carga se deben entonces a la omisión de las capas SQL
tradicionales.
Una vez, los usuarios de negocio han decidido que atributos son importantes, el modelador
de datos diseña la dimensión. Con los pasos de ETL el desarrollador ve esta dimensión
como cualquier otra. El siguiente paso es definir cómo efectuar los cambios y
actualizaciones en la dimensión. Warehouse Builder automatiza esto basado en la
definición de la dimensión. La combinación entre estos pasos, el diseño y la
estandarización hacen que los procesos relacionados con dimensiones lentamente
cambiantes presente un alto desempeño en su ejecución.
Con la Enterprise ETL Option de Warehouse Builder, es posible generar un modelo para
configurar los ambientes de desarrollo, pruebas y producción a niveles separados. Para
mover los cambios desde el ambiente de desarrollo a producción, el código generado en
desarrollo es modificado en producción solo en áreas específicas. Por ejemplo, la
información sobre las conexiones es substituida por la definida en desarrollo.
Página 20 de 21
Benetl: Es una herramienta ETL de uso libre, desarrollada entre los años 2007 – 2014,
hecha en java y trabaja con base a lenguajes de base de datos PostgreSQL o MySQL.
Esta herramienta se creó para facilitar el trabajo con archivos TXT, CSV o archivos de
fuente de datos XML. Para recuperar los datos que tendrán que definir un dato de tiempo y
una entidad, que está representado por datos a calcular o para mostrar. Todos los objetos
útiles serán creados por Benetl dentro de una base de datos MySQL o PostgreSQL. La
entidad.
Caracteristicas Benetl
Tecnologias:
Java 7 update 80
Requerimientos Tecnicos:
Página 21 de 21
incluido)