Académique Documents
Professionnel Documents
Culture Documents
Metodologa Kimball
Modelado Dimensional
Modelado Fsico
ETL
Minera de Datos
Reportes
Tabla de Contenido
Informacin y Conocimiento Sistemas transaccionales y sistemas analticos Inteligencia de negocios Almacenes de datos.
Objetivos
1. Describir el rol de la Inteligencia de Negocios (BI) y del Datawarehouse en el actual mercado. 2. Describir porque un Sistema de Procesamiento Transaccional en Lnea (OLTP) no se ajusta a un reporte analtico. 3. Describir como se procesa las consultas de soporte a las decisiones en un DW . 4. Explicar porque los negocios se orientan a manejar tecnologa de Datawarehouse.
INFORMACIN Y CONOCIMIENTO
0 1
entendimiento
=
0 1
entendiendo principios
conocimiento
entendiendo patrones
informacin
entendiendo relaciones
datos
percepcin por los sentidos
Qu es el conocimiento?
Es aquello que permite tomar decisiones. Es aquello que responde a la pregunta de cmo ...? Es aquello que responde a la pregunta de cundo tomar una decisin. . . . . . .? Es la informacin til. Es la experiencia adquirida.
0 1
entendimiento
=
0 1
entendiendo principios
conocimiento
buscando patrones
informacin
relacin entre datos
datos
captura por sensores
SISTEMAS OLTP
Analtico
Sistemas de Informacin
Transaccional
BD
actividades y transacciones elementales de BD
Sistemas Operacionales
Una BD operacional tiene caractersticas como:
Est orientada a la aplicacin. Tiene estructuras normalizadas. Contiene los datos de las operaciones. Los datos se almacenan con el mximo nmero de detalle. Se actualiza en lnea. Est en constante cambio.
Cada tablas est normalizada para asegurar la integridad de los datos, minimizar el espacio ocupado y maximizar el rendimiento de los datos.
Sistemas Operacionales
Las estructuras de datos son complejas. Los sistemas son diseados para una alto rendimiento de funcionamiento y procesamiento. La data est dispersa. Pueden no ajustarse a consultas complejas.
OLTP (OnLine Transaction Processing) es el Procesamiento de Transacciones En Lnea es un tipo de software que administran aplicaciones transaccionales, usualmente para entrada de datos y recuperacin y procesamiento de transacciones. La tecnologa OLTP se utiliza en aplicaciones, como banca electrnica, procesamiento de pedidos, comercio electrnico, supermercados, industria, etc.
SISTEMAS OLAP
Sistemas Analticos
OLAP (On-Line Analytical Processing) es Procesamiento Analtico en Lnea.
Es rpido para entregar consultas complejas. Utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de Sistemas OLTP. Un BD dimensional almacena los datos en cubos olap donde se encuentran calculados y agregados para ser consultados
Sistema OLAP
Tiene un esquema que est optimizado para que las consultas se ejecuten rpidamente. Almacena varios niveles de datos conformados por estructuras altamente optimizadas para consultas.
Permite el uso interactivo con los usuarios. Preparado para realizar informes complejos. Proporciona una vista de datos multidimensional (las tablas son bidimensionales) Permite cambiar fcilmente las filas, las columnas y las pginas en informes de OLAP.
Usos
Sistemas de informacin ejecutivos. Los gerentes necesitan informacin sobre los indicadores (lo normal y las excepciones o las variaciones) Aplicaciones financieras. Para para comunicar, planear, y analizar escenarios de mercado. (pronstico). Ventas y aplicaciones de Marketing. Anlisis de la facturacin, anlisis de producto, anlisis del cliente, y anlisis de ventas regional. Otros Usos. Anlisis de la Produccin, anlisis de servicios al cliente, evolucin del costo del producto, etc
Organizacin
Cambios en los datos
INTELIGENCIA DE NEGOCIOS
Inteligencia de Negocios
La Inteligencia de Negocios es el proceso de transformacin de datos en informacin y a travs de descubrir la transformacin de la informacin en conocimiento.
Conjunto de tcnicas y herramientas que apoyan la toma de decisiones enfocadas a la administracin y creacin de conocimiento mediante el anlisis de datos existentes.
Transforma
Dato
Informacin
Descubre
Informacin
Conocimiento
Finalidad
Convertir grandes volmenes de datos en un valor para el negocio a travs de los reportes analticos.
Generar informacin para el control de los procesos del negocio, independientemente de la fuente de datos. Soportar la toma de decisiones. Diferenciar la informacin til para los usuarios finales. Uniformizar los trminos usados en la institucin. Independientemente del origen de los datos o de la forma de extraccin, transformacin y agregacin.
Inteligencia de Negocios
Plazo Corto Plazo Uso Gestin de datos Obtencin y control Tcnica Legacy Sistems Tecnologa OLTP On-Line Transaction Processing Tecnologa Conocimiento Datos Operativo
Mediano Plazo
Decisiones tcticas
Data Warehouse
Largo Plazo
Estratgico, Pronstico
Minera de Datos
Patrones
Nuevos Conocimientos
Evolucin
Datos, Informacin y Conocimiento del Negocio.
Etapa Data Collection (1960) Data Access (1980) Pregunta del Negocio Cul fue el total de ventas en Lima y en Arequipa? Cules fueron las ventas por sucursal en Lima y en Arequipa? Tecnologa disponible Computadoras, cintas, discos Proveedores Caractersticas
Retrospectivo Esttico
RDBMS SQL
Retrospectivo binmico
Data Cul fue el total de Navigation ventas en Lima?, Drill (1990) Down Data Mining (2000)
OLAP DW
Cmo evolucionarn Algoritmos Intelligent Miner las ventas en el avanzados, (IBM), SAS, etc prximo ao? Multiprocesadores
Disciplinas
Business Intelligence. Tecnologas de almacenamiento de datos, metodologas, anlisis de informacin y software para apoyar la toma de decisiones.
Data Warehousing: (cubos, datamart) Estructuras multidimensionales que almacenan informacin calculada previamente de todas las combinaciones posibles. Knowledge Discovery in DataBases: Tcnicas para la extraccin no trivial de informacin implcita, desconocida, y potencialmente til desde los datos. Data Mining: Tcnica para la extraccin de patrones y reglas desde los datos, ayuda a crear nuevos modelos no percibidos por el analista hasta ese momento pero que realmente existen en los datos.
Disciplinas
Caractersticas comunes: Proveen informacin para el control del proceso de negocio, independientemente de la fuente en la que los datos se encuentran almacenados. Dan soporte a la toma de decisiones, siendo esta la caracterstica ms importante. La capa semntica. No se pueden tomar decisiones de negocio si no se habla el lenguaje propio del negocio. Independientemente del origen de los datos o de la forma de extraccin, transformacin y agregacin
La informacin le debe servir a los usuarios finales en un lenguaje de negocios comprensible por ellos sin la necesidad de intrpretes. La idea es que el analista se concentre en la toma de decisiones, las tome con rapidez y seguridad, lo que le ofrece una ventaja competitiva a la empresa y la acerca al cumplimiento de los objetivos.
ETL
Los datos de los sistemas OLAP son obtenidos desde los sistemas OLTP. Este no es un proceso trivial, existen cientos de potenciales problemas al momento de obtener los datos
Ejemplo - Codificacin
Codificacin y descripcin del genero del individuo. Se pudo haber sido almacenado de diferentes maneras. Por ejemplo, puede encontrarse como M y F, 1 y 0, Hombre y Mujer Masculino y Femenino. En la transformacin, habr que elegir una convencin nica para el DW, que puede ser M y F y transformar los datos.
Operacional
Data Warehouse
M-F
Operacional
Data Warehouse
Litros
Ejemplo - Formatos
Los formatos de fecha que encontramos en los diferentes sistemas operacionales pueden estar almacenados en multiples formatos. Las fechas pueden estar almacenadas como yyyy/mm/dd, mm/dd/yyyy dd/mm/yyyy. En el desarrollo del sistema DW, debemos elegir alguna de ellas y realizar la transformacin correspondiente.
Operacional
Data Warehouse
dd/mm/yyyy
ALMACENES DE DATOS
Data Warehouse
Un almacn de datos (data warehouse) es una coleccin de datos orientada a un determinado mbito (empresa, organizacin, rea, tema, etc.), integrado, no voltil y variable en el tiempo.
Data Warehouse
Ayuda a la toma de decisiones. Va ms all de los datos transaccionales y operacionales. Favorecer el anlisis y la divulgacin eficiente de datos. Contiene gran cantidad de informacin que se dividen en unidades lgicas ms pequeas, denominadas datamarts.
Ventajas de DWH
Confiable Controlado.
nica fuente de datos. No duplicacin de esfuerzos. No conflictos en periodos de tiempo. No confusin de algoritmos. No restricciones de drill-down.
Informacin de calidad. No disparidad de data, singnificado o representacion. No necesita de herramientas para soporte de muchas tecnologas.
Datamart
Es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica.
Dispone de una estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de informacin.
Datamart
Datamart OLAP Se basan en los cubos OLAP. Se construyen agregando, dimensiones e indicadores necesarios en cada cubo. Modo de creacin, explotacin y mantenimiento heterogneo (depende de la herramienta utilizada). Datamart OLTP Se basan en un extracto de un datawarehouse Se introduce mejoras en su rendimiento (agregaciones, filtrados) Lo ms comn son tablas report y vistas materializadas.
Tecnologa
Tecnologa
Databases OLAP tools
ETCL tools
BusinessMiner
API
Application Programmer Interface. Interfaz de Programacin de Aplicacin. Lenguaje y formato de mensaje utilizados por un programa para activar e interactuar con las funciones de otro programa o de un equipo fsico.
PREGUNTAS