Académique Documents
Professionnel Documents
Culture Documents
Tarea 2
A00805836
Sistemas Datawarehouse
Un Data Warehouse (DW) es un repositorio de datos organizacional para el soporte al proceso de
gestin y toma de decisiones. Funciona como un repositorio central para todos o importantes partes de
los datos que los distintos sistemas de negocio de una empresa recogen. El trmino fue acuado por W.
H. Inmon en 1970.
Un DW es una base de datos relacional que est diseado para la consulta y anlisis en lugar de
para el procesamiento de transacciones. Por lo general, contiene datos histricos derivados de los datos
de transaccin, pero puede incluir datos de otras fuentes. Adems puede incluir la extraccin, transporte,
transformacin y carga de solucin (ETL), un procesamiento analtico (OLAP) del motor en lnea,
herramientas de anlisis de clientes, y otras aplicaciones que gestionan el proceso de recopilacin de
datos y la entrega a los usuarios de negocios. Sus caractersticas principales, segn William Inmon, son:
asunto Orientada, integrado, no voltil, tiempo variable.
Un cubo es una estructura de datos que supera las limitaciones de las bases de datos relacionales,
proporcionando un anlisis rpido de los datos. Los cubos pueden mostrar y resumir grandes cantidades
de datos al tiempo que proporciona a los usuarios acceso de bsqueda a cualquiera de los puntos de
datos. De esta manera, los datos pueden ser enrollados, en rodajas, en cubitos y segn sea necesario para
manejar la ms amplia variedad de preguntas que son relevantes para el rea de un usuario de inters.
Para
las
mejores
soluciones en software para DWs
que podemos encontrar en el
mercado, se
consult
el
cuadrante mgico de Gartner.
(Figura 1). Como podemos ver, en
el cuadrante de lderes podemos
encontrar Teradata, Oracle, IBM,
Microsoft, SAP y HP. En cuanto a
sistemas open source,
podemos encontrar Actian,
Cloudera e InfiniDB.
Sistemas
Microsoft SQL Server Analysis Services Microsoft
Es una herramienta de procesamiento analtico en lnea (OLAP), minera de datos y presentacin
de informes en Microsoft SQL Server. Se utiliza como una herramienta de las organizaciones para
analizar y dar sentido a la informacin. Gartner estima que los ingresos DBMS relacional de
Microsoft crecieron 13,6% en 2013, ms rpido que el mercado en general.
Funcionalidad de SQL Server Analysis Services OLAP incluye:
Desventajas:
Microsoft est poniendo al da con los otros lderes, pero una demanda del mercado
rpido-seguidor todava conduce el mapa de ruta de Microsoft. Sin embargo, Microsoft
ha demostrado su voluntad de ser agresivo en ciertas reas (como datos no estructurados
mediante la bsqueda de SharePoint y Azure).
Organizaciones sealan grandes volmenes de datos, pero, en general, los almacenes de
datos de Microsoft tienen un pequeo nmero de usuarios, se necesitan mejores
ejemplos de almacenes de escalamiento. Los clientes desean facilitar el acceso a
metadatos utilizable para entornos heterogneos.
Clientes de referencia todava informe que una ventaja de costos significativos, pero las
investigaciones indican que incluso las pequeas subidas importantes y necesidades de
Microsoft para mantener su diferenciacin de precios de otros proveedores.
Ventaja: OLAP, y los recursos de objetos relacionales se hacen escalable, confiable, segura y
manejable por el mismo conjunto de mecanismos.
Desventajas:
Oracle ha anunciado la capacidad asignar en memoria (en Oracle Open World en 2013),
pero todava tiene que ser entregado.
Una tercera parte de los clientes de referencia encuestados indicaron como un tema de
licencias y precios. Oracle anot bajo en la encuesta sobre el valor percibido por costo.
Una baja calificacin de la experiencia del cliente no parece afectar a la intencin de los
clientes a comprar ms de este proveedor (dos tercios de encuesta encuestados indic
planes actuales para comprar ms de Oracle).
IBM ofrece todos los factores de forma de cinco para los almacenes de datos: software
gestionado, arquitecturas de referencia, electrodomsticos, nube y servicios. Canales y
alianzas de IBM son altamente prolficos en cuanto a la capacidad de ofrecer soporte
local. IBM utiliza socios, distribuidores y personal directo.
Referencias centran en caractersticas de PureData, mencionando especficamente la
facilidad de implementacin y confiamos en el futuro de la plataforma. El acelerador de
analtica (IDAA) para sistema-Z tambin es alabado.
Desventajas
Actian (open
Ofrece productos de procesamiento masivamente paralelo (MPP) y multiprocesamiento simtrico
y el uso general, open source Ingres DBMS.
Fortalezas:
Tiene un precio por nodo, pero tambin ofrece lo que llama "derecho a desplegar" la
concesin de licencias - mediante el cual, los clientes pueden implantar una licencia de
nodo ilimitado basado uso-caso-por un perodo de tiempo especfico y un caso de uso
especfico.
Desventajas:
Cloudera
Ofrece una plataforma de almacenamiento y procesamiento de datos basado en un marco de
software de cdigo abierto Apache Hadoop, as como del sistema de propiedad y de gestin de
datos de herramientas para el diseo, implementacin, operacin y gestin de la produccin.
Ofrece licencias de venta y varias suscripciones anuales; actualmente cuenta con poco ms de
1.000 clientes.
Fortalezas:
Desventajas:
Business Intelligence
Segn Gartner, Business Intelligence es el proceso de transformar datos en informacin y por
medio del descubrimiento transformar esa informacin en conocimiento. Business Intelligence es una
disciplina de desarrollo de la informacin que es concluyente, basada en hechos y acciones concretas,
ofreciendo a las empresas la capacidad de descubrir y utilizar la informacin que ya poseen, y convertirlo
en el conocimiento de que afecta directamente el rendimiento de las empresas " segn IBM.
Como
las
mejores soluciones en
software para Business
Intelligence
que
podemos encontrar en
el mercado, se consult
el cuadrante mgico de
Gartner. (Figura 2).
Como podemos ver, en
el cuadrante de lderes
podemos
encontrar
Tableau
8,
Qlik,
Microsoft SAS, IBM, SAP,
Tibco, Oracle, entre
muchos otros. En cuanto
a sistemas open
source,
podemos
encontrar Jaspersoft,
Figura 2. Cuadrante
Mgico de Gartner para
Business Intelligence and
Analytics Platforms, en
Febrero del 2014.
Tableau 8 Tableau
Fortalezas:
Desventajas:
Los clientes de Tableau reportan una experiencia inferior a la media de ventas, que
incluye todo el ciclo de vida de las ventas de las actividades de pre-venta a la contratacin,
la fijacin de precios y la relacin de ventas en curso
Aunque los clientes informan que emplean Tableau para una amplia gama de usos, la
empresa carece de capacidades de la plataforma de BI tradicionales, tales como los
informes de produccin.
Ya que Tableau ofrece su producto Data Server para facilitar la reutilizacin de datos y la
gobernanza, esto sugiere que la capacidad de Tableau para satisfacer la combinacin de
necesidades de los usuarios de negocio y de TI requisitos de gobierno de la empresa y
capacidad de ge stin es todava un trabajo en proceso, y la carrera para asegurar este
mercado "espacio en blanco" permanece abierto y altamente competitivo.
Desventajas:
Power BI - Microsoft
Microsoft ofrece un conjunto competitivo y en expansin de BI y capacidades de anlisis,
envasado y precios que atraen a los desarrolladores de Microsoft, distribuidores independientes
y ahora a los usuarios de negocios.
Fortalezas:
Desventajas:
Desventajas:
Mondrian - Pentaho
Plataforma open-source que ofrece una completa gama de integracin de datos y capacidades
analticas.
Fortalezas:
Gran capacidad de datos grandes, incluyendo mezcla bajo demanda, integracin de datos,
visualizacin avanzada y anlisis predictivo.
Permite a los desarrolladores hacer operativo el anlisis avanzado al integrar Pentaho
Data Mining o modelos de terceros en los componentes de la plataforma de BI.
Bajo costo de licencia, gran funcionalidad y facilidad de uso para usuarios finales, as como
su fcil acceso de datos y capacidades de integracin.
Desventajas:
La calidad y soporte del producto no son los esperados por los clientes.
Dificultad para utilizar e implementar.
Bibliografa
Gartner. "Magic Quadrant for Data Warehouse Database Management Systems." Gartner (2014). Magic
Quadrant. Web. 28 Aug. 2014.
<http://my.gartner.com/portal/server.pt?open=512&objID=260&mode=2&PageID=3460702&resId=266
8318&ref=QuickSearch&sthkw=data warehouse>.
Gartner. Magic Quadrant for Business Intelligence and Analytics Platforms." Gartner (2014). Magic
Quadrant. Web. 28 Aug. 2014.
<http://my.gartner.com/portal/server.pt?open=512&objID=260&mode=2&PageID=3460702&resId=266
8318&ref=QuickSearch&sthkw=business intelligence>.
"Data warehouse appliance: Oracle Exadata". 22 September 2011. Retrieved 16 September 2012.
Paul Lane, Oracle Database Data Warehousing Guide. 11g Release 2 (11.2), September 2011
Bond, J. (2013). Top 20 Automatic data collection suppliers. Modern Materials Handling, 68(10), 38-41.
Roldan, M. (2010). Pentaho 3.2 Data Integration : Beginner's Guide: Explore, Transform, Validate, and
Integrate Your Data with Ease. Birmingham: Packt Pub
Vailiev, Y. (2010). Oracle Business Intelligence : The Condensed Guide to Analysis and Reporting.
Birmingham [England]: Packt Pub.
http://technet.microsoft.com/en-us/sqlserver/cc510300.aspx
http://technet.microsoft.com/en-us/library/hh495576.aspx