Vous êtes sur la page 1sur 10

Caracrteristicas Generales de la herramienta

Common Uses
Pentaho Data Integration is an extremely flexible tool that addresses a broad
number of use cases including:

Data warehouse population with built-in support for slowly changing


dimensions and surrogate key creation

Data migration between different databases and applications

Loading huge data sets into databases taking full advantage of cloud,
clustered, and massively parallel processing environments

Data Cleansing with steps ranging from very simple to very complex
transformations

Data Integration including the ability to leverage real-time ETL as a data


source for Pentaho Reporting

Rapid prototyping of ROLAP schemas

Hadoop functions: Hadoop job execution and scheduling, simple Hadoop


MapReduce design, Amazon EMR integration

Key Benefits
Pentaho Data Integration features and benefits include:

Installs in minutes; you can be productive in one afternoon

100% Java with cross platform support for Windows, Linux, and
Macintosh

Easy to use graphical designer with over 100 out-of-the-box mapping


objects including inputs, transforms, and outputs

Simple plug-in architecture for adding your own custom extensions

Enterprise Data Integration server providing security integration,


scheduling, and robust content management including full revision
history for jobs and transformations

Integrated designer (Spoon) combining ETL with metadata modeling and


data visualization, providing the perfect environment for rapidly
developing new Business Intelligence solutions

Streaming engine architecture provides the ability to work with extremely


large data volumes

Enterprise-class performance and scalability with a broad range of


deployment options including dedicated, clustered, and/or cloud-based
ETL servers

Qu es pentaho?
Pentaho es una herramienta de Business Intelligence desarrollada bajo la
filosofa del software libre para la gestin y toma de decisiones empresariales. Es
una plataforma compuesta de diferentes programas que satisfacen los requisitos
de BI. Ofreciendo soluciones para la gestin y anlisis de la informacin, incluyendo
el anlisis multidimensional OLAP, presentacin de informes, minera de datos y
creacin de cuadros de mando para el usuario.
La plataforma ha sido desarrollada bajo el lenguaje de programacin Java y tiene
un ambiente de implementacin tambin basado en Java, haciendo as
que Pentahosea una solucin muy flexible al cubrir una alta gama de necesidades
empresariales.

Caractersticas de pentaho.
Pentaho Business Intelligence abarca las siguientes areas de reporte:

* Pentaho reporting.
La solucin proporcionada por la plataforma Business Intelligence
OpenSource pentaho e integrada en su suite para el desarrollo de informes se
llama pentaho Reporting.

Existen tres productos con diferentes enfoques y dirigidos a diferentes tipos de


usuarios.
Pentaho Reporting es un potente generador de informes: Permite la distribucin de
los resultados del anlisis en multiples formatos.

1.Pentaho Report Designer:


Editor basado en eclipse con prestaciones profesionales y de calidad y con
capacidad de personalizacin de informes a las necesidades de negocio
destinado a desarrolladores.
Incluye Asistentes para facilitar la configuracin de propiedades.
Est estructurado de forma que los desarrolladores pueden acceder a sus
prestaciones de forma rpida:
Incluye un editor de consultas para facilitar la confeccin de los datos que sern
utilizados en un informe.

2. Pentaho Report Design Wizard:


Herramienta de diseo de informes, que facilita el trabajo y permite a los
usuarios obtener resultados de forma inmediata. Est destinada a usuarios con
menos conocimientos tcnicos.
A travs de pasos sencillos permite:
Conectarse a todo tipo de bases relacionales.
Integrar el resultado dentro del portal pentaho.
Posibilidad de montar codificacin semafrica.

3. Web ad-hoc reporting.


Es el similar a la herramienta anterior pero via web. Extiende la capacidad de
los usuarios finales para la creacin de informes a partir de plantillas
preconfiguradas y siguiendo un asistente de creacin.

Las caractersticas generales son:


Proporciona funcionalidad crtica para usuarios finales como:
Acceso va web.
Informes parametrizados.
Scheduling.
Suscripciones.
Distribucon (bursting).
Proporciona claras ventajas a especialistas en informes:
Acceso a fuentes de datos heterogeneos: relacional (va jdbc), OLAP, XML,
transformaciones de pentaho data integration.
Capacidad de integracin en aplicaciones o portales: jsp, portlet, web service.
Definicin modular de informes (distincin entre presentacin y consulta).
Diseo de informes flexible:
Entorno de diseo grfico.
Capacidad de uso de templates.
Acceso a datos relacionaes, OLAP y XML.
Desarrollado para:
Ser embebible.
Ser fcil de extender.
No consumir muchos recursos.
100% Java: portabilidad, escalabilidad e integracin.
Multiplataforma (tanto a nivel de cliente como servidor):
Mac.
Linux/unix.

Windows.

Pentaho Analysis

Ayuda a operar con mxima efectividad para ganar perspicacia y entender lo


necesario para tomar optimas decisiones.

Las caractersticas generales son:


Vista dimensional de datos (por ventas, por periodo).
Navegar y explorar.
Anlisis Ad Hoc.
Drill-down.
Seleccionar un especifico miembro para el anlisis.
Interactuar con alto rendimiento.
Tecnologa optimizada para rpida respuesta interactiva.

Pentaho Dashboards
Provee inmediata perspicacia en un rendimiento individual, departamental o
empresarial. Para deliberar key metrics en una atractiva e intuitiva interfaz
visual, Pentaho Dashboards a los usuarios de los negocios informacin critica
que necesitan para entender y mejorar el rendimiento organizacional.
Identificacin de unas Mtricas Clave (KPIs, Key Performance Indicators).
Monitoreo/Mtricas.
Investiga detalles subyacentes.
Drill a reportes de soporte.
Seguimiento de excepciones.
Alertas basadas en reglas del negocio.

Pentaho Data Integration


Muchas organizaciones tienen informacin disponible en aplicaciones y base de
datos separados. Pentaho Data Integration abre, limpia e integra esta valiosa
informacin y la pone en manos del usuario. Provee una consistencia, una sola
versin de todos los recursos de informacin, que es uno de los ms grandes
desafos para las organizaciones TI hoy en da. Pentaho Data Integration
permite una poderosa ETL (Extraccin, Transformacin y Carga).
El uso de kettle permite evitar grandes cargas de trabajo manual
frecuentemente difcil de mantener y de desplegar.

La arquitectura de Pentaho Data Integration viene representada por el siguiente


esquema:

Propiedades bsicas:
A parte de ser open source y sin costes de licencia, las caractersticas bsicas de
esta herramienta son:
Entorno grfico de desarrollo
Uso de tecnologas estndar: Java, XML, JavaScript
Fcil de instalar y configurar
Multiplataforma: windows, macintosh, linux
Basado en dos tipos de objetos: Transformaciones (coleccin de
pasos en un proceso ETL) y trabajos (coleccin de transformaciones)
o
Incluye cuatro herramientas:

Spoon: para disear transformaciones ETTL usando el entorno


grfico.

PAN: para ejecutar transformaciones diseadas con spoon.

CHEF: para crear trabajos.

Kitchen: para ejecutar trabajos.


o
o
o
o
o

Data Mining
Es el proceso de correr datos en algoritmos completamente sofisticados,
relevando significantes patrones y correlaciones que pueden estar escondidos.
Esto puede ser usado para ayudar a entender lo mejor para el negocio y
explotar el rendimiento de este en un futuro prediciendo completamente en el
anlisis.
Se caracteriza por:
Descubrir patrones ocultos y correlacionales en los datos.

Prevenir eventos futuros basados en patrones histricos.


Contar con la tecnologa de:
Poderoso motor de Data Mining.
Herramientas de diseo grfico.
Seguridad y conformidad.
Servicios Web, Repositorios y definiciones basadas en XML.
Rendimiento y escalabilidad.

Pentaho BI Plataform

La plataforma de Pentaho BI provee de servicios crticos incluyendo


programacin, seguridad, integracin automatizacin y flujo de trabajo.
Proporcionando habilidades a los usuarios finales de Pentaho y provenido un
lugar central para administrar y mantener el despliegue de la empresa BI.
Integracin con procesos de negocio.
Administra y programa reportes.
Administra seguridad de usuarios.

Componentes:
Plataforma 100% J2EE, asegurando la escalabilidad, integracin y
portabilidad.
Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS,
WebSphere, Tomcat, WebLogic y Oracle AS.
Base de datos: va JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle,
PostgreSQL, NCR Teradata, Firebird.
Sistema operativo: no hay dependencia. Lenguaje interpretado.
Lenguaje de programacin: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO).
Interfaz de desarrollo: Java SWT, Eclipse, Web-based.
Repositorio de datos basado en XML.
Todos los componentes estn expuestos va Web Services para facilitar la
integracin con Arquitecturas Orientadas a Servicios (SOA).

El siguiente esquema nos muestra la arquitectura estructurada de las diferentes


componentes que forman parte de Pentaho:
La solucin Business Intelligence OpenSource Pentaho pretende ser una
alternativa a las soluciones propietarias tradicionalesms completas: Business
Objects, Cognos, Microstrategy, Microsoft, etc por lo que incluye todos
aquellos componentes que nos podemos encontrar en las soluciones BI
propietarias ms avanzadas:
Reporting.
Anlisis.
Dashboards.
Workflow.
Data Mining.
ETL.
Single Sign-On.
Ldap.
Auditora de uso y rendimiento.
Planificador.
Notificador.
Seguridad.
Perfiles.

Vous aimerez peut-être aussi