Vous êtes sur la page 1sur 18

Pentaho :

Comparatif fonctionnel
entre la version Communautaire (gratuite)
et la version Entreprise (payante)

Table des matires


1
2
3
4

PRSENTATION DE PENTAHO.................................................................................................2
LISTING DES COMPOSANTS DE LA PLATE-FORME............................................................................4
2.1
2.2

Composants pour les Utilisateurs Mtiers.......................................................................4


Composants pour les utilisateurs Techniques (Service informatique)..............................4

SYNTHSE DES DIFFRENCES ENTRE LES VERSIONS CE ET EE (PENTAHO 3.6).......................................5


DTAIL DES DIFFRENCES ENTRE LES VERSION CE ET EE (PAR COMPOSANT)..........................................6

4.1
Console Utilisateur Fonction Tableaux de Bords ....................................................6
4.1.1
Tableaux de bords en version Enterprise........................................................................6
4.1.2
Tableaux de bords en version communautaire ................................................................9
4.2
Console Utilisateur Fonction OLAP .......................................................................13
4.2.1
Fonctionnalits OLAP avec la version Enterprise.............................................................13
4.2.2
Fonctionnalits OLAP avec la version Communautaire ...................................................16
4.3
Console d'administration..............................................................................................18
4.3.1
La Console d'administration en version Enterprise..........................................................18
4.3.2
La Console d'administration en version Communautaire..................................................19
4.4
Les apports de Pentaho Data Integration en version Enterprise....................................21
4.4.1
Introduction.............................................................................................................21
4.4.2
Caractristiques de PDI EE.........................................................................................21

www.atolcd.com: Atol Conseils & Dveloppements

PRSENTATION

DE

PENTAHO

Pentaho est une plate-forme dcisionnelle open source complte possdant les caractristiques
suivantes :
Une couverture complte des fonctionnalits de la Business Intelligence :
ETL (intgration de donnes)
Reporting
Tableaux de bords ("Dashboards")
Analyse ad-hoc (requtes la demande)
Analyse multidimensionnelle (OLAP)
Data Mining

Pentaho permet de fournir des ressources dcisionnelles 2 types d'utilisateurs :


Des utilisateurs de base qui vont consommer des indicateurs prdfinis. Quelques
clics vont suffire pour obtenir un tat et ceci de faon intuitive.
Des utilisateurs avancs, qui vont disposer d'outils d'analyse et d'exploration
avancs afin de construire et d'exploiter leurs propres tats.

Pentaho s'appuie sur une architecture NTIC Web 2.0 qui se compose :
D'un serveur web J2EE permettant d'accder l'ensemble des ressources
dcisionnelles et ceci au travers d'URLs web uniques et standardises.
Le serveur est dnomm "Pentaho User Console" (PUC)
De plusieurs clients riches permettant la conception et la publication des
ressources. Ces derniers sont librement tlchargeables et peuvent tre installs
sous des environnements Windows, Linux ou Mac-OS (clients Java):

Le serveur web Pentaho comporte galement une plate-forme d'administration (Pentaho


Administration Console) permettant la gestion des droits d'accs, la planification
d'vnements, la gestion centralise des sources de donnes...
Pentaho est reconnue pour tre une solution d'une grande qualit conceptuelle et
technique. La plate-forme est oriente processus , ainsi au travers de squences
d'actions on ainsi peut modliser avec Pentaho des workflows BI avancs.
Il n'est pas utile de connatre le langage JAVA pour travailler avec Pentaho: seule la
matrise du langage SQL est ncessaire, ainsi que des connaissances de base en XML,
HTML et Javascript.
Une communaut importante et trs active s'anime autour de Pentaho. Celle-ci contribue
au codage de nombreux plugins et projets communautaires .
Pentaho est une suite dcisionnelle open source commerciale qui est trs ouverte et dont
les diffrences fonctionnelles entre la version libre gratuite (Community Edition) et la
version payante (Enterprise Edition) restent limites. Ainsi la version libre de Pentaho
permet d'installer une plate-forme dcisionnelle complte.

LISTING

2.1

DES COMPOSANTS DE LA PLATE-FORME

COMPOSANTS

POUR LES

UTILISATEURS MTIERS

Les utilisateurs mtiers ont seulement besoin d'un browser web pour accder aux ressources dcisionnelles :
Composant
Console Utilisateur
(accs via un navigateur web)

2.2

COMPOSANTS

Code

Fonction

PUC

Interface web qui permet un utilisateur mtier d'accder l'ensemble


des ressources dcisionnelles : rapports, tableaux de bords, indicateurs,
alertes, analyses multidimensionnelles, analyses Ad-Hoc

POUR LES UTILISATEURS

TECHNIQUES (SERVICE

INFORMATIQUE)

Les utilisateurs techniques (les concepteurs de ressources BI) installent des outils clients sur leur PC :
Composant
Console d'administration
(accs via un navigateur web)

Pentaho Data Integration


(Kettle)

Code

Fonction

PAC

Interface web permettant la gestion des droits d'accs, la planification


d'vnements (envoi de rapports par mail en automatique par exemple),
la gestion centralise des sources de donnes.
ETL (Extract Transform Load) complet, pouvant tre
compltement indpendamment de la plate-forme Pentaho.

PDI

utilis

Kettle est comparable Talend Open Studio en terme de fonctionnalits.


Un livre blanc rdig par Atol CD dtaille les caractristiques et
diffrences entre ces 2 ETL.
Client de conception de rapports avancs. Il s'agit d'un outil de mise en
page similaire iReport, Eclipse BIRT, Crystal Reports...

Pentaho Report Designer

PRD

Permet de se connecter de nombreuses sources de donnes: SGBD,


XML, Excel, CSV, flux de donnes venant de Kettle, MDX (OLAP),
Mtadonnes Pentaho.
Gestion native des formats de sortie HTML, PDF, EXCEL, WORD

Pentaho Design Studio

PDS

Client riche (Eclipse) de modlisation de worflows BI (Xactions) propre


Pentaho.
Design Studio permet de mettre en uvre de nombreuses ressources BI
en minimisant l'criture de code (envoi de mails automatis par ex.)
Client riche permettant la mise en place d'une couche smantique
d'abstraction (mta-donnes) sur la couche physique (tables et colonnes
d'une base de donnes).

Pentaho Metadata

PME

Le but est de rendre les objets d'un SGBD comprhensibles et


manipulables par un utilisateur final afin de lui permettre d'effectuer ses
propres requtes et ceci sans connatre le langage SQL.
La couche de mta-donnes peut-tre utilise dans le requteur web adhoc, dans Pentaho Report Designer et dans Pentaho Design Studio

Pentaho Schema Workbench

PSW

Client riche permettant la dfinition des schmas Mondrian partir d'un


modle en toile ou flocon de l'entrept de donnes

Pentaho Aggregation Designer

PAG

Client riche permettant l'optimisation des schmas de cube conus avec


Pentaho Schema Workbench (construction et chargement des tables
d'agrgation en vue d'amliorer les performances)

SYNTHSE

DES DIFFRENCES ENTRE LES VERSIONS

CE

ET

EE (PENTAHO 3.6)

Le tableau ci-dessous prsente une grille comparative entre les composants Pentaho de la version
gratuite (CE=Community Edition) et ceux de la version payante (EE=Enterprise Edition) :
Composant

Code

Ecart fonctionel CE vs EE
Reporting

Tableaux de Bord

Console Utilisateur

PUC
Requtage Ad-Hoc
(sur mtadonnes)
OLAP

Console d'administration

PAC

Pentaho Data Integration

PDI

Pentaho Report Designer

PRD

Pentaho Design Studio

PDS

Pentaho Metadata

PME

Pentaho Schema Workbench et


Pentaho Aggregation Designer

PSW

Lgende :
Aucune diffrence entre les 2 versions
Ecart faible : les diffrences entre la version gratuite et payante se situent au niveau du
confort et de la facilit des paramtrage. Pas de rel cart fonctionnel.
Ecart moyen : L'cart fonctionnel se traduit par une amlioration de la productivit ou par
des fonctionnalits complmentaires pour les utilisateurs finaux. Ce niveau d'cart peut
malgr tout tre contourn par l'utilisation de mthodes alternatives proposes dans la
version CE ou via des projets communautaires tiers.
Ecart important : La fonctionnalit propose dans la version payante apporte un rel gain
fonctionnel aux utilisateurs finaux. Aucun contournement possible avec la version CE.

4
4.1

DTAIL

DES DIFFRENCES ENTRE LES VERSION

CE

CONSOLE UTILISATEUR FONCTION TABLEAUX

4.1.1

ET

DE

EE (PAR

COMPOSANT)

BORDS

Tableaux de bords en version Enterprise

La version Enterprise permet un utilisateur mtier de construire ses propres tableaux de bords
via la console d'utilisation (PUC) :

Il est ainsi possible :


de spcifier un modle de mise en page (nombre et positionnement des fentres) :

d'indiquer pour chaque fentre le type de ressource que l'on veut prsenter :

graphique

liste tabulaire de donnes

lien url ou une ressource existante (rapport, analyse OLAP...)

de rcuprer des donnes partir du requteur MQL qui s'appuye le rfrentiel de


mtadonnes de Pentaho, ce qui permet l'utilisateur mtier d'effectuer une requte sans
connaissance du langage SQL :

d'utiliser un assistant de cration de graphiques simple et convivial :

de filtrer les donnes d'une ou plusieurs fentres en dfinissant des paramtres :

Une vido de dmonstration (commente) de cration d'un tableau de bord avec la version
Enterprise est disponible sur la chane YouTube opensourcebi cette url :
http://www.youtube.com/watch?v=XvVxjgxLAYc
4.1.2

Tableaux de bords en version communautaire

Depuis la version 3.0 de Pentaho, le framework open source Pentaho Community Dashboard
Framework (Pentaho CDF) permet la cration et la publication de tableaux de bords
avancs.
Il faut noter que contrairement la version EE, ce framework s'adresse essentiellement des
utilisateurs techniques (service informatique) : il faut en effet possder quelques notions de base
en HTML et Javascript pour la conception des tableaux de bords, ce qui n'est pas le cas dans la
version Enterprise.
Bas sur une API Javascript/Ajax trs complte, Pentaho CDF permet au final la mise en place
de tableaux de bords pouvant tre trs riches : intgration de cartes (GoogleMaps, OpenLayers),
graphiques en Flash, rapports embarqus, listes tabulaires pagines, composants HTML (listes
droulantes, bouton radio, ), etc.
Quelques exemples :

Depuis Pentaho 3.6, un designer de Dashboard (Pentaho CDE) simplifie d'ailleurs de faon trs
sensible le travail de cration des utilisateurs techniques via un assistant de cration graphique
web :

Aperu de l'interface web de conception :

4.2
4.2.1

CONSOLE UTILISATEUR FONCTION OLAP


Fonctionnalits OLAP avec la version Enterprise

La version Enterprise permet un utilisateur mtier de construire ses propres analyses


multidimensionnelles via la console d'utilisation (PUC) :

L'outil qui permet la ralisation des analyses multidimensionnelles se nomme Pentaho Analyzer
Une vido de dmonstration de Pentaho Analyzer sur un jeu de donnes UNEDIC est disponible
sur la chane YouTube opensourcebi cette url :
http://www.youtube.com/watch?v=EBuug7Z6hxw
Pentaho Analyzer se caractrise notamment par une excellente ergonomie entirement base
sur le drag & drop (glisser/dposer).
De plus, certaines fonctionnalits de Pentaho Analyzer n'existent pas dans la version
communautaire avec JPivot, comme par exemple le rajout la vole de membres calculs,
l'affichage de tendances, une gestion simplifie des graphiques...
La cration d'tats partir de Pentaho Analyzer est donc puissante et intuitive, ci-dessous
quelques fonctionnalits :

Construction d'tats par drag & drop des niveaux des hirarchies et des mesures depuis la
zone Field List droite de l'cran. Possibilit de crer des tats tabulaires ou croiss

Possibilit d'ajouter des filtres sur les membres d'un niveau d'une dimension :

Les donnes peuvent tre galement filtres directement depuis le tableau grce aux
menus contextuels des en-ttes de colonnes.

De nombreux filtres numriques sont disponibles : Top X, Bottom X, Plus petit que, plus
grand que, non vide...

Il est possible de paramtrer de faon trs avance les modalits de calcul et la


prsentation des mesures dans le tableau crois: ranking, rpartition en %, somme
cumules, sous-totaux pour chaque niveaux, tris, tendances sur des intervalles de temps
(cart en valeur ou pourcentage de la priode compare), ajout de membres calculs, .

Ajouts de graphiques, sans paramtrage complexe: Bar Charts (histogrammes


horizontaux/verticaux, empils o non), Pie Charts (camemberts), Area Chart (zones),
Line Charts (courbes). Les graphes sont ractualiss en permanence selon les tableaux
construits par l'utilisateur

4.2.2

Possibilit d'exporter les analyses au format EXCEL, PDF ou CSV (pour un change avec
d'autres applications)

Fonctionnalits OLAP avec la version Communautaire

Jpivot est le navigateur OLAP disponible dans la version gratuite.

Les manques fonctionnels en comparaison de Pentaho Analyzer sont essentiellement :


Une ergonomie moindre et une prsentation web 1.0
L'impossibilit de rajouter des membres calculs la vole
Des graphiques un peu moins lisibles et faciles raliser
A noter que Jpivot va tre remplac en open source courant 2011 par le projet SAIKU .
Il s'agira d'un requteur OLAP full web 2.0 (drag&drop, meilleur ergonomie, graphiques en
Flash...)
Une vido de dmonstration de JPivot sur un jeu de donnes UNEDIC est disponible sur la chane
YouTube opensourcebi cette url :
http://www.youtube.com/watch?v=T16K8vsuUiA

4.3
4.3.1

CONSOLE D'ADMINISTRATION
La Console d'administration en version Enterprise

La console d'administration EE est une application web qui permet de configurer, paramtrer et
monitorer l'ensemble du serveur Pentaho. Elle permet essentiellement de ne pas avoir diter
manuellement les fichiers de configuration du serveur Pentaho (fichers XML...)

On notera surtout la prsence d'une interface de planification et de monitoring des jobs Kettle

4.3.2

La Console d'administration en version Communautaire

La console d'administration en version communautaire est une version simplifie de la console


Enterprise.
Celle-ci permet uniquement :
La gestion des sources de donnes (ajout/modification/suppression d'une data source)
La gestion des utilisateurs (ajout/modification/suppression d'utilisateurs et de groupes)
Mise en place de tches planifies
Pilotage des divers mcanismes de rafraichissement de la plate-forme

4.4
4.4.1

LES

APPORTS DE

PENTAHO DATA INTEGRATION

EN VERSION

ENTERPRISE

Introduction

La version payante de Kettle amne quelques fonctionnalits intressantes.


Celles-ci peuvent s'avrer intressantes dans le cadre de dploiements importants, typiquement
lors de la mise en uvre par des Grands Comptes qui emploient de nombreux dveloppeurs
devant concevoir et dployer des jobs ETL :

4.4.2

Caractristiques de PDI EE
Gestion des droits d'accs avec un contrle sur le contenu et les actions qui peuvent tre
effectues par les dveloppeurs et les groupes de dveloppeurs (via rles). La scurit
peut-tre gre directement dans le rfrentiel Kettle ou configure partir de l'annuaire
LDAP de l'entreprise (Active Directory au autre)
Gestion du travail collaboratif avec scurisation d'accs aux jobs, versionning et
verrouillage des jobs en cas de modification en cours (check in/check out)
Un planificateur intgr facilitant la gestion des dclenchements programms :

Quelques briques fonctionnelles supplmentaires : Hadoop, JMS, GoogleDocs, ...