Vous êtes sur la page 1sur 59

Livre blanc : la business intelligence

Charlotte GALZY Pierre GIRONA Benot MARTIN Cdric NICOLOSO Julien VANDERMOERE Mai 2010

Sommaire
Introduction ...................................................................................................................................... 5 Les ETL ............................................................................................................................................... 6 Introduction .................................................................................................................................. 6 March des ETL ............................................................................................................................. 7 Les perspectives et les challenges de lETL ................................................................................... 8 Les nouveaux modes de stockage..................................................................................................... 9 Introduction .................................................................................................................................. 9 Les acteurs .................................................................................................................................... 9 Qliktech ..................................................................................................................................... 9 SAP ............................................................................................................................................ 9 La technologie In-memory .................................................................................................... 10 Les solutions................................................................................................................................ 10 Qlikview................................................................................................................................... 10 La solution de SAP ................................................................................................................... 11 Conclusion ................................................................................................................................... 11 La business intelligence en mode SaaS ........................................................................................... 12 Introduction ................................................................................................................................ 12 March et acteurs ....................................................................................................................... 13 Les diteurs et leurs solutions ................................................................................................ 13 Les cibles ................................................................................................................................. 13 Les changements apports par le Saas ....................................................................................... 14 Pour les diteurs/intgrateurs ................................................................................................ 14 Pour les clients ........................................................................................................................ 14 Stockage de donnes et scurit ................................................................................................ 17 Conclusion ................................................................................................................................... 18 La business intelligence mobile ...................................................................................................... 19 Introduction ................................................................................................................................ 19 March et acteurs ....................................................................................................................... 20 March des smartphones ........................................................................................................... 22 Scurit ....................................................................................................................................... 24 Apports de la mobilit................................................................................................................. 25 Conclusion ................................................................................................................................... 26 Les moteurs de recherche .............................................................................................................. 27 Introduction ................................................................................................................................ 27 Limportance du moteur de recherche ....................................................................................... 28 Page 2 sur 59 Mai 2010 Livre blanc

Le march et les acteurs ............................................................................................................. 29 Les technologies du web smantique ......................................................................................... 31 Le futur des moteurs de recherche ............................................................................................ 32 Les mdias de restitution ................................................................................................................ 33 Introduction ................................................................................................................................ 33 Pourquoi lindexation ? ............................................................................................................... 33 Les acteurs .................................................................................................................................. 34 Les solutions................................................................................................................................ 35 IMEDIA de lINRIA ................................................................................................................... 35 Google Audio Indexing (Gaudi) ............................................................................................... 35 Aigle de Business Geographic ................................................................................................. 36 Exalead CloudView .................................................................................................................. 36 Quaero .................................................................................................................................... 37 LTU .......................................................................................................................................... 37 Chromatic ................................................................................................................................ 38 Autonomy ............................................................................................................................... 38 NewPhenix .............................................................................................................................. 39 Google Location Services ........................................................................................................ 39 Conclusion ................................................................................................................................... 39 Master Data Management.............................................................................................................. 40 Introduction ................................................................................................................................ 40 Pourquoi le MDM ? ..................................................................................................................... 40 Dfinitions, approches et concepts ............................................................................................ 42 Normes et standards................................................................................................................... 45 Le march du MDM .................................................................................................................... 46 Les acteurs .................................................................................................................................. 48 Le projet MDM ............................................................................................................................ 51 Perspectives et tendances .......................................................................................................... 52 Conclusion ....................................................................................................................................... 54 Sources ............................................................................................................................................ 55 Les ETL ......................................................................................................................................... 55 Les nouveaux modes de stockage............................................................................................... 55 In memory ............................................................................................................................... 55 Qlikview................................................................................................................................... 55 SAP .......................................................................................................................................... 55 La business intelligence en mode SaaS ....................................................................................... 55 March et acteurs ................................................................................................................... 55 Page 3 sur 59 Mai 2010 Livre blanc

Changements apports par le Saas......................................................................................... 56 Stockage de donnes et scurit ............................................................................................ 56 La business intelligence mobile .................................................................................................. 56 Acteurs .................................................................................................................................... 56 March des smartphones ....................................................................................................... 56 Scurit ................................................................................................................................... 56 Apports de la mobilit............................................................................................................. 56 Les moteurs de recherche........................................................................................................... 57 Introduction ............................................................................................................................ 57 Limportance du moteur de recherche ................................................................................... 57 Le march et les acteurs ......................................................................................................... 57 Les technologies du web smantique ..................................................................................... 57 Le futur des moteurs de recherche ........................................................................................ 57 Les mdias de restitution ............................................................................................................ 57 Indexation ............................................................................................................................... 57 IMEDIA .................................................................................................................................... 57 CQBI ........................................................................................................................................ 57 Gaudi ....................................................................................................................................... 57 Aigle ........................................................................................................................................ 58 Exalead .................................................................................................................................... 58 Quaero .................................................................................................................................... 58 LTU .......................................................................................................................................... 58 Chromatic ................................................................................................................................ 58 Autonomy ............................................................................................................................... 58 Google Location Services ........................................................................................................ 58 NewPhenix .............................................................................................................................. 58 MDM ........................................................................................................................................... 58 Site dinformations et dactualits sur la Business Intelligence.............................................. 58 Site dactualits gnrale et business ..................................................................................... 58 Site dditeur ou de cabinet de conseil .................................................................................. 58 Blog business et MDM ............................................................................................................ 59 Livre blanc et livre ................................................................................................................... 59

Page 4 sur 59 Mai 2010 Livre blanc

Introduction
Selon le cabinet Gartner, le march mondial de la BI1 s'est lev 9,3 milliards de dollars dans le monde en 2009, ce qui, malgr la crise, note une progression de 4,2% par rapport 2008. Des chiffres relativement rconfortants et qui confirment un march en plein essor. Les avances technologiques ainsi que les exigences du march ont rendu ce domaine incontournable chez les analystes, les dcideurs et les dveloppeurs. Tout le monde se met la BI. La valeur ajoute que peut apporter un environnement de BI dans une entreprise est stupfiante. Prenons lexemple de lentreprise Wal-Mart, une grosse entreprise de distribution grand public. Elle a prouv cela en dmarrant un projet de BI trs peu aprs la cration de l'entreprise. Rsultat, l'entreprise est indtrnable, sa gestion interne est parfaite, la gestion des stocks impeccable, et sa capacit prvoir les tendances et habitudes des consommateurs nous met la fois en admiration et en crainte : ils sont capables de prvoir ce que le client moyen va acheter avant mme qu'il ne rentre dans un magasin Cest pourquoi nous allons dans ce livre blanc faire une tude plus approfondie de la business intelligence en suivant diffrents axes dtude tel que : Les ETL ; Les nouveaux modes de stockage ; La BI en SaaS2 ; La BI mobile ; Les mdias de restitution ; Les moteurs de recherche ; Le MDM3.

1 2

Business Intelligence Software as a Service 3 Master Data Management

Page 5 sur 59 Mai 2010 Livre blanc

Les ETL
Introduction
Un ETL, acronyme dExtraction-Transformation-Loading est un systme de chargement de donnes depuis les diffrentes sources de lentreprise jusqu lentrept de donnes. Afin de charger correctement ces donnes, ce systme soccupe de raliser diffrentes oprations. EXTRAIRE : accder la majorit des systmes de stockage de donnes (SGBD, ERP, fichiers plat) afin de rcuprer les donnes identifies et slectionnes. TRANSFORMER : toutes les donnes ne sont pas utilisables telles quelles. Elles doivent tre vrifies, reformates, nettoyes et enfin consolides. CHARGER : insrer les donnes dans le datawarehouse. Elles sont ensuite disponibles pour les diffrents outils danalyse et de prsentation comme les tableaux de bord, lanalyse multidimensionnelle OLAP, le data mining, les requteurs et autres reportings.

Les termes Back Room (la cuisine) ou Data staging area sont souvent utiliss par lindustrie pour dcrire les systmes ETL.

Les processus ETL sont les composants les plus critiques et les plus importants dune infrastructure dcisionnelle. Bien que cachs de lutilisateur de la plate-forme dcisionnelle, les processus ETL rassemblent les donnes partir des systmes oprationnels et les prtraitent pour les outils danalyse et de reporting. La prcision et la vitesse de la plate-forme dcisionnelle toute entire dpendent des processus ETL. Dailleurs Ralph Kimball, un informaticien et chef d'entreprise amricain, aprs dix huit mois dtudes des ETL, en a dfini trente-huit sous-systmes et il a statu que 70% dun projet dentrept de donnes est ddi aux systmes ETL.

Page 6 sur 59 Mai 2010 Livre blanc

March des ETL


Aujourdhui, lOpen Source a pris une part importante du march et beaucoup dETL se fondent au sein d'offres plus globales d'intgration de donnes. Synthse des solutions suivre Editeur IBM Solution Datastage Server Datastage PX Talend Pentaho Informatica Autres offres du march Editeur Microsoft Oracle Cognos Clover.ETL Solution SQL Server 2008 Oracle Warehouse Builder Data Manager Clover.ETL (Open Source)
En grant les processus lgers (threads) de faon indpendante, Clover.ETL partage la charge de transformation sur diffrents processeurs et s'adapte ainsi aux multiples configurations matrielles L'diteur propose sa solution en mode intgr ou bien en SaaS et dispose notamment de connecteurs natifs pour les ERP SAP, PeopleSoft, Oracle et Siebel Fonctionnalit de centralisation des metadonnes et un module complet de qualit des donnes (normalisation, correction...). DataMigrator s'interfae avec les principaux SGBDR du march en utilisant une palette de connecteurs

Tarification Ds 21 000 Offre Open-Source gratuite Offre Open-Source Ds 2000 Ds 50 000

Principaux clients NC
Groupe Accor, GMF, Direction Gnrale de la Comptabilit Publique... T Mobile, Ericsson, General Electric Verizon Business, Socit Gnrale, Sanofi Aventis...

Open Studio Data Integration Power Center

Commentaire

SAS

Data Integration Server

SAP Business Objects iWay Software

Data Integrator iWay DataMigrator

Manapps, un groupe de conseil et de services basant son succs rapide sur une forte spcialisation dans les nouvelles technologies, le CRM, le MDM et la business intelligence a publi une mise jour dun benchmark trs contest sur les performances de cinq ETL. Fin 2008, une premire vole de tests avait clairement plac lETL Open Source dit par Talend en tte devant les ETL dIBM, celui de Pentaho et surtout celui dInformatica. Le leader mondial de lETL se voyait assassin dans les tests, ce qui allait dclencher un torrent de ractions sur le Web. La nouvelle tude value les performances dIBM Datastage Server 7.5, de Datastage PX 7.5, de Talend Open Studio 2.4.1, dInformatica 8.1.1 et de Pentaho Data Integrator 3.0.0. Le benchmark porte sur onze tests diffrents, de complexit croissante avec des volumtries de donnes identiques au premier test et avec un simple PC de bureau sous xp comme machine de test. Cette fois, cest Page 7 sur 59 Mai 2010 Livre blanc

Informatica qui sen tire le mieux. Lamricain obtient la meilleure note globale, devant Talend, les deux ETL IBM (Datastage PX devance Datastage server) et enfin Pentaho qui clt le classement. Le benchmark est disponible gratuitement sur le site du cabinet de consulting.

Les perspectives et les challenges de lETL


Limplmentation de processus dETL efficaces et fiables comprend de nombreux challenges. Les volumes de donnes sont en croissance exponentielle et les processus dETL doivent traiter des quantits importantes de donnes. Certains systmes dcisionnels sont mis jour de faon incrmentale, alors que dautres sont rechargs dans leur totalit chaque itration. Alors que les systmes dinformation se complexifient, la varit des sources de donnes saccrot galement. Les processus dETL doivent disposer dune large palette de connecteurs des progiciels (ERP, CRM), bases de donnes, mainframes, fichiers, Services Web Toutes les structures et applications dcisionnelles (datawarehouse, datamart, applications OLAP) prsentent des besoins diffrents en termes de transformation de donnes, ainsi que des latences diffrentes. Les transformations des processus dETL peuvent tre trs complexes, et certaines, spcifiques au dcisionnel, sont aussi requises. Le dcisionnel se rapproche du temps rel, les datawarehouses et datamarts doivent donc tre rafrachis plus souvent sachant quil faut viter les fentres de chargement.

Concernant lavenir de lETL, il se situe peut tre dans le cloud. En effet, Informatica sest positionn sur cette niche de march en proposant Informatica on-Demand. Nicholas Goodman, consultant et fondateur de Bayon Technologies sest livr un benchmark de la plate-forme Penthano Data Integration dploye sur Amazon EC2. Largument de ce choix de la plate-forme Amazon est financier et il est de taille : 4$ facturs pour lutilisation de quarante serveurs de petite taille (1 cur + 1,7Go de RAM) et 2,80$ pour les 20To despace de stockage. Cest dans ce mode de facturation dAmazon EC2 que se cache lintrt du cloud pour lETL. Il nest pas plus coteux de louer cent machines pour un temps t quune seule machine durant cent fois ce temps. Pour peu que la monte en charge de lETL soit proche du linaire, on va pouvoir mobiliser pour un traitement ETL un nombre de machines quil serait totalement inenvisageable davoir dans son propre datacenter. On assiste un vritable changement de modle qui pourrait trs vite se dvelopper dans un avenir proche.

Page 8 sur 59 Mai 2010 Livre blanc

Les nouveaux modes de stockage


Introduction
Dans cet axe nous allons nous intresser principalement la technologie in-memory . Nous verrons les diffrents acteurs de la BI qui utilisent cette technologie, un descriptif de cette technologie ainsi que ses avantages puis enfin les solutions qui lutilisent.

Les acteurs
Qliktech
QlikTech ouvre la voie une nouvelle gnration de solutions danalyse dcisionnelle, simples utiliser, rapides et flexibles, qui permettent aux utilisateurs de manipuler instantanment les donnes grce une dmarche intuitive, facilement comprhensible et trs visuelle. QlikView 9, le produit phare de QlikTech, est construit sur une technologie brevete dassociation in-memory de nouvelle gnration et de nombreuses fois prime. Il offre des solutions de reporting et danalyse de linformation puissantes et visuelles, qui amliorent la prise de dcisions quotidienne des oprationnels. Les solutions QlikView peuvent tre dployes en quelques jours et les utilisateurs forms en quelques minutes, leur donnant ainsi la libert dtre plus pertinents et cratifs dans leurs analyses.

SAP
SAP propose une gamme d'applications d'entreprises et de solutions de business intelligence afin de rpondre aux besoins oprationnels en termes de gestion d'entreprise. Les logiciels de gestion SAP mettent en vidence les gisements d'amlioration des activits et permettent de les transformer en avantage comptitif. Au final, les solutions de gestion SAP apportent : la capacit anticiper pour identifier de nouvelles opportunits ; l'agilit pour sinscrire dans une dynamique d'amlioration continue ; les fonctionnalits ncessaires pour optimiser les oprations au quotidien ; des moyens permettant d'tendre les meilleures pratiques de gestion au del de lentreprise, l'chelle de toute chane de valeur.

Page 9 sur 59 Mai 2010 Livre blanc

La technologie In-memory
Cette technologie repose sur le fait de stocker les informations, non plus sur le disque dur, mais dans la mmoire vive. La mmoire vive (RAM) ne dispose pas des limitations mcaniques et du temps de latence des disques durs. On obtient ainsi un gain de vitesse, de bruit, de consommation d'nergie et de fiabilit. Dans un futur proche la technologie in-memory devrait remplacer les appareils de stockage mobile (disque dur externe, ), et peut-tre dans un futur plus loign, remplacer les disques durs internes. Actuellement, ce type de mmoire nest pas encore concurrent des disques durs internes ou des serveurs utilisant une architecture RAID.

Les solutions
Qlikview
La technologie unique et brevete dassociation en mmoire de QlikView est le principe fondateur dune plate-forme de business intelligence de nouvelle gnration. Cette technologie permet de littralement supprimer les problmes et la complexit inhrents aux outils de BI traditionnels : lincapacit dlaborer des analyses rapidement, laccs lent des donnes et sources de donnes limites et la ncessit de faire appel au service informatique de lentreprise pour laborer et modifier les analyses.

Puisque QlikView fonctionne entirement en mmoire, il peut combiner des donnes partir dun nombre illimit de sources avec un niveau de performance lev, et ce quel que soit le niveau de performance de chaque source. On profite ainsi dun moyen plus rapide pour visualiser les relations entre les diffrents lments de lentreprise. QlikView le permet en associant des donnes en mmoire partir de n'importe quelle source, par exemple : des systmes transactionnels tels que SAP, Oracle, salesforce.com ; des entrepts de donnes traditionnels tels que BusinessObjects, Cognos, Hyperion ; des bases de donnes telles que SQL Server, Oracle, MySQL qui optimisent vos applications personnalises ; et des donnes locales issues dExcel ou de fichiers plats. De plus, le fait que les donnes soient stockes en mmoire permet de contourner les limites des cubes sur disque traditionnel, ce qui rend toutes vos donnes accessibles rapidement.

Page 10 sur 59 Mai 2010 Livre blanc

Pour conclure, les avantages de Qlikview rsident dans sa rapidit obtenir des donnes ainsi que dans sa simplicit dutilisation. De plus, Qlikview possde une interface graphique moderne et dynamique, ce qui rend le logiciel agrable utiliser.

La solution de SAP
Bien quencore en dveloppement, SAP tente aujourdhui dadapter la technologie inmemory son systme traditionnel. SAP prvoit dune part une simplification de ses applications mais espre aussi remettre en cause le pouvoir des grandes bases de donnes, commencer par celle du grand rival Oracle (Daprs un article du LeMagIT Cf. sources). Il reste nanmoins SAP maitriser la technologie et la faire adopter son environnement. Bien quon trouve peu dinformations ce sujet, je pense quil serait judicieux de suivre les volutions de SAP dans ce domaine.

Conclusion
Actuellement QlikTech est la seule solution utiliser la technologie in-memory dans le monde de la BI. Prochainement, on devrait voir apparatre un nouvel utilisateur SAP : sera-t-il aussi performant que QlikView ? Nous verrons cela dans les prochaines annes.

Page 11 sur 59 Mai 2010 Livre blanc

La business intelligence en mode SaaS


Introduction
Avant ces dernires annes, le monde des logiciels informatiques tait confin au modle conomique qui consiste vendre un logiciel comme un produit, proposer lacquisition dune licence ( on-premises ) ncessitant linstallation du logiciel chez le client. Mais depuis le dbut des annes 2000, un nouveau modle conomique a fait son apparition sur le march, le SaaS : Software as a Service (ou on-demand ) proposant aux clients dacqurir un logiciel priodiquement en y accdant par le biais dinternet, ce qui offre de nombreux avantages. Les cabinets danalystes sont trs optimistes concernant l'utilisation du mode SaaS par les entreprises. Par exemple, selon Gartner, le SaaS devrait reprsenter 25% des revenus logiciels dici 2011. Le mode SaaS a connu ces dernires annes un essor considrable, cest pourquoi le domaine de la business intelligence nest pas pargn et la majorit des grands diteurs de BI propose aujourdhui une offre en SaaS. Cette partie ddie la business intelligence en SaaS prsentera le march actuel existant autour de cet axe, puis seront mis en vidence les apports de ce mode ainsi quun point sur la question sensible de la scurit. Enfin, ayant une vue densemble, une conclusion sera tire concernant le mode SaaS.

Page 12 sur 59 Mai 2010 Livre blanc

March et acteurs
Les diteurs et leurs solutions
Depuis lapparition du modle SaaS, son dveloppement constant, et lapparition de startups spcialises dans la BI en SaaS, la plupart des grands diteurs on ajout leurs offres un outil en mode SaaS. La tendance est donc pour linstant lajout dun outil de BI en SaaS une gamme de produits en complment des outils classiques.

Editeurs

Solutions SaaS
Oracle Hyperion On Demand

SAS On Demand

crystalreports.com SAP BusinessObjects BI OnDemand

Cognos now!

Il faut savoir que ce tableau ne recense que les solutions SaaS des plus grands diteurs de la business intelligence mais quil existe aussi bon nombre de pure-players ou socits spcialises dans ce domaine. Depuis 2008, le nombre doffres de business intelligence en SaaS a considrablement augment et ce modle, ainsi que son fonctionnement conomique, sont de plus en plus entrs dans les murs. Cependant, aucun des diteurs majeurs ne sest vraiment impos sur le march, exception faite de SAP qui a pris une longueur davance avec ses offres Business Objects On Demand . Les grands diteurs communiquent peu sur le prix de labonnement leurs offres SaaS. Cependant, parmi les acteurs plus secondaires du march de la BI proposant des offres SaaS, le prix de labonnement est compris entre 30 et 100 par mois et par utilisateur, en fonction des diffrentes fonctionnalits des applications choisies.

Les cibles
Les cibles de la business intelligence en mode SaaS sont clairement les entreprises de taille rduite ayant peu de moyens attribuer au dcisionnel. Ce sont donc les PME4 qui se tournent de plus en plus vers des solutions on-demand qui sont beaucoup moins onreuses et qui leur offrent tout de mme des services primordiaux, accessibles o ils le souhaitent grce internet. Le SaaS permet aussi aux entreprises dassimiler leur utilisation dune solution de business intelligence un cot de fonctionnement et non plus un investissement, il nest plus obligatoire de dverser de fortes sommes pour la mise en place dune solution classique.

Petites et Moyennes Entreprises

Page 13 sur 59 Mai 2010 Livre blanc

Les changements apports par le Saas


Lattrait que suscite le SaaS dans le monde du dcisionnel sexplique par les nombreux avantages que celui-ci peut apporter aux clients et aux diteurs/intgrateurs, bien que ces avantages soient plus prononcs pour les clients. De plus, avec le passage au on-demand , les diteurs se rmunrent diffremment.

Pour les diteurs/intgrateurs


Pour les diteurs et les intgrateurs de solutions de business intelligence, le SaaS permet surtout de cibler un nouveau march, celui des PME qui nont pas un budget suffisant pour accder la BI classique . Cela peut donc leur permettre de toucher de nouveaux clients et dlargir leur palette de revenus. De plus, par rapport aux solutions classiques, la mise en place des solutions en mode SaaS est considrablement simplifie et donc trs rapide. Les socits proposant des solutions de BI en SaaS peuvent se rmunrer de deux faons diffrentes. La premire consiste proposer un forfait fixe quant lutilisation illimite de la solution et la deuxime est dtre rmunre en fonction de lutilisation qui est faite de la solution (nombre d'utilisateurs, services activs, volumes consomms...). Aujourdhui, le pourcentage de revenu gnr par la BI en mode SaaS est insuffisant et insignifiant en comparaison des revenus gnrs par les plateformes de BI classiques. La BI en SaaS reprsente moins de 5% du march global de la business intelligence.

Pour les clients


Grce au SaaS, il ny a plus de contraintes matrielles ou logicielles pour le client, un simple poste avec un navigateur web suffit accder aux outils dcisionnels. Les utilisateurs peuvent donc consulter et interroger les donnes de leur entreprise sans recourir des logiciels onreux et contraignants. De plus, mettre en place une solution de BI devient beaucoup plus rapide quauparavant puisque quil y a peu de changements effectuer chez le client. Les cots de maintenance sen trouvent aussi trs diminus, les besoins de dplacement chez le client tant rduits. Ce sont donc les prix abordables, la facilit de dploiement et de maintenance qui sont au centre de lintrt des PME pour le mode SaaS. Selon des tudes menes par diffrents cabinets danalystes et notamment Hurwitz & Associates , le cot total de possession (ou TCO : Total Cost of Ownership en anglais) dune solution de BI en SaaS serait denviron 70% infrieur celui dune solution classique.

Page 14 sur 59 Mai 2010 Livre blanc

Schma comparatif des cots dacquisition de solutions on-demand et on-premises Source : Rapport du cabinet Hurwitz & Associates-The TCO Advantages of SaaS-Based Budgeting, Forecasting & Reporting

Graphe comparatif de lvolution des cots dacquisition de solutions on-demand et on-premises sur les quatre premires annes Source : Rapport du cabinet Hurwitz & Associates-The TCO Advantages of SaaS-Based Budgeting, Forecasting & Reporting

Page 15 sur 59 Mai 2010 Livre blanc

Cette tude a permis de confirmer plusieurs points positifs concernant le choix dune solution SaaS. Avec ce modle, les cots de souscription loutil se montent 62% du cot total de la solution. Avec le modle classique on-premises les cots dacquisition de la licence ne comptent que pour 17% du cot total de la solution. Ces cots sont quivalents pour les deux modles, or de nombreuses dpenses sajoutent ceux-ci pour ce qui est du modle classique, savoir des cots de conception, de maintenance, dachat de matriel ce qui rend ce modle plus onreux. Le SaaS permet aussi un dploiement plus rapide et plus flexible tout en ayant une fiabilit et des performances au niveau des solutions classiques. Cependant, le Gartner invite les socits tre prudentes en ce qui concerne le choix de leur modle de solution dcisionnel car les avantages annoncs par les diteurs de solutions SaaS peuvent se rvler moins importants que ceux promis dans loffre commerciale.

Page 16 sur 59 Mai 2010 Livre blanc

Stockage de donnes et scurit


Un des points les plus sensibles concernant le mode SaaS est la question de la scurit du transfert et du stockage des donnes lextrieur de la socit. Il est donc lgitime pour un client de se poser des questions en ce qui concerne le choix dune solution de BI en SaaS. En effet, on peut penser que les donnes seront beaucoup moins protges si elles sont transfres via Internet plutt que stockes directement au sein de lentreprise. Il faut savoir quaujourdhui, pour ce qui est des solutions actuellement sur le march, la plupart sont mises en place en partenariat avec un hbergeur, les donnes sont hberges et maintenues par ce partenaire. Ce sont donc des socits spcialises dans ce domaine qui grent ces flux et stockages de donnes et ils ont donc une exprience certaine en la matire. De plus, si lon se penche sur la ralit des architectures actuelles des systmes dinformations, on saperoit que louverture et le partage des systmes avec des tiers partenaires est une pratique avre. Et, mme si le risque zro nexiste pas, avec leurs annes dexprience dans ce domaine, il est incontestable que la scurisation des donnes na jamais t aussi fiable quaujourdhui. Et pour en finir avec ces inquitudes, les tudes dmontrent quune application (transactionnelle ou dcisionnelle) est, dans plus de 95% des cas, mieux scurise chez un hbergeur contractuellement responsable quau sein dun systme dinformations interne. En ajoutant cela lavantage de la rapidit daccs aux donnes, la question de lexternalisation des donnes ne devrait plus poser de problme.

Page 17 sur 59 Mai 2010 Livre blanc

Conclusion
Le march de la BI en SaaS tant en phase dexpansion, il y a de nombreux acteurs proposant ce type de solutions que ce soit les grands diteurs comme SAP ou des entreprises spcialises dans le SaaS. Cela peut sexpliquer par le fait que ce modle touche de nouveaux clients dans le monde du dcisionnel, les PME. Nous avons pu voir quil y a de nombreux avantages pouvant inciter les PME adopter une solution en SaaS avec un argument de poids : un prix raisonnable tout en bnficiant des avantages doutils classiques. De plus, le principal obstacle aux solutions SaaS tant la question de la scurit, les partenaires de stockage de donnes sur internet disposent aujourdhui dassez dexprience pour permettre aux diteurs et intgrateurs de btir des argumentaires solides pour faire tomber cette dernire barrire. Nous pensons donc quune solution SaaS peut tre une bonne option pour complter une gamme doffres de BI classique dans le but dtendre sa palette de clients. En revanche, miser sur une totale orientation vers le SaaS serait un pari trs risqu aux vues des revenus gnrs actuellement par celui-ci. Bien que la BI on-demand connaisse une forte croissance au mme titre que les autres domaines touchs par le SaaS, les revenus engendrs restent trop insuffisants compars ceux gnrs par une solution classique pour que le SaaS soit rentable.

Page 18 sur 59 Mai 2010 Livre blanc

La business intelligence mobile


Introduction
Le march de la business intelligence ne cesse de stendre. En effet, en 2008, malgr des conditions conomiques difficiles, la croissance des ventes de logiciels de business intelligence tait de 20%, dpassant largement la plupart des autres marchs logiciels. Bien que ce march stende, seulement 30% de potentiels utilisateurs de ces logiciels utilise la business intelligence en entreprise. Cela suggre que la BI au sein des entreprises est en train de changer et de se rpandre. Lun des moteurs de cette volution est le dveloppement de solutions mobiles de business intelligence qui font de grands progrs en termes dutilisabilit. Cette partie du document vise tudier les diffrents aspects de la business intelligence mobile. Nous allons tout dabord lister les diffrents acteurs de ce domaine, puis nous prsenterons des tudes des parts de march des smartphones. Ensuite, nous nous poserons la question des contraintes de scurit ncessaires pour protger les donnes sensibles accessibles depuis les tlphones mobiles. Et enfin, nous essaierons de trouver une rponse la question : ces solutions mobiles sont-elles rellement un plus pour les entreprises ou relvent-elles plutt du gadget ?

Page 19 sur 59 Mai 2010 Livre blanc

March et acteurs
On peut observer de nombreux acteurs prsents dans le march des logiciels de business intelligence pour tlphone mobile. Des diteurs dj existants adaptent leur solution pour smartphones, mais de nouveaux diteurs spcialiss dans ces applications apparaissent galement. Voici un tableau rcapitulatif des diffrents diteurs prsents sur le march :

Socit
BeeEye

Solution propose
BeeEye

Compatibilit
Android (bientt) BlackBerry (bientt) iPhone BlackBerry iPhone, iPad Microsoft Windows Mobile Symbian S60 3rd Edition wireless iPhone Java-enabled devices iPhone Tout appareil mobile ayant une connexion internet Android iPhone, iTouch, iPad Java-enabled devices (BlackBerry, Nokia) Android BlackBerry iPhone Microsoft Windows Mobile iPhone, iPad BlackBerry iPhone, iTouch Microsoft Windows Mobile Symbian Android (avril 2010) BlackBerry iPhone (juin 2010) Java-enabled devices Microsoft Windows Mobile Palm Symbian

IBM

Cognos 8Go ! Mobile

Information Builders Novedia Pentaho Prelytis

WebFOCUS Novedia Decision Pentaho Prelytis

QlikTech

QlikView

Regard

R-Survey

Roambi

Roambi

SAP Business Objects

SAP Business Objects Mobile

Webalo

Webalo

Editeurs spcialiss dans le dveloppement dapplications de business intelligence pour smartphone. Page 20 sur 59 Mai 2010 Livre blanc

On observe donc quun grand nombre dditeurs dveloppe aujourdhui des solutions de business intelligence pour tlphone mobile. Cest un march qui se propage car la mobilit est un facteur de plus en plus important pour les entreprises. Ce type de solution vise des personnes souvent en dplacement et ayant besoin de prendre des dcisions importantes dans de brefs dlais. En effet, elles permettent davoir accs, depuis un tlphone mobile, aux informations prsentes sur les serveurs de lentreprise ; avec une interface toute aussi lisible et maniable que celle dune solution de business intelligence classique. Les tlphones portables deviennent de plus en plus proches des ordinateurs, beaucoup sont tactiles, la plupart permettent aujourdhui daccder internet et de sy dplacer avec aisance. Utiliser une application de business intelligence ncessite une grande interactivit et les diteurs ont russi relever le challenge de rendre les solutions de business intelligence ergonomiques sur tlphone mobile. Le march vis par les diteurs est donc constitu de tous les dcideurs qui sont trs mobiles et doivent avoir la possibilit de consulter, voire mme de modifier les donnes de lentreprise tout instant.

Page 21 sur 59 Mai 2010 Livre blanc

March des smartphones


Les smartphones sont des tlphones portables disposant de nombreuses fonctionnalits telles que lagenda/calendrier, la navigation web, la consultation de courrier lectronique, le GPS, etc... De part leurs nombreuses fonctionnalits, les smartphones sont trs attractifs et ils prennent une part de plus en plus importante dans le march des tlphones mobiles. Selon une tude faite par le cabinet Gartner, les ventes de smartphones devraient mme dpasser celles de PC ; en effet, en 2013, il devrait y avoir 1,82 milliards de smartphones contre 1,78 milliards de PC. Il parat intressant dtudier les parts de march des smartphones dans le monde, par systme dexploitation. En effet, savoir quels systmes dexploitation prdomineront dans quelques annes peut permettre de prvoir pour quels systmes dexploitation les diteurs vont principalement dvelopper leur application. Pour lanne 2009, la rpartition des parts de march des diffrents systmes dexploitation a t la suivante :

Parts de march des systmes dexploitation pour smartphones pour lanne 2009

Page 22 sur 59 Mai 2010 Livre blanc

Le cabinet Gartner a rcemment ralis une tude sur les parts de march des diffrents systmes dexploitation5 de smartphones et a ainsi essay dtablir ce que serait le march en 2012. Daprs cette tude, la part de march pour les mobiles Android augmenterait de 12% dici 2012, ce qui le positionnerait en deuxime position dans le Top 7 mondial des systmes dexploitation. La part de march de Symbian devrait quant elle chuter 39%.

Prvisions des parts de march des systmes dexploitation pour smartphones pour lanne 2012

Si lon se fit aux chiffres prcdents, les diteurs de solutions pour tlphones mobiles auront donc intrt dvelopper ou adapter leur solution pour des systmes dexploitation Symbian, Android et iPhone. Les BlackBerry seront toujours prsents sur le march mais en net recul. La part de march du systme Microsoft Windows Mobile augmentera nettement mais restera en retrait par rapport la prdominance de Symbian Andoid et iPhone.

Le systme dexploitation du BlackBerry est RIM

Page 23 sur 59 Mai 2010 Livre blanc

Scurit
Les donnes transfres lors de lutilisation de logiciels de business intelligence sont sensibles et doivent tre protges. Lutilisation dun VPN6 permet de faire une interconnexion avec le rseau local de lentreprise. Cela repose sur un protocole permettant aux donnes de passer dune extrmit lautre du rseau VPN en tant scurises car cryptes. Malgr tout, plusieurs mesures lmentaires simposent pour prserver la scurit des donnes : Lauthentification : les solutions doivent tre compatibles avec tous les modles de scurit et la procdure dauthentification doit tre conforme au modle en vigueur dans lentreprise. Lautorisation : des droits daccs doivent tre attribus et adapts aux diffrents utilisateurs. L'accs VPN des smartphones doit tre restreint aux serveurs rellement ncessaires aux utilisateurs de tlphones portables. La sauvegarde des donnes et des communications sensibles : les donnes doivent tre cryptes et les communications rpondre des critres trs stricts tels que seuls les utilisateurs dment authentifis et autoriss peuvent dcrypter les donnes. Les connexions venant des tlphones doivent tre rgules par des systmes de prvention des intrusions (IPS). Un serveur avec pare-feu o sont stockes les donnes de scurit et autres informations propres lutilisateur doit tre utilis, spar du reste de lintranet. Lutilisation de mot de passe : le mot de passe doit tre actualis rgulirement et comprendre majuscules, minuscules et caractres alphanumriques. La neutralisation des appareils perdus ou vols : en cas de perte ou de vol, ladministrateur doit pouvoir empcher laccs aux donnes stockes en les supprimant puis en dsactivant le mobile. Inconvnient : une fois lappareil dsactiv, il est impossible deffacer les donnes distance.

Cest en additionnant les fonctions de scurit des terminaux mobiles et celles des solutions de business intelligence que les entreprises protgeront correctement leurs donnes. Avec de bonnes pratiques et une prvention auprs des utilisateurs, la scurit des donnes consultes depuis un terminal mobile peut tout fait tre assure sans reprsenter de contrainte majeure.

Virtual Private Network = rseau priv virtuel

Page 24 sur 59 Mai 2010 Livre blanc

Apports de la mobilit
Quelque soit le secteur dactivit, la mobilit est aujourdhui une ralit que les entreprises ne doivent pas ngliger. De nouveaux applicatifs accessibles depuis le web se dveloppent alors, permettant aux entreprises daccder aux informations dont elles ont besoin, mme en dplacement. Paralllement cela, les smartphones se dveloppent galement de plus en plus, permettant daccder au web, ses e-mails, accroissant ainsi la facilit daccs aux informations depuis son mobile, soit nimporte quand et depuis nimporte o. Aujourdhui, la business intelligence ressent elle aussi le besoin de se dvelopper pour les terminaux mobiles, permettant aux utilisateurs davoir accs depuis leur mobile, des donnes calcules en temps rel. Lergonomie des solutions actuellement dveloppes est tout fait propice lutilisation mobile (tableaux interactifs, alertes, etc). Le march de la mobilit dentreprise devrait donc connatre une trs forte progression au cours des prochaines annes et, selon le cabinet danalyse Gartner, le nombre dapplications mobiles dployes par les socits auprs de leurs collaborateurs va continuer crotre de 30 % par an dici 2011 (probabilit de 0,7) . Malgr cet engouement pour les applications mobiles, on peut se demander si des applications de business intelligence pour tlphones mobiles seraient rellement un plus pour les entreprises. En effet, ces solutions permettent aux dcideurs davoir accs tout le temps et partout aux donnes actualises de sa socit, mais est-ce un rel atout pour les entreprises ? Un dcideur a-til rellement besoin daccder aux donnes de lentreprise en dehors de celle-ci ? Il est difficile de rpondre ces questions sans interroger les personnes concernes. Dun point de vue extrieur, ces nouvelles solutions paraissent rvolutionnaires mais toute nouvelle technologie ne donne telle pas cette impression laube de sa sortie ? Peut-tre alors queffectivement, ces nouvelles applications se rvleront tre un peu gadget au fil du temps.

Page 25 sur 59 Mai 2010 Livre blanc

Conclusion
Pour conclure, nous avons vu quil existe de nombreux acteurs prsents dans le domaine des applications mobiles de business intelligence. Ces acteurs peuvent tre des diteurs de solutions de business intelligence dj existants, comme SAP ou encore Cognos, qui dveloppent une solution mobile de leur application phare. Ces entreprises peuvent galement tre des diteurs spcialiss, cest--dire quils proposent uniquement des solutions mobiles de business intelligence. Ces solutions mobiles sont faites pour tre utilises sur des smartphones, nous avons donc ensuite tudi le march des systmes dexploitation de smartphone et essay danticiper ce quil serait dici 2012 afin de savoir vers quels systmes dexploitation les diteurs de solution mobile devraient se tourner. Par la suite, nous nous sommes poss le problme des contraintes de scurit imposes par les solutions mobiles et il est ressorti quelles paraissaient tout fait surmontables. Enfin, la question des apports de la mobilit, il est vrai que les avantages semblent nombreux tant donn le contexte de mobilit actuel, mais seuls des tmoignages de professionnels et lavenir pourront nous dire si ces solutions apportent un rel plus aux entreprises.

Page 26 sur 59 Mai 2010 Livre blanc

Les moteurs de recherche


Introduction
Les outils de recherche peuvent se classer en trois grandes catgories : les moteurs de recherche sur Internet, qui sont les plus communment utiliss ; les logiciels de recherche installs sur un ordinateur personnel, comme Exalead Desktop, Google Desktop et Copernic Desktop Search ; les outils ddis la recherche de donnes dans un rseau dentreprise.

Ce sont ces derniers outils qui nous intressent dans cette partie. Quest-ce quun moteur de recherche ? Un moteur de recherche est un outil permettant de retrouver des ressources associes des mots quelconques. Chaque document identifi est alors index dans une base de donnes, accessible ensuite par les utilisateurs partir de mots-cls. Pourquoi un moteur de recherche dans une entreprise ? L'explosion du nombre de contenus de formats divers (donnes, informations non structures, images, vidos...) disponibles dans les entreprises les pousse s'quiper de moteurs de recherche en interne. Selon une tude mene par MARKESS International, 49% des organisations ont dj recours un moteur de recherche d'entreprise, et 18% envisagent son utilisation d'ici 2010. Ces moteurs de recherche sont en majeure partie intgrs aux postes de travail ou aux outils de gestion lectronique des documents, mais ils sont, dans un nombre grandissant d'entreprises, capables de couvrir la fois les contenus internes et externes de l'entreprise, ou encore intgrs aux outils de gestion de contenu ou aux solutions dcisionnelles. Les moteurs de recherche peuvent tre abords au travers dautres problmatiques, comme les mdias de restitution ou la qualit des donnes prsentes (MDM).

Page 27 sur 59 Mai 2010 Livre blanc

Limportance du moteur de recherche


Pas de business intelligence et de ractivit sans un bon moteur de recherche. Il faut dsormais pouvoir tirer parti de toutes les sources de donnes de l'entreprise : PGI, CRM, GED, intranets, systme de collaboration... Puis les besoins de performance, de scurit et dextension de la couverture des formats ont augment. Le moteur de recherche devient le point cl daccs aux donnes et informations de lentreprise. Les oprationnels ont besoin dun vrai service de recherche, accdant un maximum de sources existantes o qu'elles se trouvent (poste de travail, web, GED, mails, PGI, applications mtiers, gestion des connaissances, bases de donnes clients, factures, forums, wikis, rseaux sociaux internes...). Ce service doit s'intgrer aux modes et contrles d'accs ainsi qu'aux systmes d'archivage existants. Et cela pour un patrimoine informationnel qui double tous les dix-huit mois. Enfin, pour les utilisateurs finaux, il doit tre aussi simple et rapide que Google lest sur la toile. Et d'abord qu'est-ce qu'un bon moteur ? Il doit idalement combiner une analyse statistique et smantique. La premire apprcie l'importance des mots selon leur occurrence et leur emplacement dans les textes. L'autre reconnat leur sens et sait donc associer par exemple les mots dplacement, avion et voiture. Tous les diteurs sont bons sur l'analyse statistique, mais plus ingaux sur l'analyse smantique.

Page 28 sur 59 Mai 2010 Livre blanc

Le march et les acteurs


Gartner prvoit que le march de lEnterprise Search sera de 1,5 milliards de dollars en 2012, contre 860 millions en 2007, soit un taux de croissance de 11,4 % en moyenne par an. Les clients des moteurs de recherche sont trs varis. Quelque soit lentreprise, elle pourra intgrer dans son rseau une solution de recherche. Les caractristiques des trois acteurs principaux ont t regroupes dans le tableau ci-dessous :

Exalead Sige social Fond en Nb employs Produit(s) Formats supports Volumtrie Rapidit CA Nb clients Rfrences Paris 2000 160 Exalead CloudView Search 320 > un milliard de documents 800 req/sec sur 15 millions de docs 13 millions d'euros en 2007 15,5 en 2008 > 250 (site Exalead) Via Michelin, Air Liquide, 118 218, Socit Gnrale, BNP Paribas

Endeca Boston 1999 500 Endecas Information Access Platform

Sinequa Paris 2000 50 en 2008 (*3 en 5 ans) Sinequa CS : solution d'accs la connaissance pour l'entreprise > 300 > un milliard de documents 400 requtes par seconde (les Pages Jaunes europennes) 7 millions d'euros en 2008 > 200 (mars 2009) Bouygues Construction, Arkema, la DGA, EADS

> un milliard de documents

100 millions de dollars en 2007 env. 500 (janvier 2008) Boeing, Ford, JBM, Toshiba

Dautres acteurs sillustrent grce leur outil de recherche : Autonomy Autonomy est une entreprise anglaise implante partout dans le monde. Les technologies des solutions dveloppes cherchent donner du sens aux informations non structures (texte, voix ou vido) pour ensuite pouvoir excuter des traitements automatiques. Leur moteur de recherche se nomme Idol K2, il apparat comme le plus riche fonctionnellement. Google Au travers de sa branche ddie aux entreprises, Google propose sa solution de recherche en entreprise : Google Search Appliance.

Page 29 sur 59 Mai 2010 Livre blanc

Vivisimo La solution Velocity Search Platform 7.0 de Vivisimo apporte pour sa part la recherche conceptuelle, fonction du profil de l'utilisateur et de son contexte, ainsi que la recherche sociale et la gestion avance de la catgorisation automatique. Cet diteur amricain, cofond par le franais Jrme Pesenti, a notamment quip Airbus, Procter & Gamble, la National Library of Medecine, Cisco, USA.gov et lUS Air Force. Sa technologie peut tre librement teste via le mta-moteur Clusty.com, qui peut interroger simultanment neuf moteurs diffrents et qui catgorise automatiquement les rsultats par thmatique. Fast (Microsoft) Fast Search & Transfer a lui aussi une couverture fonctionnelle trs large. Son crateur, une jeune pousse norvgienne de sept cents cinquante personnes dsormais, est galement l'auteur du moteur de recherche web AllTheWeb, d'abord rachet Overture, puis par Yahoo!. Il quipe plus de deux milles six cents clients (AOL, Dell, IBM, Wanadoo, Vodafone, Lexis-Nexis, Reuters, T-online, US Army...). Microsoft l'a rachet en avril 2008 pour 1,2 milliard de dollars. Logique : ceux qui se heurtaient aux limites du moteur de SharePoint Server le remplaaient gnralement par un moteur plus puissant comme Fast. A terme, Microsoft compte videmment en faire une plate-forme de recherche intgre pour l'ensemble de son environnement. Omnifind (IBM) Omnifind a t taill pour des millions de documents et des milliers d'utilisateurs. Moteur smantique de plus de soixante langues, il analyse les contenus, les sentiments et les menaces dans les serveurs Sharepoint, Filenet, Documentum, MS Exchange, Lotus Notes et Websphere.

Page 30 sur 59 Mai 2010 Livre blanc

Les technologies du web smantique


Quest-ce que le web smantique ? Le web smantique se base sur la standardisation des mtadonnes des ressources web. Il va permettre de dcrire les relations entre personnes, laide de langages destins structurer ces vocabulaires. Ce principe repose sur des standards dj bien dfinis tels que RDF et OWL. Ils sont issus du W3C, organisme charg de promouvoir la compatibilit des technologies du World Wide Web. Ces standards concrtisent la notion dintelligence collective. En quoi ces technologies vont-elles modifier les moteurs de recherche ? Cela va sans doute prendre beaucoup de temps, mais les dveloppeurs et crateurs de ressources vont de plus en plus utiliser les mtadonnes standardises du web smantique. Les moteurs de recherche doivent alors mieux prendre en compte ces nouvelles informations pour pouvoir les exploiter. Une tude du Gartner date de juillet 2009 indique que les technologies du web smantique ne seront exploites pleinement que dans une dizaine dannes. Certains diteurs ont dj bien compris lintrt de ces nouvelles technologies, limage dExalead qui investit dans ce domaine au travers de son ple innovation. Son moteur de recherche web intgre la prise en compte des mtadonnes. Lditeur Sinequa sintresse galement ces nouvelles technologies, sa solution Enterprise Search cre des liens smantiques entre les donnes dans un contexte mtier pour aider les employs trouver linformation et prendre des dcisions plus rapidement. Faire rflchir les ordinateurs : cest lide de Fabrice Lacroix, prsident d'Antidot, diteur franais de solutions d'accs l'information, outils de recherche et de navigation. Ayant embot trs tt le pas de la smantique, Antidot se pose prsent comme lun des acteurs les plus avancs du domaine. Cette affirmation se vrifie au travers de leur important catalogue client.

Page 31 sur 59 Mai 2010 Livre blanc

Le futur des moteurs de recherche


L'lment central sur lequel tait construit le systme d'information de l'entreprise 1.0 tait la base de donnes relationnelle mais cela implique souvent un systme lourd et couteux. De plus, les outils de business intelligence manquent d'agilit ; et enfin, les donnes non structures sont devenues de plus en plus mtiers et critiques. Paralllement cela, l'info-explosion des donnes non structures (les mails et les fichiers qui sont stocks plat , sans modle relationnel) a fait progresser les technologies de recherche. Le CEO de Sinequa indique que dans 90% des besoins, le moteur de recherche fait plus souple et mieux que l'outil de BI. En plus de lintgration des technologies du web smantique, les moteurs de recherche devraient prendre en compte dautres problmatiques. Dans un futur proche, la problmatique de la gestion des donnes de rfrence (MDM) deviendra invitable. Cest alors quentre en jeu l'Enterprise Search Bus, un bus de moteur de recherche intelligent capable de mettre en cohrence l'ensemble des donnes en les rendant cherchables et navigables par des axes mtier. Les futurs moteurs de recherche devront galement sappuyer sur des solutions de Master Data Management afin de prsenter des donnes dune qualit et dune fraicheur toujours meilleures. Certains diteurs proposent par ailleurs leurs services en mode SaaS, limage des produits Exalead On Demand. Il sagit l aussi dune volution possible des solutions de recherche court et moyen terme.

Page 32 sur 59 Mai 2010 Livre blanc

Les mdias de restitution


Introduction
L'indexation est la base une pratique documentaire ddie aux textes, et dont l'objectif est de gnrer pour un document, une description sous forme d'index permettant de le retrouver dans un ensemble. Le choix des caractristiques du document et du langage de description dtermine la pertinence des index. Ces questions sont au centre des recherches actuelles sur l'indexation automatique de documents audiovisuels. Dsormais, on arrive indexer dautres mdias comme limage, le son et la vido. Ensuite, grce des moteurs de recherches, en entrant des mots cls ou des couleurs, il est possible de retrouver les mdias indexs. L'information non indexe (non structure) est de plus en plus prsente sur le net. Aujourdhui, 80% des informations dune entreprise ne sont pas structures et selon Gartner, le volume de ces donnes double tous les mois. Ces informations tant chres traiter, le dfi pour l'entreprise moderne est d'essayer de comprendre et d'extraire la valeur qui se trouve dans cette vaste mer de donnes. Dans une premire partie, nous allons voir les diffrents acteurs par mdia et ensuite les solutions quils proposent.

Pourquoi lindexation ?
On note trois points importants :
Permettre la dcouverte de connaissances en organisant et en classifiant de faon dynamique lactif informationnel en dossiers consultables pertinents dans le contexte, afin de permettre lutilisateur de prendre des dcisions opportunes et de rsoudre les problmes rencontrs dans le monde rel. Trouver des informations pertinentes sur le plan conceptuel, et les convertir en connaissances quelle que soit la langue dans laquelle elles sont conserves et les perspectives de recherche de lutilisateur final. Rcuprer des rsultats de recherche exhaustifs et pertinents, y compris lorsque les termes de la recherche sont diffrents de la source, tout en y tant apparents.

Page 33 sur 59 Mai 2010 Livre blanc

Les acteurs
Acteur Solution Image Google INRA IBM Business Geografic Exalead Groupe Quaero IT channel.info Seigneurie Universit de Cambridge Google NewPhenix Gaudi IMEDIA CQBI Aigle CloudView Quaero LTU Chromatic Autonomy Google Location Services NewPhenix X X X X X X X X X Mdia trait Son X X X Vido X X X Carte X -

X -

Page 34 sur 59 Mai 2010 Livre blanc

Les solutions
IMEDIA de lINRIA
Lobjectif premier de lquipe-projet IMEDIA est de dvelopper des mthodes dindexation par le contenu, de recherche interactive, et de navigation dans des bases dimages, dans un contexte multimdia. Pour ce faire, IMEDIA traite aussi bien des bases dimages gnriques (ex : web) que des bases dimages spcifiques un domaine dapplication cibl (visages, images mdicales...). Ces deux catgories relvent respectivement de la recherche dimages et de la reconnaissance dobjets. En ralit, la recherche dimages est une problmatique plus vaste qui englobe la reconnaissance dobjets et intgre les interactions avec lutilisateur. Plus gnralement, lquipe-projet IMEDIA dploie ses efforts de recherche, de collaboration et de transfert pour rpondre au problme complexe de laccs intelligent aux donnes multimdias dans sa globalit. Actuellement, on ne trouve aucune information rcente sur la toile. Ce projet a t soit abandonn soit a chang de nom. Par ailleurs, lquipe de lINRIA travaille sur le projet Quaero (indexation multi-mdias) avec de nombreux collaborateurs (Cf. Quaero, un peu plus loin).

Google Audio Indexing (Gaudi)


Google Audio Indexing est en fait une nouvelle technologie de Google qui permet aux utilisateurs d'effectuer de meilleures recherches vido et regarder des vidos YouTube partir de divers canaux. C'est une technologie qui permet de trouver, dans une vido, un mot que la personne a dit. Elle permet l'utilisateur d'accder directement la partie de la vido o ces mots sont prononcs. Google ralise ici un grand pas dans le monde des moteurs de recherche. Pour le moment, les tests sont effectus sur la prochaine lection prsidentielle o est bas Google ; mais ils ont dj prvu d'amliorer le service pour le proposer ensuite d'autres vidos. Il y a quelque mois, on pouvait tester cet outil sur les vidos des lections prsidentielles amricaines, mais dsormais tous les liens sont morts.

Page 35 sur 59 Mai 2010 Livre blanc

Aigle de Business Geographic


Business Geographic, filiale du groupe CIRIL, est linventeur du concept de Go Intelligence . Editeur de la technologie Aigle, Business Geographic prsente GeoBI, la solution BI ddie au reporting gographique en environnement Business Objects. GeoBI est la solution offrant un vritable lien dynamique entre votre portail Business Objects WEBI/DASHBOARD ou votre environnement client/serveur BO et vos donnes gographiques. Alliant puissance et simplicit, GeoBI simpose comme la solution leader sur le march du Go-Dcisionnel. GeoBI est un vritable outil de reporting et d'analyse cartographique en environnement Intranet/Extranet et Internet. GeoBI apporte une nouvelle dimension linformation en offrant la possibilit de consulter, danalyser et de partager des tableaux de bords gographiques. Dans un article de directions magazine publi le 18 Mai 2010 (Cf. Annexe), Business Geographic a rcemment ajout un volet mobile dvelopp pour iPod. L'application assure la mise jour de donnes en temps rel, afin que la ractivit et la crdibilit de l'quipe sur le terrain soit amliores. The iPod interface is very intuitive; it really makes the field operations more efficient , a dclar Dany Bouchard, Prsident de DBx GEOMATICS.

Exalead CloudView
CloudView est une solution pertinente et reconnue pour le dveloppement dapplications mtier. La business intelligence nouvelle gnration met lutilisateur au centre des applications et dlivre une vue 360 degrs sur linformation de lentreprise. Les Search Based Applications (SBA) comme celles reposant sur CloudView vont plus loin, en intgrant les donnes non structures forte valeur ajoute : fichiers, courriels, Web Celles-ci garantissent un accs instantan aux donnes et sintgrent de faon non intrusive au systme dinformation existant. Elles prfigurent ainsi les nouveaux systmes dinformatique dcisionnelle rich media qui vont rendre lentreprise plus agile et ractive. Daprs un article de directions magazine publi le 29 Avril 2010 (Cf. Annexe), Exalead est devenu le partenaire de Micropole-Univers. Fort de plus de vingt annes dexpertise oprationnelle dans les domaines de la business intelligence, du Web & IT, des ERP et du CRM, Micropole-Univers est reconnu par ses clients pour sa connaissance de leurs mtiers et sa matrise des technologies. Cest dans cette logique dinnovation constante que le groupe a intgr la plateforme Exalead CloudView son portefeuille de solutions, notamment pour ses possibilits de dveloppement dapplications mtiers facilitant lagilit et la ractivit des entreprises, moindre cot.

Page 36 sur 59 Mai 2010 Livre blanc

Quaero
Quaero ( je cherche en latin) est un programme de recherche et d'innovation destin dvelopper des outils intgrs de gestion des contenus multimdias , dont des extensions multimdias pour des moteurs de recherche de nouvelle gnration qui permettront de rechercher par le contenu non seulement du texte, mais aussi des images, du son et de la vido. Ce projet est dvelopp par vingt-cinq partenaires : grands groupes, PME, laboratoires de recherche, tablissements publics.

Dimportants efforts de recherche sont ncessaires pour que lordinateur effectue ce que les humains font naturellement : reconnatre les visages et les voix, comprendre ce qui se dit et la faon de le dire... Quaero a lambition dlaborer des solutions nouvelles pour faire merger de nouveaux services daccs linformation. Ainsi, dans le domaine du langage parl, Quaero vise identifier la langue utilise et le locuteur, transcrire la parole, ou traduire automatiquement dune langue lautre. dit Joseph Mariani, directeur de lInstitut des technologies Multilingues et Multimdias de lInformation (IMMI). Fin mars 2010, le site de lElyse a t lanc avec, comme moteur de recherche, Voxalead Inspired by Quaero . Une premire en France dans l'indexation vido !

LTU
LTU technologies est la pointe des technologies existantes dans le domaine de la dtection vido ( video matching ) tant en termes de performance que de prcision. Les acteurs du march, et particulirement les dtenteurs de droits, les sites de partages de vidos, les rseaux sociaux sont demandeurs de solutions pour grer l'explosion des contenus multimdias, ainsi que l'utilisation frauduleuse toujours plus importante de contenus protgs. LTU applique son expertise unique en analyse d'images pour rechercher des correspondances entre vidos, quel que soit leur format. Dans un premier temps, des images sont extraites de vidos Page 37 sur 59 Mai 2010 Livre blanc

de rfrence et leur ADNs sont calculs. Ensuite, lorsqu'une vido requte est soumise au systme, des images en sont extraites. Ainsi, les ADNs des images de la requte peuvent tre compars aux ADNs de la rfrence. Lorsqu'un nombre suffisant d'images en commun est trouv entre la requte et une vido de la rfrence, une alerte est leve. Des algorithmes de matching trs pointus permettent d'viter les faux positifs tout en supportant de nombreuses transformations. LTU technologies, pionnier des technologies de recherche et de reconnaissance d'images, a ouvert en avril 2010 une API permettant de crer des applications sur mesure mettant en uvre des fonctionnalits de recherche par l'image. Afin de dmontrer l'efficacit et la facilit d'intgration de son API de recherche visuelle, la socit prsente en parallle lookthatup, une application iPhone de recherche par l'image. Vritable vitrine de la technologie de recherche et de reconnaissance d'images de LTU, cette application a t dveloppe uniquement partir de plateformes open source et de l'API LTU. Elle permet aux utilisateurs de reconnatre certains objets en les prenant en photo, puis de les bookmarquer ou les partager sur les rseaux sociaux. Elle permet galement d'ajouter facilement du contenu la base de donnes d'images reconnaissables de lookthatup.

Chromatic
Chromatic est un outil pour les architectes et matres duvre offrant une classification fine des couleurs proposes par le fabricant : Identification rapide par hauteur de ton dsir ; Rpartition des couleurs par cycle chromatique, allant des tons pastel, aux tons moyens, puis aux tons forts et enfin aux tons gris.

Autonomy
Autonomy Corporation plc (LSE : AU. ou AU.L) est le leader mondial sur le march du logiciel d'infrastructure d'entreprise et des technologies dites de meaning-based computing . La technologie Autonomy permet la comprhension conceptuelle et contextuelle de toutes les donnes lectroniques y compris les informations non structures, qu'il s'agisse de donnes texte, email, voix ou vido. Le logiciel Autonomy dmontre son efficacit dans tous les domaines stratgiques d'une organisation : accs l'information, IE, GRC, KM, solutions pour centres d'appels, gestion de contenus multimdias, solutions de conformit et traitement des litiges, applications de scurit. Il est reconnu par les analystes comme le leader du march professionnel de la recherche d'informations. Le Groupe Autonomy se compose de : ZANTAZ, leader de l'archivage, de la dtection d'informations au format lectronique et de la gestion proactive des risques lis aux informations (Information Risk Management, soit IRM) ; Cardiff, l'un des plus grands diteurs de solutions intelligentes de traitement des documents ; etalk, fournisseur rput de produits de centres d'appels d'entreprises ; Virage, pionnier des technologies de gestion des contenus multimdias, de scurit et de surveillance.

Autonomy a t fonde sur une vision de changer radicalement la manire dont nous interagissons avec l'information et les ordinateurs, s'assurer que les ordinateurs structurent notre monde, plutt que l'inverse.

Page 38 sur 59 Mai 2010 Livre blanc

L'essence du logiciel Autonomy rside dans sa capacit extraire les concepts de base de donnes non structures. La manire dont elle y parvient est sans doute une voie suivre. Whiting Peter, UBS.

NewPhenix
NewPhenix dveloppe des logiciels danalyse, dindexation, de recherche et de classification de linformation multimdia et multilingue. Ils sont modulaires afin dtre intgrs et sappuient sur des technologies linguistiques/smantiques et pixliques.

Google Location Services


Grce au service Google Location Services, le navigateur peut transmettre vos coordonnes gographiques aux sites Web afin que vous puissiez trouver les informations les plus pertinentes et utile. Un site Web sera capable de vous demander de partager votre localisation de sorte qu'en cherchant simplement le mot pizza le site vous donnera les rponses dont vous avez besoin aucune information ou saisie de texte supplmentaire n'est ncessaire. Un autre exemple : vous cherchez votre route pour vous rendre quelque part, le site Web saura o vous vous trouvez, ainsi vous n'aurez indiquer que votre destination. Ce service est totalement optionnel et le navigateur Web ne partage pas votre localisation sans votre permission ; ceci est ralis avec le plus grand respect de votre vie prive. Si vous tes d'accord, le navigateur rassemblera les informations sur les points d'accs sans fil alentour et l'adresse IP de votre ordinateur. Alors, il enverra ces informations au fournisseur de service de golocalisation par dfaut, Google Location Services, pour faire une estimation de votre localisation. Cette estimation de localisation est alors partage avec le site Web qui l'a demande. Si vous n'tes pas d'accord, le navigateur ne fera rien. Par dfaut, le navigateur utilise Google Location Services pour dterminer votre localisation en envoyant : l'adresse IP de votre ordinateur ; des informations sur les points d'accs sans fil environnants ; un identifiant client alatoire, assign par Google, et qui expire aprs deux semaines, enregistr sous la forme de cookies.

Conclusion
Depuis que les contenus audiovisuels schangent lectroniquement des donnes, les techniques dindexation automatique se dveloppent : pour le texte ; pour limage ; pour le son ; pour la vido ; pour les cartes ;

et les formats dindex se standardisent. Nanmoins, laugmentation massive de documents ne cesse de crotre et il est de plus en plus important de faire le tri entre lutile et le futile.

Page 39 sur 59 Mai 2010 Livre blanc

Master Data Management


Introduction
La gestion de la multitude de donnes diffrentes existant dans une entreprise est coteuse et complexe. La gestion des rfrentiels mtiers (master data management en anglais, MDM) a pour but de rfrencer, contrler, synchroniser toutes les donnes travers l'entreprise (par exemple les donnes clients et produits), de faon ce quelles soient prcises, conformes, exploitables par les systmes et leurs utilisateurs. Le master data management est un ensemble de disciplines, technologies et solutions utilises pour assurer l'exactitude, la cohrence et l'unicit des donnes au sein de l'entreprise.

Pourquoi le MDM ?
Les consquences de la faible qualit des donnes sont nombreuses et cotent souvent cher aux entreprises. Les consquences savrent parfois fatales aux organisations dont les donnes sont de mauvaise qualit : Insatisfaction des clients : les clients victimes de donnes incorrectes pardonnent difficilement. Non-conformit des chiffres publis : des erreurs dans les donnes comptables entranent gnralement de lourdes sanctions (amendes et peines). Et ce, mme si cette situation ne rsulte pas dune manipulation volontaire. Dvalorisation de limage de lentreprise : en consquence du point prcdent, des erreurs portant sur des donnes diffuses lextrieur de lentreprise dtriorent rapidement limage de celle-ci, et handicapent son expansion commerciale. De plus, limpact boursier des socits cotes est immdiat, entranant la chute rapide du cours de laction. Perturbation du fonctionnement oprationnel : les donnes incorrectes au sein de lentreprise ralentissent le fonctionnement oprationnel, et rendent les dcisions difficiles ou incertaines. Cela gnre aussi du stress et de la dmotivation chez les collaborateurs. De plus, le surcrot de travail engendr par des erreurs de donnes nest jamais le bienvenu. Enfin, la perte de confiance dans les informations manipules nest propice ni linitiative, ni un climat sain. Erreurs de stratgie : dfinir une stratgie ncessite plus de temps si les informations utilises sont de mauvaise qualit ou tout simplement errones. Augmentation des cots : les impacts noncs prcdemment engendrent videmment des surcots. Les situations variant dune entreprise une autre, il est trs difficile destimer le cot de la non-qualit. Certains experts estiment cependant que ce cot cach peut reprsenter plus de 10 % du chiffre daffaires, ce qui ampute de faon consquente la rentabilit.

La gestion de linformation est un facteur clef de la comptitivit de lentreprise. Une information cohrente, intgre, fiable, accessible et scurise permet entre autres : Laugmentation du time to market Mise sur le march de nouvelles offres ; Rapidit de dcision grce une information et des supports danalyse fiables ; Suivi client efficace et rponse client rapide.

Page 40 sur 59 Mai 2010 Livre blanc

La rduction du risque derreur Contrle et qualit de linformation (data management) ; Unicit et fiabilit de linformation (master data) ; Automatisation de process manuels et administratifs ; Scurit de la base de donnes (accs rserv certaines informations, prvenir des modifications non autorises). La rduction des cots Rationalisation vis--vis des fournisseurs dinformation externes ; Automatisation de process manuels et administratifs ; Rationalisation de systmes dinformation multiples et complexes.

Typiquement, les besoins conduisant limplmentation dun outil de Master Data Management sont les suivants : Diffrencier les informations stratgiques et les informations mtier, et avoir une vision globale de ces informations stratgiques ; Fiabiliser linformation ; Bien diffuser linformation (quelle information ? A qui ? Quand ? O ?) ; Continuit historique de linformation (source unique de rfrence, unicit didentifiant pour lensemble de lentreprise, traabilit tant rglementaire que pour des besoins de reporting).

Page 41 sur 59 Mai 2010 Livre blanc

Dfinitions, approches et concepts

MDM Platform / Source : http://fr.exalead.com/

La gouvernance des donnes est un cadre de contrle qualit visant valuer, grer, exploiter, optimiser, contrler, entretenir et protger les donnes des entreprises. De nombreux facteurs poussent actuellement la gouvernance des donnes en tte des proccupations des dcideurs. Il est gnralement admis que les socits disposant dun plan efficace dans ce domaine sont capables de produire durablement des donnes plus prcises, compltes et cohrentes sur leurs activits dans lensemble de leurs services. La consolidation de donnes consiste rassembler plusieurs donnes semblables afin dobtenir un rapport structur, plus facile consulter que linformation brute prsente sur le serveur, mais avec le moins de perte dinformation possible. Le nettoyage des donnes permet de vrifier et de corriger les donnes tout en assurant la standardisation des formats des bases de donnes des entreprises. Les procds de nettoyage de donnes permettent doptimiser la qualit de lensemble des donnes des entreprises. Avant dutiliser une information et de peut-tre prendre une dcision, il est important de se poser au pralable quelques questions : quelle est cette information ? Do provient-elle (base de donnes, table) ? Comment est-elle calcule ? Quand et comment est-elle rafrachie ? Quelles sont les prcautions dusages ? Toutes les informations sur la donne susceptibles de rpondre cette liste de questions sont enregistres au sein dun rfrentiel. On les appelle les mtadonnes, c'est--dire les donnes sur les donnes. Les mtadonnes sont actuellement un des points les plus importants de la gestion des systmes dinformation. Une gestion centralise des mtadonnes permettrait de suivre en termes de qualit la donne toutes les tapes de sa vie : stockage, extraction, traitement et prsentation. Une donne de rfrence, ou master data est une information de base, unique, fondamentale pour l'activit de l'entreprise, et partage dans diffrents services. Par exemple, le nom d'un client, le code d'un produit, la rfrence d'un fournisseur, un numro de compte sont des donnes exploites, souvent dans des formats diffrents, par le service des ventes, le suivi de production, la direction comptable, le contrle de gestion La donne de rfrence, qui est une donne mtier, doit en effet tre identifiable et reconnue comme telle partout dans l'entreprise, quel que soit le service qui en est responsable, quel que soit le systme dinformation, le serveur ou le logiciel qui l'hberge, la traite ou l'enregistre, ou quelle que soit la division ou la filiale de l'entreprise qui la produit. Page 42 sur 59 Mai 2010 Livre blanc

Exemples de donnes rfrentielles / Source : http://blog.homsys.com

Daprs lvolution de la demande au niveau des donnes : lentreprise sest dabord focalise sur le stockage des donnes (avec les systmes de gestion de bases de donnes) puis sur la comprhension des donnes (avec les outils dcisionnels dits de BI), et enfin, sur la fiabilit du contenu (avec les outils de MDM).

Source : http://www.cxp.fr/domaine-expertise_mdm.htm

Si la notion de rfrentiel de donnes nest pas nouvelle, le concept-mme de MDM est apparu en 2003 et prend vraiment son essor actuellement. Historiquement, celui-ci sest dvelopp sous deux angles : La gestion des catalogues produits (Product Information Management) notamment dans les domaines de la grande distribution (retail) et du manufacturing,

Page 43 sur 59 Mai 2010 Livre blanc

Lintgration des donnes clients (Customer Data Integration) particulirement pour ladministration de grosses bases de donnes transactionnelles (gestion des doublons, vrification et homognisation des adresses, etc).

Depuis, ce concept sest gnralis dautres problmatiques et concerne la gestion des tiers et des personnes, des produits et des offres, de lorganisation et des structures, des nomenclatures et des codifications, de la configuration et des paramtres. Les approches sont connues et pratiques dans lEnterprise Application Integration (EAI) depuis vingt ans. La terminologie anglophone propre au MDM est issue du travail de David Loshin. Approche dite Identity Hub Dans cette approche, toutes les donnes-matre sont gres dans un registre unique. Ce sont les composants de ce registre (le Hub ) qui transforment la donne. Enfin, les applications clientes interrogent le registre. Cette approche a un inconvnient : les systmes oprationnels ne sont pas prvenus des changements dans le registre. Approche dite Proactive Harmonization Un seul changement par rapport lapproche prcdente : les systmes oprationnels sont prvenus des changements. Cette approche et la prcdente ont encore un point faible : chaque systme oprationnel reste indpendant et les systmes ne seront pas au mme niveau dintgration. Approche dite Integrated Hub Cest la cousine de lapproche Integrated ETL des systmes dIntelligence daffaires dveloppe au dbut des annes 90. Chaque systme oprationnel est intgr dans un MDM Hub : en clair, ce Hub se substitue des composants fournisseurs des applications.

Gnralement, au sein de lentreprise, le consensus porte sur la deuxime approche. La premire est trop faible : elle oblige les systmes oprationnels dtecter les changements dans le registre de donnes-matre. Et la troisime a un cot plus lev. Dans la vraie vie, plusieurs approches sont utilises au sein dune mme compagnie. Exemple : un Integrated Hub (trs ractif) pour les donnes-matre critiques (client & produit, par exemple) et une Proactive Harmonization pour les donnes-matre restantes.

Page 44 sur 59 Mai 2010 Livre blanc

Normes et standards
Le Common Warehouse Metamodel ou CWM est un modle normalis propos par lOMG7 qui dcrit un langage d'change de mtadonnes travers un entrept de donnes, un systme dcisionnel, un systme d'ingnierie des connaissances (gestion des connaissances), ou des technologies de portail. Il est fond sur UML 8 et XML 9 . Les principaux diteurs de business intelligence soutiennent ce modle. Le Meta-Object Facility ou MOF est un standard de l'OMG s'intressant la reprsentation des mtamodles et leur manipulation. LOpen Information Model ou OIM tait un standard soutenu par Microsoft mais qui a baiss les bras et dcid de contribuer au modle commun, le CWM.

7 8

Object Management Group Unified Modeling Language 9 eXtensible Markup Language

Page 45 sur 59 Mai 2010 Livre blanc

Le march du MDM
Depuis quelques annes, les acteurs de la business intelligence investissent fortement sur ce secteur en pleine consolidation. Le MDM semble faire le buzz actuellement et de plus en plus d'entreprises s'y intressent. Le march est actuellement aliment par les fournisseurs de solutions (diteurs le plus souvent) plus que par les entreprises qui ont besoin de solutions adaptes (case studies). Les fournisseurs se positionnent ainsi en marchand de rves pour des entreprises qui se retrouvent en position d'enfants dans un magasin de jouets. Voici une carte intressante qui retrace les liens et les diffrents rapprochements entre les acteurs du secteur.

Carte des solutions MDM / http://www.ramonchen.com/

Page 46 sur 59 Mai 2010 Livre blanc

Source: August 2008 The Forrester Wave: Customer Hubs, Q3 2008

Il est flagrant que ces acquisitions successives ont fortement impact des gants comme SAP ou ORACLE, clairement en perte de vitesse et sans relle stratgie ce jour. Les bnficiaires de ce chamboulement sont les clients et les utilisateurs qui profitent pleinement de l'mulsion du march pour voir les solutions gagner en maturit.

Page 47 sur 59 Mai 2010 Livre blanc

Les acteurs
Le tableau suivant prsente une liste dditeurs de MDM et quelques informations sur leur solution. Leaders Visionnaires Pure Player Spcialistes BI/Enterprise Information Management Leader Middleware Perturbateurs

Editeur

Solution et diteur MDM DQM rachet InfoSphere MDM Server WebSphere Initiate Master Data Service Initiate Systems (2010) Lombardi (2009) Ascential (2005) DWL (2005) Trigo (2004) Oracle Master Data Management Suite Mural Silver Creek (2009) Sun Micro (2009) Hyperion (2007) Siebel UCM (2005) NetWeaver MDM IQ8 Integration Studio Business Objects et FirstLogic (2007) A2I (2004) MDM Studio MDM Server Collaborative Information Manager Netrics (2010) Velosel (2005) MDMCenter

Solution BI Complte

Open Source

Informations IBM est lun des leaders du march. Il se fait une part belle dans le secteur de la sant puisquune quarantaine de services informatiques de sant dans le monde utilisent les solutions d'Initiate Systems. Il existe diffrentes offres en fonction des donnes : Websphere Customer Center (gestion donnes client) et Websphere Product Center (gestion des donnes produit).

IBM

Oracle

Talend n'est pas le premier s'tre essay sur les pentes du MDM Open Source, Sun avait le premier lanc un outil trs complet et une communaut de dveloppement Mural pour ce type d'offre. L'Allemand est l'un des pionniers du Master Data Management. L'diteur a modifi en 2006 les bases technologiques de son MDM en s'appuyant sur la solution de l'diteur A2i. Le MDM de Teradata est bas sur le code source de la solution MDM de lditeur i2 (partenariat). TIBCO CIM intgre l'intelligence artificielle de Netrics. Le moteur de Netrics fournit un couplage des donnes temps rel. Riversand permet aux entreprises de regrouper, grer et diffuser l'information produit jour partir d'un rfrentiel central. Purisma est plac parmi les visionnaires selon ltude du Gartner Magic Quadrant for Master Data Management of Customer Data de 2009. Cette offre est par contre quasiment absente du march franais.

SAP

Teradata

Tibco

Riversand

D&B

Purisma Data Hub Delivers

Informatica

PowerCenter Siperian (2010) Agent Logic (2009) AddressDoctor (2009) Identity Systems (2008) Similarity Systems (2006) DataFlux qMDM DataFlux

Aprs avoir ralis quelques acquisitions dans le domaine de la qualit de donnes, Informatica a dbours 130 millions de dollars pour mettre la main sur Siperian, lun des leaders du MDM. La qualit des donnes est en quelque sorte un prambule la mise en place dune approche MDM. SAS lance sa plateforme MDM compose d'un nouveau triptyque : MDM, ETL et DATA QUALITY. Cette nouvelle plateforme baptise DataFlux Data Management Platform vise consolider et fiabiliser

SAS

Page 48 sur 59 Mai 2010 Livre blanc

les donnes de l'entreprise afin d'en tirer le meilleur parti en les transformant en capital stratgique. SQL Server 2008 Microsoft Bulldog Zoomix (2008) Stratature (2007) Perfect Product Suite FullTilt (2008) X SQL Server 2008 R2 propose dsormais une fonctionnalit de Master Data Management (MDM) se nommant Master Data Services (Bulldog). Bulldog regroupe les processus et standards Microsoft appliqus au code de Stratature. MDM orient produit e-commerce intgr une solution PIM (Product Information Management). Pure player franais positionn sur le march du MDM destination des institutions financires. Outil de gestion de la qualit volu. Limit en volumtrie trait. Principale rfrence du march franais. X La solution Talend MDM Open Source est btie autour du noyau de la solution Amalto Xtensis. Visionware continue d'affronter la concurrence dans le segment de march Microsoft .NET, et a russi se dvelopper en Amrique du Nord dans le secteur public et dans la sant en dveloppant une offre moins chre que ses concurrents. Kalido MDM est une application logicielle permettant d'harmoniser, stocker et grer les donnes de rfrence au cours du temps. Pure player franais positionn sur le march du MDM. Parmi les nouveauts de la version 4.7RC de EBX.Platform, l'arrive officielle de la gestion des workflows. OneData utilise un navigateur pour la gestion des donnes qui permet de consolider, de nettoyer, de crer, de grer et de normaliser toutes les donnes partageables, y compris les donnes de base, les donnes de rfrence et les mtadonnes. Health Market Science propose lune des offres MDM les plus compltes sur le march de la sant aux Etats Unis. Spcialiste des industries de tlcommunication. Enterprise Customer Hub est bas sur une version OEM de IBM InfoSphere MDM Server. iWay Master Data Center (MDC), solution MDM de type CDI, spcialise sur la gestion des donnes Clients. iWay MDC permet aux entreprises de consolider des millions denregistrements partir dun certain nombre de rgles mtier trs faciles dfinir. Product Information Manager est une solution web qui permet de grer et duniformiser les informations relatives au produit dans l'entreprise. Enable MDM dispose d'une technologie de workflow qui permet de rationaliser les processus lis un produit et de coordonner les personnes et les systmes. STEP est conu pour fournir un ensemble d'outils et une interface utilisateur intuitive pour la gestion, la validation, la manipulation et l'accroissement des donnes. Product Manager est une plate-forme standard pour la gestion de l'information produit et de la communication produit dans le commerce et l'industrie.

QAD

Smartco

Smart Financial DataHub

Talend

Talend MDM Xtentis MDM Amalto (2009)

VisionWare

MultiVue Identification Server

Kalido

Kalido MDM

Orchestra Networks

EBX.Platform

Data Foundations

OneData

Health Market Science

CompleteView

Amdocs

Enterprise Customer Hub

Information Builders iWay Software

iWay MDC

GXS PMDM

Product Information Manager

EnterWorks

Enable MDM

Stibo Systems

STEP

Heiler Software

Product Manager

Page 49 sur 59 Mai 2010 Livre blanc

Innovit

iICE Express Edition (EE)

iICE Express Edition est une solution MDM complte cre pour les petites et moyennes entreprises qui recherchent un systme pour grer leurs donnes de produit. Liaison est une plateforme MDM en mode SaaS. Zynapse offre une solution base sur l'intelligence artificielle entirement automatis pour nettoyer, enrichir et d-dupliquer (liminer les redondances) les donnes de rfrence. Le premier MDM spcifique aux sciences humaines et disponible en SaaS. Cegedim a pour client un grand groupe pharmaceutique. CloudView peut permettre dacclrer la phase de MDM ou venir remplacer compltement un MDM pour des petites organisations avec des sources et des volumes de donnes limites. ID Integrator automatise lintgration de donnes de rfrence dans lentreprise.

Liaison Technologies

Liaison MDM Zynapse Automated Master Data Management Solution Suite

Zycus

Cegedim dendrite

Nucleus360 as a service

Exalead

CloudView

Global Ids

ID Integrator

On remarque ici que les leaders du march sont les diteurs qui ont investi trs tt dans le MDM. On peut prendre lexemple dIBM avec le rachat de Trigo Technologies ds 2004. Depuis le rachat de Sun par Oracle, lide dun MDM Open Source bas sur le projet Mural sest estompe. Talend MDM est donc la seule offre Open Source du march. A la manire dInformatica, lacquisition dditeurs dILM (gestion du cycle de vie de l'information) ou de spcialistes de la qualit des donnes peut tre un prambule la mise en place dune approche MDM.

Page 50 sur 59 Mai 2010 Livre blanc

Le projet MDM
Les points qui vont tre noncs ci-dessous sont considrs comme primordiaux dans le succs d'un projet de MDM. La gestion des donnes de rfrence repose sur plusieurs composantes : 1. Une dfinition commune et unique de linformation de rfrence, partage dans toute lentreprise (entre les mtiers, entre matrises douvrage et matrises duvre). Il savre souvent complexe de saccorder sur une dfinition commune dune mme appellation. 2. Des processus de mise jour et de validation des donnes explicitement formaliss et rpondant aux exigences de qualit de tous les acteurs de lentreprise concerns. 3. Des rceptacles robustes et prennes pour les systmes rfrentiels de lentreprise. 4. Des donnes de rfrence qui constituent le contenu ; un contenu qualifi par ses mtadonnes permettant de lutiliser au mieux : date de mise jour, de premption, auteur de la mise jour 5. Des applications clientes adapter pour se connecter au rfrentiel et utiliser absolument les Master Data. 6. Une roadmap de mise en uvre du rfrentiel reste indispensable : Quel est ltat des donnes existantes (audit des donnes) ? Comment migrer ces donnes existantes ? Comment faire voluer les applications clientes existantes ? Comment matriser la connexion au rfrentiel des nouvelles applications ? Comment grer le changement ? Autant de questions majeures pour la russite du projet MDM. 7. Une dimension cl : la mise en place dune gouvernance des donnes de rfrence. commencer par lidentification dune relle matrise douvrage, responsable du rfrentiel et des politiques de gestion de son volution. Daprs Pascal Anthoine, directeur conseil chez Micropole-Univers, le budget des projets MDM nest pas si dissuasif si on le compare aux gains aussi bien en termes de qualit de donne que doptimisation des processus. Avec le recul sur la vingtaine de projets MDM mens chez MicropoleUnivers, le budget moyen tourne plus autour des 300 400 k que du million deuros, comme ont pu lannoncer certains acteurs . Les projets de MDM ont des impacts majeurs en termes doutils, dapplication, dorganisation et de processus. Il sagit donc de projet long terme dont les bnfices, stratgiques pour lentreprise, ne sont accessibles quaprs une longue traverse du dsert.

Page 51 sur 59 Mai 2010 Livre blanc

Perspectives et tendances
Nous entrons dans une nouvelle dcennie et sept nouvelles tendances se dgagent autour du nouveau monde du MDM : 1. Les clients ne veulent plus dapplications horizontales (progiciel conu pour tre utilis par diffrents types dorganisation). Le MDM doit sadapter aux exigences spcifiques des industries. Les rsultats doivent tre pertinents la faon dont une industrie fonctionne. 2. Les clients souhaitent avoir des outils pour lier des hirarchies et des relations sur les donnes non structures afin de connatre la valeur de l'information. 3. Lutilisation des modles Cloud Computing et SaaS vont imposer les approches hybrides. Les systmes MDM doivent prendre en charge les modles hybrides en temps rel. L'intgration des donnes doit tre pilote par les vnements. 4. La manire de manager les donnes de rfrence na pas dimportance, seuls les rsultats comptent. Les utilisateurs de BI recherchent des rsultats et des pistes de rflexion. 5. La gouvernance et la gestion des donnes deviennent les points les plus importants du MDM. 6. Il est ncessaire de crer une relation de confiance, de devenir un partenaire, un vrai, plutt qu'un fournisseur froid et distant, si l'on souhaite justement gagner la fameuse confiance tant recherche des consommateurs. Les organisations ont besoin de comprendre aussi bien leur dfenseur que leur dtracteur. Dans un monde social et interconnect, il est ncessaire davoir un marketing, des ventes et un support plus cibls. 7. Le MDM va devoir couvrir plus de types de donnes. De nouvelles formes de contenu entreront bientt dans l'quation (images, vidos, flux, tweet). IBM Research a annonc en janvier 2008 le lancement du projet Semantic Master Data Management (SMDM) qui vise utiliser les technologies Web smantique pour outiller l'interrogation et l'analyse smantique de donnes de rfrence. Cette technologie vise terme amliorer l'utilisation des donnes de rfrence en se greffant aux solutions MDM existantes. Le projet SMDM a fait le choix de grer des ontologies enrichies partir du modle de donnes logique dune solution MDM. Pour mmoire, lontologie est un concept fondamental du Web smantique, pouvant tre dfinie comme la spcification explicite dune conceptualisation partage. Il sagit donc dune structure cl pour la reprsentation des connaissances. Les donnes matres sont reprsentes sous formes dinstances dontologies de la forme <sujet, prdicat, objet>, similaires au langage naturel et aisment interprtables. Aprs la mise en place de lentrept dontologies, celle des moteurs de recherche associs : le langage de requte SPARQL permet linterrogation de ces donnes, les requtes tant intuitivement construites sans quil ne soit ncessaire davoir connaissance du modle de donnes sous-jacent. Lutilisation dontologies permet galement la dcouverte dinformations implicites par le biais du raisonnement ontologique : dcouvertes de nouvelles relations, classification automatique, mise en relation automatique, catgorisation la vole. Les solutions MDM et de gestion de contenu actuelles maintiennent elles-mmes leurs propres mtadonnes, et de ce fait lentreprise reste tributaire des choix (trop souvent propritaires) effectus par chaque diteur. Ces silos de mtadonnes sont un obstacle pour lentreprise l'accs une comprhension globale et transverse de ses donnes stratgiques, structures ou non structures.

Page 52 sur 59 Mai 2010 Livre blanc

Par la construction dun socle smantique utilisant les standards W3C au dessus de ses entrepts de donnes, lentreprise se dote des moyens lui offrant de nouveaux usages pour lexploitation des contenus mtiers, par la capacit valoriser lensemble de ses donnes stratgiques en vritables informations. Alors que la smantique permet la comprhension, la dduction automatique et l'interrogation intelligente des donnes, les standards smantiques ajoutent linteroprabilit interapplicative : les outils danalyse ont accs toujours plus de contenu intelligible ; les rgles mtiers peuvent saffiner et perfectionner la gouvernance des donnes, la dduction automatique permet la mise en relation de donnes toujours plus htrognes, et linterrogation sur ces donnes devient plus pertinente, offrant ainsi une meilleure matrise des actifs informationnels de lentreprise.

Page 53 sur 59 Mai 2010 Livre blanc

Conclusion
De nos jours, la business intelligence volue sans cesse, ce qui ncessite une attention toute particulire pour se tenir inform des dernires tendances. De plus, la BI est un domaine o les enjeux sont considrables et pour lequel il est trs important danticiper sur lavenir. Nous avons donc veill sur diffrents axes technologiques et avons tent de pressentir ce qui pourrait tre les futures tendances dans le monde du dcisionnel. Deux axes ont particulirement retenu notre attention, le Master Data Management et les nouveaux mdias de restitution, et ce pour diverses raisons. Le march du MDM est aujourdhui en pleine expansion et la qualit des donnes est un lment primordial en BI. Cest pourquoi le MDM est le premier axe sur lequel nous pourrions investir. Viennent ensuite les mdias de restitution qui continuent voluer. Il serait bnfique dinvestir dans ce domaine car des mdias de restitution originaux et performants peuvent tre des atouts de poids pour conqurir de nouveaux clients.

Page 54 sur 59 Mai 2010 Livre blanc

Sources
Les ETL
http://grim.developpez.com/articles/concepts/etl/ http://www.decideo.fr/ http://www.journaldunet.com/solutions/0702/070221-panorama-etl/1.shtml

Les nouveaux modes de stockage


In memory
http://en.wikipedia.org/wiki/Flash_memory

Qlikview
http://www.pvirgule.fr/contenu-communique/3202/429/uk?pv=3a9ea1715e1dd24a6f96a302086d1fd6 http://www.qlikview.com/fr/explore/products/in-memory-advantage http://www.decideo.fr/Edition-2010-du-barometre-Decideo-QlikView-remporte-le-Decideo-d-Or_a3527.html

SAP
http://www.sap.com/france/solutions/index.epx http://searchbusinessanalytics.techtarget.com/news/1507060/In-memory-technology-promises-faster-more-flexible-BIand-data-analysis

http://www.lemagit.fr/article/serveurs-lames-sap-decisionnel-oracle-sybase-sgbd-infotel-erp-dram-lamesbydesign-snabe-business-suite-in-memory-plattner-blade/5221/1/in-memory-comment-sap-compteringardiser-les-bases-donnees-surtout-marginaliser-oracle/

La business intelligence en mode SaaS


Rapport du cabinet Hurwitz & Associates-The

TCO Advantages of SaaS-Based Budgeting, Forecasting &

Reporting-2010
Rapport du Gartner - Business Intelligence as a Service: Findings and Recommendations - 2009 Rapport du Gartner - Hype Cycle for Software as a Service - 2009 Rapport du Gartner - Key Issues for Software as a Service - 2010 http://www.channelnews.fr/expertises/tendances/6479-leconomie-du-saas-gagne-en-densite-et-en-maturite-.html

March et acteurs Les diteurs et leurs solutions


http://www.legrandbi.com/2009/03/bi-saas-controverse-sur-l%E2%80%99opportunite-du-modele/ http://www.legrandbi.com/2010/02/sap-relance-saas-businessobjects/

Les cibles
http://biguru.wordpress.com/2008/03/13/saas-bi-software-as-a-service-model-in-business-intelligence/ http://searchbusinessanalytics.techtarget.com/news/1506987/SaaS-BI-and-data-warehousing-finally-stepping-out-of-theshadows http://searchbusinessanalytics.techtarget.com/news/1506980/SAP-unveils-SaaS-business-intelligence-suite-for-the-rest-ofus

Page 55 sur 59 Mai 2010 Livre blanc

Changements apports par le Saas Pour les diteurs/intgrateurs


http://www.legrandbi.com/2009/03/bi-saas-controverse-sur-l%E2%80%99opportunite-du-modele/

Pour les clients


http://www.computerworld.com/s/article/9142307/SaaS_BI_vendor_Oco_aims_to_help_enterprise_IT_be_tactical http://applicationdevelopment.searchoracle.com/document;5143880/oracle-research.htm http://www.itworld.com/saas/62953/gartner-dont-assume-saas-cheaper http://www.b-eye-network.com/view/13726

Stockage de donnes et scurit


http://www.decideo.fr/Le-point-sur-les-offres-dites-SaaS-Software-as-a-Service-,-ASP-Application-Services-Provider-ouOnDemand_a3184.html

La business intelligence mobile


Debra Logan, Bill Hostmann, Enterprise Information Management: A Requirement for Enterprise-Scale Business Intelligence and Performance Management Initiatives, Gartner, 2009

Acteurs
http://www.bee--eye.com/ http://www-01.ibm.com/software/data/cognos/products/cognos-8-go/mobile/features-and-benefits.html? http://www.novediagroup.com/ http://www.pentaho.com/launch/iPhone/ http://www.prelytis.com/ http://www.qlikview.com/ http://regard-solutions.blogspot.com/ http://www.roambi.com/ http://www.sap.com/solutions/sapbusinessobjects/business-intelligence/informationinfrastructure/enterprise/mobile/index.epx http://www.webalo.com/

March des smartphones


http://www.canalys.com/pr/2010/r2010021.html http://france.blog.nimbuzz.com/2009/10/16/les-mobiles-sous-android-plus-repandus-que-les-iphone-dici-a-2012-maissymbian-toujours-en-tete/#more-540

Scurit
http://www.decideo.fr/CINQ-MESURES-CLES-POUR-PROTEGER-LES-DONNEES-DECISIONNELLES-CONSULTABLES-SUR-LESTERMINAUX-MOBILES_a3291.html http://www.indexel.net/securite/smartphones-cinq-regles-de-securite-a-respecter.html

Apports de la mobilit
http://www.usinenouvelle.com/article/l-avenement-du-decisionnel-mobile.N127147 http://www.idexen.com/blog/cognos-8-go-mobile-est-disponible-sous-windows-mobile/

Page 56 sur 59 Mai 2010 Livre blanc

Les moteurs de recherche


Introduction
Article Wikipedia sur les moteurs de recherche. http://fr.wikipedia.org/wiki/Moteur_de_recherche

Limportance du moteur de recherche


Source : 12 moteurs de recherche dentreprise compars par Denis Lafont, responsable du ple de comptences Enterprise Search de Capgemini. http://www.eweekeurope.fr/produit/comparatif-12-moteurs-de-recherche-d-entreprise-au-crible745

Le march et les acteurs


Deux pages PDF sur lentreprise Sinequa. http://www.evalir.com/resources/sinequa-connect-to-Knowledge.pdf

Les technologies du web smantique


Les informations non-structures. http://benhur.teluq.uqam.ca/SPIP/inf6104/article.php3?id_article=17&id_rubrique=4&sem=2 Certains articles du blog http://nicolas.cynober.fr/, co-fondateur de pearltrees. Lien vers le pearltrees Web smantique : http://www.pearltrees.com/#/N-u=1_2&N-f=1_18&N-s=1_18&N-p=82&N-play=0 http://websemantique.org/ http://wiki.dbpedia.org/ PDF du Gartner Hype Cycle for Enterprise Information Management, 2009 page 8 Ple innovation dExalead. http://fr.exalead.com/software/company/innovation/ Page dactualits de Sinequa. http://www.sinequa.com/fr/news,l-enterprise-search-devient-une-application-decisive-avecla-sortie-de-la-version-7-0-de-sinequa-enterprise-search,188.html Une interview de Fabrice Lacoix, prsident dAntidot. http://www.clubic.com/actualite-79037-fabrice-lacroix-antidot-websemantique.html Blog de lditeur Antidot. http://blog.antidot.net/tag/web-semantique/

Le futur des moteurs de recherche


Enterprise Search Bus. http://jean-ferre-blog.blogspot.com/2010/02/enteprise-search-bus-intelligent.html Produits Exalead On Demand. http://www.exalead.com/software/products/on-demand/

Les mdias de restitution


Indexation
http://www.photogestion.com/manuel/indexation_image.html http://www.educnet.education.fr/dossier/metadata/metadonnees

IMEDIA
http://www.inria.fr/recherche/equipes/imedia.fr.html

CQBI
http://wwwqbic.almaden.ibm.com/ http://spiedl.aip.org/getabs/servlet/GetabsServlet?prog=normal&id=PSISDG001908000001000173000001&idtype=cvips&g ifs=yes&ref=no

Gaudi
http://www.clubic.com/actualite-164322-google-audio-indexing.html

Page 57 sur 59 Mai 2010 Livre blanc

http://labs.google.com/gaudi

Aigle
http://www.business-geografic.com/company/ Business Geographic sur Iphone : http://www.directionsmag.com/press.releases/?duty=Show&id=48984

Exalead
Exalead devient partenaire de Micropole-Univers : http://www.cfo-news.com/Exalead-devient-partenaire-de-Micropole-Univers_a14387.html

Quaero
http://www.quaero.org/media/files/presse/fr-brochure-all.pdf

LTU
http://www.ltutech.com/fr/press-articles/ltu-lance-une-api-de-recherche-visuelle http://www.ltutech.com/fr/technology/matching-de-videos http://www.publi-news.fr/data/28042010/28042010-093715.html http://www.itchannel.info/articles/104150/ltu-lance-api-recherche-visuelle.html?key=ca3f96286fb5f4d3 http://www.lookthatup.com/

Chromatic
http://www.batiproduitsmaison.com/bpm/FicheProdRecherche2.do?id=1475385958

Autonomy
http://www.autonomy.com/

Google Location Services


http://fr.www.mozilla.com/fr/firefox/geolocation/#geo-demo

NewPhenix
http://societe.journaldunet.com/fiche/chiffre_cle/24964/newphenix.shtml

MDM
Site dinformations et dactualits sur la Business Intelligence
http://www.decideo.fr/Des-solutions-de-gestion-des-donnees-de-reference-MDM_a3293.html http://www.decideo.fr/2010-l-annee-du-Master-Data-Management_a3592.html http://www.decideo.fr/Gerer-le-Referentiel-Metier-dans-l-Entrepot-de-Donnees_a2853.html http://www.legrandbi.com/2010/01/informatica-siperian-mdm/ http://www.piloter.org/business-intelligence/projet-mdm.htm

Site dactualits gnrale et business


http://pro.01net.com/ http://www.journaldunet.com/solutions/acteurs/strategie-mdm-de-talend.shtml

Site dditeur ou de cabinet de conseil


Page 58 sur 59 Mai 2010 Livre blanc

http://www.gartner.com/technology/media-products/reprints/oracle/article78/article78.html http://www.dataflux.com/dfblog/?p=2032 http://www.dataflux.com/dfblog/?tag=master-data-management http://www.teradata.com/master-data-management http://www.cxp.fr/domaine-expertise_mdm.htm http://www.informationdifference.com/mdm_landscape.html

Blog business et MDM


http://nourdinebouaghaz.blogspot.com/2010/02/une-image-vaut-mieux-que-mille-discours_09.html http://nourdinebouaghaz.blogspot.com/2010/02/ibm-degaine-son-tour-et-s-initiate_07.html http://nourdinebouaghaz.wordpress.com/2010/03/07/mais-au-fait-le-mdm-cest-quoi/ http://nourdinebouaghaz.blogspot.com/2009/12/reflexion-mdm-les-entreprises-sont_3583.html http://nourdinebouaghaz.blogspot.com/2010/04/le-chaos-ruineux-de-la-non-qualite-des.html http://blog.homsys.com/tag/mdm http://architecturedinformation.blogspot.com/2010/03/mdm-les-approches.html http://architecturedinformation.blogspot.com/2010/03/master-data-management.html http://blogs.forrester.com/business_process/2010/01/introducing-the-mdm-markets-newest-800lb-gorilla-informaticaacquires-siperian.html http://blog.homsys.com/tag/mdm http://www.masterdatamanagement.fr/master-data-management http://oliviermathurin.blogspot.com/2008/07/perspectives-mdm-et-technologies-web.html

Livre blanc et livre


SearchDataManagement.coms Master Data Management Platform Directory 2009 Edition La gestion des donnes de rfrence avec TIBCO Collaborative Information Manager La gestion des donnes de rfrence ou comment exploiter toutes vos informations (IBM) Master Data Management and Data Quality Datactics White Paper Les nouveaux tableaux de bord des managers Alain Fernandez

Page 59 sur 59 Mai 2010 Livre blanc