Académique Documents
Professionnel Documents
Culture Documents
Visualisation avance
Sommaire
2 Introduction 3 Visualiser le Big data pour obtenir une image globale 4 Des donnes client simples 5 Ajouter le facteur temps lquation client 7 Comprendre le ressenti du client 8 Comprendre les relations des clients 9 Comprendre les clients diffrents niveaux de dtail 12 Dompter la complexit du Big data avec IBM 14 Conclusion 14 A propos de lauteur
Introduction
Des tudes ont montr que la mmoire court-terme humaine est capable de retenir 3 7 lments simultanment, autrement dit lHomme peut uniquement jongler avec quelques lments puis commence les oublier. La visualisation consiste crer des codages de donnes en canaux visuels visibles et comprhensibles par lHomme. Ce processus externalise les donnes et permet ltre humain de penser et de manipuler les donnes un niveau suprieur. Cette externalisation lui permet de rflchir de manire plus complexe sur des volumes dinformations plus importants que ce quil pourrait faire normalement. 1 La visualisation exploite la vision humaine de manire fournir une mthode daffichage et de prsentation des donnes intuitive, immdiate et indpendante des langues. Il sagit dun outil essentiel pour comprendre les informations. La vision humaine est la voie dacheminement dinformations jusquau cerveau de loin la plus riche, la plus immdiate et la plus performante. La part de capacit crbrale consacre au traitement des informations visuelles est largement suprieure celle consacre aux autres sens. Daprs certains scientifiques, la vision humaine est capable de traiter environ 9 mgabits dinformations par seconde, soit prs dun 1 million de lettres de texte par seconde.
Business Analytics
Au cours des dernires dcennies, les recherches sur la visualisation ont mis en vidence diverses techniques de visualisation efficaces qui vont bien au-del des diagrammes classiques circulaire, barres, courbes omniprsents dans les tableurs et les tableaux de bord. Ces techniques sont particulirement utiles lheure o la plupart des entreprises sont confrontes au Big data. En effet, la majorit dentre elles sefforcent de rendre comprhensibles les rsultats de diverses sources de donnes communications RFID, texte des mdia sociaux, enqutes clients, vido en streaming, etc. ainsi que les donnes acquises sur de trs longues priodes. Le rapport de lIBM Institute for Business Value sur le Big data, pour lequel IBM a enqut auprs de plus de 1100 professionnels de lentreprise et de linformatique, a rvl que moins de 26 % des personnes interroges qui taient activement impliques dans le Big data pouvaient analyser des donnes extrmement dstructures telles que la voix et la vido, et seules 35 % pouvaient analyser les donnes en streaming. 2 La visualisation joue un rle cl en permettant la comprhension de ces analyses de donnes complexes et la communication des fragments dinformations analytiques essentiels des collaborateurs de lentreprise moins verss dans lanalytique. La capacit danalyser le Big data est un rel avantage pour les entreprises. Dans cette mme enqute IBM, 63 % des personnes interroges ont dclar que, selon elles, la comprhension et lexploitation efficaces du Big data pouvaient crer un avantage concurrentiel pour leur entreprise. 3 Lanalyse du Big data peut en effet aider les entreprises amliorer la prise de dcision, crer une vue 360 degrs de leurs clients, amliorer la scurit et la surveillance, analyser les oprations et augmenter la cration dentrepts de donnes. La visualisation peut jouer un rle crucial en tirant parti du Big data pour obtenir une vue complte de votre client. Dcouvrez comment dans ce document.
Ces techniques peuvent tre typiquement utilises pour prsenter 4 8 catgories dans un diagramme unique ; toutefois, pour de nombreux scnarios de Big data, le nombre de mesures (colonnes dans un tableur) peut se compter en milliers. Dans ces cas-l, il nexiste aucune technique de visualisation unique adapte la communication des donnes brutes. Une technique de rduction analytique ou dimensionnelle doit tre pralablement applique aux donnes avant de tenter la visualisation. De nombreuses techniques de rduction des donnes sont disponibles et peuvent tre appliques, y compris la segmentation, le groupement, la rgression linaire, etc. Lide est de trouver un modle mathmatique qui rduise la complexit des donnes, soit le nombre de dimensions soit le nombre de points de donnes, tout en continuant capturer les caractristiques essentielles des donnes.
Figure 1: Diagramme barres illustrant une mesure unique pour plusieurs catgories de vente.
Business Analytics
Le diagramme en toile (Figure 2) est souvent un bon choix pour prsenter rgulirement des donnes cycliques comme des donnes journalires sur une semaine, ou des donnes mensuelles sur un an. Toutefois, il faut tre prudent avec les donnes horaires car elles peuvent perturber les personnes habitues au cycle dhorloge de 12 heures.
Figure 2 : Diagramme en toile qui illustre des cycles hebdomadaires de donnes de vente organiss de manire circulaire.
Le calendrier constitue galement une mtaphore efficace et bien connue de la reprsentation du temps.Une visualisation efficace est la carte thermique avec chelle de couleurs pour attribuer une valeur aux jours calendaires (Figure 3).
On obtient une reprsentation visuelle intuitive trs compacte, qui communique les modles hebdomadaires et mensuelles efficacement, que ce soit pour quelques mois ou pour de nombreuses annes de donnes.
Figure 3 : Exemple de carte thermique calendaire qui illustre deux ans dvolution (en pourcentages) des commandes clients sur le Web par an (range), mois (colonne), jour de la semaine (sous-range), semaine (sous-colonne) et jour.
Business Analytics
Si lon compare la carte thermique calendaire un diagramme courbes (Figure 4) qui contient les mmes informations, on peut se rendre compte de lefficacit de la carte thermique.
Figure 4 : Diagramme des donnes illustres sur la Carte thermique calendaire de la Figure 3.
Figure 5: Visualisation de type rivire illustrant la frquence dutilisation au cours du temps de phrases lies aux plateformes de jeu.
non seulement les clients eux-mmes mais aussi leurs rseaux de relations amicales et familiales associs. Ces types de relations sont trs difficiles comprendre au format texte ou tableau ; toutefois, le recours la visualisation (Figure 6) peut faire apparatre les tendances et modles de rseau mergents.
Figure 6 : La visualisation dun rseau social peut reprsenter des modles de ressenti client, les inuenceurs cls et leur porte.
Business Analytics
Les hirarchies sont trs rpandues dans lanalyse de donnes ; elles doivent toutefois tre utilises avec prudence, en particulier avec le Big data, car le mcanisme de regroupement peut parfois masquer des dtails importants des niveaux infrieurs. Une mthode classique pour permettre la comprhension dinformations diffrents niveaux de dtail hirarchique est de prsenter les niveaux individuels dans une srie de rapports onglets, chaque rapport prsentant une section unique de la hirarchie (par exemple, tous les produits lis au tennis). La visualisation en hirarchies offre une comprhension plus complte des informations car elle prsente des niveaux multiples de la hirarchie simultanment. Il existe un large ventail de techniques de visualisation pour les hirarchies ; lexemple ci-dessous (Figure 7) illustre une approche assez directe o chaque entit de la hirarchie est reprsente par un noeud sur le diagramme. La taille et la couleur indiquent les diverses proprits des noeuds, et les lignes entre les noeuds indiquent la relation hirarchique.
Figure 7 : Visualisation de la hirarchie des donnes qui indique le nombre de rponses aux campagnes cibles au niveau rgional, dpartemental et municipal. Chaque niveau est reprsent par une ou plusieurs bulles.
10
Sur la Figure 7, la taille des bulles indique le nombre de rponses aux campagnes, et la couleur indique une autre mesure, par exemple une volution par rapport lanne prcdente. Rouge correspond faible, blanc neutre et bleu lev. Du fait de leur structure ramifie, les hirarchies sont souvent dsignes comme des arborescences au sein de la communaut des chercheurs en visualisation. Une autre mthode trs performante et efficace de visualisation des hirarchies est le treemap, dans lequel le rectangle extrieur reprsente la somme totale pour lensemble de la hirarchie et est sous-divis de manire rcursive en fonctions des divisions de la hirarchie.
La taille de chaque sous-rectangle peut reprsenter une mesure alors que la couleur est souvent utilise pour reprsenter une autre mesure des donnes. La Figure 8 illustre un treemap dun ensemble de choix de titres musicaux et vidos proposs en streaming par une communaut de rseau social et qui pourrait tre utile un service mdia pour la conception doffres personnalises de titres audio et vido tlcharger. La couleur reprsente les genres des titres slectionns, chaque genre tant sous-divis en rectangles, chaque rectangle correspondant un artiste. La taille du rectangle pour le genre et lartiste reprsente le nombre de titres disponibles dans cette catgorie.
Figure 8 : Treemap de slections de titres dun rseau social partir dun service de media en streaming.
Business Analytics
11
La communaut des chercheurs a explor des centaines de mthodes de visualisation par arborescences, nombreuses dentre elles parfaitement adaptes des types spcifiques darborescence comme le squenage du gnome, les grands
schmas sociaux et les tournois sportifs. Certaines de ces mthodes de visualisation par arborescence sont capables de reprsenter des centaines ou des milliers de donnes voire des millions dentits organises en une structure hirarchique.
Quel volume de Big data peut-on visualiser directement ? La question se pose souvent de savoir quel volume de Big data il est possible de visualiser et de comprendre directement par des techniques de visualisation. La rponse dpend essentiellement du type de donnes visualises, et des questions et rponses que lutilisateur veut dvelopper. Toutefois, dans la plupart des cas, la visualisation directe des sources de Big data nest pas possible ou pas efcace. La visualisation des donnes volumineuses fonctionne mieux avec les techniques danalyse, cest la raison pour laquelle un domaine de recherche a t cr spciquement : lanalyse visuelle. Toutefois, il est utile de dterminer le volume de donnes qui peut tre visualis directement de manire efcace. La rponse dpend dun certain nombre de facteurs : lchelle et la structure des donnes, la dimension du dispositif dafchage, lvolutivit des calculs,les besoins de collaboration et de partage et lvolutivit de la prsentation visuelle. Voici quelques rgles gnrales concernant le volume dlments de donnes qui peuvent tre reprsentes efcacement grce certaines techniques de visualisation classiques : Diagramme circulaire : 3 10 Diagramme barres : moins de 50 Diagramme courbes : moins de 500 Trac de bulles : moins de 500 Nuage de points : moins de 10 000 Des techniques de visualisation plus avances peuvent reprsenter un plus grand nombre dlments. Ces styles avancs peuvent permettre de reprsenter entre 3 et 6 ordres de grandeur (1000 1 000 000 lments) de visualisation directe de donnes, et environ 9 ordres de grandeur (1 000 000 000) pour les cas trs spciaux. Bien que la visualisation puisse offrir une rduction dchelle considrable, ce ne peut tre quune partie de la solution si lobjectif est de traiter un traoctet (12 ordres de grandeur) ou un ptaoctet (15 ordres) de Big data. Lanalyse joue un rle cl en contribuant rduire la taille et la complexit du Big data jusqu un point o les donnes peuvent tre visualises et comprises efcacement. Dans le meilleur scnario, la visualisation et lanalyse sont intgres de manire fonctionner ensemble sans problme.
12
Les produits IBM tels quIBM InfoSphere BigInsights et IBM SPSS Analytic Catalyst, utilisent des bibliothques de visualisation et le RAVE pour permettre des visualisations interactives qui peuvent vous aider mieux comprendre votre Big data. InfoSphere BigInsights est un logiciel qui aide les entreprises dcouvrir et analyser les informations mtiers dissimules dans le Big data, et cette solution inclut des visualisations pour simplifier lanalyse des donnes. SPSS Analytic Catalyst automatise la prparation du Big data, choisit les procdures danalyse appropries et peut afficher les rsultats sous la forme de visualisations interactives.
Visualisation extensible
IBM est conscient que lanalyse du Big data contribue significativement lavantage concurrentiel et que la visualisation en est un lment cl, cest la raison pour laquelle lentreprise a dot ses solutions danalyse mtier de capacits de visualisation. Le composant indispensable de ces solutions est le moteur RAVE (Rapidly Adaptive Visualization Engine) dIBM. Le RAVE est de plus en plus utilis comme le standard pour les capacits de visualisation IBM car il permet le dveloppement rapide de types de visualisations classiques et nouvelles. Linterprtation du Big data tant encore un concept mergent et les mthodes pour le comprendre tant encore en cours de dveloppement, la capacit du RAVE crer de nouveaux types de diagrammes qui ne sont pas encore connus est particulirement intressante.
Le Big data nen tant qu ses prmices, les nouveaux types de visualisation qui vous permettent de ragir quand vous en avez besoin, vous aident faire face aux enjeux du Big data. De plus en plus de solutions danalyse mtier IBM, y compris la solution IBM Cognos Business Intelligence, utilisent de nouvelles capacits de visualisation extensible. La visualisation extensible permet aux utilisateurs de tlcharger de nouvelles visualisations partir dune bibliothque constamment enrichie sur IBM Analytics Zone suivant leurs besoins. Laccs cet ensemble de visualisations en perptuelle volution libre les utilisateurs mtier et les auteurs de rapport des contraintes dune bibliothque prescrite de visualisations des produits et permet dutiliser des visualisations nouvellement dveloppes avec le Big data.
Business Analytics
13
La visualisation par diagramme en cordes (Figure 9) est un exemple de ce que peut gnrer la visualisation extensible. Il sagit dune manire lgante et compacte de prsenter des rseaux de relations entre des lments tels que des produits, des individus ou des groupes. La largeur de chaque corde indique le volume de trafic entre les groupes situs autour de la circonfrence. La couleur des cordes et des groupes peut
galement permettre de communiquer des informations supplmentaires. Cet exemple particulier met en relation des types de demandes de support client, indiques du ct droit du cercle, avec le groupe de support de lentreprise qui traite la demande, qui est reprsent du ct gauche du cercle. Cette visualisation unique peut reprsenter une quantit considrable dchanges clients sur une priode dun an minimum.
Figure 9 : Une visualisation en diagramme cordes cre avec la technologie de visualisation extensible.
14
Conclusion
La visualisation est un outil essentiel pour comprendre les informations et rvler des informations caches dans vos donnes, y compris votre Big data. La comprhension du Big data vous permet daccomplir un certain nombre de choses qui peuvent aider votre entreprise, par exemple crer une vue complte de vos clients. De nouvelles mthodes de visualisation parfaitement adaptes aux besoins spcifiques du Big data sont disponibles dans de nombreux domaines tels que lanalyse des mdia sociaux, lanalyse gospatiale et lanalyse du ressenti ou du texte. Ces nouvelles mthodes vont bien au-del des tableaux et diagrammes barres ou lignes traditionnels. Elles incluent des diagrammes en toile, des diagrammes cordes, des cartes thermiques calendaires, etc. La technologie IBM, par exemple la solution RAVE et les capacits de visualisation extensible, peuvent vous aider crer et utiliser des visualisations efficaces qui vous permettent de mieux comprendre votre Big data.
Pour en savoir plus sur la visualisation extensible et pour voir les visualisations extensibles actuellement disponibles chez IBM, rendez-vous sur Extensible Visualization Community dans Analytics Zone: analyticszone.com/visualization
A propos de lauteur
T. Alan Keahey joue un rle prpondrant dans la recherche et le dveloppement de systmes de visualisation dinformations hautement innovants depuis prs de 20 ans. Son exprience couvre une vaste gamme denvironnements ; il a t notamment chercheur dans des laboratoires nationaux, directeur de recherche dune entit propre de Lucent Bell Labs et fondateur de sa propre entreprise de recherche et dveloppement en visualisation. Il sefforce de relier les capacits cres dans les environnements de recherche et les besoins des clients professionnels du monde rel. Alan occupe actuellement le poste de Visualization Science and Systems Expert lIBM Business Analytics Office du CTO. Blog : http://www.HolisticSofa.com LinkedIn : http://www.linkedin.com/in/truviz/
Business Analytics
15
Compagnie IBM France 17 Avenue de lEurope 92 275 Bois-Colombes Cedex La page daccueil dIBM est accessible ladresse suivante : ibm.com IBM, le logo IBM logo, ibm.com, BigInsights, Cognos, InfoSphere, et SPSS sont des marques dInternational Business Machines Corp., dposes dans de nombreuses juridictions rparties dans le monde entier. Les autres noms de produits et de services peuvent tre des marques dIBM ou dautres socits. Une liste actualise de toutes les marques dIBM est disponible sur la page Web Copyright and trademark information ladresse suivante : ibm.com/legal/copytrade.shtml Le prsent document contient des informations qui taient en vigueur et valides la date de la premire publication et qui peuvent tre modifies par IBM tout moment. Toutes les offres mentionnes ne sont pas distribues dans tous les pays o IBM exerce son activit. LES INFORMATIONS DU PRSENT DOCUMENT SONT FOURNIES EN LTAT ET SANS GARANTIE EXPLICITE OU IMPLICITE DAUCUNE SORTE. IBM DCLINE NOTAMMENT TOUTE RESPONSABILIT RELATIVE CES INFORMATIONS EN CAS DE CONTREFAON AINSI QUEN CAS DE DFAUT DAPTITUDE LEXCUTION DUN TRAVAIL DONN. Les produits IBM sont garantis conformment aux dispositions des contrats au titre desquels ils sont fournis.
1 2
Donald A. Norman, The Design of Everyday Things. New York: 2002. Analytics: The real-world use of big data. IBM Institute for Business Value, en collaboration avec la Said Business School de lUniversit dOxford. 2012. http://public.dhe.ibm.com/common/ssi/ecm/en/ gbe03519usen/GBE03519USEN.PDF
Analytics: The real-world use of big data. Copyright IBM Corporation 2013 Pensez recycler ce document
YTW03349-FRFR-00