Vous êtes sur la page 1sur 18

Optimisation de la qualit des donnes dans lentreprise

Comment sattaquer aux informations de mauvaise qualit

Un livre blanc
Vincent Lam

Information Builders

Vincent Lam

Vincent Lam est Directeur Marketing Poduits en charge de loffre dintgration iWay. Monsieur Lam a une grande expertise dans le secteur des technologies de linformation. Il a aid au positionnement de loffre iWay dans un march trs concurrentiel. Plus tt dans sa carrire au sein dInformation Builders, Vincent Lam tait responsable des produits stratgiques. Il a ainsi lanc de nouveaux produits trs innovants sur le march comme WebFOCUS Magnify, la premire solution dEnterprise Search transactionnelle en temps rel au monde. Vincent Lam possde un diplme scientifique de lUniversit de Cornell situe dans lIthaca, dans lEtat de New York.

Table des matires


1

Introduction Comment amliorer la qualit des donnes


Profilage Nettoyage, standardisation, enrichissement, rapprochement et fusion Scoring Extensibilit et souplesse pour les donnes personnalises

2 2 3 6 6

7 7 7 8

La gestion de la qualit des donnes dun bout lautre de leur cycle de vie
En amont En cours dexploitation En aval

9 9 9

Une exploitation efficace de la qualit des donnes


Garantir la qualit des donnes provenant de sources extrieures Pourquoi le contrle de la qualit des donnes en temps rel est crucial

10 10 11

iWay: Une gestion de la qualit des donnes ingale lchelle de lentreprise


iWay Data Quality Center iWay Data Profiler

13

Une partie essentielle de toute stratgie de gestion des informations Conclusion

14

Introduction
Pour de nombreuses entreprises aujourdhui, la qualit des donnes (la mesure de lexactitude, de lintgralit et de la cohrence des donnes au sein dun mtier) est devenue le cur de la gestion des informations. Des problmes de qualit de donnes se posent aux entreprises de tous types et de toutes tailles. Des tudes indiquent quau moins 75% des grandes entreprises sont confrontes des problmes importants en raison de donnes incorrectes. Une tude de SiriusDecisions prtend que, mme dans des socits qui ont optimis leurs processus, environ 10 % de leurs donnes importantes relatives aux clients et prospects sont errones. Cest le cas, par exemple, de donnes dmographiques incorrectes ou primes. Dans les entreprises qui nont pas mis en place de stratgies de gestion des donnes, ce pourcentage peut atteindre 25 %.1 Ces problmes de qualit des donnes peuvent avoir diffrentes origines. Dans un pass pas si lointain, cest par la saisie des donnes manuelle, sujette aux erreurs, que les informations se sont introduites pour une grande part dans lenvironnement de lentreprise. Toutefois, de nouvelles source d informations, comme les portails Web et les interactions B2B avec les prestataires et les partenaires, sont en train de rendre plus complexe lenvironnement des donnes de lentreprise. Ces diverses sources fournissent en temps rel des informations qui sont plus labores et confrent une valeur plus importante au mtier. En revanche, parvenir une qualit de donnes au sein de lentreprise devient plus difficile raliser. Il faut un pare-feu de qualit des donnes en temps rel pour prserver lintgrit des informations. De plus, des informations comme des dtails sur les clients, peuvent tre stockes dans de multiples sources au sein de lentreprise telles que les applications CRM ou les systmes de comptabilit. Les informations peuvent tre mises jour dans lune mais demeurer inchanges dans lautre, ce qui cre des incohrences et conduit de multiples versions de la vrit. En outre, les donnes peuvent savrer difficiles rcuprer. Limpossibilit pour les utilisateurs de localiser et daccder aux informations dont ils ont besoin pour accomplir leurs mtiers ou pour prendre des dcisions en temps rel peut rduire de faon significative la valeur des donnes dentreprise. Une simple erreur peut impacter les donnes au sein de tout les processus mtier et avoir un effet dvastateur. Des tudes de march montrent que les problmes de qualit des donnes des clients cotent au moins 611 milliards de dollars par an aux entreprises. Dans son ouvrage, Data Driven: Profiting From Your Most Important Business Asset 2 , Thomas C. Redman prtend que, mme si les entreprises sont 99 %, plutt satisfaites de lexactitude de leurs donnes ce simple pourcentage derreurs peut savrer dsastreux. Il cite lexemple dune commande faite par un client portant sur une douzaine de critres. Si la saisie dune centaine de commandes comportant douze critres chacune se droule parfaitement, cela cote 100 dollars lentreprise, soit un dollar par commande. En tenant compte dun taux derreur de 1%, douze commandes seront traites incorrectement. Les cots induits seront plus que doubls. Dans le prsent document, nous allons passer en revue quelques techniques que les entreprises peuvent utiliser pour amliorer la qualit de leurs donnes. Nous insisterons sur les solutions de la gamme iWay portant sur la gestion de la qualit des donnes. Elles permettent aux mtiers damliorer, avec efficacit et de manire rentable, lexactitude, lexhaustivit et la cohrence des informations dans chacun des systmes, sans exception, au sein de leur propre infrastructure.

1 The Impact of Bad Data on Demand Creation, SiriusDecisions, 2008. 2 Redman, Thomas C., Data Driven: Profiting From Your Most Important Business Asset, 2008.

Information Builders

Comment amliorer la qualit des donnes

La cl pour garantir un niveau de qualit optimal des donnes, tous les niveaux de lentreprise et quelle quen soit la source, rside dans lautomatisation de processus. Les mthodes de gestion de la qualit des donnes les plus courantes sont :

Le profilage
Appel aussi dcouverte des donnes (Data Discovery), le profilage des donnes est un processus qui consiste collecter des statistiques portant sur les donnes dentreprise. Quels sont ses caractristiques et attributs principaux ? Comment ont-elles t cres et par qui ? Quels sont les utilisateurs qui y accdent le plus souvent ? Dans quels buts sont-elles essentiellement utilises ? Et surtout, dans quel tat sont-elles ? Le profilage est lun des moyens les plus efficaces dobtenir une connaissance approfondie des donnes dentreprise.

Il devient ainsi plus facile danalyser avec prcision la qualit globale des donnes et didentifier les anomalies et erreurs. Le contrle permanent permet aux entreprises dtre plus proactives dans la dtection et la rsolution des problmes de qualit de donnes.

Comment sattaquer aux informations de mauvaise qualit

Le nettoyage, la standardisation, lenrichissement, le rapprochement et la fusion


Apparemment sans rapport entre elles, toutes ces tapes concourent au maintien des niveaux optimums de qualit des donnes. Le nettoyage limine les erreurs au sein des bases de donnes et des autres sources dinformations par la modification des donnes existantes, base sur des rgles et des critres mtier prdfinis. Dans lexemple ci-dessous, on a identifi des enregistrements contenant des noms errons. Au cours du processus de nettoyage, les entres manquantes sont modifies et les champs remplis sont automatiquement adapts aux standards selon un format spcifique bas sur des rgles prdfinies. Source de donnes Prnom Dr. John Smith Smith W. John John William Smith Dr. J.W. Smith John Smith Smith John John Smiht Jane Watson Watson Jane Jane Smith J. Smith S M M M Numro de SS 000000000 095-242-434 095242434 095242433 095252433 095252433 420347213 420-347-213 SIN420347213 420-347-213 Date de Naissance 12/16/1978 16.12.1978 781612 11/16/78 16.11.1978 16.11.1978 16.11.1978 1982 5.1.1982 1982-01-0 Adresses 14618 110 Ave Surrey V3R 2A9 Surrey 14618 110 Ave 25 Linden Str Toronto M4X 1V5 8500 Leslie L3T 7M8 Toronto 8500 Leslie street Marham 600-8500 Leslie str. Toronto L3T 7M8 8500 Leslei street Toronto L3T 7M8

F F

Donnes avant nettoyage

Donnes nettoyes Date de Prnom John John John John John John Jane Jane Jane J. Nom Smith Smith Smith Smith Smith Smith Smith Watson Watson Smith Smith S M M M M M M M F F F
Numro de SS Naissance

095242434 095242434 095252433 095252433 420347213 420347213 420347213 420347213

1987-12-16 1978-12-16 1987-11-16 1978-11-16 1978-11-16 1978-11-16 1982-01-01 1982-01-05

Adresses V3R 2A9; BC; Surrey; 14618 110 Avenue V3R 2A9; BC; Surrey; 14618 110 Avenue M4X 1V5; ON;Toronto; 25 Linden Street L3T 7M8; ON; Markham; 8500 Leslie Str. L3T 7M8; ON; Markham; 8500 Leslie Str. L3T 7M8; ON; Markham; 8500 Leslie Str. L3T 7M8; ON; Markham; 8500 Leslie Str.

Donnes aprs nettoyage

Information Builders

Lenrichissement permet davoir une vue densemble par lextension et lamlioration dynamiques des informations en les comparant dautres contenus (comme par exemple des donnes dmographiques sur des consommateurs ou la rpartition gographique des distributeurs) et en ajoutant leurs attributs le cas chant. Dans ce scnario, les codes postaux manquants au dpart ont t obtenus sur la base dadresses existantes. Ils ont t ajouts dans un champ distinct pour chaque enregistrement. Donnes nettoyes
Prnom Nom

John John John John John John Jane Jane Jane J.

Smith Smith Smith Smith Smith Smith Smith Watson Watson Smith Smith

S M M M M M M M F F F

No de SS 095242434 095242434 095252433 095252433 420347213 420347213 420347213 420347213

Date de Naissance 1978-12-16 1978-12-16 1978-11-16 1978-11-16 1978-11-16 1978-11-16 1982-01-01 1982-01-05

Adresses BC;Surrey;14618 110 Avenue BC;Surrey;14618 110 Avenue ON;Toronto;25 Linden Street ON;Markham;8500 Leslie Str. ON;Markham;8500 Leslie Str. ON;Markham;8500 Leslie Str. ON;Markham;8500 Leslie Str.

Donnes avant enrichissement Donnes enrichies


Prnom Nom

John John John John John John Jane Jane Jane J.

Smith Smith Smith Smith Smith Smith Smith Watson Watson Smith Smith

S M M M M M M M F F F

No de SS 095242434 095242434 095252433 095252433 420347213 420347213 420347213 420347213

Date de Naissance 1978-12-16 1978-12-16 1978-11-16 1978-11-16 1978-11-16 1978-11-16 1982-01-01 1982-01-05

Adresses BC; Surrey; 14618 110 Avenue V3R 2A9 BC; Surrey; 14618 110 Avenue V3R 2A9 ON; Toronto; 25 Linden Street M4X 1V5 ON; Markham; 8500 Leslie Str. L3T 7M8 ON; Markham; 8500 Leslie Str. L3T 7M8 ON; Markham; 8500 Leslie Str. L3T 7M8 ON; Markham; 8500 Leslie Str. L3T 7M8

Donnes aprs enrichissement La fusion et le rapprochement des donnes favorisent la cohrence des informations par la dcouverte automatique dentres apparentes au sein dun mme systme ou de multiples systmes, puis par la liaison, le rapprochement ou la fusion, selon les besoins. Lexemple ci-dessous illustre le fonctionnement du processus de rapprochement et de fusion.

Comment sattaquer aux informations de mauvaise qualit

Donnes nettoyes
Prnom Nom

Smith Smith Smith Smith John Smith John Smith John Smith Jane Watson Jane Watson Jane Smith J. Smith Le Rapprochement

John John John

S M M M M M M M F F F

No de SS 095242434 095242434 095252433 095252433 420347213 420347213 420347213 420347213

Date de Naissance 1978-12-16 1978-12-16 1978-11-16 1978-11-16 1978-11-16 1978-11-16 1982-01-01 1982-01-05

Adresse V3R 2A9;BC;Surrey;14618 110 Avenue V3R 2A9;BC;Surrey;14618 110 Avenue M4X 1V5;ON;Toronto;25 Linden Street L3T 7M8;ON;Markham;8500 Leslie Str. L3T 7M8;ON;Markham;8500 Leslie Str. L3T 7M8;ON;Markham;8500 Leslie Str. L3T 7M8;ON;Markham;8500 Leslie Str.

Les entres apparentes pour John Smith et Jane Watson sont identifies. Toutefois, malgr quelques similitudes entre les enregistrements, toutes les informations ne sont pas redondantes : il y a en fait deux John Smith. Des fonctionnalits de rapprochement perfectionnes valuent les donnes contenues dans chaque enregistrement pour distinguer celles qui sont redondantes de celles qui ne le sont pas. Donnes nettoyes
Prnom Nom

John John John

Smith Smith Smith

S M M M

No de SS 095242434 095242434

Date de Naissance 1978-12-16 1978-12-16

Adresse V3R 2A9;BC;Surrey;14618 110 Avenue V3R 2A9;BC;Surrey;14618 110 Avenue M4X 1V5;ON;Toronto;25 Linden Street

Enregistrement matre
Prnom Nom

John La fusion

Smith

S M

No de SS 095242434

Date de Naissance 1978-12-16

Adresse V3R;BC;Surrey;14618 110 Avenue

La fusion regroupe alors les donnes rapproches dans un enregistrement matre. Ici, les doublons pour John Smith sont unifis dans un enregistrement matre qui contient les informations provenant de tous les enregistrements en double. Il y avait des donnes discordantes dans le champ adresse de sorte que cest loccurrence la plus frquente qui a t utilise automatiquement, sur la base de rgles prdfinies. Le chanage de donnes, une technique semblable la fusion o des informations apparentes provenant de systmes disparates sont collectes et stockes dans un rfrentiel ou dans un autre emplacement centralis pour un accs facile, est aussi class dans cette catgorie. Avec le chanage de donnes, les entreprises peuvent regrouper des informations semblables sur une famille, une entreprise, etc. pour fournir la vue la plus complte possible aux utilisateurs finaux.

Information Builders

Scoring
De nombreuses socits ont commenc se reposer sur le scoring pour valuer avec une plus grande efficacit la qualit des donnes et pour mieux classer les problmes par ordre de priorit si ou quand ils surviennent. Avec le scoring, un nombre est affect chaque enregistrement de donnes pour avoir une ide de sa qualit. Par exemple, un enregistrement dentreprise parfait peut avoir une cote de 5 tandis quun enregistrement totalement erron peut se voir attribuer une cote de 1. Tout nombre entre les deux illustrerait le niveau de confiance que lorganisation a vis-vis de la rigueur et de lexactitude de lenregistrement. Il indiquerait aussi si une action doit tre entreprise son gard (une cote de 3 ou en dessous ncessiterait un examen manuel). Les entreprises doivent tre souples dans lutilisation des procdures de scoring et appliquer des rgles diffrentes des types de donnes diffrents pour transmettre un sentiment durgence ou non, lorsque surviennent des problmes. Par exemple, des donnes sensibles, comme les informations sur les clients, devraient tre cotes de faon plus rigoureuse que les donnes sur le stock de fournitures de bureau.

Extensibilit et souplesse pour les donnes personnalises


Pour dterminer quelles sont les donnes incohrentes, une entreprise doit tablir sous quelle forme les enregistrements doivent se prsenter. Les informations comme les adresses et les codes postaux peuvent tre rapproches dune base de donnes afin de vrifier leur exactitude. Mais ce type de validation nest en gnral pas disponible pour la plupart des types denregistrements. Une grande proportion des donnes est exclusive (les dtails sur les produits, par exemple) et elles ncessitent un certain niveau de connaissances sur lobjet pour valuer sa qualit. Les entreprises doivent pouvoir appliquer des rgles ce type dinformations afin de sassurer de leur qualit de faon plus proactive. Il faut que les rgles soient faciles dfinir et mettre en oeuvre. Elles devraient tre utilises de telle sorte quelles aillent au-del du simple dpistage et de la correction des donnes incohrentes ; elles doivent commencer par les empcher de sintroduire dans lenvironnement.

Comment sattaquer aux informations de mauvaise qualit

La gestion de la qualit des donnes dun bout lautre de leur cycle de vie
Les donnes dentreprise ont un cycle de vie ; elles se dplacent dans plusieurs directions au sein et au-del dun mtier. Dans les activits mtier quotidiennes, les informations vitales circulent :

En amont
Les donnes sintroduisent dans une entreprise de diffrentes manires et sous des formes innombrables. Par exemple, elles peuvent provenir dun mail, dun fax ou dune lettre. Elles peuvent tre saisies au cours dun entretien tlphonique, de runions individuelles ou dchanges B2B dynamiques et automatiss. Elles peuvent mme tre introduites par des voies de nouvelle gnration, comme les portails Web et les environnements en libre service, ainsi que par des sources hberges ou bases sur linformatique distance (cloud computing), tel que Salesforce.com.

Les multiples points de communication par lesquels les donnes sont gnres et collectes sont devenus plus labors ces dernires annes, ce qui laisse beaucoup de place aux erreurs. Le respect des rgles mtier et des standards sur la qualit des donnes devient ainsi difficile garantir. Assurer et maintenir lintgrit des informations devient un vritable dfi.

En cours dexploitation
Les donnes existantes circulent sans cesse au sein dune entreprise. Elles sont souvent modifies ou agrges avec dautres enregistrements au cours de transactions mtier complexes ou dans le cadre dactivits de reporting ou danalyse.

Information Builders

Ce mouvement incessant engendre des problmes potentiels importants sur la qualit. Un manque de vrifications actives au fur et mesure que les donnes sont utilises peut entraner des discordances, des redondances, des classements errons et mme des pertes. Ces anomalies peuvent savrer difficiles dtecter avant quil ne soit trop tard.

En aval
Les utilisateurs finaux accdent frquemment aux donnes dans des oprations de reporting et danalyse. Les donnes peuvent tre rcupres directement depuis des sources back-office, des Data Marts et des Data Warehouses. Elles sont ensuite exploites pour un reporting oprationnel ou financier ou encore pour du reporting de conformit. Elles sont prsentes des cadres, dirigeants et autres collaborateurs, laide de tableaux de bord et de scorecards ou charges dans des cubes multidimensionnels pour une manipulation et une analyse plus approfondies.

Des problmes daccessibilit, comme des doublons ou des incohrences smantiques, peuvent avoir un impact ngatif sur la capacit des utilisateurs finaux exploiter ces donnes pour servir les activits mtier essentielles. Cet impact peut affecter lefficacit oprationnelle, les performances et, en fin de compte, la profitabilit. Il est avr que les donnes impropres se rpandent. De mme quune rivire pollue contamine les eaux dun lac dans lequel elle se jette, un seul enregistrement altr peut infecter de multiples systmes pendant son parcours en amont, en cours dexploitation et en aval. Plus une organisation tarde corriger les donnes impropres, plus les dommages sont importants. Il faut que les entreprises aient une approche proactive pour grer la qualit des donnes afin dviter de courir le risque que la plus petite anomalie sur la qualit se transforme en problme grave.

Comment sattaquer aux informations de mauvaise qualit

Une exploitation efficace de la qualit des donnes


Garantir la qualit des donnes provenant de sources extrieures
On voque souvent la qualit des donnes du point de vue des informations contenues dans les bases de donnes back-office, les Data Warehouses et autres sources internes. Mais un large volume de donnes provient de lextrieur de lentreprise. Elles sont collectes par des applications maintenues par des fournisseurs, des distributeurs et autres partenaires. Elles sont regroupes et agrges partir de sites Web ou fournies par des clients sous de nombreuses formes non structures. Pourtant, peu dinitiatives sur la qualit des donnes prennent en considration ces informations. Elles minimisent ainsi le succs des efforts consentis lamlioration de cette qualit en laissant des gouffres bants et en crant un environnement prsentant dnormes risques. Comme un seul enregistrement impropre est mme de polluer de nombreux autres systmes, ces sources extrieures constituent une menace significative. Cest pourquoi il est si important dappliquer le scoring, le nettoyage, le rapprochement, la fusion et dautres techniques prouves de gestion de la qualit chacune des sources de lentreprise. La mise en place de politiques et de procdures de qualit des donnes rserves uniquement aux systmes internes ne serviront protger quun sous-ensemble des informations essentielles. Cela rendra les programmes de qualit des donnes en partie inefficaces.

Pourquoi le contrle de la qualit des donnes en temps rel est-il crucial ?


Tandis que lidentification et la correction des donnes incohrentes aprs quelles sont introduites dans lenvironnement sont importantes, la possibilit de grer leur qualit en temps rel prsentera des avantages considrables. Dans le rapport SiriusDesigns, la socit prsente la rgle 1-10-100 qui dcrit les avantages de la proactivit lorsquil sagit de qualit des donnes. Selon cette rgle, vrifier un enregistrement revient uniquement un dollar, le nettoyer et corriger le doublon aprs son introduction cotent dix dollars. Mais si on ne fait rien, il y a cent dollars de perte potentielle en rentabilit ou en recettes.5 Revenons sur lexemple du fleuve. Arrter les eaux contamines la source est moins coteux et demande moins defforts que de nettoyer une large tendue deau (le lac dans lequel se jette le fleuve) aprs quelle a t pollue. Il en va de mme pour les donnes dentreprise. Nettoyer les informations disperses dans diverses sources demandera beaucoup plus de ressources humaines et financires que la simple interception dun enregistrement incohrent ds quil entre, ou quil est sur le point dentrer, dans une base de donnes.

5 The Impact of Bad Data on Demand Creation, Sirius Decision, 2008.

Information Builders

iWay Software : une gestion hors pair de la qualit des donnes lchelle de lentreprise
Information Builders, avec iWay, fournit des solutions puissantes comportant un grand nombre de fonctionnalits qui optimisent lexhaustivit, lexactitude, la cohrence et lintgrit des donnes dentreprise. Nos outils de prochaine gnration aident les organisations de tous types et de toutes les tailles obtenir et maintenir la qualit des donnes au sein de tous les systmes, sans exception, avec lesquels ils dialoguent, que ce soit au sein du mtier ou en dehors.

iWay Data Quality Center


iWay Data Quality Center (DQC) est un outil essentiel dans la gestion de la qualit des donnes complexes. iWay DQC est conu, non seulement pour valuer, surveiller et superviser la qualit des donnes dans des systmes dinformation distincts, mais surtout pour viter dintgrer ces systmes des donnes incorrectes. iWay Data Quality Center permet :

Le contrle de la qualit dans des applications transactionnelles et analytiques Le nettoyage et lunification des donnes au cours des migrations de systmes La garantie de la qualit dun bout lautre des projets dintgration L amlioration de lintgrit des informations sur les adresses et les contacts L amlioration des donnes des clients des fins didentification des clients La validation et la correction des enregistrements incomplets au sein de profils clients La validation des saisies de donnes par des applications en ligne en libre service Le profilage des donnes dans les projets dintgration de donnes

10

Comment sattaquer aux informations de mauvaise qualit

iWay DQC fournit une large palette de fonctions innovantes dans une solution abordable et intuitive. Les fonctionnalits les plus importantes sont :

Une gestion centralise de toutes les activits de qualit des donnes, y compris les rgles mtier et les flux de donnes partir dune plateforme unique et unifie. Des outils administratifs prpackags qui permettent une configuration facile, sans avoir recourir des applications extrieures Une architecture indpendante des plateformes, base sur des formats ouverts Des mthodes de traitement en parallle qui permettent lextensibilit, qui prennent en charge les modes batch et la demande et qui acclrent les procdures de qualit des donnes. Elles excutent lintgralit des processus de qualit des donnes en moins dun dixime de seconde et traitent plus de cinq millions denregistrements par jour. Un profilage smantique perfectionn pour une analyse rapide et prcise des informations Une intgration cohrente dans toute application B2B, B2C ou de portail. Il existe aussi des outils ESB, SOA et ETL trs rpandus La possibilit daccder aux sources de donnes extrieures, comme les registres de noms et adresses nationaux, ainsi qu des dictionnaires et des listes personnalises tiers en vue danalyses syntaxiques, de nettoyage et de validation Un ensemble dalgorithmes puissants qui excutent efficacement des oprations de rapprochement approximatif dans lunification des enregistrements, quelles que soient les structures de donnes internes.

iWay Data Profiler


iWay Data Profiler incorpore les rsultats issus diWay DQC avec la technologie de linformatique dcisionnelle de faon simple mais puissante. Les administrateurs peuvent voir, surveiller, comparer et produire des rapports sur toutes les donnes critiques sans avoir recourir dautres logiciels clients, des plug-ins ou des visionneuses de rapports. iWay Data Profiler fournit des capacits dintgration perfectionnes grce des outils volus pour la supervision de la qualit des donnes, le reporting et lanalyse.

11

Information Builders

Cela permet aux utilisateurs de lancer des requtes, danalyser, de fournir et dafficher des donnes de profilage de multiples faons. Des informations de profilage labores, engendres partir de lanalyse smantique et des rgles mtier complexes diWay Data Quality Center, fournissent des statistiques de base sur les donnes comme lunicit et la frquence. Elles rvlent les relations entre les donnes utilisant des cls primaires et trangres. On peut pousser davantage lanalyse de ses donnes de profilage laide doutils de reporting intuitifs et graphiques pour permettre aux utilisateurs de dcouvrir des variances portant sur diffrentes priodes dans le temps. Les utilisateurs peuvent aussi zoomer sur des catgories profiles pour obtenir des dtails sur des enregistrements prcis au sein de ce groupe. iWay Data Profiler fournit un large ventail de possibilits comme :

Des indicateurs personnalisables sur la qualit des donnes (DQI) qui permettent aux entreprises de dfinir diffrents niveaux de validit. Ces DQI peuvent alors tre appliqus aux donnes pour obtenir une connaissance immdiate de lintgrit des enregistrements spcifiques. Une collection dynamique de donnes de profilage partir diWay DQC Le balisage et larchivage des donnes de profilage en tant quensembles au sein dun systme de gestion de bases de donnes relationnelle qui leur est associ en vue dune rcupration facile Des manipulations de donnes et des reprsentations graphiques labores La comparaison de multiples ensembles de profilage des donnes pour une dcouverte de variance plus rapide Limpression et lexportation de tout affichage de profilage des donnes dans un format HTML, PDF, Excel ou tout autre standard de lindustrie. Des capacits analytiques en mode connect ou dconnect, intgres directement au sein du rapport de profilage, qui permettent aux utilisateurs de visualiser et danalyser des donnes de profilage de diffrentes faons, pratiquement sans limite.

De plus, iWay Data Profiler est disponible sous la forme dune application SaaS. Il prsente de nombreux avantages notables comme :

Une installation et un dploiement acclrs Une plus grande facilit de prparation du budget grce un modle simple, avec paiement l utilisation, qui limine les dpenses initiales importantes associes aux outils disponibles La possibilit pour des informations dtailles de profilage dtre partages plus facilement avec les propritaires des donnes ainsi profiles ; il sagit des utilisateurs non techniques qui travaillent dans diffrents services et autres directions mtier Une extensibilit immdiate et conomique toutes les fois quil est ncessaire de rpondre des besoins changeants.

12

Comment sattaquer aux informations de mauvaise qualit

Une partie essentielle de toute stratgie de gestion des informations


Le profilage des donnes et la gestion de la qualit sont les composants cls de toute stratgie EIM denvergure. LEIM associe les principes et les techniques de lintgration dentreprise, de linformatique dcisionnelle et de la gestion du contenu pour rationaliser les activits associes la gnration, au stockage, laccs et la manipulation des donnes. En consquence, les socits peuvent accrotre la valeur de leurs informations dentreprise en les exploitant afin dobtenir un avantage concurrentiel significatif grce une amlioration de la productivit oprationnelle, une rduction des cots indirects et de meilleures performances mtier. Information Builders offre une gamme complte doutils et de solutions pour prendre en compte toutes les facettes de lEIM.

13

Information Builders

Conclusion
Des problmes de qualit des donnes continuent se rpandre dans les entreprises de toutes tailles et dans toutes les industries. Quelles que soient leurs origines, ces problmes cotent aux entreprises des milliards deuros tous les ans. Plus les problmes existent sans tre dcels ni corrigs, plus ils causent des dommages. Des techniques de pointe sont en train dmerger. Elles permettent aux entreprises de surmonter leurs dfis les plus importants quant la qualit des donnes. Grce ces mthodes et ces solutions, les entreprises peuvent mettre en place avec une grande efficacit une stratgie de qualit des donnes. Information Builders offre une gamme complte de solutions de gestion de la qualit des donnes qui comprend un outil de profilage efficace et une plateforme de qualit des donnes exhaustive rendant la gestion de la qualit des donnes plus rapide, plus facile et plus abordable pour les entreprises. Grce ces outils, les mtiers peuvent normment amliorer la cohrence, lexactitude et lexhaustivit de leurs donnes dentreprise vitales, peu importe comment elles ont t cres et o elles se trouvent.

14

Comment sattaquer aux informations de mauvaise qualit

Nos bureaux dans le monde


Amrique du Nord
tats-Unis

Europe

Atlanta,* GA (770) 395-9913 Baltimore, MD Professional Services : (703) 247-5565 Boston,* MA (781) 224-7660 Channels, (800) 969-4636 Chicago,* IL (630) 971-6700 Cincinnati,* OH (513) 891-2338 Dallas,* TX (972) 490-1300 Denver,* CO (303) 770-4440 Detroit,* MI (248) 641-8820 Federal Systems,* DC (703) 276-9006 Hartford, CT (860) 249-7229 Houston,* TX (713) 952-4800 Los Angeles,* CA (310) 615-0735 Minneapolis,* MN (651) 602-9100 New Jersey Sales : (973) 593-0022 New York,* NY Sales : (212) 736-7928 Professional Services : (212) 736-4433, ext. 4443 Orlando, FL (407) 562-1852 Philadelphia,* PA Sales: (610) 940-0790 Phoenix, AZ (480) 346-1095 Pittsburgh, PA Sales : (412) 494-9699 St. Louis,* MO (636) 519-1411 San Jose,* CA (408) 453-7600 Seattle, WA (206) 624-9055 Washington,* DC Sales : (703) 276-9006 Professional Services : (703) 247-5565

Allemagne Information Builders (Deutschland) Eschborn* +49-6196-77576-0 Belgique* Information Builders Belgium Bruxelles +32-2-7430240 Espagne Information Builders Iberica S.A. Barcelone +34-93-344-32-70 Bilbao +34-94-452-50-15 Madrid* +34-91-710-22-75 France* Information Builders France S.A. Paris +33-14-507-6600 Italie Information Builders Italy Milan 39-02-30-314-420 Pays-Bas* Information Builders (Netherlands) B.V. Amsterdam +31-20-4563333 Portugal Information Builders Portugal Lisbonne +351-217-217-400 Royaume-Uni* Information Builders (UK) Ltd. Londres +44-845-658-8484 Suisse Information Builders Switzerland AG Dietlikon +41-44-839-49-49

Reprsentants

Canada
Information Builders (Canada) Inc. Calgary (403) 437-3479 Montreal* (514) 421-1555 Ottawa (613) 233-7647 Toronto* (416) 364-2760 Vancouver (604) 688-2499

Mexique

Information Builders Mexico Mexico 52-55-5062-0660

Australie
Information Builders Pty. Ltd. Melbourne* 61-3-9631-7900 Sydney* 61-2-8223-0600

Afrique du Sud InfoBuild South Africa (Pty.) Ltd. Gauteng 27-83-4600800 Fujitsu Services (Pty.) Ltd. Johannesbourg 27-11-2335911 Arabie Soudite InfoBuild Middle East Riyad 996-1-2180280 Autriche Raiffeisen Informatik Consulting GmbH Vienne +43-12-1136-3870 Bahren InfoBuild Brazil Ltda. Dubai 973-17-536-222, ext. 312 Brsil InfoBuild Brazil Ltda. So Paulo 55-11-3285-1050 Chine Information Builders China (IBC) Beijing 86-10-5128-9680 Beijing Xinrong Software Technology Co., Ltd. Beijing 86-10-5873-2031 Core UVANSYS Soul 82-2-832-0705 Danemark InfoBuild AB Kista, SE +46-735-23-34-97 gypte InfoBuild Middle East Abou Dhabi 971-2-627-5911 Dubai 971-4-3914391 Emirates Arabes Unis InfoBuild Middle East Abou Dhabi 971-2-627-5911 Dubai 971-4-3914391 thiopie MKTY IT Services Plc Addis Ababa 251-11-5501933

Finlande InfoBuild Oy Espoo 358-207-580-840 Grce Applied Science Athnes +30-210-699-8225 Guatmala IDS de Centroamerica Guatemala City 502-2412-4212 Inde* InfoBuild India Chennai 91-44-42177082 Isral SRL Group Ltd. Tel Aviv +972-3-7662030 Japon K.K. Ashisuto Osaka 81-6-6373-7113 Tokio 81-3-5276-5863 Jordanie InfoBuild Middle East Abou Dhabi 971-2-627-5911 Dubai 971-4-3914391 Kowet InfoBuild Middle East Dubai 965-22322926 Liban InfoBuild Middle East Dubai 961-4-533162 Norvge InfoBuild Norway Oslo 47-48-20-40-30 Oman InfoBuild Middle East Abou Dhabi 971-2-627-5911 Dubai 971-4-3914391 Pologne/Europe Centrale et de lEst InfoBuild SP.J. Varsovie +48-22-657-00-14 Qatar InfoBuild Middle East Dubai 974-467-7311 Russie (Fdration de) FOBOS Plus Co., Ltd. Moscou 7-495-926-3358 Singapour Automatic Identification Technology Ltd. Singapour 65-6286-2922 Tawan Galaxy Software Services Tapeh 886-2-2586-7890 Thalande Datapro Computer Systems Co. Ltd. Bangkok 662-679-1927, ext. 200 Turquie InfoBuild Middle East Ankara 90-312-266-33-00 Istanbul 90-212-325-4114 Vnzuela InfoServices Consulting Caracas 58-212-763-1653

Numro gratuit

Ventes, fournisseurs indpendants, revendeurs de produits modifis et intgrateurs de systmes partenaires (800) 969-4636

* Installations de formation disponibles dans ces locaux.

Sige social Information Builders France

Two Penn Plaza, New York, NY 10121-2898 Tel: (212) 736-4433 Fax (212) 967-6406 informationbuilders.com askinfo@informationbuilders.com 2, rue Troyon - 92316 Svres Cedex Tel: +33 1 45 07 66 00 Fax +33 1 45 07 66 07 informationbuilders.fr - info_fr@ibi.com

DN3601409.0110-FR

Copyright 2011 par Information Builders. Tous droits rservs. [92] Tous les produits et noms de produits cits dans la prsente publication sont des marques commerciales ou des marques commerciales dposes par leurs socits respectives.