Vous êtes sur la page 1sur 4

LE DATA MINING

La connaissance client est le nouveau capital des entreprises

La bataille autour des prix et des produits ne suffit plus pour obtenir un avantage concurrentiel. Les entreprises doivent connatre leurs clients pour leur proposer, selon l'expression consacre, "le bon produit, au bon moment et avec le bon canal". Tous les secteurs sont concerns par ce nouveau paradigme : "Placer le client au coeur de l'entreprise", c'est--dire mieux connatre son client, le reconnatre et tisser avec lui une relation durable et attractive en lui proposant des services, des avantages ou du statut (club affinitaire). On parle de marketing diffrenci, loppos du marketing de masse o lon sadresse tous les clients dune seule et mme voix. Les clients sont tous diffrents, ils nont pas les mmes besoins, ni les mmes habitudes ou les mmes attentes. Il faut donc adapter la relation que lon entretient avec le client, la fois pour le fidliser mais aussi pour augmenter le chiffre daffaires quil gnre (on parle daugmenter la valeur client). Les programmes de fidlit permettent, grce lutilisation de la carte de fidlit, d'identifier le client et de le "tracer" au fil de sa relation avec l'entreprise ou l'enseigne. On parle d'ailleurs de Chiffre d'affaires identifi ! Ces programmes de fidlit doivent donc tre attractifs et diffrenciants. Grce aux moyens informatiques, les entreprises engrangent de nombreuses informations sur leurs clients. Ces informations viennent de sources htrognes : transactions d'achat (tickets de caisse), informations identitaires (questionnaire dadhsion un programme de fidlit), contacts avec le service relation client (service consommateur, SAV...). De ces informations clients, il devient ncessaire d'en dduire de la connaissance client, comme par exemple des comportements d'achats (le fameux RFM - Rcence, Frquence, Montant - dans la VPC ou la distribution), leur propension (ou probabilit) acheter un produit (score d'apptence), leur vulnrabilit la concurrence (score d'attrition), leur versatilit changer d'enseigne (score de churn, CHange and tURN , notamment dans la tlphonie mobile), leur rceptivit un canal (courrier, SMS, e-mail...). On tend le principe du crdit-scoring, bien connu dans le monde bancaire, tous les aspects de la gestion de la relation client. Passer de l'information brute la connaissance client ncessite de "transformer" les donnes, de passer de la transaction commerciale (tickets de caisse, minutes de tlphone) des indicateurs pertinents (panier moyen dans la distribution, part des communications tlphoniques au national, l'international de chaque client, client monodtenteur/multi-dtenteur de produits financiers, etc.). Et pour cela, il faut des mthodes, des techniques, des outils et des comptences en STATISTIQUE. Le Data Mining (ou fouille des donnes , en franais) est le processus qui permet de passer de l'information brute (le minerai contenu dans les profondeurs des bases de donnes marketing) la connaissance client qui permet d'actionner avec pertinence la relation avec le client (c'est le carburant ou l'nergie qui met en action). Si les

Antoine-Eric Sammartino

1/4

19 mai 2006

LE DATA MINING
techniques de Data Mining empruntent la statistique (analyse factorielle, classification automatique, rgression multiple ou logistique, analyse discriminante) et l'intelligence artificielle (arbre de dcision, rseaux neuronaux), la mthodologie est spcifique aux bases de donnes marketing car : Les donnes n'ont pas t collectes pour tre analyses (ce sont des donnes de gestion, donc pas de protocole de collecte ou de plans dexprience), Les tests de significativit ne sont plus pertinents (plusieurs dizaines de centaines de milliers, voire de millions d'observations),

Il ny a pas d'hypothse H0, ni de modle a priori (appel modle explicite, dont on pose l'quation)
que l'on confronte aux donnes pour le valider ou le rejeter. Mais ici, au contraire, des donnes on extrait un modle (dit implicite, car contenu implicitement dans les donnes) et qui rpond une question (Quels sont les clients susceptibles de partir la concurrence ?). On retrouve au passage le principe de lanalyse exploratoire des donnes (lanalyse factorielle) qui a fait pousser, en son temps, des cris dorfraie aux tenants de la statistique infrentielle (pour qui lon ne devait pas dcouvrir des structures dans les donnes en les explorant, mais poser une hypothse que lon rejette ou non la faveur des donnes). Dans le jargon Data Mining, on "mine" ou on fouille les donnes pour en extraire un modle : on prsente un ensemble de variables candidates pour figurer dans le modle que l'algorithme slectionne, par exemple, dans le cas d'une rgression stepwise ou d'un arbre de dcision (on parle alors dExtraction de Connaissances partir de Donnes ou ECD), Si le modle explicatif dun comportement client est robuste (il conserve sa performance sur dautres observations (dautres clients) qui nont pas servi sa construction, et on peut le faire car on traite de grands volumes de clients), alors il est dclar apte la prdiction (on parle de prvisions pour les sries chronologiques, mais de prdiction pour un score de comportement dachat, de rsiliation ou de rponse un mailing). La validation de la robustesse est caractristique de lobtention dun modle prdictif en Data Mining. Deux types de traitement de donnes sont effectus principalement : La segmentation clients qui consiste regrouper les clients homognes au regard dun comportement, par exemple en matire de dtention de produits financiers ( inactifs , pargnants , boursicoteurs , potentiels , bests ). On y retrouve les techniques de classification automatique et de typologie, et plus rarement

Antoine-Eric Sammartino

2/4

19 mai 2006

LE DATA MINING
les rseaux de neurones non superviss (cartes de Kohonen). Ce type de segmentation permet lentreprise dlaborer son marketing diffrenci, cest--dire dadapter son offre et son discours chaque segment de clients. Le scoring clients qui consiste calculer, pour chaque client, une probabilit de survenue dun vnement (achat, souscription, dpart). On y retrouve les techniques de modlisation (rgression multiple ou logistique, analyse discriminante, arbre de dcision, rseaux de neurones superviss). Le scoring permet doptimiser les campagnes marketing en ne ciblant que les clients susceptibles de rpondre positivement loffre (contacter moins de clients pour un chiffre daffaires quivalent). Les entreprises, aprs avoir abondamment investi dans les outils et comptences informatiques pour mettre en place les systmes d'information clients ou datawarehouses, les bases de donnes marketing, les outils de gestion de la relation client distance (centre d'appels, site internet) ou au point de vente (borne interactive l'entre des magasins, terminaux de points de service), investissent maintenant dans des outils et des comptences statistiques pour traiter la donne. Pour paraphraser un magazine spcialis dans la distribution (LSA, 27 avril 2006, n1950), nous entrons dans l're du pouvoir de la donne, o qu'elle soit . Les secteurs concerns sont la distribution, grande et spcialise, la bancassurance, les tlcommunications (tlphonie mobile), les transports (la SNCF a rejoint le programme de fidlit SMiles gr par une filiale de ma socit LaSer Loyalty), les nergticiens (Gaz de France, EDF) car, avec louverture la concurrence, il faudra fidliser le client, donc le connatre pour mieux le servir. Le mtier de Data Miner - qui est un statisticien ! - sen trouve valoris car le statisticien nest plus cantonn un rle mineur dans lentreprise (en VPC et en recherche clinique, il a toujours eu un rle prpondrant). Il se retrouve au cur de cet enjeu que reprsente la connaissance client, et devient un maillon important dans le process de la valorisation des donnes clients. Il a pour interlocuteurs, entre autres, linformatique (les producteurs de donnes) et le marketing/vente (les consommateurs de donnes). Son rle est de rendre comestibles tous les ingrdients de la connaissance client. Pour conclure, je citerai Alain Morineau* en rappelant que le Data Mining est une seconde chance pour le statisticien . Antoine-Eric Sammartino ISUP 1984 LaSer Loyalty Responsable de lInnovation en Marketing Diffrenci Matre de confrence associ LUniversit Bretagne-Sud aesammartino@laser.fr

Antoine-Eric Sammartino

3/4

19 mai 2006

LE DATA MINING
* Alain Morineau, statisticien, auteur de nombreux ouvrages sur lanalyse exploratoire des donnes

Antoine-Eric Sammartino

4/4

19 mai 2006