Vous êtes sur la page 1sur 3

Vers un Systme d Information Stratgique en Tlphonie Mobile Prpaye

Cdric Archaux, (2)Ali Khenchaf Bouygues Telecom, 20 quai du point du jour, 92640 Boulogne Billancourt (2) Laboratoire E3I2, ENSIETA, 2 rue Franois Verny, 29806 Brest CEDEX 09 carchaux@bouyguestelecom.fr [Cedric.Archaux, Ali.Khenchaf]@ensieta.fr
(1) (1,2)

Rsum : L offre de tlphonie mobile actuelle tant trs diversifie, la fidlisation des clients est devenue un enjeu majeur pour les diffrents oprateurs. Nous prsentons dans cet article des travaux qui tendent vers la conception et le dploiement d un systme d information stratgique en tlphonie mobile prpaye. Nos travaux se situent dans le cadre de la mthodologie d extraction de connaissances partir de donnes et portent sur la caractrisation et la prvision des comportements des clients. Aprs avoir introduit la spcificit de la tlphonie prpaye et dcrit une premire tape de dtection de la fuite des clients, nous prsentons un modle de prvision d activit qui permet d tablir des perspectives financires. Nous mettons enfin en perspective le systme d information stratgique qui merge de la fusion des indicateurs fournis par les diffrents modles. Mots Cls : Tlphonie Mobile, Aide la dcision, Extraction de Connaissances, Apprentissage Supervis, Machines Support de Vecteurs, Analyse de Survie. 1 Introduction

Aprs plusieurs annes de trs forte croissance, le march franais de la tlphonie mobile a atteint sa maturit et se stabilise. Il devient dsormais primordial pour les oprateurs de fidliser leurs clients afin de prvenir leur fuite la concurrence (churn). Par ailleurs il est souhaitable d avoir une estimation de l activit des clients afin de rpondre leurs attentes. Afin d'valuer la valeur terme des clients, le modle de Life Time Value (LTV) a t dvelopp et est couramment utilis en gestion de la relation client. Cet indicateur est bas sur la modlisation de la fonction de valeur au cours du temps ainsi que sur la fonction de survie des clients. Nous prsentons dans un premier temps les bases de donnes sur lesquelles nous travaillons en dcrivant le type de variables utilises, nous prsentons ensuite la dtection de la fuite des clients, qui vise distinguer ceux qui cesseront leur activit dans un horizon de temps donn de ceux qui maintiendront leur niveau de consommation. Les approches dj tudies dans le domaine de la tlphonie se sont tournes vers des techniques telles que les chanes de Markov (Hollmn 2000), les mixtures de gaussiennes et rseaux baysiens (Taniguchi et al. 1998), les rgles d associations (Rosset et al. 1999), ou encore les rseaux de neurones (Mozer et al. 2002). Dans (Mani et al. 1999), il est montr que l'introduction d un rseau de neurones multi-couches pour la modlisation de la survie permet d'obtenir de bons rsultats en s appuyant sur une analyse critique d autres mthodes. Nous prsentons donc l application de cette approche pour la dtection du churn. Cependant, nous avons souhait amliorer la capacit de gnralisation du modle pour tenir compte du volume trs important de donnes auquel nous sommes confronts et prsentons ainsi la dtection par machines support de vecteurs.

Les modles de survie historiquement utiliss sont des modles paramtriques et des modles non-paramtriques risques proportionnels (Rosset et al. 2002). Nous prsentons dans un troisime temps la modlisation du dlai de rechargement ainsi que les rsultats obtenus sur nos bases de donnes. Nous concluons enfin sur nos perspectives d intgration des diffrents lments stratgiques dans un systme d information dcisionnel ddi la gestion de la relation client dans le domaine de la tlphonie mobile prpaye. 2 Bases de donnes

Les bases de donnes que nous utilisons dans le cadre de l tude prsente sont composes de diffrents types de donnes : ? ? des donnes de facturation comme les montants rechargs par les clients ou les montants prlevs pour les services et options souscrits, ces montants sont des nombres rels qui prennent gnralement leurs valeurs dans un ensemble restreint. ? ? des donnes relatives aux usages comme le nombre total des appels, la rpartition des appels locaux nationaux ou internationaux (pourcentage), la consommation en pic et la consommation moyenne (rels), ? ? des donnes relatives la ligne tlphonique telles que l'anciennet (entier born l'anciennet de commercialisation des offres prpayes), le plan tarifaire actuel, le nombre de plans tarifaires diffrents par lequel le client est pass, ? ? des donnes relatives aux souscriptions et rsiliations de services, ? ? d'autres informations telles que l'ge ou la catgorie socioprofessionnelle du client, la rentabilit actuelle et la rentabilit prcdente, la slection d'autres options, etc. 3 Dtection de la fuite des clients

L approche SVM (Vapnik 1998) tente de sparer des clients fort risque de fuite des clients moins risqus dans l'ensemble des clients par l'hyperplan optimal qui garantit que l cart entre les deux classes soit maximal. Les nouveaux clients pour lesquels nous devons dtecter le churn, pourront ainsi ne pas tre trop similaires ceux employs pour trouver l'hyperplan mais tre tout de mme situs franchement d'un ct ou l'autre de la frontire. La force des SVM tient leur simplicit de mise en uvre face des problmes difficiles et des fondements mathmatiques solides. Nous avons donc retenu et test les modles SVM qui ont fait leur preuves dans d'autres domaines tels que la classification d images (Goffinet 2001, Laayana 2003), ou la reconnaissance de locuteurs (Gutschoven et al. 2000). Nous comparons ainsi la dtection par perceptron multicouches la dtection par SVM. 4 Modlisation du dlai de rechargement

La modlisation de la survie a t initialise par (Cox 1972, Kaplan et Meier 1958). Dans notre tude, une fois obtenus les profils de rechargement, la mthode que nous utilisons pour prvoir les rechargements consiste en deux tapes (Kalbfleisch et Prentice 2002, Lawless 2002). Une premire tape consiste modliser et prvoir le dlai de rechargement de chaque client, partir des rechargements effectus durant la priode d'apprentissage. Nous effectuons ensuite une analyse de survie, qui permet d affecter chaque client sa probabilit de rechargement dans les six mois suivant la date de modlisation.

Conclusions et perspectives

Les mthodes prsentes dans cet article nous fournissent des rsultats satisfaisant et encourageants pour une exploitation des fins dcisionnelles. Nos perspectives portent sur l intgration des indicateurs obtenus dans le modle de LTV afin de constituer un systme d information dcisionnel intgr, s talant de la slection des donnes jusqu la mise disposition des indicateurs aux utilisateurs finaux du systme. 6 Rfrences

Cox. D.R., " Regression models and life tables ". Journal of the Royal Statistical Society, B34: pages 187- 220 , 1972. Goffinet J. (2001), Machines vecteur de support pour la dtection et le suivi de personnes sur des squences vido, rapport de stage, juillet 2001. Gutschoven B. et Verlinde P. (2000), Multi-modal Identity Verification using Support Vector Machines (SVM), International Conference on Information Fusion, Paris, France, 10-13 juillet 2000. Hollmn J. (2000), User Profiling and Classification for Fraud Detection. Thse de doctorat, University of Helsinki, 2000. Kalbfleisch J.D., Prentice R.L. " The Statistical Analysis of Failure Time Data ", John Wiley & Sons; 2nd edition, ISBN: 047136357X , 2002. Kaplan E.L.,R. Meier, " Nonparametric Estimation From Incomplete Observations " Journal of the American Statistical Association, pages 457-481 , 1958. Laayana H. (2003), Dtection par SVM Application la dtection de roches pour le recalage d images sonar, rapport de DESA, juillet 2003. Lawless J.F., " Statistical Models and Methods for Lifetime Data ", John Wiley & Sons; 2nd edition, ISBN: 0471372153 , 2002. Mani D.R., Drew J., Betz A., Datta P. (1999), Statistics and data mining techniques for lifetime value modeling, Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 94-103, 1999. Mozer M.C., Dodier R., Colagrosso M.D., Guerra-Salcedo C., Wolniewicz R. (2002), Prodding the ROC Curve: Constrained Optimization of Classifier Performance, Advances in Neural Information Processing Systems 14, MIT Press, 2002. Rosset S., Murad U., Neumann E., Idan Y., Pinkas G. (1999), Discovery of fraud rules for telecommunications-challenges and solutions, Proceedings ACM SIGKDD, 1999. Rosset S., Neumann E., Eick U., Vatnik N., Idan Y. (2002), Customer lifetime value modeling and its use for customer retention planning, Proceedings of the eighth ACM SIGKDD, pp. 332-340, 2002. Taniguchi M., Haft M., Hollmn J., Tresp V. (1998), Fraud detection in communications networks using neural and probabilistic methods, ICCASP, Vol 2, pp 1241-1244 1998. Vapnik V. (1998), Statistical Learning Theory. John Wiley & Sons, 1998.

Vous aimerez peut-être aussi