Résumé
Les entreprises soucieuses de leur progrès tentent à satisfaire continuellement leurs clients potentiels.
L’utilisation du e-commerce, l’essor des technologies liées à l’internet fait naître de nouvelles attentes de la part
des clients et des collaborateurs. Ceci oblige ces entreprises à prendre les décisions adéquates en vue de
répondre aux exigences de leurs clients, en examinant leur comportement sur son site de e-commerce. L’analyse
du marché pour une entreprise donnée repose sur la quantité importante d’informations provenant de son site
web marchand. Cette analyse peut se faire en exploitant les entrepôts de données (ED) ou data warehouse (DW)
d’une part et les outils de data mining ou de fouille de données pour une classification (profilage) des clients
d’autre part, car l’aide à la décision peut nécessiter de comprendre plus profondément les chiffres et les faits de
l’entreprise. Le présent article décrit la conception, l’architecture et quelques fonctionnalités d’un outil d’aide à
la décision pour la gestion de la relation client sur un site de e-commerce.
Mots clés
E-CRM , Data warehouse, Data Mining, modèle multidimensionnel, OLAP.
Intégrées
Les données de l’entrepôt proviennent de
différentes sources éventuellement
hétérogènes. L’intégration consiste à résoudre
les problèmes d’hétérogénéité des systèmes de
stockage, des modèles de données, de
sémantique de données.
Orientées sujet
Après leur intégration dans une sorte de source
globale, les données sont réorganisées autour
de thèmes tels que : client, vendeur,
produit…etc.
Figure 1.1 : Architecture d’un entrepôt de données
SETIT2005 3
3.2 E-CRM :
L'e-crm est un processus continu d'amélioration de
la relation client sur Internet. C’est un domaine en
pleine expansion au vu de l’impact d’Internet sur le
e-commerce. Voici quelques chiffres justifiant
l’intérêt porté à ce domaine (Source: META Group,
Business Week, Forrester Research, Jupiter
Communication):
Figure 2.1 : Exemple d’un cube de données
SETIT2005 4
Accéder à l’OAD.
Visualiser les données en cube
(choisir un magasin de données).
Appliquer les opérations OLAP sur le
cube de données.
Appliquer les techniques du data
mining.
Classe
d’interface
Classe de
contrôle
Figure 4.8 : DCP du cas d'utilisation « Appliquer un
algorithme de data mining»
i
nuage d’individus.
Centre de gravité
Le centre de gravité g d’un nuage N ou encore le
« Barycentre » des points Xi (ou Xi et le ième
individu du nuage N) affectés aux poids pi est
donné par la formule suivante :
n
g = ∑ pi * xi qui s’écrit :
i =1
⎛ xi1 ⎞ ⎛ x1 ⎞
⎜ ⎟ ⎜ ⎟
Figure 4.10 : schéma en étoile du magasin de ⎜ . ⎟ ⎜ . ⎟
⎜ ⎟
g = ∑ pi * ⎜ . ⎟ = ⎜ . ⎟
données des ventes n
i =1 ⎜ ⎟
⎜ . ⎟ ⎜ . ⎟
⎜ p ⎟ ⎜⎜ p ⎟⎟
⎝ xi ⎠ ⎝ x ⎠
n
Où x =
j
∑p
i =1
i * xij est la moyenne de la jième
variable.
Inertie du nuage
L’inertie d’un nuage d’individus N par rapport à un
point (individu) X ∈ ℜ est la quantité notée par :
n
n
I x ( N ) = ∑ pi * d 2 ( xi , x) Où d 2 ( xi , x) est
i =1
la distance entre Xi et X.
Figure 4.11 : Schéma en étoile du magasin de I x ( N ) mesure la dispersion du nuage autour de x.
données des visites
Remarques
4.5 Module de Data Mining − Le poids pi dans notre cas est identique pour
Le deuxième module de l’OAD, est basé sur un 1
tous les individus et est égal à .
algorithme de groupage (Gardarin, 2000), N
permettant de construire des groupes de clients en
fonction de critères de similarité. − Pour l’algorithme de groupage nous avons
Avant de détailler le fonctionnement de utilisé la distance euclidienne qui est donnée
l’algorithme de groupage, il faut éclaircir certains par la formule suivante :
points et rappeler quelques définitions de base n
utilisées dans les étapes de calcul des groupes
d’individus.
d ( x, y ) = ∑ (x
i =1
i − y i ) Avec x et y deux
vecteurs de ℜ
n
SETIT2005 7
i := i + 1 ;
tmp:= distance entre l’individu et le
kème centre ;
Non
tmp < d
Oui
L’individu ∈ au kème groupe ;
Conclusion
Le travail présenté dans cet article consiste en la
5.3 Module de data mining :
conception et la réalisation d’un outil d’aide à la
L'objet de cette analyse est de regrouper les décision dans la gestion de la relation client sur
individus en fonction de leurs actions et de internet. L’intérêt principal d’un tel outil est d’offrir
renseignements propres aux personnes. L'intérêt est aux décideurs une meilleure vision de leurs clients
de former des groupes de personnes ayant des leur permettant ainsi, une meilleure gestion de leurs
comportements similaires. Dans un premier temps, entreprises. Comme perspective à ce travail, nous
à des fins d'analyse (qui sont mes visiteurs ? quelles proposons un enrichissement du module data
sont les pages les plus visités ? les produits les plus mining en intégrant d’autres techniques de
visités ?) et dans un second temps à des fins classification telles que les réseaux de neurones.
d'anticipation (proposer le produit le plus adapté à
un individu).
Remerciements : nous tenons à remercier Mrs
K. ALLOUN & O. CHOUIB pour leur contribution
dans la réalisation de l’outil.
Références
(Bret & al, 2001) : Groupe EVOLUTION. F. Bret. T.
Cruanees. I. Guessarian. E. Metais. M-C. Rousset. S.
Schwer. O. Teste. G. Zurfluh, Ingénerie des systèmes
d’information , édition HERMES, 2001
(Chaudrui,1997) : S. Chaudhuri , Data Warehousing
and OLAP for Decision Support (Microsoft Research,
Redmont), SIGMOD AZ, USA, 1997.
(Codd, 1993) : E. F. Codd, Providing OLAP to user-
analysts: an IT mandate, Technical Report, E. F. Codd
and associates, 1993.
(Gardarin, 2000) : Georges Gardarin, Internet,Intranet
Figure 5.8 : Application de la technique de et bases de données, Edition DUNOD, 2000.
groupage
(Inmon,1996a) : W. H. Inmon, The Data Warehouse
and Data Mining , communication of the ACM, , Vol. 39,
Le décideur va donc donner en entrée le nombre k N° 11, Novembre 1996
de groupes, pour valider ensuite son choix, le (Inmon,1996b) :W. Inmon. Building the Data
résultat de cette opération est affiché sous forme de Warehouse. QED Technical Publishing Group,
rapports imprimables à la demande du décideur. Wellesley, Massachusetts, U.S.A., 1996
SETIT2005 10