Vous êtes sur la page 1sur 16

3me atelier sur la Fouille de donnes complexes dans un processus dextraction des connaissances

FDC06 Lille, Mardi 17 Janvier 2006

Modle dentrept de donnes base de rgles


Ccile Favre, Fadila Bentayeb et Omar Boussad
Laboratoire ERIC Universit Lyon 2

Contexte 1/2
Collaboration avec LCLLe Crdit Lyonnais Demande de marketing local :
Formulation dune demande de ciblage pour une action marketing ponctuelle (opration spcifique un produit ou un vnement). Extraction dune liste de clients rpondant certains critres Mesure de rsultats

Analyser des donnes provenant de sources htrognes, indpendantes pour enrichir nos connaissances sur les demandes marketing : donnes complexes
C. Favre, F. Bentayeb et O. Boussad Atelier FDC 17 Janvier 2006 2/15

Contexte 2/2
Architecture dentreposage virtuel de donnes base sur la mdiation et lentreposage

C. Favre, F. Bentayeb et O. Boussad

Atelier FDC 17 Janvier 2006

3/15

Problmatique
Rpondre des besoins danalyse qui voluent rapidement Intgrer des connaissances pour enrichir lanalyse Impliquer davantage lutilisateur dans le processus dcisionnel

C. Favre, F. Bentayeb et O. Boussad

Atelier FDC 17 Janvier 2006

4/15

Modle multidimensionnel : exemple


Donnes de LCL pour lanalyse du PNB
CLIENT idClient Sit_Familiale Sexe Segmentation Code_Postal AGENCE idAgence Lib_Agence

TF_PNB idClient idAgence idAnnee PNB

ANNEE idAnnee
C. Favre, F. Bentayeb et O. Boussad Atelier FDC 17 Janvier 2006 5/15

Modle dentrept de donnes base de rgles : R-DW


Partie fixe du modle R-DW Dimension 1 Table des faits Cle_Dim1 Cle_Dim2 Cle_Dim3 Cle_DimN Mesure1 Mesure2 Dimension 3 Rgle3 Rgle5 Rgle6 Rgle7 Rgle9 Partie volutive du modle R-DW

Dimension 2

Dimension N

Rgle1 Rgle2 Rgle4 Rgle8 Rglem

C. Favre, F. Bentayeb et O. Boussad

Atelier FDC 17 Janvier 2006

6/15

Connaissances : exemple
Connaissances :
Identifiants des agences ddies aux tudiants : 01903, 01905, 02256 Connaissances utiles pour lanalyse Expression sous forme de rgles :
si idAgence{01903, 01905, 02256} alors type_agence=tudiant

C. Favre, F. Bentayeb et O. Boussad

Atelier FDC 17 Janvier 2006

7/15

Modle R-DW : exemple


Modle conceptuel R-DW pour l'analyse du PNB
CLIENT idClient Sit_Familiale Sexe Segmentation Code_Postal TF_PNB idClient idAgence idAnnee PNB ANNEE idAnnee
Atelier FDC 17 Janvier 2006

AGENCE idAgence Lib_Agence type_agence

C. Favre, F. Bentayeb et O. Boussad

8/15

Rgles
Expression en extension
Rgle de type si-alors Ex : agences ddies aux tudiants
si idAgence{01903, 01905, 02256} alors type_agence=tudiant

Expression en intention
Rgle de calcul : extraction de caractres, fonction de scoring, Ex : calcul de laffinit dun client pour un produit
affinit=f(caractristiques du client)
C. Favre, F. Bentayeb et O. Boussad Atelier FDC 17 Janvier 2006 9/15

Application aux donnes LCL


Rgles enrichissant lanalyse du PNB :
departement type_agence dim_departement=left(Code_Postal,0,2) si idAgence{'01903','01905','02256'} alors type_agence='tudiant' si idAgence{'01903','01905','02256'} alors type_agence='classique' si Age < 60 alors dim_age='moins de 60 ans' si Age 60 alors dim_age='plus de 60 ans' si Sexe='F' et Sit_Familiale='M' alors dim_groupe_personne='femmes maries' si Sexe='F' et Sit_Familiale'M' alors dim_groupe_personne='femmes non maries' si Sexe='H' et Sit_Familiale='M' alors dim_groupe_personne='hommes maris' si Sexe='H' et Sit_Familiale'M' alors dim_groupe_personne='hommes non maris'

age

groupe_personnes

C. Favre, F. Bentayeb et O. Boussad

Atelier FDC 17 Janvier 2006

10/15

Implmentation
Plateforme Web (HTML/PHP) qui interface le SGBD Oracle Principe I
N T 1- Visualisation des rgles E R R g 2- Expression des connaissances F l A Alimentation sous forme de rgles e C s E
3- Expression du besoin d'analyse Paramtres : mesure, oprateur, attributs dfinissant les axes d'analyse Table de Rgles Dfinies en Intention Table de Rgles Dfinies en Extension Table de Table de Dimension 1 Dimension 3

Table de Faits Table de Dimension 2

W E B
Calcul des agrgats Procdure Stocke d'Analyse

SGBD Oracle
11/15

C. Favre, F. Bentayeb et O. Boussad

Atelier FDC 17 Janvier 2006

Travaux relatifs : volution de schma


Mise jour de schma
Migrer les donnes vers le schma le plus rcent (Blaschka et al. 1999, Hurtado et al. 1999)

Versionnement de schmas
Historiser les dimensions (Bliujute et al. 1998, Chamoni et Stock 1999, Eder et Koncilia 2001)

C. Favre, F. Bentayeb et O. Boussad

Atelier FDC 17 Janvier 2006

12/15

Travaux relatifs : utilisation de rgles dans les ED


Dfinition du modle dentrept partir des schmas sources (Kim et al. 2003, Peralta et al 2003) Contraintes dintgrit (Carpani et Ruggia 2001, Hurtado et Mendelzon 2002, Ghozzi et al. 2003) Gestion dexceptions dans le processus dagrgation (Espil et Vaisman 2001)
C. Favre, F. Bentayeb et O. Boussad Atelier FDC 17 Janvier 2006 13/15

Conclusions
Proposition du modle R-DW pour :
crer des hirarchies de dimension de faon dynamique ; faire voluer les contextes d'analyse ; intgrer des connaissances dans le modle renforcer l'interaction entre l'utilisateur et le systme d'aide la dcision

Implmentation dun prototype


C. Favre, F. Bentayeb et O. Boussad Atelier FDC 17 Janvier 2006 14/15

Perspectives
Enrichir limplmentation Mesurer la performance de lapproche en termes d'espace de stockage et de temps de rponse Introduire les mthodes doptimisation (index/vue) Rflchir la matrialisation des donnes gnres par les rgles Dfinir un langage qui permet de valider les rgles utilises (gestion des conflits entre les rgles, vrification de contraintes sur celles-ci) Prendre en compte lvolution des rgles dans le temps Utiliser des mthodes d'apprentissage non supervis pour dcouvrir de nouvelles rgles
C. Favre, F. Bentayeb et O. Boussad Atelier FDC 17 Janvier 2006 15/15

Merci de votre attention.