Vous êtes sur la page 1sur 15

Systme dintelligence conomique et paramtres sur lutilisateur : application un entrept de publications

Babajide AFOLABI*, Odile THIERY*


Babajide.afolabi@loria.fr, Odile.Thiery@loria.fr

*Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA) Campus Scientifique BP 329 54506 Vandoeuvre-ls-Nancy France. +33 3 83 59 20 87

Mots-cls : Intelligence conomique, entrept de donnes, modlisation utilisateur, base mtier, besoin informationnel, besoin dcisionnel.

Rsum
Il existe de nombreuses dfinitions qui peuvent qualifier lIntelligence Economique. Dans le cadre de notre approche nous prfrons celle de qui la dfinie comme le processus de collecte, de traitement et de diffusion de linformation qui a pour objet la rduction de la part dincertitude dans la prise de toute dcision stratgique. Notre objectif dans le cadre de cette recherche est dtudier les paramtres qui peuvent aider lutilisateur lors de son utilisation dun systme dintelligence conomique. Dans cet optique, nous avons admis comme hypothse de base que chaque individu ragit diffremment face un systme dinformations en fonction de caractristiques et dun contexte qui lui sont propres. Ds lors, notre travail de recherche se dveloppe selon deux axes : dune part, la modlisation de lutilisateur dans un systme dintelligence conomique, pour tudier la faon de reprsenter un utilisateur de manire explicite ; dautre part, les connaissances sur lutilisateur acquises lors de ses connexions sont tudies en vue de leur exploitation. Aussi, nous observons la structure de la base dexprimentation (en loccurrence la base de documentation de Loria) afin de constater la ncessit ou non dune rorganisation. Dans cet optique, le prototype METIORE cr par lquipe de recherche SITE est en cours dadaptation pour exprimenter nos propositions.

1. Introduction
Selon [Revelli, 1998], lIntelligence Economique (IE) est le processus de collecte, de traitement et de diffusion de linformation qui a pour objet la rduction de la part dincertitude dans la prise de toute dcision stratgique . Dans sa forme la plus simple, un systme dinformation (SI) peut tre considr comme un ensemble des moyens (organisation, acteurs, procdures, systmes informatiques) ncessaires au traitement et lexploitation des informations dans le cadre dobjectifs dfinis au niveau de la stratgie de ltablissement, des mtiers, et de la rglementation. Nous mettons laccent sur deux types de systmes dinformation stratgiques (SIS). Nous appelons le premier, qui aide la gestion de lentreprise au jour le jour, un systme dinformations stratgiques oprationnelles (SI-S), il sagit dun systme dinformations comportant des informations stratgiques et permettant lautomatisation de lorganisation pour satisfaire au mieux les objectifs stratgiques de la direction . Par exemple un SI amliorant la gestion des stocks. [Tardieu and Guthmann, 1991]. Le deuxime, un systme stratgique dinformations (S-IS) est, daprs nous, un systme dinformation qui est consacr aux dcisions stratgiques et ne comporte que des informations de type stratgiques . Par exemple, un SI peut permettre au dcideur dobserver des rsultats de chiffres daffaire par pays sur plusieurs annes ou encore au veilleur de mettre en exergue les choix quil a faits lors de lanalyse des rponses dun systme de recherche dinformation sur le Web [David and Thiery, 2003]. Le S-IS agit sur les informations dj stockes pour aider la prise de toute dcision stratgique. Les dcisions prises dpendent des informations qui sy trouvent, et aussi de lutilisateur qui a pour fonction linterrogation et lappropriation de ce systme dans le but de prendre des bonnes dcisions. La figure suivante montre que le SI de lentreprise est le premier tre construit. Le SI est divers et vari. Il comporte des informations stratgiques, par exemple des indications de chiffre daffaires. Il faut en extraire les informations ncessaires la prise de dcision et galement leur structure, cest-dire les mtas-donnes. Ceci constitue lentrept relationnel, appel ainsi car il est actuellement gr par un SGBD relationnel. De cet entrept sont extraites des bases de donnes multidimensionnelles (BDM), appeles ainsi car elles permettent de regarder lorganisation sous diffrents angles ou dimensions (par exemple sur laxe temps ou quantit vendue de produits ou encore chiffre daffaires). Ces bases de donnes multidimensionnelles constituent le S-IS. En effet elles ne sont constitues que de donnes propres la dcision. [Thiery et al. 2004]

SI de lEntreprise

Schma de lentrept relationnel

Schmas des BDM

SI-S

S-IS

Concepteurs

Reprsentation du SI-S et du S-IS

Les dcisions prises en utilisant un SI, sont fondes sur linformation qui sy trouve et elles dpendent aussi de lutilisateur qui a pour objet lappropriation de tels systmes pour son processus dcisionnel. Ainsi nous considrons un Systme d'Intelligence conomique (SIE) comme un systme qui combine

les propositions des domaines des Systmes dInformation Stratgiques (SIS), et la modlisation de l'utilisateur. Le but final dun systme dintelligence conomique est daider lutilisateur / dcideur dans son processus de prise de dcision. La figure 2 montre larchitecture dun systme dintelligence conomique propose par lquipe SITE1. Dans cette structure nous distinguons les quatre tapes suivantes.

UTILISATEURUTILISATEUR-ACTEUR a: dcideur b: veilleur c: client

? (b)
Le monde de linformation Base de donnes
Slection

? (a,b,c)
Demande
Mise en correspondance

Processus cognitif
* Observation * Abstraction lmentaire * Symbolisation/raisonnement * Crativit

? (a,c)
Rsultats
Analyse
Information valeur ajoute

? (a,c)
Interprtation

Dcision

Figure 3 : Architecture dun systme dintelligence conomique Slection : Elle permet de constituer le SI de lentreprise qui peut tre (i) la base de donnes de production (celle qui permet lexploitation courante de lorganisation), (ii) lensemble des informations support dun systme de recherche dinformations (en documentation par exemple) ou (iii) un systme dinformation stratgique reposant sur un entrept de donnes. Ce SI est constitu partir de sources de donnes htrognes, laide dun filtrage de la ralit Mise en correspondance : La mise en correspondance permet tout type dutilisateur daccder aux informations du SI. Deux principales mthodes daccs linformation sont actuellement proposes aux utilisateurs : accs par exploration et accs par requte. Lexploration est base sur la technique dhypertexte. Les requtes sont exprimes laide doprateurs boolens. Le rsultat de la mise en correspondance est un ensemble dinformations. Analyse : Afin de donner de la valeur ajoute aux informations trouves, des techniques danalyse sont appliques au rsultat. Par exemple, lassistante dun chef de service que nous considrons comme un veilleur pourra tablir des tableaux de bord pour son chef de service. Interprtation : Il sagit l de permettre au dcideur ou en gnral au client du systme de prendre les bonnes dcisions. Lide est que le dcideur nest pas forcment le client du

Modlisation et Dveloppement des Systmes dIntelligence Economiques Laboratoire Lorrain de Recherche en Informatique et ses Applications Nancy, France.

systme cest dire, par exemple, un veilleur. On voit alors tout lintrt de capturer des connaissances sur le dcideur et de les mettre dans les mta-donnes de lentrept afin de construire une base mtier spcifique un groupe de dcideur ou mieux encore un dcideur particulier. Les deux termes : veilleur et dcideur, seront dcrits dans le paragraphe suivant. Dans ce processus, nous pouvons galement identifier trois acteurs principaux : Dcideur : Cest celui qui est apte identifier et poser le problme rsoudre en terme denjeu, de risque ou de menace qui pse sur lentreprise. En dautres termes, il connat les besoins de son entreprise, les enjeux et ventuellement les risques et menaces quelle peut subir. Veilleur : celui-ci se spcialise dans la mthodologie de collecte et danalyse de linformation. Son objectif est dobtenir des indicateurs ou des informations valeur ajoute sur lesquels sappuieront les dcideurs. Aprs avoir reu le problme rsoudre exprim par le dcideur, le veilleur doit le traduire en terme des attributs des informations collecter qui sont ncessaires pour le calcul des indicateurs. Le veilleur doit identifier galement les sources pertinentes dinformations et employer son expertise pour obtenir de ces sources des informations pertinentes car la totalit des informations dans une source pertinente dinformations nest pas forcment pertinente. Cette dernire remarque peut tre illustre par le filtrage ncessaire sur une base de donnes dorganisation considre sre et valide mais dont toutes les informations ne sont pas ncessaires pour le problme traiter. Client : est lutilisateur final du systme, il peut prendre la casquette du dcideur ou celle du veilleur. Cet utilisateur doit tre dfini en prenant en compte le niveau du systme avec lequel il interagit.

2. Modlisation de lutilisateur
2.1 Rle de lutilisateur
Lutilisateur, en fait pour nous un dcideur, a un rle central jouer au sein dun systme dinformations stratgiques. Son utilisation efficace du systme est troitement lie son degr de connaissance du systme. La premire tape serait donc de pouvoir valuer ses connaissances, et donc den dduire limportance de son rle, sa faon de travailler, les donnes les plus souvent utilises, etc. Ensuite, partir de ces informations, une structure personnalise peut tre gnre pour amliorer son utilisation du systme. Un environnement de travail complet peut amliorer grandement son efficacit. Dautre part, il pourra mettre en vidence des lments critiques, des failles ou des lacunes du SIS. Pour cet utilisateur dcideur, le processus de prise de dcision commence par la prise en compte dun problme dcisionnel, que lon peut traduire comme son besoin dcisionnel (BeD). La rsolution dun BeD comporte lidentification de ses besoins informationnels (BI), ses besoins stratgiques, ses besoins humains etc. Nous mettons laccent sur ses besoins informationnels. Le BI peut tre dfini en fonction du modle de lutilisateur, son environnement et son (ses) objectif(s). Notre hypothse est quun entrept de donnes (ou data warehouse) est la base de tout SIS. Un entrept de donnes se dfinit dabord comme une collection de donnes orientes sujet, intgres, non volatiles et historises, organises pour le support dun processus daide la dcision [Inmon, 1995]. Cet entrept donne naissance, par filtrage par rapport des profils utilisateurs, des bases mtiers (ou data marts). Ce sont des sous bases de lentrept de donnes destines une fonction de lorganisme. Elles sont alimentes priodiquement et reposent sur une vue multidimensionnelle de donnes. Enfin, elles sont non modifiables par les utilisateurs.

2.2 Notre problmatique


La plupart des systmes dinformations existants ont t conus en prenant en compte un strotype de modle de lutilisateur, reposant sur le type de son mtier. Par exemple un SI autour de la gestion de commandes prendra en compte la faon dont on a lhabitude dans lentreprise de grer les commandes. Stock flux tendu ou non ? Livraison dissocie de la facture ? Paiement 30,60 ou 90 jours ? etc. Ds lors, ce modle nest pas complet puisque chaque utilisateur agit diffremment selon ses besoins et sa faon de travailler. Par exemple, un utilisateur / dcideur pourrait avoir un besoin spcifique lui (au niveau de traits personnalits, style cognitif, prfrences) qui na pas t trait dans le SI. Nous essayons de rpondre la question suivante : Quels sont les paramtres rajouter au modle de lutilisateur, quelles sont les donnes rajouter dans lentrept ou la base mtier pour rpondre au mieux au besoin informationnel de lutilisateur ?

2.3 Le modle propos


Lobjectif de la modlisation de lutilisateur est de pouvoir personnaliser les rponses du systme. La modlisation de lutilisateur est la faon de reprsenter un utilisateur et ses comportements. Cela concerne galement la faon dexploiter les connaissances dont le systme dispose son sujet. Trois catgories de modle sont proposes : Le profil de lutilisateur o un utilisateur est associ sa requte qui exprime son besoin. Dans ce contexte, le besoin de lutilisateur est relativement stable. Le profil est appliqu aux nouvelles informations afin de lui proposer les informations les plus pertinentes. Le modle implicite de lutilisateur o le comportement et les prfrences de lutilisateur sont dtermins dune manire implicite. Par exemple, la visualisation dun document par lutilisateur peut tre interprte comme une adquation du document par rapport sa requte. Le modle explicite de lutilisateur o le comportement et les prfrences de lutilisateur sont galement reprsents mais selon les spcifications de lutilisateur. Ici, lutilisateur ne fait que visualiser un document mais il faut quil indique son opinion sur le degr de pertinence du document par rapport sa requte.

Les travaux par [Thiery and David, 2002] sur la personnalisation des rponses en systme de recherche dinformation ont adapt les quatre phases cognitives identifies dans le processus dapprentissage humain, c'est--dire : La phase dobservation : lapprenant prend connaissance de son environnement par le processus dobservation ; La phase dabstraction lmentaire : lapprenant dsigne les objets observs par des mots, ce qui correspond galement une phase dacquisition de vocabulaire ; La phase de symbolisation et de raisonnement : lapprenant emploie des vocabulaires spcialiss qui relvent dun niveau dabstraction des concepts levs. Par exemple, quelquun un niveau dabstraction bas peut dire je vois un poisson , mais dira pas je vois un piscivore (i.e. un oiseau qui mange des poissons). Ou encore lors de la gestion de commandes la secrtaire engage la commande auprs dun fournisseur mais ne manipulera pas forcment aisment le compte charge correspondant ; La phase de crativit : lapprenant dcouvre et sapproprie des connaissances qui ne sont pas prsentes dune manire explicite dans le systme. Par exemple dans un cadre dexprimentation du prototype BIRDS que nous avons dvelopp, un lve a repr le fait

que tous les carnivores ont des pattes courtes, ce qui navait pas t reprsent explicitement dans le systme. Ce modle a t transform en un modle de lutilisateur dans un cadre de recherche dinformation. Les deux premires phases (observation et abstraction lmentaire) sont combines dans une seule phase exploration qui nous donne un modle : M = {Identit, Objectif, {Activit} {Sous-sessions}} O Activit = {Type-activit, Classification, Evaluation} Type = {Exploration, Requte, Synthse} Classification = {Attributs, Contraintes} Evaluation = {Solution du systme, Degr de pertinence} Identit : L'identit de l'utilisateur. Ce paramtre permet d'individualiser l'historique des sessions de l'utilisateur. Objectif : L'objectif principal ou besoin de l'utilisateur pour la session. Activit : Une activit de l'utilisateur pour obtenir des solutions son besoin en information. Une session est compose de plusieurs activits. Une activit est dfinie par trois paramtres : type-activit, classification, valuation. Type-activit : Les types d'activit correspondent aux diffrentes phases d'habitudes vocatives, savoir ici l'exploration, la requte et la synthse. Classification : La classification est l'approche que nous employons pour l'accs l'information. La technique de classification permet l'utilisateur d'exprimer sa demande en information dans les phases d'habitudes vocatives que nous implmentons. L'utilisateur pourra spcifier les attributs des documents classer et les contraintes qui doivent tre satisfaites par les documents. C'est ce que nous appelons classification avec contraintes . Par exemple, l'utilisateur peut spcifier l'attribut auteur et quipe=SITE. Notre systme donnera l'utilisateur les frquences des publications des auteurs, mais uniquement des auteurs de l'quipe SITE. Le systme permettra galement l'utilisateur d'accder aux documents publis par chacun des auteurs. L'utilisateur peut spcifier plusieurs attributs. Tous les attributs spcifis peuvent tre identiques ou diffrents. Par exemple (attribut : auteur, auteur) permet d'obtenir les frquences des co-publications des auteurs. valuation : L'utilisateur pourra valuer la pertinence de toutes les solutions du systme. Notons que l'valuation de l'utilisateur porte sur le degr de pertinence et les raisons du jugement. Par exemple, un document peut tre jug non-pertinent parce que l'utilisateur le connat dj. Nous ne voulons pas faire abstraction de la raison de la non pertinence du document pour l'utilisateur en tant qu'individu. Nous voyons ici un lment important de l'individualisation de notre modle. Nous ne pouvons pas gnraliser le jugement de la nonpertinence d'un document par un utilisateur sans connatre les raisons. Ces raisons ne sont pas identiques pour tous les utilisateurs. Sous-sessions : Une sous-session est reprsente de la mme manire que la session principale sauf pour le fait que l'objectif sera associ l'objectif principal et ne constituera pas une session part.

Le modle de lutilisateur a permis de proposer une architecture de SI qui repose sur l'volution cognitive de lutilisateur. L'architecture permet lutilisateur dexplorer la base dinformations pour dcouvrir son contenu, formuler des requtes, effectuer des annotations et lier des activits de recherche un besoin en information (objectif).

2.4 Le besoin informationnel


Le besoin informationnel dun utilisateur est un concept qui varie en dfinition, selon les chercheurs et selon les diffrents utilisateurs. Il existe des recherches qui ont essay de lui donner une dfinition [Campbell and Rijsbergen, 1996], [Xie, 2000]. Pour nous un besoin informationnel est une reprsentation informationnelle dun problme dcisionnel. Dfinir un problme dcisionnel implique une connaissance sur lutilisateur et son environnement. Donc, un problme dcisionnel est une fonction dun modle de lutilisateur, de son environnement et de son objectif . Nous nous appuyons sur la dfinition dun problme dcisionnel selon [Bouaka, 2003]. Le problme dcisionnel a t dfini ainsi : Pdcisionnel = f(enjeu, caractristiques individuelles, paramtres de lenvironnement)

Lenjeu est ce que lorganisation risque de perdre ou de gagner selon la dcision prise. Il est compos de lObjet, le Signal et lHypothse. Les caractristiques individuelles font rfrence lutilisateur, ses comportements et ses prfrences. Les paramtres de lenvironnement dsignent les apports de la socit sur lorganisation. Ils peuvent tre globaux ou immdiats. Donc, un problme dcisionnel peut tre dfini comme Pdcisionnel = f((O, S, H), (SC, TP, I), (EG, EI) O : O = lObjet de lenvironnement dtect par le dcideur ; S = le Signal associ cet objet, c'est--dire la signification de lobjet daprs le dcideur ; H = les Hypothses, qui traduisent les rsultats possibles ; SC = le Style Cognitif qui reprsentent les diffrences spcifiques et individuelles chaque personne ; TP = les Traits de Personnalits qui sont un ensemble des structures cognitives et affectives conserves dans le temps sur les individus pour faciliter leur adaptation aux vnements, aux circonstances, aux thmes, aux individus et leur perception de lenvironnement et enfin aux dcisions ; I = lidentit qui est une rfrence unique pour chaque utilisateur et pour chaque session ; EG = lEnvironnement Global, il regroupe lenvironnement social, politique, conomique. C'est-dire limage de lorganisation. EI = lEnvironnement Immdiat, qui a une implication directe sur lorganisation. Par exemple, les clients, les fournisseurs, les concurrents etc.

3. Domaine dApplication
Actuellement nous travaillons sur une version nouvelle de METIORE [David, 1999] (qui est une volution de STREEMS, une application qui gre des donnes botaniques et des donnes dexploitation sur les arbres) fonde sur la plateforme JAVA qui sera accessible partir de lInternet et donc disponible pour tous. La nouvelle version sera utilisable avec nimporte quel fichier valide XML ; ce fichier tant une base pour les diffrentes analyses souhaites. METIORE est un systme de recherche dinformations appliqu aux rfrences bibliographiques. Le systme est actuellement expriment sur une collection de plus de 6000 rfrences bibliographiques du laboratoire LORIA2. Le systme permet lutilisateur de pouvoir voluer dans ses niveaux dhabitudes vocatives. Cette fonctionnalit est implmente dans le systme par la mthode de
2

Laboratoire Lorrain de Recherche en Informatique et ses Applications.

recherche dinformation que nous avons dveloppe et que nous appelons analyse croise avec contraintes.

Figure 3 : La page daccueil de METIORE Comme toute application qui peut tre utilise dans un environnement de recherche cooprative dinformation, METIORE est compos dune interface graphique. Rappelons que linterface de lapplication permet lutilisateur deffectuer des interactions avec le systme. La mthode de recherche dinformation par analyse croise avec contraintes permet de formuler une recherche classique et dindiquer des attributs pour une analyse croise. Une recherche classique est compose de critres combins par des oprateurs boolens. Par exemple dans METIORE, (author * david) OU (year >=1990) indique que lutilisateur cherche des rfrences o lauteur contient le nom david ou des publications partir de 1990. Linterface danalyse croise avec contraintes permet dindiquer trois attributs pour une analyse. Les combinaisons possibles des attributs sont prsentes dans le Tableau 1 : (Types de spcification des attributs pour les analyses ). Pour le type 1, aucun attribut nest spcifi par lutilisateur. Dans ce cas, nous utilisons le champ rfrence comme attribut1. Le type 2 permet lutilisateur de spcifier lun des attributs dune rfrence bibliographique. Le systme fournit les frquences des valeurs de lattribut. Les types 3 et 4 permettent lutilisateur de spcifier deux attributs pour lanalyse. Dans le cas du type 3, les deux attributs sont identiques. Cela permet de calculer les co-occurrences intra-champ. Par exemple auteur, auteur pour connatre les co-auteurs. Dans le cas du type 4, les deux attributs sont diffrents. Cela permet de calculer les co-occurrences inter-champ. Par exemple auteur, anne pour connatre les publications par anne pour chaque auteur.

Les types 5 et 6 permettent lutilisateur de spcifier trois attributs pour lanalyse. Pour ces deux cas, lattribut 3 doit tre diffrent de lattribut1 et attribut 2. Par contre dans le cas du type 5, lattribut1 et lattribut 2 sont identiques et dans le cas du type 6 lattribut1 est diffrent de lattribut 2. En spcifiant lanne comme le troisime attribut, lutilisateur peut observer lvolution des co-occurrences des valeurs des deux premiers attributs.

Figure 4 : Une requte en METIORE

Figure 5 : Premiers rsultats

Figure 5 : Une reprsentation dune fiche correspondante un des rsultats. Il faut noter que seuls les attributs sont spcifis par lutilisateur. En donnant les frquences des valeurs des attributs spcifis par lutilisateur, le systme donne une vue globale de la base lutilisateur. Le systme fournit galement la liste des rfrences correspondant aux rsultats des analyses, ce qui donne un moyen lutilisateur pour dcouvrir les valeurs possibles pour les attributs. Cette fonctionnalit facilite donc la recherche par le contenu. Tous ces types danalyse permettent de suivre lvolution et lmergence de concepts.

TYPE 1 2 3 4 5 6

ATTRIBUT1 ATTRIBUT2 ATTRIBUT3

VARIATION Utiliser rfrence comme Attribut1

x X X X X x x x x x x Attribut1 == Attribut2 Attribut1 != Attribut2 Attribut1 == Attribut2 Attribut1 != Attribut2

10

Tableau 1 : Types de spcification des attributs pour les analyses Quand lutilisateur dmarre lapplication, nous lui demandons son objectif principal. Nous regardons si lutilisateur a dj formul un objectif similaire. Si oui, le systme lui propose les solutions classes selon les types dvaluation quil a donnes. Il peut changer les valuations . Sil est satisfait des solutions, alors il peut arrter sinon il peut modifier son objectif ou effectuer dautres recherches. Nous introduisons ici la notion de sous-objectif. Sil ny a pas dobjectif enregistr pour lutilisateur qui ressemble celui quil vient de prsenter, le systme regarde sil y aurait des objectifs similaires qui ont t prsents par dautres utilisateurs. Si oui alors cette solution servira de point de dpart pour le systme. Lutilisateur pourra toujours valuer les solutions du systme. Sil ny a pas dobjectif similaire retenu par dautres utilisateurs, alors lutilisateur doit effectuer des recherches pour trouver ce quil cherche. Ceci est possible puisque chaque activit ( chaque fois quil se connecte au systme) de lutilisateur est enregistre. Le systme alors observe le comportement de lutilisateur. Par exemple, si lutilisateur rpte une mme requte pour le mme objectif alors le systme peut dclencher un dialogue pour savoir pourquoi. Lintgration du paramtre objectif dans le modle de lutilisateur est dj prvue dans linterface daccs et danalyse de linformation par les zones OBJECTIF et Mots cls. La zone OBJECTIF donnera le texte complet de lobjectif de lutilisateur. La zone mots cls donnera la liste de mots cls associs cet objectif. Ces activits enregistres pour chaque utilisateur seront stockes dans un fichier XML qui sera analys afin de pouvoir amliorer les propositions du systme. Comme nous lavons dj dit nous nous plaons dans ce cadre dapplications de recherche dinformation , reposant sur lentrept de documents publis par des chercheurs du centre de recherche LORIA. Cet entrept contient les publications, historises et classes selon la nomenclature habituelle, des membres du laboratoire. Nous avons dj travaill sur la classification, la normalisation et lamlioration de telles ressources documentaires lectroniques et notre objectif est de constituer un rel entrept documentaire depuis lequel nous pourrions susciter tout type danalyse dinformation. En particulier, nous nous proposons de produire des bases mtiers selon les diffrents utilisateurs de lentrept, en utilisant le contenu du fichier XML, produit des activits de lutilisateur. Par exemple, voyons les bases mtiers obtenues lors dune analyse de cet entrept de documents. Nous ne cherchons plus les documents mme mais les informations sur ces documents qui peuvent aider pendant un processus de prise dcision. Dans la figure 3, nous pouvons observer les bases mtiers pour les 3 types dutilisateurs essentiels : 1. Lune (i) contient des documents et une reprsentation de l'volution des recherches des utilisateurs selon un sujet de recherche, par exemple un thsard qui fait une recherche sur un sujet prcis qui veut savoir qui a crit quoi ? ou quelles sont les publications dun auteur soit toutes, soit par une anne particulire . 2. La deuxime (ii) concerne les documents qui aident savoir l'volution des demandes dun utilisateur au cours du temps afin de pouvoir le tenir au courrant des nouvelles acquisitions dans son domaine de recherche ou de ne pas lui recommander la mme chose plusieurs fois, le destinataire est logiquement le documentaliste ; 3. La troisime (iii) concerne des documents selon l'volution des publications des quipes de recherche dans un centre de recherche au cours du temps. Cette information peut tre intressante pour la direction de ce centre de recherche mais lest moins pour les documentalistes. Chacun des utilisateurs aura une vision diffrente des donnes de lentrept par le biais des bases mtiers et peut-tre souhaitera que lui soient proposes uniquement les donnes utiles pour rpondre ses besoins.

11

Il faut galement noter que la structure actuelle des entrepts de donnes nen permet pas une volution facile. Ainsi lors dune interrogation de la base de documents du LORIA, nous voulions suivre lvolution des publications de chaque quipe. Or en fait, nous nous sommes aperus que lattribut EQUIPE qui pourrait nous aider raliser cette tche ntait pas inclus dans la base car ce champ navait pas t prvu la construction de la base. Un autre exemple est une question pose par un utilisateur qui voulait en savoir plus sur la visibilit des chercheurs des pays du sud. Ainsi, nous voulions voir si nous pouvons rpondre sa question en utilisant notre base de documents mais nous avons constat que la balise/ lattribut pays dorigine qui pourrait nous aider rsoudre cette question est manquante.

Entrept de donnes (documents)

Base Mtier (Thsard) i

Base Mtier (Documentaliste) ii

Base Mtier (Direction) iii

Figure 4 : Les bases mtiers de lentrept de documents Nous avons donc constat que certains attributs, ncessaires au processus de prise de dcision, peuvent tre absents. Et cest un de nos objectifs de dtecter ce phnomne lusage de la base mtier et de trouver des solutions pour y remdier.

4. Propositions supplmentaires
Pour les attributs manquants, nous avons classifi les types dinformations qui peuvent manquer. Il peut y en avoir deux majeurs : Les attributs lis lutilisateur : ce sont des attributs qui dcrivent lutilisateur, ses prfrences, ses habitudes, ses besoins informationnels etc. Les attributs lis aux documents : ce sont des attributs qui dcrivent les documents qui se trouvent dans la base. Ils sont ncessaires la description des documents.

Pour chacun de ces attributs, il y a des donnes associes qui sont les valeurs associables ces attributs. Nous sommes davis que ces attributs peuvent tre reprsents dans la base mais sans les valeurs associes. Ainsi il faut remarquer que des attributs ou des valeurs peuvent tre manquants. La solution propose, pour rsoudre le problme des informations manquantes dpend de lobjet considr : un attribut ou donne. Une premire solution est dtendre les sources dinformations

12

toutes les autres bases du centre et de ne pas se fonder seulement sur les bases du centre de documentation. Par exemple, lannuaire tlphonique du laboratoire LDAP qui contient les noms de tous les membres du centre de recherche avec leur appartenance une quipe peut tre utilis comme une source de donnes sur les utilisateurs et leur affiliation respective. Les systmes de GRH peuvent galement fournir des informations intressantes. Ce que nous proposons ici est dtendre les sources dinformations toutes les bases qui peuvent assister le systme pour rpondre aux besoins reposant sur des informations manquantes. On pourrait aussi exploiter les mtas donnes de lentrept. La dfinition des mtas donnes de lentrept doit tre faite de manire prendre en compte lutilisateur, ses comportements, et ses prfrences pour pouvoir scinder lentrept en bases mtiers plus intressantes pour chaque utilisateur. Ce type de solution pourrait aider lutilisateur dans son utilisation quotidienne du systme. Ainsi, ltude de la base doit nous permettre de vrifier si les donnes peuvent rpondre telles quelles toutes les attentes de tous les utilisateurs. Ltude de lhistorique des activits de lutilisateur peut mettre en valeur ses comportements et donc donner des indications sur ses besoins. Lide de base de notre travail sappuie sur lutilisation dune mthode dapprentissage pour dcliner un modle de lutilisateur, qui semble tre le mieux adapt pour notre problmatique. Nous envisageons galement de dvelopper un cahier de charges qui intgre les comportements de lutilisateur. Nous tenterons, ensuite, de comparer les deux approches dans le but dimplanter lune de deux, suivant ce qui nous paratra le plus intressant.

Un ensemble des besoins Informationnels dun dcideur

nsemble de donnes disponibles


E

Un ensemble des analyses ralisables sur un entrept de donnes

Figure 4 : Entrept de donnes La figure 4 montre les interactions possibles entre les donnes disponibles dans un entrept (ou une base de donnes), les analyses ralisables sur un entrept de donnes et les besoins informationnels dun dcideur. Les besoins informationnels peuvent tre transforms en requtes (qui peuvent tre des traductions ou des reprsentations des analyses ralisables sur lentrept). Les donnes disponibles dans lentrept sont utilises pour rpondre ces requtes avant de proposer une rponse au demandeur dinformation. C'est--dire que, pour les rponses les mieux adaptes aux besoins informationnels, nous nous appuyons sur les donnes disponibles. Mais, nous nous demandons si les donnes disponibles sont suffisantes pour rpondre tous les besoins ou sil y aura la ncessit dacqurir des donnes supplmentaires ? Ou bien est-ce que les donnes, telles quelles sont, peuvent rpondre tous les besoins informationnels exprimables par lutilisateur. Est-ce que les analyses ralisables sur un entrept peuvent exprimer tous les besoins ? Existe-t-il un lien entre ces trois ensembles ? Un des nos objectifs de recherche est dtudier les effets dun changement dun item dun

13

de ces ensembles sur les autres. Ceci, nous aiderait constater lexistence ou non dun mapping (ou un matching) entre ces trois ensembles.

5. Conclusion et perspectives
Dans cet article aprs avoir rappel ce que nous entendons par Intelligence Economique, Systme dIntelligence Economique, Systme dInformation Stratgique, entrept de donnes, base mtier, nous avons explicit notre dfinition de lutilisateur, de son problme dcisionnel, de son besoin informationnel. Puis nous avons dfini le modle utilisateur que nous avons retenu et nous avons montr comment lexploiter afin de construire les bases mtiers orientes BI dans le but de rpondre la question souleve par notre problmatique. Ensuite nous avons prsent notre domaine dapplication et les premires exprimentations que nous avons dj menes et les solutions que nous avons trouves pour rpondre notre problmatique. Enfin nous avons prsent nos objectifs actuels de rechercher. Une bonne dfinition dun besoin informationnel avec un modle de lutilisateur dans un contexte de la recherche dinformation (cf. la section 2) peut tre utilise pour extraire davantage dinformations sur lutilisateur, en particulier des informations sur ses comportements lors de ses connexions au systme. Nous pourrons ainsi en dduire les raisons de ses comportements et par consquent lui proposer des rponses adaptes son niveau. Nous travaillons actuellement sur une modlisation du besoin informationnel. Notre modle du besoin informationnel doit prendre en compte lutilisateur, ses comportements, ses prfrences etc. Ce modle nous servira la dfinition de mtas donnes stocker dans lentrept de donnes.

6. Bibliographie
[Bouaka and David, 2003] Najoua Bouaka and Amos David, Modle pour lExplicitation dun Problme Dcisionnel : Un outil daide la dcision dans un contexte dintelligence conomique in Proceeding of the Confrence on Intelligence Economique : Recherches et Applications, 14-15 avril 2003. [Campbell and Rijsbergen, 1996] Iain Campbell and Keith van Rijsbergen, The Ostensive Model of developing information needs in Proceeding of the Second International Conference on Conceptions of Library and Information Science, Copenhagen, October 1996. [David, 1999] Modlisation de lutilisateur et recherche cooprative dinformation dans les systmes de recherche dinformations multimedia en vue de la personnalisation des rponses Mmoire de HDR en Sciences de lInformation et de la Communication. Universit Nancy 2. 29 Juin 1999. [David and Thiery, 2003]. Amos David and Odile Thiery, LArchitecture EQuA 2te et son Application lintelligence conomique in Proceeding on the Confrence on Intelligence Economique : Recherches et Applications, 14-15 avril 2003. [Haynes, 2001] S. R. Haynes, Explanation in Information Systems: A Design Rationale Approach, PhD thesis submitted to The London School of Economics, 2001. [Inmon, 1995] W. H. Inmon, What is a Data Warehouse? Prism Tech Topic, Vol. 1, No. 1, 1995 [Kimball et al. 1998] Ralph Kimball, Laura Reeves, Margy Ross and Warren Thornthwaite, The Data Warehouse Toolkit: Experts Methods for Designing, Developing and Deploying Data Warehouses, Wiley, 1998. [Revelli, 1998] C. Revelli, Intelligence stratgique sur Internet, Paris, Dunod, 1998. [Tardieu and Guthmann, 1991]. H. Tardieu and B. Guthmann, Le triangle stratgique Les Editions dOrganisation, 1991. [Saracevic, 1996] T. Saracevic, Modeling interaction in information retrieval (IR): A review and proposal. Proceedings of the American Society for Information Science, 33, 3-9. 1996

14

[Thiery and David, 2002] Odile Thiery and Amos David, Modlisation de lUtilisateur, Systme dInformations stratgiques et Intelligence Economique, Revue Association pour le Dveloppement du Logiciel (ADELI). 2002. n 47. [Thiery et al., 2004] O.Thiery, A. Ducreau, N. Bouaka, A. David, Piloter une organisation : de linformation stratgique la modlisation de lutilisateur ; application au domaine de la GRH. In Congrs Mtamorphoses des organisations Nancy Novembre 2004. [Xie, 2000] Hong Xie, Patterns between interactive intentions and information-seeking strategies in Information Processing and Management 38 (2002). p 55 77.

15