Vous êtes sur la page 1sur 19

Université Saad Dahlab BLIDA 1

Faculté des sciences


Département d’informatique

Enrichissement de requêtes

Module: Recherche d’Information 2


M2 TAL

Par: Dr. Oukid Lamia


2022 - 2023

1
Introduction
 La qualité des réponses des systèmes de recherche
d’information (SRI) dépend de:

 La qualité du mécanisme d’appariement requête/documents,

 des requêtes formulées par l’utilisateur.

 Le besoin d’information n’est souvent pas suffisamment bien


exprimé par l’utilisateur pour le SRI.
Introduction (suite)

 La requête initiale telle qu’elle est saisie par l’utilisateur peut


être une représentation inadéquate ou incomplète des
besoins de l’utilisateur:

 Soit de lui-même
 Soit de la représentation des idées dans les documents
But de l’enrichissement de requêtes

 Améliorer le Rappel: permettre de récupérer davantage


de documents et donc de limiter le nombre de documents
pertinents non retournés.

 Améliorer la précision: limiter le retour de documents


non pertinents.
Enrichissement de requêtes
« Query Expansion »

Définition:
l’enrichissement de requêtes ou l’enrichissement de termes est un
processus qui vise à compléter la requête en proposant des termes
supplémentaires, et est considéré comme une amélioration de la
recherche d’information (Efthimis & Efthimiadis, 1996)
Enrichissement de requêtes

 Peut être appliquée quelle que soit la recherche ou les


méthodes utilisées.
Approches d’enrichissement de
requêtes
Approches basée sur une ressource
sémantique
 Ontologies

 Utilisation de Wordnet

 Utilisation des relations sémantiques pour l’enrichissement


de requêtes :
 synonymes, méronymes, hyponymes, hyperonymes et autres
relations sémantiques
Approches basée sur une ressource
sémantique

 Enrichissement interactive de la requête : l’utilisateur


choisit dans une liste issue de l’ontologie les concepts sur
lesquels il souhaite étendre sa recherche

 Enrichissement automatique de la requête: des


concepts sont ajoutés automatiquement à la requête à partir
de la ressource sémantique
Approches basées sur une collection
de documents

Hypothèse:
 les requêtes des utilisateurs n’ont pas suffisamment de
contexte pour bien cibler leur besoin d’information.

 créer une relation entre des termes qui sont cités dans les
mêmes documents.
Approches basées sur une collection
de documents
 Approches globales

 Utilisation de toutes la collection de documents pour


l’extension de la requête

 Co-occurrence de termes dans toute la collection

 Collection de documents de taille réduite


Approches basées sur une collection
de documents
 Approches locales

 Un ensemble de documents considérés comme pertinents.

 Retour de Pertinence « Relevance Feedback »:


 l’utilisateur examine les résultats de sa requête en déclarant au
système les documents pertinents et/ou non pertinents.
Relevance Feedback: Example
 Requête: Bike
 Résultats initiaux:
Relevance Feedback: Example
 Retour de pertinence de l’utilisateur:
Relevance Feedback: Example
 Résultats après enrichissement de la requête:
Approches indirectes
 Retour aveugle de pertinence« Implicit Feedback »

 Informations collectées de façon indirecte à la suite de


interactions des utilisateurs dans un processus de recherche
d’information.

 Utilisation des historiques (logs) des sessions de recherche


générés par l’ensemble des utilisateurs.
Approches indirectes
 Exemple d’utilisation Cui et al. [2003]
Hypothèse

 Si un document est souvent ouvert pour la même requête


dans plusieurs sessions de recherche, les termes de ce
document sont probablement pertinents vis à vis des termes
de la requête, et sont donc de bons candidats pour
l’expansion de nouvelles requêtes similaires.
Critique

 La dérive de la requête:
 Les nouveaux termes ajoutés à une requête peuvent pousser les
résultats vers un sens différent de celui cherché à la base.
Références
-G. Salton and M. J. McGill. Introduction to modern information retrieval. McGraw-Hill, New
York, 1983.

-C. Manning, P. Raghavan, and H. Schütze. An Introduction to Informa-


-tion Retrieval. Cambridge university press, Cambridge, England, 2009.

-M.Boughanem. Cours Recherche d’Information https://www.irit.fr/~Mohand.Boughanem/

- W. AZZOUG. Contribution à la définition d’une approche d’indexation sémantique de


documents textuels. Thèse de doctorat, 2013.

-Jian-Yun Nie. Information Retrieval-Query expansion. Title (umontreal.ca) (accès novembre


2021)

19

Vous aimerez peut-être aussi