Vous êtes sur la page 1sur 27

Application des techniques denchres dans

les rseaux de radio cognitive


Badr Benmammar
Rapport de recherche
Laboratoire de Tlcommunications Tlemcen
Universit Abou Bekr Belkaid , Tlemcen, Algrie
BP 230 ple Chetouane, 13000 Tlemcen
badr.benmammar@gmail.com

RESUME. La prolifration rapide de standards et services de radiocommunication ces dernires annes provoquent le problme de la pnurie du spectre. Dans ce contexte, l'objectif
principal de la Radio Cognitive (RC) est de faciliter laccs au spectre radio. Notre contribution dans le cadre de ce papier est lutilisation des enchres pour rsoudre le problme de
lencombrement du spectre dans le cadre de la RC. Pour cela, nous avons combin la thorie
des enchres avec les systmes multi agents. Notre approche a prouv quil est prfrable
dutiliser les enchres Enveloppe Scelle avec programmation dynamique car cette mthode
a beaucoup davantages par rapport aux autres mthodes.
ABSTRACT. The rapid proliferation of standards and radio services in recent years caused the
problem of spectrum scarcity. The main objective of Cognitive Radio (CR) is to facilitate
access to radio spectrum. Our contribution in this paper is the use of auctions to solve the
problem of spectrum congestion in the context of CR, for that, we will combine the theory of
auctions with multi-agent systems. Our approach has shown that it is preferable to use the
Sealed-bid Auction with dynamic programming because this method has many advantages
over other methods.
MOTS-CLES : Radio cognitive, thorie des enchres, systme multi-agent, programmation
dynamique, accs dynamique au spectre.
KEYWORDS: Cognitive radio, auction theory, multi-agent system, dynamic programming,
dynamic access spectrum.

1. Introduction
Avec la prolifration des diffrentes technologies de rseau sans fil tels que les
rseaux cellulaires, rseaux locaux sans fil, les rseaux mtropolitains sans fil, etc. la
demande de spectre radiolectrique est en augmentation considrable. Actuellement,
le spectre est rglement par un organisme gouvernemental comme la Federal
Communications Commission (FCC), et il alloue le spectre en attribuant des licences exclusives pour les utilisateurs d'exploiter leurs rseaux dans diffrentes
rgions gographiques.
Il y a une croyance largement rpandue que le spectre radiolectrique est de plus
en plus encombr. Toutefois, les mesures de spectre indiquent que le spectre attribu
est sous-utilis, c'est dire, nimporte quel temps et endroit donnes, une grande
partie du spectre est non utilise. Les rseaux de radio cognitive (RC) apparaissent
comme une solution prometteuse ce problme.
Lide de la RC consiste partager le spectre entre un utilisateur dit secondaire
qui pourra tout moment accder des bandes de frquence quil trouve libres, et
un utilisateur dit primaire qui possde une licence sur cette bande.
Il faut noter galement que lvolution technologique de ces dernires dcennies
a entran une croissance considrable de nouveaux services de tlcommunications
utilisant la ressource rare que constitue le spectre radiolectrique. On prvoit que la
demande de frquences continuera daugmenter avec le dveloppement de nouvelles
techniques de tlcommunications ce qui augmente lallocation du spectre statique
qui est un problme majeur dans les rseaux sans fil. Gnralement, ces allocations
conduisent une utilisation inefficace du spectre donc le problme de
lencombrement de celui-ci.
Dans le cadre de ce travail, nous avons utilis la thorie des enchres qui est une
technique daccs dynamique au spectre pour rsoudre le problme
dencombrement. Cette mthode est connue par sa simplicit dans le but de faciliter
lallocation des ressources rares. Donc, dans le cadre de ce papier, nous avons mis
en place plusieurs mthodes tels que une variante de FIFO (FIFO' : FIFO mais sans
blocage des demandes insatisfaites), lenchre enveloppe scelle avec et sans programmation dynamique. Les trois mthodes ont t implmentes laide de loutil
JADE (Java Agent DEvelopment Framework). Une comparaison entre les trois
mthodes a t galement ralise afin de tirer des conclusions dans ce contexte. Les
rsultats obtenus nous ont permis de confirmer que lutilisation des enchres avec
programmation dynamique a beaucoup davantages en termes de nombre de SUs
satisfaits, gain obtenu par le PU, temps de traitement ct PU et finalement temps de
rponse cot SU.
Ce papier est organis comme suit :
Dans la section 2, nous introduisons le concept de la radio cognitive tout en
prsentant sa dfinition et ses principes les plus importantes, ensuite les diffrentes
phases de cycle de cognition et les fonctions la radio cognitive seront dtailles.

Enfin, une brve description sera donne sur les rseaux de la radio cognitive pour
comprendre le fonctionnement exact de ce paradigme.
La troisime section prsente une brve description sur les diverses mthodes
daccs dynamique au spectre tels que la thorie des jeux, les chanes de Markov et
les systmes multi agent. Tandis que, concernant notre sujet principal, nous nous
concentrons sur les approches d'accs au spectre bases sur la thorie des enchres.
La quatrime section dcrit les simulations que nous avons effectues pour valider notre approche. Pour mettre en pratique ceci, nous avons mis en place un scnario qui dcrit notre approche auquel nous sommes confrontes. Une fois que les
rsultats sont obtenus, une comparaison est effectue pour montrer que lutilisation
des enchres avec programmation dynamique est la solution la plus efficace pour
amliorer la gestion et l'utilisation du spectre radio.
2. Radio cognitive
La radio cognitive est un nouveau paradigme de la conception de systmes de
communication sans fil qui vise amliorer l'utilisation de la frquence radio (RF)
du spectre. La motivation derrire la radio cognitive est la raret du spectre des frquences disponibles, la demande croissante, provoque par les applications sans fil
mergents pour les utilisateurs mobiles.
Le principal facteur caus par la forte demande est lencombrement de spectre
qui conduit une utilisation inefficace de celui-ci. Pour rsoudre ce problme il faut
une bonne gestion du spectre. Cest dans ce cadre que des tudes sont menes dans
le domaine de la radio cognitive par des chercheurs donc il est clair que les rseaux
de radio cognitive constituent un domaine de recherche trs prometteur.
2.1. Dfinition et principe
Lide de la radio cognitive a t prsente officiellement par Joseph Mitola III
un sminaire KTH, l'Institut royal de technologie, en 1998, publi plus tard dans
un article de Mitola et Gerald Q. Maguire, Jr en 1999.
Mitola combine son exprience de la radio logicielle ainsi que sa passion pour
l'apprentissage automatique et l'intelligence artificielle pour mettre en place la technologie de la radio cognitive. Daprs lui : Une radio cognitive peut connatre,
percevoir et apprendre de son environnement puis agir pour simplifier la vie de
l'utilisateur.
Le terme radio cognitive (RC) est utilis pour dcrire un systme ayant la capacit de dtecter et de reconnatre son cadre d'utilisation, ceci afin de lui permettre
dajuster ses paramtres de fonctionnement radio de faon dynamique et autonome
et d'apprendre des rsultats de ses actions et de son cadre environnemental d'exploitation. (cf Benmammar et Amraoui., 2013)

La radio cognitive est une technologie qui fait appel lintelligence des rseaux
et des terminaux pour :
- dtecter les besoins de communications des utilisateurs en fonction de l'utilisation ;
- fournir des ressources radio et les services sans fil les plus appropris ces besoins.
Une radio cognitive doit tre capable de raliser trois tches essentielles :
- Aware : cest la capacit prendre conscience de son environnement. Un terminal radio cognitif associera donc environnement spatial, spectral et comportement
des usagers, pour une meilleure prise en conscience du provisionnement en ressources et un meilleur service.
- Adaptation : cest la capacit sadapter soit lenvironnement (spectral ou
technologique), soit lutilisateur (besoins et scurit).
Ladaptation lenvironnement spectrale est la capacit choisir les meilleures
bandes de frquences et ainsi optimiser lutilisation du spectre. Cela revient :
- connatre loccupation des bandes de frquences en temps rel ;
- adapter les puissances mises / marges en rception / formes dondes ;
- adapter le dbit en temps rel en fonction de la place disponible ;
- prendre en compte un partage temporel.
- Cognition : La cognition regroupe les divers processus mentaux allant de l'analyse perceptive de l'environnement la commande motrice (en passant par la mmorisation, le raisonnement, les motions, le langage). Cette dfinition dpasse donc
le seul cadre de la cognition humaine ou animale. La radio cognitive est donc un
systme qui peut percevoir son environnement, lanalyser, le mmoriser et agir en
consquence. (cf Chehata., 2011)
La radio cognitive offre galement une solution quilibre au problme de l'encombrement du spectre en accordant d'abord l'usage prioritaire au propritaire du
spectre, puis en permettant d'autres de se servir des portions inutilises du spectre.
(cf Benmammar et Amraoui., 2013)
2.2. Cycle de cognition
Une radio cognitive est un systme radio qui opre selon un cycle prcise appel
cycle cognitif. Mitola dfinit le cycle cognitif en six tapes selon le schma
gnrique prsent dans la Figure 1 :

Figure 1. Cycle de cognition version Mitola.

Ce cycle cognitif se ralise en parallle avec la fonction principale du systme radio, c'est dire la communication. (cf Colson et Kountouris, 2006). Une
radio cognitive fonctionne ainsi :
- Phase dobservation : La RC observe son environnement par l'analyse du flux de
stimuli entrant. Dans la phase d'observation, la RC associe lemplacement, la temprature, le niveau de lumire des capteurs, et ainsi de suite pour en dduire le contexte
de communication. Cette phase lie ces stimuli des expriences antrieures pour
discerner les modles au fil du temps. La radio cognitive rassemble les expriences
en se souvenant de tout.
- Phase dorientation : La phase d'orientation dtermine l'importance d'une observation en liant celle-ci une srie connue de stimuli. Cette phase fonctionne l'intrieur des structures de donnes qui sont analogues la mmoire court terme
(STM), que les gens emploient pour sengager dans un dialogue sans forcment se
souvenir de tout la mme mesure que dans la mmoire long terme (LTM). Le
milieu naturel fournit la redondance ncessaire pour lancer le transfert de la STM
la LTM. La correspondance entre les stimuli courants et les expriences stockes se
fait par reconnaissance des stimuli ou par reliure.
- Phase de planification : La plupart des stimuli sont traits avec dlibrative plutt
quavec ractivit. Un message entrant du rseau serait normalement trait par la
gnration d'un plan (dans la phase de plan, la voie normale). Le plan devrait galement inclure la phase de raisonnement dans le temps. Gnralement, les rponses
ractives sont prprogrammes ou apprises en tant dit, tandis que d'autres ractions
de dlibration sont prvues.
- Phase daction : Cette phase lance les processus slectionns qui utilisent les effecteurs slectionns qui accdent au monde extrieur ou aux tats internes de la

radio cognitive. L'accs au monde extrieur consiste principalement composer des


messages qui doivent tre envoys dans l'environnement en audio ou exprims dans
diffrents langages appropris.
- Phase de dcision : La phase de dcision slectionne un plan parmi les plans candidats. La radio peut alerter l'utilisateur dun message entrant ou reporter l'interruption plus tard en fonction des niveaux de QoI (Quality of Information) status dans
cette phase, en fonction de cette information, la radio dcide si une bande du spectre
est libre ou si elle est occupe ; si elle est occupe, une autre bande libre est choisie
pour la poursuite de la communication.
- Phase dapprentissage : Lapprentissage dpend de la perception, des observations, des dcisions et des actions. L'apprentissage initial est ralis travers la
phase dobservation dans laquelle toutes les perceptions sensorielles sont continuellement compares l'ensemble de l'exprience antrieure pour continuellement
compter les vnements et se souvenir du temps coul depuis le dernier vnement.
(cf Benmammar et Amraoui., 2013)
2.3. Fonctions de la radio cognitive
Les principales fonctions de la radio cognitive sont les suivants : (cf Amraoui et
al., 2012)
- Dtection de spectre (Spectrum sensing) : Dtection de spectre inutilis et de le
partageant, sans interfrences nuisibles d'autres utilisateurs ; une condition importante du rseau de radio cognitive pour capter le spectre vide. Dtecter les utilisateurs primaires est le moyen le plus efficace pour dtecter le spectre vide. Les techniques de dtection de spectre peuvent tre regroupes en trois catgories :
- Dtection dmetteur : Les radios cognitives doivent avoir la capacit de dterminer si un signal d'un metteur primaire est prsent localement dans un certain
spectre. Il existe plusieurs approches proposes la dtection dmetteur :
- dtection d'un filtre correspondant (Matched filter detection).
- dtection d'nergie (Energy detection).
- dtection de fonctionnalit cyclostationnaire (Cyclostationary-feature detection).
- Dtection cooprative : Fait rfrence aux mthodes de dtection du spectre
o les informations provenant de plusieurs utilisateurs de radio cognitive sont incorpores pour la dtection de l'utilisateur primaire.
- Dtection d'interfrences.
- La gestion du spectre (Spectrum management) : Capturer le meilleur spectre
disponible pour rpondre aux besoins de communication des utilisateurs tout en ne
crant pas l'interfrence anormale aux autres utilisateurs (primaires). Les radios
cognitives devrait dcider de la meilleure bande de frquences (de toutes les bandes
disponibles) pour rpondre la qualit des services exigences et par consquent , les

fonctions de gestion du spectre sont requises pour les radios cognitives. Le fonctions
de gestion du spectre sont classes comme : (cf Amraoui et al., 2012)
- Analyse du spectre : elle permet de caractriser les diffrentes bandes spectrales en termes de frquence d'opration, de dbit, de temps et de l'activit de l'utilisateur primaire. Cette caractrisation sert rpondre aux exigences de l'utilisateur.
Des paramtres supplmentaires viennent complter cette caractrisation, savoir, le
niveau d'interfrence, le taux d'erreur du canal, 1es vanouissements, le dlai et le
temps d'occupation de la bande spectrale par un utilisateur. (cf Chehata., 2011)
- Dcision sur le spectre : aprs que toutes les bandes spectrales aient t catgorises et classifies, on applique un ensemble de rgles dcisionnelles pour obtenir
la ou les bandes spectrales les plus appropries la transmission en cours, en tenant
compte des exigences de lutilisateur. (cf Chehata., 2011)
- Modle de dcision : un modle de dcision est ncessaire pour l'accs au
spectre. La complexit de ce modle dpend des paramtres considrs lors
de l'analyse du spectre.
- Comptition / coopration dans un environnement multi utilisateurs :
Lorsque plusieurs utilisateurs ( la fois primaires et secondaires) sont dans
le systme, leur prfrence va influer sur la dcision du spectre daccs. Ces
utilisateurs peuvent tre coopratifs ou non coopratifs dans l'accs au
spectre.
Dans un environnement non-coopratif, chaque utilisateur a son propre objectif,
tandis que dans un environnement coopratif, tous les utilisateurs peuvent collaborer
pour atteindre un seul objectif. Dans un environnement coopratif, les radios cognitives cooprent les unes avec les autres pour prendre une dcision pour accder au
spectre et de maximiser une fonction objectif commune en tenant compte des contraintes. Dans un tel scnario, un contrleur central peut coordonner le spectre de
gestion. (cf Benmammar et Amraoui., 2013)
- La mobilit du spectre (Spectrum mobility) : processus par lequel un utilisateur de
radio cognitive modifie sa frquence de fonctionnement. Les rseaux de radio cognitive visent utiliser les frquences de manire dynamique, en permettant aux terminaux radio fonctionnant dans la meilleure bande de frquence disponible, maintenant des exigences de communication transparente lors des transitions un meilleur
spectre. (cf Amraoui et al., 2012)

Figure 2. Accs au spectre coopratif et non-coopratif. (Ekram et al., 2009)


2.4. Architecture dun rseau de radio cognitive
Les rseaux de radio cognitive (ou smart) sont une approche innovatrice l'ingnierie sans fil dans lequel les radios sont conus avec un niveau sans prcdent de
l'intelligence et l'agilit. Cette technologie de pointe permet aux appareils de radio
d'utilisation du spectre dans des voies entirement nouvelles et sophistiques.
Le rseau radio cognitive est un systme de communication multi-utilisateurs
complexes sans fil capable d'un comportement mergent. Elle incarne les fonctions
suivantes (cf Simon., 2008):
- percevoir l'environnement radio (c'est dire, l'extrieur du monde) en habilitant
le rcepteur de chaque utilisateur pour dtecter l'environnement sur une base continue dans le temps ;
- apprendre de l'environnement et d'adapter les performances de chaque metteur/rcepteur (metteur-rcepteur) aux variations statistiques dans les stimuli RF
entrants ;
- faciliter la communication entre plusieurs utilisateurs grce la coopration d'une
manire auto-organiss ;
- contrler les processus de communication entre les utilisateurs concurrents grce
une rpartition judicieuse des ressources disponibles ;
- crer l'exprience de l'intention et la conscience de soi.
Une description dtaille de l'architecture des RRC est primordiale pour dvelopper des protocoles efficaces de communication. Dans cette section, nous dcrirons l'architecture des RRC qui peut tre dcompos en deux groupes : rseau primaire et rseau secondaire.
- Le rseau primaire : est le rseau dot d'une licence pour utiliser certaines bandes
spectrales. Le rseau primaire a acquis ce droit travers l'achat de licences des
agences gouvernementales. Il est compos des lments suivants (cf Ahmed Ben,
2011) :

- Un utilisateur primaire : (dit utilisateur licenci) est un utilisateur qui dtient


une licence pour oprer sur des bandes spectrales qui lui sont rserves. L'accs
est contrl uniquement par ses stations de base et ne doit pas subir
dinterfrence extrieure nuisible. Les PUs ne doivent subir aucune modification
pour permettre la coexistence avec les utilisateurs ou rseaux de radios cognitives ou leurs stations de base.
- Une station de base primaire : (dite station de base licencie) La station de
base des PU est une structure fixe du rseau primaire qui possde une licence
pour oprer sur la bande spectrale. Ces stations sont conues de telle sorte ne
pas partager le spectre avec aucune entit extrieure au systme, en l'occurrence,
les utilisateurs radio cognitive. Cependant, il peut exister des stations de bases
licencies qui reconnaissent les protocoles des utilisateurs radio cognitive.
- Le rseau secondaire : Le rseau secondaire, appel aussi rseau de radios cognitives ou rseau non-licenci, ne possde pas de licence pour oprer sur la bande
spectrale. D'o le besoin d'un ensemble de fonctionnalits additionnelles pour pouvoir partager les bandes spectrales licencies d'une manire opportuniste. Les rseaux secondaires sont dploys en mode infrastructure ou en mode ad-hoc. Ils se
disposent de quatre composants (cf Ahmed Ben, 2011) :
- Un utilisateur radio cognitive : (dit utilisateur non licenci ou utilisateur
secondaire) n'a pas de licence pour transmettre sur la bande spectrale. Cependant, grce aux fonctionnalits additionnelles dont ils disposent, ces utilisateurs
pourront partager la bande spectrale avec les utilisateurs primaires condition
de ne pas nuire leurs transmissions ou bien profiter de leur absence pour transmettre.
- Une station de base secondaire : (dite station de base non licencie) est une
infrastructure fixe avec des capacits cognitives. L'utilisateur se connecte la
station de base secondaire pour accder d'autres rseaux ou services.
- Un serveur spectral : (en anglais Spectrum server) est une entit du RRC qui
sert partager les ressources spectrales entre diffrents utilisateur dans le mme
rseau. Ce serveur est connect aux rseaux secondaires et agit comme un gestionnaire d'information spectrale. Dans un RRC, un utilisateur peut tre lu par
les autres utilisateurs pour remplir les tches du serveur spectral. L'lection de
ce serveur dpend essentiellement de l'emplacement de ce dernier et de ses capacits raliser une dtection spectrale quasi parfaite.
- Un courtier spectral : (en anglais Spectrum broker) est une entit du RRC qui
partage les ressources spectrales entre diffrents RRC. Ce serveur est connect
plusieurs RRC et agit comme un gestionnaire d'information spectrale.

Figure 3. Architecture des rseaux de radio cognitive. (cf Akyildiz, 2006)

Selon l'architecture prsente dans (Akyildiz, 2006), le RRC est un ensemble de


plusieurs types de rseaux qui coexistent sur les mmes bandes spectrales. cause
de cette htrognit, il existe diffrents types d'accs ces rseaux (cf Ahmed
Ben, 2011) :
- accs au RRC : les utilisateurs accdent leur station de base en utilisant les
spectres licencis ou non licencis ;
- accs au rseau ad-hoc de radios cognitives : les utilisateurs peuvent communiquer entre eux travers des connexions ad-hoc sur des spectres licencis ou non
licencis ;
- accs au rseau licenci : les utilisateurs accdent la station de base des PUs en
utilisant les spectres licencis.
3. Accs dynamique au spectre dans la cadre de la RC
L'accs dynamique au spectre est considr comme une solution approprie
pour rsoudre le problme courant de pnurie de spectre. Les futures architectures
de rseau de radio cognitive devraient tre volutive et assez cooprative, afin de
fournir les meilleures solutions possibles. Le but final est d'augmenter l'utilisation de
spectre par l'utilisation des techniques d'accs plus efficaces et les utilisateurs de
radio cognitive pourront bnficier de ces techniques pour pouvoir accder au
spectre requis quand et o ncessaire (si possible), un cot accessible.
Gnralement, l'accs au spectre peut tre vu comme sous-ensemble de la gestion de ressource radio. Pour une meilleure explication de certains des techniques

10

dj proposs lis l'accs au spectre, nous avons divis ces travaux en diffrents
domaines. Premirement, nous prsentons les solutions bases sur la thorie des
jeux, des chanes de Markov et des systmes multi agent. Tandis que, concernant
notre sujet principal, nous dpeignons les approches d'accs au spectre bases sur la
thorie des enchres.
3.1. Accs au spectre en utilisant la thorie des jeux
Plus gnralement, une partie de poker, la formation dune quipe, o une ngociation entre agents pour la prise de rendez-vous est autant de jeux diffrents obissant des rgles spcifiques. Dans ces jeux, chaque participant ne peut tre totalement matre de son sort ; on dit alors que tous les intervenants se trouvent en situation dinteraction stratgique. La thorie des jeux vise tudier formellement ce
type de jeux o le sort de chaque agent participant dans le jeu, dpend non seulement des dcisions quil prend mais galement des dcisions prises par les autres
agents intervenant dans le jeu. Ds lors, le meilleur choix pour un agent dpend
gnralement de ce que font les autres. Les agents participants un jeu sont appels
joueurs. Ainsi un joueur est un agent qui pourrait reprsenter une entreprise, un
robot, un consommateur, etc. (cf Chaib-draa., 2010)
La thorie des jeux fournit la base mathmatique et statistique pour l'analyse des
processus dcisionnels interactifs en prvision de ce qui se produira quand les
joueurs interagissent avec les conflits d'intrts. Fondamentalement, un jeu se compose de trois partis principaux : un ensemble de joueurs, un ensemble d'actions, et un
ensemble de prfrences. Deux prtentions importantes sont faites, y compris la
prtention de rationalit, dans laquelle, les joueurs choisissent les stratgies qui
maximisent leurs gains individuels attendus, et prtention de connaissance commune, avec tous les joueurs ayant la connaissance d'autres joueurs joignant et laissant le jeu, leurs ensembles d'action, et dfinitions de leur rapport de prfrence. (cf
Mir, 2011)
Quand les joueurs agissent, les rsultats entiers (utilit possible de chaque
joueur) pour le jeu peuvent tre drivs par leur rapport de prfrence. La proprit
la plus clbre et la plus connue de l'approche des thories des jeux est appel quilibre de Nash (NE), qui est un concept de solution d'un jeu comportant deux ou
plusieurs joueurs. En NE, on assume que chaque joueur sait les stratgies d'quilibre
des autres joueurs, et aucun joueur n'a rien gagner en changeant sa propre stratgie
(cf Mir, 2011)
Largement, les concepts de thorie des jeux ont t intensivement employs
pour des attributions de spectre dans les rseaux de radio cognitive, o les utilisateurs primaire et secondaires participant un jeu, se comportent rationnellement
pour choisir les stratgies qui maximisent leurs gains individuels. (cf Mir, 2011)
Les gains dsirs peuvent tre sous forme d'utilisation de spectre pour la dure
respecte, le prix associ, le rapport signal sur bruit (SNR), le taux d'erreurs binaire
(BER) et de retard, etc (cf Mir, 2011)

11

Ainsi, afin de la simplicit et sur la base des comportements des joueurs dans un
jeu, ces jeux sont gnralement classs dans deux domaines : jeux coopratifs, et
jeux comptitifs.
Dans le cadre des jeux coopratifs, les joueurs sont autoriss communiquer
avant de choisir leurs stratgies et de jouer le jeu. Ils peuvent convenir, mais aussi en
dsaccord sur une stratgie commune. (cf Gaoning., 2010)
Tous les joueurs sont proccups par tous les gains globaux et ils ne sont pas
trs inquiets de leur gain personnel. Certains travaux rcents utilisent la thorie des
jeux coopratifs pour rduire la puissance de transmission des utilisateurs secondaires afin dviter de gnrer des interfrences avec les transmissions des utilisateurs primaires. (cf Beibei et al., 2007)
Au contraire, un jeu non coopratif est bas sur l'absence des coalitions (cf Mir,
2011) o chaque joueur agit individuellement pour optimiser son rendement, sans
gard la performance des autres joueurs (cf Gaoning., 2010) et donc toutes ses
dcisions sont prises de manire comptitive et goste. (cf Amraoui et al., 2012)
Dans la littrature existante, nous avons constat que les concepts thoriques du
jeu ont t largement utiliss pour des attributions de frquences dans les rseaux
RC, o lorsque les utilisateurs primaires et secondaires participent un jeu, ils ont
un comportement rationnel pour choisir les stratgies qui maximisent leurs propres
gains. (cf Amraoui et al., 2012)
3.2. Accs au spectre en utilisant les approches de Markov
Dans ce qui prcde, nous avons discut de plusieurs aspects lis l'application
de la thorie des jeux dans les rseaux de RC. Toutefois, les approches de thorie
des jeux ne savent pas modliser l'interaction entre le SU et le PU pour l'accs au
spectre. Cette modlisation peut tre ralise en utilisant efficacement les chanes de
Markov et peu de recherche ont t effectus. Dans (Chunsheng et al., 2010), un
modle de Markov est prsent, o chaque SU choisit au hasard son propre canal
plutt que d'changer des messages de contrle avec le SU voisin. (cf Mir, 2011)
Les processus d'accs au spectre ont aussi t modliss en temps continu avec
CTMC (Chaines de Markov en temps continu continuous time Markov chain ).
Un modle relatif de CTMC est prsent dans (Beibei et al., 2007) pour capturer
l'interaction entre les utilisateurs primaires et secondaires. Les deux modles avec et
sans files d'attente sont analyss et la dgradation du dbit due linterfrence des
SU est compense. Les modles CTMC obtiennent des bonnes statistiques entre
quit et efficacit. (cf Mir, 2011)
Un autre systme CTMC de l'attribution du spectre optimal est prsent dans
(Xiaorong et al., 2007), ce qui rduit la probabilit de terminaison force de la SU
correspondant. Le mme type de modles CTMC avec et sans file d'attente sont
analyss dans (Waqas et al., 2009 ; Zhang, 2008 ; Zhao et al. , 2007) et les paramtres tels que la probabilit de est considrablement rduit. (cf Mir, 2011)

12

Nanmoins, un nombre limit de travaux ont t raliss pour accder au spectre


sans licence l'aide de chanes de Markov. Parmi ceux-ci, un clbre modle de
CTMC est propos dans (Xing et al., 2006) pour atteindre des assignations quitables de frquences entre les SU. Cette approche vise plus spcifiquement sur
l'utilisation efficace du spectre, en vitant les interfrences. En utilisant le modle
CTMC, les auteurs tirent le temps d'utilisation du spectre et de la probabilit de
blocage comme indicateurs de performance importants. Les rsultats d'analyse et de
simulation montrent que le modle propos permet d'obtenir un bon compromis
entre efficacit et quit.
3.3. Accs au spectre en utilisant les Systmes Multi Agents (SMA)
Les SMA ont t dj appliqus pour l'allocation des ressources et les partages
dans des contextes diffrents, via des applications et des rseaux sans fil actuels (cf
Sycara Katia, 1998). Un des nouveaux apports des SMA est leur utilisation dans les
rseaux de la radio cognitive. (cf Mir et al., 2009)
Un SMA est employ pour contrler des ressources de spectre travers plusieurs LANs sans fil (WLANs), situ dans une zone gographique (cf Benmammar
et Krief. , 2003 ; Jrad et al. , 2005). Chaque point d'accs (AP) situ dans un WLAN
contient un agent qui interagit avec les agents voisins dAP (situs dans l'autre
WLANs) pour former un SMA. (cf Jiang et al. , 2007).
L'architecture interne d'un agent se compose de deux parties : l'estimation de paramtres prdictifs, qui gnre des estimations de paramtres en utilisant les caractristiques du signal reu partir de l'environnement WLAN, et de l'optimisation de
gestion des ressources, qui dcide les bandes appropries de spectre choisir. L'approche propose est explique conceptuellement, mais rien d'analyse et des expriences ne sont montres.
Un schma d'allocation distribue et dynamique de facturation, tarification et
des ressources sont examins. Le protocole utilis pour l'allocation des ressources
radio entre les SUs et les oprateurs est nomm comme protocole denchres offre
scelle multi-unit qui est bas sur le concept de soumissions et d'attribution des
marchandises. Un bon agent d'allocation de ressource radio (RAA) qui gnre les
offres pour obtenir le spectre dsir reprsente le comportement de chaque SU. Un
agent commissaire-priseur reprsente le comportement de l'oprateur, ayant les
capacits d'annoncer des enchres (pour l'accs au spectre) et le calcul du prix relatif. (cf Tian et al., 2010). L'cosystme se compose de plusieurs parties, y compris :
- gestion de mmoire tampon QoS (qualit de service-BM), dtermine les donnes
envoyer en premier lieu ;
- gestionnaire de profils utilisateur (UPM), identifie les besoins de QoS et de spectre
prfrences pour les SU ;
- stratgie d'enchres (BRI), tire son entre de QoS-BM de faire une offre de ressources requrante. (cf Tian et al. ,2010)

13

Toutes les pices ci-dessus fonctionnent ensemble pour faire un message d'entre (ou une offre) et ce message est alors envoy l'agent commissaire-priseur. A la
rception d'une offre, ce dernier dtermine les bandes de frquences attribuer des
SUs. De mme, dans la deuxime approche (cf Kloeck et al., 2006), les SUs sont
reprsents comme des agents de consommateurs et les PUs travaillent comme
agents de fournisseurs pour louer leurs spectres aux agents consommateur requrant.
Un agent secondaire annonce laccs au spectre offert (au nom d'un agent de la consommation) l'agent fournisseur voisin, qui comprend le degr requis de contrle
sur le spectre et le prix.
En retour, l'agent fournisseur correspondant rpond et sil y a un accord, le partage du spectre est dmarr, sinon les exigences des deux agents aller dans un scnario concurrentiel et l'agent avec meilleure offre remporte l'affaire. Les auteurs de
(Tonmukayakul et Weiss, 2005) se concentrent sur la conception d'un algorithme
centralis de partage entre les agents de l'ISP l'aide de ventes aux enchres.
Le commissaire-priseur centralis attribue le spectre d'une manire libre de
linterfrence, tout en maximisant la protection sociale (ou l'utilit). Les auteurs
montrent comment leur rgime peut rduire les frais gnraux de calcul par l'allocation du spectre en une seule itration. Ils ont en outre concevoir un systme de paiement qui permet aux agents d'tre honnte, en leur imposant une valeur minimum
fixe d'une offre. Un autre modle d'agent bas sur l'change ou lallocation de
spectre est prsent dans (Gopinathan et Zongpeng., 2010), o les agents acquirent
les rles des courtiers de spectre. Le bnfice des agents, leur probabilit d'accs au
spectre et l'incertitude de la demande sont obtenus en termes de prix et de bande
passante et une stratgie optimale unique (cf Gopinathan et Zongpeng., 2010). Toutefois, dans les approches concurrentielles, les agents peuvent parfois se trouver en
envoyant de fausses offres, obligeant les chercheurs dvelopper des stratgies
complexes de punir qui devraient tre l'abri de mensonge.
Les auteurs de (Ba-Lam et al., 2010) soutiennent que par le dploiement
d'agents sur les SUs et en leur permettant d'apprendre par une interaction peuventt
amliorer l'utilisation du spectre global et les SUs peuvent quitter facilement le
spectre lorsque les PUs le rcupre. Une approche d'apprentissage est propose dans
(Zhang et al., 2012), o chaque SU peroit ses paramtres actuels de transmission et
prend les mesures ncessaires lorsque le PU apparat. Plusieurs valeurs de pnalit
sont appliqus lorsque les agents SUs tentent d'interfrer les uns avec les autres ou
avec les PUs. Les rsultats des simulations montrent que lapproche propose amliore la transmission du SUs et les capacits de commutation de canaux par rapport
l'approche gloutonne.
En bref, les SMA peuvent tre utiliss de diverses faons pour l'accs au spectre
dans les rseaux de RC, mais encore le dploiement de SMA par ces infrastructures
est relativement un nouveau concept.

14

3.4 Accs au spectre en utilisant les Enchres


La thorie des enchres a rcemment t applique pour rsoudre divers problmes en ingnierie. Un processus d'enchres fonctionne comme suit. Tout d'abord,
les acheteurs prsentent des soumissions pour l'achat des produits, et les vendeurs
soumettent les demandes de vendre des marchandises. Un produit d'enchre tant
commerc peut tre un article rel ou un service. Chaque offre/demande contient des
informations qui indique les prfrences de l'acheteur/vendeur, les exigences et les
demandes pour les produits d'tre commerc. Gnralement, une offre doit exprimer
au moins dun prix de soumission offert et dune quantit de produit acheter. De
mme, une demande devrait contenir un prix de demande et une quantit de produit
vendre. Le prix inclus dans une offre/demande ne pourrait pas tre la vraie valuation de l'acheteur/vendeur, qui est une valeur prive value par ces derniers, sur le
produit pour tre achet/vendu. Il y a un agent intermdiaire dsign sous le nom du
commissaire-priseur qui conduit l'enchre et dgage le march en assortissant des
offres et des demandes. Ensuite, chaque paire assortie d'acheteur-vendeur doit s'occuper un prix d'quilibre (ou notamment au prix s'occupant). Dans quelques enchres, il y a seulement un vendeur et ce vendeur peut excuter un rle d'un commissaire-priseur. En consquence, dans ce cas, les termes "commissaire-priseur" et
"vendeur" peuvent tre employs l'un pour l'autre. (cf Waqas et al., 2009)
Dans le contexte de la radio cognitive, les acheteurs sont des utilisateurs secondaires qui peuvent utiliser le spectre en le payant, et les vendeurs (par exemple, les
utilisateurs primaires) fournissent les ressources radio aux acheteurs et recevoir des
gains de ces derniers en vendant des ressources radio inutiliss ou sous-utiliss. Les
produits sont des ressources radio, par exemple, la bande passante, les time-slots et
les droits de transmission des donnes sur le rseau. En outre, les commissairespriseurs peuvent facturer des frais de commission organis des enchres pour les
utilisateurs primaires et secondaires au revenu de gain. Grce la vente aux enchres, les utilisateurs primaires, les utilisateurs secondaires et commissairespriseurs ont des motivations participer pour obtenir des avantages dans un systme
de radio cognitive. (cf Vijay, 2009 ; Parsons et al., 2011 ; Zhang et al., 2012)
3.4.1 Composants d'un march aux enchres
Les composants d'un march aux enchres sont les suivantes (cf Jarraya.,
2006) :
- le vendeur est une entit du march qui veut vendre le produit. Un vendeur propose le prix et la quantit de produit tre ngocies aux enchres.
- l'acheteur est une entit qui veut acheter le produit. Un acheteur soumet une offre
en termes de prix et de quantit d'enchres pour acheter travers la vente aux enchres.
- le prix d'change / de compensation est le prix de chaque produit tre ngocis
sur un march aux enchres. Le prix de ngociation doit satisfaire le prix demand et
le prix de l'offre par le vendeur et l'acheteur, respectivement.

15

3.4.2 Types plus classiques denchres


Dans lenchre anglaise, le commissaire-priseur initie lenchre en annonant
un premier prix initialement infrieur la valeur estime du produit. Aprs chaque
annonce, le commissaire-priseur attend pendant un certain temps pour voir sil existe
des participants acceptant cette offre. Ds quun participant se manifeste, le commissaire-priseur annonce une nouvelle proposition de prix gale au dernier prix
incrment dune valeur appele pas dincrmentation. (cf Jarraya., 2006)
Lenchre se termine quand aucun des participants ne se manifeste. A ce moment-l, le commissaire-priseur compare le prix de la dernire offre accepte avec la
valeur estime du produit. Si le prix de loffre est suprieur la valeur estime alors
lenchre est accorde au participant qui sest prononc pour cette offre. Dans le cas
contraire, les participants sont informs de lannulation de la vente. Le manager peut
rexaminer au cours de lenchre la valeur estime du produit, pour viter toute
annulation de la vente. (cf Jarraya., 2006)
Dans lenchre hollandaise, le commissaire-priseur annonce au dpart une valeur trs leve par rapport la valeur estime du produit. Puis il commence par
baisser le prix jusqu ce quun participant signale son acceptation du prix propos.
Le vendeur possde une estimation de la valeur du produit (prix de rserve) audessous de laquelle il ne vend pas le produit. Si lenchre atteint le prix de rserve
sans quil y ait dacheteurs, lenchre se termine. (cf Jarraya., 2006)
Dans lenchre Vikrey (Enveloppe scelle au second prix), les propositions sont
prives, aucun participant ne connat le contenu des autres enchres. Les enchres
Vickrey permettent de vendre un article unique, comme les enchres anglaises. La
diffrence est que le soumissionnaire le plus lev obtient larticle au prix offert par
le deuxime plus haut soumissionnaire. (cf Jarraya., 2006)
Dans lenchre au premier prix, des enchres sont soumises au vendeur sous un
certain format, sans quaucun des participants ne sache le contenu des autres enchres. Le gagnant paye le prix quil avait soumis. (cf Jarraya., 2006)
Dans le double enchre, les participants sont des acheteurs et des vendeurs qui
ngocient sur un mme produit. Lenchre peut dmarrer par lenvoie dune offre.
(cf Jarraya., 2006)
Les vendeurs envoient des offres qui dmarrent avec le plus haut prix puis elles
dcroissent, et des propositions sont faites par les acheteurs dont les prix voluent
dans le sens inverse des offres. Les offres et les propositions sont publiques, chaque
participant est au courant de toutes les offres et les propositions soumises (lmetteur
et le prix propos). La ngociation peut sachever si un acheteur accepte une offre
propose par un vendeur ou si un vendeur accepte une proposition dun acheteur. (cf
Jarraya., 2006)
3.4.3 Quelques travaux relatifs
Dans (Zhu et al., 2009), les auteurs ont tudi le problme daccs au spectre
dans le cadre de la radio cognitive unique et multicanal. Un cadre fond sur

16

lenchre rpte a t adopte. Dans l'accs au spectre canal unique, les SUs participent de manire slective dans la vente aux enchres en fonction de leur valuation et historique des enchres pass. Dans les rseaux multicanal, une approche
non-regret a t propose. Sa performance a t montre pour tre nettement mieux
qu'une solution gourmande nave.
Dans les solutions bases sur les enchres, chaque canal est assign un seul rseau, cest dire quil ny a pas la notion de SU et de PU dans le mme canal. Dans
la littrature, deux possibilits soffrent (cf Amraoui et al., 2013) :
- soit le rgulateur alloue les canaux aux utilisateurs primaires, ces derniers allouent
indpendamment les portions inutilises de leur canal aux SU ;
- soit le rgulateur alloue le droit dtre SU ou PU dans le canal.
Dans (Chen et al., 2008), les auteurs adoptent les mcanismes d'enchres au second prix pour rsoudre le problme dallocation du spectre ainsi que les problmes
de dtection des bandes libres la radio cognitive. Ils introduisent la notion dargent
fictif en ralisant le systme de payement en temps rel.
Dans une autre approche, les auteurs proposent une nouvelle vente aux enchres
bases sur le temps d'attente pour l'allocation dynamique du spectre. Avec cette
approche, les soumissions des utilisateurs sont leur temps d'attente au lieu d'argent.
(cf Guangen et al., 2011)
Dans (Lin et al., 2010), les auteurs proposent un cadre d'enchres pour les rseaux de radio cognitive pour permettre aux SUs non autoriss de partager le spectre
disponible avec des PUs autoriss de manire quitable et efficace, soumis la contrainte de la temprature de l'interfrence chaque PU. Ils tendent ensuite le cadre
de la vente aux enchres propose pour le scnario le plus difficile avec des bandes
de frquences libres o le SU aura le choix entre payer et avoir une bonne QoS ou
bien accder aux canaux gratuitement et risquer de rencontrer des interfrences avec
les utilisateurs.
Dans certains scnarios, le spectre est utilis de manire plus efficace en accordant une bande plusieurs SUs simultanment, ce qui le distingue des enchres
traditionnelles o un seul utilisateur peut tre le gagnant. Toutefois, la vente aux
enchres multi-gagnantes est un nouveau concept qui pose de nouveaux dfis aux
mcanismes d'enchres traditionnelles. Par consquent, dans (Yongle et al., 2008),
les auteurs proposent un mcanisme efficace de la vente aux enchres du spectre
multi-gagnant rsistant la collusion o plusieurs SU peuvent gagner laccs un
seul canal.
4. Implmentation de la solution propose
Dans ce papier, nous avons choisis un type particulier denchres, cest
lenchre enveloppe scelle, nous lavons implment avec et sans programmation

17

dynamique et compar les rsultats obtenus avec ceux de la mthode FIFO 1 dans le
but de mesurer limportance de lenchre pour le partage du spectre mais aussi
limportance de combiner la programmation dynamique avec les enchres.
Notre approche est base sur les SMA et implmente laide de la plateforme
JADE qui facilite la mthodologie SMA car cest un langage de programmation
d'agents qui permet de suivre les traces des messages changs et afficher chaque
message dans la fentre du sniffer. Nos agents (PU et SUs) utilisent le type de ngociation plusieurs un c.--d. plusieurs SUs et un seul PU.
4.1. Topologie du rseau utilis
Dans la littrature, la plupart des inconvnients et des problmes lis aux enchres sont en rapport avec le rgulateur (initiateur), ce dernier peut avoir un comportement mensonger, il peut aussi utiliser de faux participants pour faire augmenter
lvaluation de lobjet. (cf Amraoui et al., 2013)
Pour viter ce type de problme, nous utilisons dans ce travail une architecture
de systme multi-agents coopratifs pour la gestion des ressources radio, cest une
architecture de rseau sans infrastructure rseau Ad-hoc . Nous considrons que
tous nos agents sont fixes durant leurs mises en uvre, car ils travaillent localement,
chacun dans son propre site et communiquent entre elles de faon directe.
Autrement dit, la communication se fera directement entre le PU et les SUs (il
ny a pas la notion de commissaire-priseur c.--d. lenchre se fait directement entre
le vendeur et lacheteur). La Figure 4 illustre la topologie du rseau que nous avons
utilis :

Figure 4. Topologie du rseau (mode Ad-hoc).

1FIFO : FIFO mais sans blocage des demandes insatisfaites.

18

4.2. Scnario propos


Nous considrons un scnario o le PU et les SUs sont connects en mode Adhoc avec le type particulier de ngociation plusieurs un tels que lagent PU
ngocie avec les agents SUs qui ont besoin de bandes libres pour maximiser l'accs
dynamique au spectre.
Dans notre situation, le PU et les SUs ngocient leur accord sur la base de certains critres tels que le prix et le nombre de canaux. La Figure 5 illustre le scnario
qui sera trait dans la suite de ce travail :

Figure 5. Scnario propos.

4.3. Algorithme propos


Les auteurs dans (Amraoui et al., 2013), ont compar les enchres un tour avec
les enchres plusieurs tours (nommes aussi enchres classiques) mais en les combinant systmatiquement avec la programmation dynamique, et aussi sans passer par
une vraie simulation du comportement de ngociation entre agents. C'est--dire en
ignorant les interactions entre SUs et PU. Le travail des auteurs est valu uniquement en centralis cot PU.
Dans cet article, nous avons opt pour une comparaison entre les enchres un
seul tour (enveloppe scelle au premier prix) et les enchres un seul tour avec
programmation dynamique mais dans le cadre dun vrai comportement de ngociation laide dune simulation avec loutil Jade. Lobjectif est de montrer lapport de
la programmation dynamique pour les enchres. Ensuite nous avons compar les
rsultats obtenus avec ceux de la mthode FIFO.

Dans ce qui suit, nous allons noter :

19

- nb : le nombre de SU.
- m : le nombre de canaux libres cot PU.
- W : tableau de taille gale au nombre de SU, W[i] est le nombre de canaux demands par SUi.
- C : tableau de taille gale au nombre de SU, C[i] reprsente le prix propos pour
W[i] par SUi.
La fonction monotone croissante optimiser est :
nb 1

Max C [ i ]

(1)

i0

La contrainte est :
nb 1

W [i ]

(2)

i0

Lalgorithme propos dans (Amraoui et al., 2013) pour la programmation dynamique est le suivant :
Algorithme 1. Algorithme de programmation dynamique adapt dans le cadre de la
RC
1 : fonction COUT (W, C, m)
2 : n longueur (C)
3 : tab : tableaux 2 dimensions de taille (n+1)*(m+1)
4 : pour j=0 m faire
5:
tab[0][j] 0
6 : fin boucle
7 : pour i=1 n faire
8:
pour j=0 m faire
9:
si (j < W[i-1]) alors
10 :
tab[i][j]=tab[i-1][j]
11:
sinon
12 :
tab[i][j]=Max(tab[i-1][j],C[i-1]+tab[i-1][j-W[i-1]])
13 :
fin condition
14 :
fin boucle
15 : fin boucle
16 : retourner tab[n] [m]
17 : fin fonction

4.4. Etude comparative


Pour la simulation, nous avons utilis le mme jeu de donnes pour les trois mthodes (enchre enveloppe scelle avec et sans programmation dynamique et

20

FIFO) pour pouvoir comparer les rsultats obtenus. Le jeu de donnes utilis est :
nb=5 et m=4, C = {300, 354.35, 212.6, 141.7, 141.68} et W = {6, 5, 3, 2, 2}.
Nous avons implment lalgorithme de lenchre enveloppe scelle avec et
sans programmation dynamique cot PU et ensuite compar les rsultats obtenus
avec celui de la mthode FIFO sachant que nous supposons quil y a 5 SUs au
mme endroit.
4.4 .1 Comparaison en termes defficacit
Ici, nous parlons de nombre de SU satisfaits. Pour cela, nous avons compar les
trois algorithmes et nous remarquons les rsultats obtenus dans la Figure 6 qui
montre limpact des enchres sur le nombre de SUs satisfaits.
Le jeu de donnes utilis est : C = {300, 354.35, 212.6, 141.7, 141.68} et
W = {6, 5, 3, 2, 2} et nous fixons le nombre de SUs 5 (nb=5) et nous varions le
nombre de canaux (m = 110).

Figure 6. Impact des enchres sur le nombre de SUs satisfaits.


Daprs la Figure 6, nous remarquons que le nombre de SUs satisfaits avec
lenchre en utilisant la programmation dynamique est suprieur par rapport celui
obtenu avec FIFO et lenchre enveloppe scelle.
4.4.2. Comparaison en termes de gain de PU
Dans cette section, nous allons montrer limpact des enchres sur le gain obtenu
par le PU, pour cela nous allons faire une comparaison entre lenchre avec et sans
programmation dynamique et avec la technique FIFO.

21

Les rsultats obtenus sont illustr dans la Figure 7.


Le jeu de donnes utilis est : nb=5, C = {286, 209, 141, 489, 105} et W = {3, 2,
1, 3,2} avec un m qui varie entre 1et 10.

Figure 7. Impact des enchres sur le gain obtenu par le PU.


Nous remarquons que lutilisation des enchres avec la programmation dynamique est plus bnfique pour le PU car ses gains sont beaucoup plus importants par
rapport lutilisation des enchres enveloppe scelle ou lutilisation de la technique FIFO.
4.4.3. Comparaison en termes de temps requis
Pour connatre le temps (en milli seconde ms ) du traitement cot PU pour
quun nombre de SUs peut tre satisfaits, nous avons fait une comparaison entre
lutilisation des deux types denchres avec la mthode FIFO.
Pour tablir cette comparaison, nous considrons le cas dun nombre variable
de SUs (nb = 110), et dun nombre fixe de canaux (m=5).

22

Figure 8. Temps du traitement cot PU par rapport au nombre de SUs.


Comme le montre la Figure 8, avec les deux types denchres, le temps du traitement ct PU saugmente en fonction de laugmentation du nombre de SUs. C'est
clair car avec plus de SUs disponibles, le PU prend plus de temps pour choisir les
meilleures offres propos par ces SUs. Mais lutilisation des enchres avec programmation dynamique reste mieux que lenchre enveloppe scelle en termes de
temps requis car lenchre enveloppe scelle dans notre cas a besoin de beaucoup
de temps pour trier les demandes reu selon le prix unitaire de chaque SU. Par
contre lide de lenchre avec programmation dynamique est de classer les SUs
selon le prix propos pour la totalit des canaux pour obtenir une solution optimale.
Dans le cadre gnral, la programmation dynamique prend beaucoup de temps pour
trier ces objets mais dans notre cas et puisque la taille du tableau est raisonable, elle
nous donne un rsultat meilleur que lenchre enveloppe scelle (la taille du tableau, dans ce cas est le nombre de SUs * le nombre de canaux). Pour la technique
FIFO, le temps requis est toujours gal 1ms car le traitement est limit (requte/rponse) le premier entr est le premier servi sans bloquer les demandes.
4.4.4 Comparaison en termes de temps de rponse cot SU
La Figure 9 montre limpact du taux darrive des SUs sur le temps de rponse
toujours cot SU, pour se faire, nous varions le taux darriv des SUs de 1s 10s, le
PU est lanc aprs 1s du lancement de SU10. Ce graphe montre le temps de rponse
uniquement pour l'enchre ( enveloppe scelle avec et sans programmation dynamique), car pour FIFO c'est requte/rponse donc le traitement est limit.

23

Figure 9. Temps de rponse par rapport aux taux darrive des SUs.
Il faut remarquer ici que le temps de rponse cot SU est le temps attendu pour
avoir une rponse de la part du PU, car pour les enchres il faut attendre jusqu'
l'arrive du dernier SU et le lancement du PU. (Le cot du traitement en ms cot PU
est toujours ngligeable).
Ce graphe montre que le temps de rponse pour un SU donn saugmente en
fonction du taux darrive des SUs sauf dans le cas du dernier SU arrive qui va
toujours attendre une seconde (le temps pour lancer le PU). Nous remarquons aussi
que plus larriv dun SU est proche de celui du dernier SU, plus son temps de rponse est diminu. Et plus larriv dun SU est loin de celui du dernier SU arrive
plus le temps de rponse est augment. Pour tre plus prcis, si X est le taux
darrive des SUs :
- SU1 va attendre 9*X+1 car 9 SUs arriveront derrire lui chaque X seconds, le PU
est lanc aprs SU10 de 1s (courbe rouge).
- SU5 va attendre 5*X+1 car 5 SUs arriveront derrire lui chaque X seconds, le PU
est lanc aprs SU10 de 1s (courbe bleu).
- Par contre, SU10 arrive le dernier donc il va toujours attendre 1s, le temps pour
lancer le PU (courbe verte).
5. Conclusion
Dans ce papier, nous avons combin la thorie des enchres avec les systmes
multi agents pour rsoudre le problme de lencombrement du spectre. Pour cela,
nous avons donn les notions les plus importantes concernant la topologie et les

24

outils utiliss pour faire simuler laccs dynamique aux spectres en utilisant un type
particulier denchres qui est lenchre enveloppe scelle au premier prix.
Les rsultats obtenus montrent que quel que soit le nombre de canaux demands, lutilisation des enchres avec la programmation dynamique est mieux que les
enchres enveloppe scelle et FIFO car la procdure est plus rapide et a beaucoup
davantages en termes de nombre de SUs satisfaits, gain obtenu par le PU, temps de
traitement ct PU et finalement temps de rponse cot SU.
Comme conclusion nous pouvons dire que notre approche a prouv quil est
prfrable dutiliser les enchres avec la programmation dynamique pour rsoudre le
problme de lencombrement du spectre et pour une gestion plus efficace de celui-ci
car tous les utilisateurs sont gagnants. Les SUs gagnent en satisfaisant leurs besoins
et le PU gagne en maximisant son gain.
Rfrences
Ahmed Ben. (2011). Allocation dynamique des bandes spectrales dans les rseaux sans-fil
radio cognitive, Thse de doctorat. Universit du Qubec Montral, 2011.
Akyildiz. (2006). LEE Won-Yeol, VURAN Mehmet C., et al, NeXt Generation/Dynamic
Spectrum Access/Cognitive Radio Wireless Networks : a Survey, Computer Networks,
vol. 50, no 13, p. 2127-2159, 2006.
Amraoui et al. (2013). Auction-based Agent Negotiation in Cognitive Radio Ad Hoc Networks, Fourth International ICST Conference, ADHOCNETS 2012, Paris, France, October 16-17, 2012, Revised Selected Papers Series: Lecture Notes of the Institute for Computer Sciences, Social-Informatics and Telecommunications Engineering, Vol. 111. pp.
119-134, Springer Edition, 2013
Amraoui et al. (2012). Accs Dynamique au Spectre dans le Contexte de la Radio Cognitive.
In : 2ime dition de la confrence nationale de l'informatique destine aux tudiants de
graduation et de post-graduation. 2012.
Ba-Lam et al. (2010). A general framework for assisted power control in Cognitive Radio
Networks. In : Personal Indoor and Mobile Radio Communications (PIMRC), 2010 IEEE
21st International Symposium on. IEEE, 2010.
Beibei et al. (2007). Primary-prioritized Markov approach for dynamic spectrum access. In :
New Frontiers in Dynamic Spectrum Access Networks, 2007. DySPAN 2007. 2nd IEEE
International Symposium on. IEEE, p. 507-515, 2007.
Benmammar et Amraoui. (2013). Radio Resource Allocation and Dynamic Spectrum Access
(FOCUS Series). John Wiley & Sons, Inc., 2013.
Benmammar et Krief. (2003). La technologie agent et les rseaux sans fil, congrs DNAC,
octobre 2003.
Chaib-draa. (2010). Introduction la Thorie des Jeux, 2010.
Chehata. (2011). Algorithmes de Routage dans les Rseaux Sans-Fil de Radios Cognitives
Multi-Sauts, 2011.

25

Chen et al. (2008). Optimizing the second-price auction algorithm in a dynamic cognitive
radio network. In : Communication Systems, 2008. ICCS 2008. 11th IEEE Singapore International Conference on. IEEE, 2008.
Chunsheng et al. (2010). On random dynamic spectrum access for cognitive radio networks.
In : Global Telecommunications Conference (GLOBECOM 2010), 2010 IEEE. IEEE, p.
1-5, 2010.
Colson et Kountouris. (2006). Une Application de la Radio Intelligente : Adaptation Dynamique de la Complexit Algorithmique, Journes Scientifiques du CNFRS, Mar 2006.
Ekram et al. (2009). Dynamic spectrum access and management in cognitive radio networks.
Cambridge : Cambridge University Press, 2009.
Guangen et al. (2011). A waiting-time Auction Based Dynamic Spectrum allocation in cognitive radio networks, GLOBECOM. 2011.
Gaoning. (2010). Strategie d'Allocation de Ressources sans Fils Base de la Thorie des
Jeux. Thse de doctorat. Tlcom ParisTech, 2010.
Gopinathan et Zongpeng. (2010). Strategyproof wireless spectrum auctions with interference.
Proceedings of IEEE GLOBECOM, 2010.
Jarraya. (2006). Rutilisation des protocoles dinteraction et Dmarche oriente modles pour
le dveloppement multi-agents, Thse de Doctorat, Universit de Reims Champagne Ardenne, 2006.
Jiang et al. (2007). Cognitive radio resource management using multi-agent systems. In :
IEEE CCNC. 2007.
Jrad et al. (2005). A User Assistant for QoS Negotiation in a Dynamic Environment Using
Agent Technology. Proceedings of the Second IEEE and IFIP International Conference
on Wireless and Optical Communications Networks WOCN 2005. March 6 - 8, 2005,
Hyatt Regency Hotel, Dubai, United Arab Emirates UAE, Print ISBN: 0-7803-9019-9.
Kloeck et al. (2006). Multi-agent radio resource allocation. Mobile Networks and Applications, vol. 11, no 6, p. 813-824, 2006.
Lin et al. (2010). An auction framework for spectrum allocation with interference constraint
in cognitive radio networks. In : INFOCOM, 2010 Proceedings IEEE. IEEE, p. 1-9, 2010.
Mir. (2011). Utilization of Cooperative Multiagent Systems for Spectrum Sharing in Cognitive Radio Networks. PHD THESES, Sep, 2011.
Mir et al. (2009) Utilization of a cooperative multiagent system in the context of cognitive
radio networks. In : Modelling Autonomic Communications Environments. Springer Berlin Heidelberg, 2009.
Parsons et al. (2011). Auctions and bidding : A guide for computer scientists. ACM Computing Surveys (CSUR), vol. 43, 2011.
Simon. (2008). Cognitive radio : research challenges. In : Vehicular Technology Conference
Tutorial, 2008.
Sycara Katia. (1998). Multiagent systems. AI magazine, vol. 19, no 2, p. 79, 1998.
Tian et al. (2010). Spectrum Trading in Cognitive Radio Network: An Agent-based Model
under Demand Uncertainty. In : Global Telecommunications Conference (GLOBECOM
2010), 2010 IEEE. IEEE, p. 1-5, 2010.

26

Tonmukayakul et Weiss. (2005). ,An agent-based model for secondary use of radio spectrum.
In : New Frontiers in Dynamic Spectrum Access Networks, 2005. DySPAN 2005. 2005
First IEEE International Symposium on. IEEE, p. 467-475, 2005.
Vijay. (2009). Auction theory. Academic press, 2009.
Waqas et al. (2009). Performance evaluation of a cognitive radio network with exponential
and truncated usage models. In : Wireless Pervasive Computing, 2009. ISWPC 2009. 4th
International Symposium on. IEEE, 2009.
Xiaorong et al. (2007). Analysis of cognitive radio spectrum access with optimal channel
reservation. Communications Letters, IEEE, vol. 11, no 4, p. 304-306, 2007.
Xing et al. (2006). Dynamic spectrum access in open spectrum wireless networks. IEEE
Journal on Selected Areas on Communications, vol. 24, 2006.
Yongle et al. (2008). Collusion-resistant multi-winner spectrum auction for cognitive radio
networks. In : Global Telecommunications Conference, 2008. IEEE GLOBECOM 2008.
IEEE. IEEE, p. 1-5, 2008.
Zhang et al. (2012). Auction-based resource allocation in cognitive radio systems. Communications Magazine, IEEE, vol. 50, no 11, 2012.
Zhang. (2008). Dynamic spectrum access in cognitive radio wireless networks. In : Communications, 2008. ICC'08. IEEE International Conference on. IEEE, 2008.
Zhao et al. (2007). Decentralized cognitive MAC for opportunistic spectrum access in ad hoc
networks: A POMDP framework. Selected Areas in Communications, IEEE Journal on,
vol. 25, no 3, p. 589-600, 2007.
Zhu et al. (2009). Repeated auctions with learning for spectrum access in cognitive radio
networks. arXiv preprint arXiv : 0910.2240, 2009.

Biographie
Badr Benmammar est un enseignant chercheur UABT et au laboratoire de Tlcommunication de Tlemcen (LTT), ses activits de recherches portent sur les rseaux de radio cognitive et sur la gestion de la qualit de service et de la mobilit dans les rseaux sans fil, il
est lauteur du livre Radio Resource Allocation and Dynamic Spectrum Access apparu
chez Wiley-ISTE en 2013, ainsi que de nombreuses revues scientifiques dans le domaine
des rseaux.

27