Vous êtes sur la page 1sur 23

Machine Translated by Google

Reçu  le  4  janvier  2022 ;  accepté  le  24  janvier  2022.  Date  de  publication  le  28  janvier  2022 ;  date  de  la  version  actuelle  11  février  2022.

Identificateur  d'objet  numérique  10.1109/OJCOMS.2022.3146618

Deep  Learning  pour  le  réseau  d'accès  radio  ouvert  B5G :
Évolution,  enquête,  études  de  cas  et  défis
BOUZIANE  BRIK  1,  KARIM  BOUTIBA2  ET  ADLEN  KSENTINI 2 (membre  senior,  IEEE)

1DRIVE  EA1859,  University  of  Bourgogne  Franche­Comté,  25000  Besançon,  France  

2Département  des  Systèmes  de  Communication,  EURECOM,  06410  Sophia­Antipolis,  France

AUTEUR  CORRESPONDANT :  B.  BRIK  (e­mail :  bouziane.brik@gmail.com)

Ce  travail  a  été  soutenu  en  partie  par  le  projet  H2020  MonB5G  de  l'Union  européenne  dans  le  cadre  de  la  subvention  871780,  et  en  
partie  par  la  5G !  Projet  de  drones  dans  le  cadre  de  la  subvention  857031.

RÉSUMÉ  L'alliance  Open  Radio  Access  Network  (O­RAN)  a  été  récemment  lancée  pour  concevoir  une  nouvelle  
architecture  RAN  comprenant  une  architecture  d'accès  radio  ouverte,  pilotée  par  logiciel,  virtuelle  et  intelligente.  
L'architecture  O­RAN  est  basée  sur  (1)  des  fonctions  RAN  désagrégées  qui  s'exécutent  en  tant  que  fonction  de  réseau  
virtuel  (VNF)  et  fonction  de  réseau  physique  (PNF) ;  (2)  la  notion  de  contrôleur  RAN  qui  exécute  de  manière  centralisée  
des  applications  RAN  telles  que  la  gestion  de  la  mobilité,  la  planification  des  utilisateurs,  l'allocation  des  ressources  radio,  
etc.  Le  contrôleur  RAN  est  chargé  d'appliquer  les  décisions  d'application  en  utilisant  des  interfaces  ouvertes  avec  les  fonctions  RAN.
Une  caractéristique  importante  introduite  par  O­RAN  est  l'utilisation  intensive  des  techniques  d'apprentissage  automatique  
(ML),  en  particulier  l'apprentissage  profond  (DL),  pour  favoriser  l'innovation  et  faciliter  le  déploiement  d'applications  RAN  
intelligentes  capables  de  respecter  la  qualité  de  service  (QoS). )  exigences  des  services  de  réseau  5G  et  au­delà  envisagés.  
Dans  ce  travail,  nous  donnons  d'abord  un  aperçu  de  l'évolution  des  architectures  RAN  vers  la  5G  et  au­delà,  à  savoir  C­
RAN,  vRAN  et  O­RAN.  Nous  les  comparons  également  en  fonction  de  diverses  perspectives,  telles  que  la  prise  en  charge  
de  la  périphérie,  la  virtualisation,  le  contrôle  et  la  gestion,  la  consommation  d'énergie  et  la  prise  en  charge  de  l'IA.  Ensuite,  
nous  passons  en  revue  les  solutions  existantes  basées  sur  DL  traitant  de  la  partie  RAN.  Nous  montrons  également  comment  
ils  peuvent  être  intégrés/mappés  à  l'architecture  O­RAN  puisque  ces  travaux  n'étaient  pas  initialement  adaptés  à  l'architecture  
O­RAN.  De  plus,  nous  présentons  deux  études  de  cas  pour  le  déploiement  de  techniques  DL  dans  O­RAN.
En  outre,  nous  décrivons  comment  les  principales  étapes  des  modèles  DL  déployés  dans  O­RAN  peuvent  être  automatisées,  
pour  assurer  des  performances  stables  de  ces  modèles,  en  introduisant  le  concept  d'opérations  du  système  ML  (MLOps)  
dans  O­RAN.  Enfin,  nous  identifions  les  principaux  défis  techniques,  les  problèmes  ouverts  et  les  futures  orientations  de  
recherche  liées  à  l'architecture  O­RAN  activée  par  l'intelligence  artificielle  (IA).

INDEX  TERMES  Réseaux  B5G,  RAN,  architecture  RAN  ouverte,  contrôleur  intelligent  RAN,  apprentissage  en  profondeur,  
MLOps.

INTRODUCTION monde  à  travers  des  cas  d'usage  inégalés  [1],  tels  que  les  systèmes  
autonomes  connectés,  la  réalité  étendue  (englobant  à  la  fois  la  réalité  
L  A  VENIR   Au­delà  
odu  
Les  réseaux,   e  
sloi­disant  
a  cinquième  
6G,  gsénération   (B5G)
ont  une  technologie   augmentée  et  la  réalité  virtuelle),  les  véhicules  volants,  l'haptique,  la  
révolutionnaire  censée  éliminer  les  limites  de  la  bande  passante,  de   télémédecine,  etc.  Pour  déployer  avec  succès  ces  cas  d'usage,  les  
l'accès,  de  la  latence  et  des  limitations  de  performances  sur  la   systèmes  B5G  doivent  simultanément  une  faible  latence,  des  débits  
connectivité  dans  le  monde  entier  [1],  [2].  Le  B5G  devrait  transformer   de  données  très  élevés  et  fiables,  une  efficacité  énergétique  élevée  et  
les  réseaux  de  communication  mobile  de  l'Internet  des  objets  (IoT)  en   de  larges  bandes  de  fréquences  (en  THz)  pour  des  dispositifs  
"intelligence  connectée",  en  tirant  parti  des  techniques  d'intelligence   hétérogènes  [2].
artificielle  (IA)  et  en  connectant  des  milliards  de  personnes  et  de   La  coexistence  d'une  telle  variété  de  services  nécessite  un  réseau  
machines.  Cela  fait  de  B5G  le  principal  catalyseur  d'une  large  gamme   polyvalent  prenant  en  compte  toutes  les  fonctionnalités.  Cependant,  
de  nouveaux  services  améliorant  la  qualité  de  vie  autour  de  la ces  objectifs  ne  peuvent  pas  être  pris  en  charge  par  la  radio  existante

Ce  travail  est  sous  licence  Creative  Commons  Attribution­NonCommercial­NoDerivatives  4.0.  Pour  plus  d'informations,  voir  https://creativecommons.org/licenses/by­nc­nd/4.0/

228 VOLUME  3,  2022
Machine Translated by Google

Access  Network  (RAN),  et  donc  l'optimisation  de  la  partie  RAN  est   parmi  95  chercheurs  sans  fil,  et  la  majorité  a  déclaré  que  l'O­RAN  
grandement  nécessaire  [3].  Une  façon  de  prendre  en  charge  la   sera  le  fondement  des  futurs  réseaux  cellulaires.
variété  des  exigences  de  service  consiste  à  concevoir  des  instances   Ensuite,  les  auteurs  ont  décrit  les  avantages  de  l'O­RAN  en  plus  de  
de  réseau  distinctes,  où  chacune  (instance)  répond  aux  besoins  d'un   ses  lacunes  actuelles  et  des  opportunités  de  recherche.
type  de  service  donné  [4].  Dans  un  tel  contexte,  les  industries  et  les   D'autre  part,  l'architecture  générale,  les  concepts  et  les  exigences  de  
universités  tirent  parti  des  nouvelles  technologies,  y  compris  le  réseau   l'O­RAN  introduits  pour  la  première  fois  dans  [13].  Ensuite,  les  auteurs  
défini  par  logiciel  (SDN)  et  la  virtualisation  des  fonctions  réseau  (NFV),   ont  conçu  un  schéma  intelligent  d'allocation  des  ressources  radio  
pour  rendre  le  réseau  radio  mobile  plus  virtuel,  orienté  logiciel,   pour  faire  face  à  la  congestion  du  trafic  et  montrer  son  efficacité  en  
intelligent  et  économe  en  énergie  [4] . exploitant  un  ensemble  de  données  du  monde  réel.  Le  travail  se  
conclut  par  des  défis  encore  ouverts  et  des  directions  de  recherche  futures.
Une  autre  solution  potentielle  pour  répondre  aux  exigences  des   De  même,  les  auteurs  ont  donné  un  aperçu  de  l'architecture  O­RAN  
services  mentionnés  ci­dessus  est  de  diviser  la  partie  RAN  en   et  de  ses  principaux  modules  dans  [14].  Les  auteurs  ont  également  
plusieurs  parties  en  fonction  de  sa  fonctionnalité  principale,  afin  de   présenté  des  scénarios  RAN  réalistes  exploitant  des  modèles  basés  
rendre  le  réseau  radio  polyvalent  et  plus  intelligent  [5].  Dans  ce   sur  l'IA/ML,  en  plus  de  l'architecture  O­RAN,  soulignant  leur  potentiel  
contexte,  l'alliance  Open  RAN  (O­RAN)  a  récemment  lancé  la   de  perturbation.  Enfin,  les  principaux  avantages  et  limites  de  l'O­RAN  
conception  d'une  nouvelle  architecture  RAN  pour  les  réseaux  mobiles   sont  détaillés  ainsi  que  les  conclusions.
de  nouvelle  génération  (5G  et  au­delà)  [6],  [7].  O­RAN  est  un   Par  ailleurs,  peu  de  travaux  ont  récemment  proposé  des  apports  
changement  de  paradigme  majeur  dans  l'architecture  RAN  visant  à   techniques  liés  à  l'architecture  O­RAN.  Dans  [15],  l'architecture  O­
diriger  l'industrie  vers  un  RAN  piloté  par  logiciel,  virtuel,  ouvert  et   RAN  est  exploitée  pour  concevoir  un  schéma  basé  sur  l'apprentissage  
activé  par  l'IA.  Plus  précisément,  l'idée  de  base  de  l'O­RAN  est  de   automatique  afin  d'optimiser  la  fonction  de  relation  de  voisinage  
désagréger  les  principales  fonctions  du  RAN  traditionnel,  de  les   automatique  (ANR)  du  réseau  auto­organisé  (SON),  et  donc  
implémenter  en  tant  que  composants  logiciels  (c'est­à­dire  VNF)  et  de   d'améliorer  les  transferts  gNodeB  (gNB).  Les  auteurs  de  [16]  ont  
les  connecter  à  l'aide  d'interfaces  standardisées  et  ouvertes.  Notons   passé  en  revue  les  systèmes  multi­agents  et  les  schémas  
également  que  la  Fondation  Linux  et  l'Alliance  O­RAN  ont  annoncé   d'apprentissage  en  équipe,  avant  de  discuter  de  la  manière  dont  ces  
l'O­RAN  Software  Community  (OSC)  en  avril  2019  [8],  donnant   schémas  peuvent  être  déployés  au­dessus  de  l'architecture  O­RAN.  
naissance  au  premier  logiciel  open­source  O­RAN,  nommé  Amber   Dans  [17],  [18],  les  auteurs  ont  discuté  de  l'évolution  du  RAN  vers  
Release,  en  décembre  2019  [9]. l'Open­RAN,  en  termes  d'architectures,  de  fonctionnalités  et  d'implémentation.
O­RAN  a  conçu  un  contrôleur  intelligent  RAN  hiérarchique  (RIC),   Tandis  que  l'intégration  potentielle  d'O­RAN  avec  les  concepts  5G  
comprenant  à  la  fois  des  RIC  en  temps  quasi  réel  et  non  en  temps   Multi­access  Edge  Computing  (MEC),  SON  et  Network  Slicing  (NS)  
réel  qui  prennent  en  charge  des  fonctions  programmables. est  discutée  dans  [19].  La  question  de  la  séparation  des  fonctions  
Les  RIC  intègrent  des  capacités  d'apprentissage  en  profondeur  (DL)   dynamiques  de  l'O­RAN  est  traitée  dans  [20].  Un  schéma  basé  sur  
intégrées  au  RAN  afin  d'optimiser  les  performances  du  RAN  et  de   l'apprentissage  par  renforcement  est  conçu  pour  diviser  
réduire  la  complexité  opérationnelle.  Il  permet  d'adapter  les  opérations   dynamiquement  les  fonctions  dans  O­RAN,  tout  en  optimisant  la  
de  gestion  des  ressources  radio,  de  la  mobilité  et  du  spectre  (contrôle   consommation  d'énergie  du  logiciel  et  du  matériel  RAN.  Dans  [21],  un  
d'admission,  allocation  et  ordonnancement  des  ressources  radio,   nouveau  cadre  est  conçu  pour  relever  le  défi  de  la  façon  de  découper  
allocation  de  puissance,  gestion  des  liaisons  radio,  etc.)  en  fonction   le  RAN  dans  la  5G,  à  savoir  la  nouvelle  flexibilité  radio  (NRflex).  
des  besoins  des  applications,  ce  qui  est  très  appréciable  dans  les   NRflex  permet  d'allouer  dynamiquement  la  partie  bande  passante  
réseaux  B5G  lors  de  l'adressage  différentes  industries  verticales. (BWP)  ainsi  que  les  ressources  radio  aux  tranches  de  réseau,  et  leurs  
utilisateurs  correspondants,  afin  de  répondre  aux  besoins  des  
A.  EXAMEN  DES  TRAVAUX  CONNEXES   tranches.  De  plus,  le  cadre  NRflex  a  été  mappé  à  l'architecture  O­
Plusieurs  articles  d'enquête  traitant  de  la  partie  4G/5G  RAN  ont  été   RAN,  pour  déterminer  dynamiquement  les  tailles  des  BWP  pour  
publiés  jusqu'à  présent.  Dans  [3],  les  auteurs  ont  fourni  une  revue  de   chaque  tranche  RAN.  Un  nouveau  cadre  architectural  de  réseaux  non  
la  littérature  et  une  étude  approfondie  de  Cloud­RAN  (C­RAN),   publics  (NPN)  5G  est  proposé  dans  [22],  pour  permettre  des  
Heterogeneous  Cloud  RAN  (H­CRAN),  Virtualzied  Cloud  RAN  (V­ déploiements  rentables  de  réseaux  privés  5G.  Ce  cadre  s'appuie  sur  
CRAN)  et  Fog  RAN  ( F­RAN).  Une  autre  enquête  axée  sur  le  C­RAN   des  technologies  émergentes  clés,  telles  que  les  modèles  basés  sur  
et  les  applications  détaillées  d'apprentissage  en  profondeur  pour   l'IA/ML,  le  MEC  et  les  fonctions  RAN  désagrégées,  pour  optimiser  la  
l'architecture  du  C­RAN  a  été  proposée  dans  [10].  De  même,  les   gestion  du  réseau.  Il  permet  également  un  partage  RAN  efficace  en  
auteurs  dans  [11]  ont  abordé  l'architecture  C­RAN.  Plus  précisément,   termes  d'orchestration  des  ressources  et  des  services  requis,  qui  sont  
ils  ont  donné  une  enquête  détaillée  sur  l'allocation  des  ressources   alignés  sur  l'architecture  O­RAN.  Dans  [23],  [24],  les  auteurs  ont  
dans  une  telle  architecture  RAN. discuté  de  la  mise  en  œuvre  de  solutions  en  boucle  fermée  basées  
Dans  le  contexte  de  l'O­RAN,  à  notre  connaissance,  nous  ne   sur  ML  au­dessus  de  l'architecture  O­RAN.  Ils  ont  également  fourni  
trouvons  que  trois  courtes  études  d'enquête/examen.  Dans  [12],  les   une  première  démonstration  d'O­RAN  à  travers  un  banc  d'essai  
auteurs  ont  donné  une  courte  étude  sur  ce  que  O­RAN  peut  faire  et   expérimental.  Ainsi,  ils  ont  déployé  O­RAN  en  utilisant  l'émulateur  de  
ce  qu'il  ne  peut  pas  faire  (limitations).  Les  auteurs  ont  commencé  par   réseau  Colosseum.  Ensuite,  ils  ont  utilisé  l'O­RAN  déployé  pour  gérer  
présenter  brièvement  l'architecture  O­RAN,  suivi  d'une  enquête   plusieurs  tranches  de  réseau.  Finalement,  le
communautaire  sur  l'importance  de  l'O­RAN.  En  effet,  cette  enquête  a  été  menée

VOLUME  3,  2022 229
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

les  auteurs  ont  introduit  un  flux  de  travail  ML  basé  sur  les  spécifications  ML  
du  groupe  de  travail  (WG)  2  de  l'alliance  O­RAN,  dans  [25].
Ils  ont  ensuite  mis  en  œuvre  ce  flux  de  travail  à  l'aide  du  logiciel  open  source  
d'O­RAN.  Ils  ont  utilisé  à  la  fois  Acumos  Framework  et  Open  Network  
Automation  Platform  (ONAP),  pour  générer  des  modèles  ML  à  exécuter  dans  
le  module  O­RAN  RIC,  et  pour  surveiller  et  gérer  le  flux  de  travail  conçu,  
respectivement.
Même  s'il  existe  plusieurs  articles  d'enquête  traitant  des  architectures  RAN  
4G /  5G,  la  plupart  d'entre  eux  ont  étudié  les  architectures  RAN  précédentes,  
notamment  C­RAN,  H­CRAN,  V­CRAN,  etc.  Ainsi,  ces  travaux  n'ont  pas  
abordé,  ou  inclure  l'architecture  O­RAN  dans  leurs  études.  De  plus,  un  large  
éventail  d'études  basées  sur  DL  ont  également  été  proposées  pour  traiter  
les  principaux  défis  RAN  dans  les  réseaux  4G/5G  [26],  [27],  [28],  [29].  
Cependant,  ces  études  n'ont  pas  également  pris  en  compte  l'architecture  O­
RAN  émergente  et  doivent  donc  être  cartographiées/intégrées  dans  cette  
FIGURE  1.  La  structure  du  document.
architecture.

D'autre  part,  les  travaux  d'enquête  existants  liés  à  l'O­RAN  se  limitent  à  de   Le  déploiement  DL  dans  O­RAN  est  détaillé  dans  la  section  IV.  L'automatisation  
courtes  études  décrivant  l'architecture  de  l'O­RAN  et  ses  principaux  modules,  
des  principales  étapes  du  processus  DL  est  présentée  dans  la  section  V.  La  
en  plus  de  ses  principaux  avantages  ainsi  que  de  ses  lacunes. section  VI  décrit  les  problèmes  ouverts  et  les  futures  directions  de  recherche.  
La  section  VII  conclut  l'article.  Notez  que  les  acronymes  utilisés  dans  ce  
document  sont  décrits  dans  le  tableau  1,  par  ordre  alphabétique,  pour  faciliter  
B.  CONTRIBUTIONS  
la  référence.
Contrairement  aux  articles  d'enquête  existants,  cet  article  traite  de  l'architecture  
O­RAN  et  vise  principalement  à  cartographier/intégrer  les  études  existantes   II.  ÉVOLUTION  DES  ARCHITECTURES  RAN  Dans  cette  
basées  sur  DL  à  la  nouvelle  architecture  O­RAN,  via  ses  modules  RIC   section,  nous  passons  en  revue  l'évolution  des  architectures  RAN,  en  partant  
hiérarchiques.  Nous  proposons  également  deux  études  de  cas  sur  la  façon   du  RAN  centralisé  vers  le  RAN  distribué,  en  passant  par  le  Cloud  RAN  (C­
de  déployer  des  modèles  basés  sur  ML/DL  au­dessus  de  l'architecture  O­ RAN),  en  passant  par  le  RAN  virtuel  (vRAN)  et  plus  récemment  l'architecture  
RAN,  et  montrons  comment  l'ensemble  du  processus  ML/DL  peut  être   O­RAN.  Nous  notons  que  nous  fournissons  plus  de  détails  sur  l'architecture  
automatisé.  Sur  cette  base,  nous  nommons  les  principales  contributions  de   O­RAN,  car  elle  représente  la  portée  principale  de  ce  travail.
cet  article  comme  suit.
•  Nous  donnons  d'abord  un  aperçu  de  l'évolution  de  l'architecture  RAN,  
vers  les  réseaux  B5G.  Nous  les  comparons  également  en  fonction  de   A.  DU  RAN  2G  CENTRALISÉ  À  L'ARCHITECTURE  RAN  3/4G  DISTRIBUÉE  
diverses  perspectives,  telles  que  la  prise  en  charge  de  la  périphérie,  la   Dans  les  réseaux  2G,  les  
virtualisation,  le  contrôle  et  la  gestion,  la  consommation  d'énergie  et  la   fonctions  de  traitement  en  bande  de  base  et  radio  sont  mises  en  œuvre  au  
prise  en  charge  de  l'IA. niveau  des  stations  de  base  (BS)  [30].  Une  BS  est  composée  de  deux  
•  Nous  fournissons  également  une  nouvelle  étude  d'examen  concernant   équipements  fonctionnels :  un  contrôleur  d'équipement  radio  (REC)  et  une  
les  travaux  existants  basés  sur  DL  pour  le  RAN  de  prochaine  génération. unité  numérique  (DU).  REC  est  responsable  du  traitement  du  signal  en  bande  
De  plus,  nous  montrons  comment  ces  travaux  peuvent  être  réalisés  au­ de  base,  de  la  surveillance  et  de  la  gestion  des  stations  de  base,  tandis  que  
dessus  de  l'architecture  O­RAN.  •  Nous   DU  est  responsable  des  fonctions  radio,  notamment  la  modulation,  la  
décrivons  deux  études  de  cas  pour  le  déploiement  des  techniques  DL   démodulation,  l'amplification,  le  filtrage  des  radiofréquences,  la  conversion  
dans  l'architecture  O­RAN,  en  plus  de  la  façon  dont  les  principales   de  fréquence  et  l'analogique­numérique  ainsi  que  le  numérique­numérique.  
étapes  de  déploiement  des  modèles  DL  peuvent  être  automatisées,  afin   conversion  analogique.
d'assurer  des  performances  stables  et  acceptables  des  modèles   Cependant,  dans  les  réseaux  3G/4G,  les  unités  de  traitement  signal  et  
déployés.  •  Les  principaux  défis  techniques,   radio  des  BS  2G  sont  séparées  les  unes  des  autres  (cf.
les  questions  ouvertes  et  les  futures  orientations  de  recherche  liées  à   figure  2).  L'unité  radio  est  déployée  à  proximité  de  la  station  de  base  3G/4G  
l'architecture  O­RAN  activée  par  l'IA  sont  enfin  discutées. et  est  appelée  Remote  Radio  Unit  (RRU)  ou  Remote  Radio  Head  (RRH).  
L'unité  de  traitement  du  signal  en  bande  de  base  est  appelée  unité  de  bande  
de  base  (BBU).  La  BBU  fournit  les  ressources  nécessaires  à  ses  RRH  en  ce  
C.  STRUCTURE  DE  L'ARTICLE   qui  concerne  les  exigences  des  applications  en  cours  d'exécution  [31].
La  figure  1  illustre  la  structure  générale  de  cet  article.  La  section  II  donne  un  
aperçu  général  de  l'évolution  des  architectures  RAN,  y  compris  l'architecture   Cette  architecture  RAN  est  appelée  Distributed  RAN
O­RAN  et  ses  modules  fonctionnels.  Les  travaux  existants  basés  sur  DL   (D­RAN).  Chaque  BBU  est  interconnecté  à  son  RRH  correspondant  via  un  
traitant  du  RAN  5G  et  leur  intégration  à  l'architecture  O­RAN  sont  examinés   réseau  de  transport,  où  les  micro­ondes  optiques  et  la  fibre  peuvent  être  
dans  la  section  III.  Deux  études  de  cas  pour déployés  pour  établir  une  liaison  entre  le  BBU  et  le  RRH  (appelé  fronthaul).

230 VOLUME  3,  2022
Machine Translated by Google

TABLEAU  1.  Liste  des  acronymes.

B.  ARCHITECTURE  RAN  CENTRALISÉE  ET   consommation  d'énergie,  augmenter  le  débit  du  réseau,  améliorer  
CLOUDIFIÉE  Avec   l'évolutivité  du  réseau  et  l'efficacité  spectrale,  faciliter  la  gestion  du  
l'augmentation  du  trafic  de  données  et  diverses  exigences  de  QoS   réseau  et  l'équilibrage  de  charge.
(Quality  of  Service),  les  acteurs  du  réseau  cellulaire  ont  dû  passer  
par  la  cloudification  et  la  centralisation  de  la  partie  BBU,  qui  contient   C.  ARCHITECTURE  RAN  VIRTUALISÉE  Les  
un  pool  de  ressources  réseau.  Cette  nouvelle  architecture  est  connue   réseaux  mobiles  5G  présentent  diverses  exigences  telles  que  le  
sous  le  nom  de  C­RAN  [32],  [33].  Comme  le  montre  la  figure  3,  l'idée   nombre  massif  d'utilisateurs  mobiles,  des  communications  à  latence  
de  base  du  C­RAN  est  de  relier  les  RRH  à  un  pool  de  BBU  cloudifié,   ultra  faible  et  un  débit  de  données  fiable  et  élevé.  Pour  répondre  à  
centralisé  et  partagé.  Chaque  RRH  est  relié  à  son  pool  de  BBU  via   ces  exigences,  les  acteurs  du  réseau  tirent  parti  des  technologies  
une  liaison  frontale,  et  jusqu'à  dix  RRH  peuvent  être  connectés  au   émergentes  de  NFV  et  SDN  afin  de  virtualiser  toutes  les  ressources  
même  pool  de  BBU. et  fonctions  de  l'architecture  RAN  et  également  de  découpler  les  
Cette  architecture  RAN  est  conçue  sur  le  dessus  de  deux   plans  de  contrôle  et  de  données.  Cette  nouvelle  tendance  de  
paradigmes :  la  virtualisation  et  la  centralisation  de  la  partie  traitement   virtualisation  des  réseaux  d'accès  représente  un  nouveau  type  de  
en  bande  de  base  [33].  Ainsi,  il  permet  de  diminuer  la RAN,  connu  sous  le  nom  de  RAN  virtualisé  ou  vRAN.

VOLUME  3,  2022 231
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

FIGURE  2.  Architecture  D­RAN. FIGURE  4.  Architecture  vRAN.

et  un  réseau  frontal  à  bande  passante  plus  élevée  pour  l'échange  de  signaux  et  
de  données  entre  les  RRU  et  les  DU.  Cela  offre  également  des  options  plus  
rentables  aux  prestataires  de  services  pour  le  transport  frontal.

D.  ARCHITECTURE  D'ALLIANCE  OUVERTE
L'alliance  O­RAN  aborde  le  domaine  du  réseau  d'accès  radio  et  promet  de  le  

rendre  plus  ouvert,  flexible  et  plus  intelligent  [6],  [7],  [9].  L'idée  de  base  est  de  
séparer  le  matériel  du  logiciel  et  de  créer  des  interfaces  ouvertes  entre  eux.  Par  
conséquent,  cela  aide  les  réseaux  à  prendre  en  charge  des  interfaces  ouvertes  
et  des  normes  de  développement  communes,  à  fournir  des  réseaux  interopérables  
multifournisseurs  et  à  éviter  tout  blocage  de  fournisseur.  La  figure  5  montre  
l'architecture  de  référence  de  l'alliance  O­RAN.  Cette  nouvelle  architecture  
s'appuie  sur  les  technologies  SDN  et  NFV  pour  inclure  de  nouvelles  interfaces  et  
redéfinir  les  blocs  fonctionnels  RAN  afin  de  permettre  le  déploiement  de  
nouvelles  applications  et  de  nouveaux  services  au­dessus  du  RAN.  Il  convient  de  
noter  que  la  figure  5  reflète  un  scénario  de  fractionnement  fonctionnel  très  
spécifique,  où  la  CU  (unité  centrale),  la  DU  (unité  distribuée)  et  la  RU  (unité  radio)  
FIGURE  3.  Architecture  C­RAN. de  l'O­RAN  se  trouvent  dans  des  emplacements  séparés.  Dans  les  sections  II­D6  
et  II­D7,  nous  décrivons  respectivement  les  différentes  options  de  fractionnement  
La  figure  4  montre  l'architecture  vRAN  composée  de  parties  de  nuage  d'unité   fonctionnel  et  les  scénarios  de  déploiement  du  RAN.  De  plus,  dans  ce  qui  suit,  
numérique  (nuage  DU)  et  de  RRU,  interconnectées  via  des  liaisons  Fibre  Ethernet   nous  décrivons  les  principaux  éléments  de  l'architecture  O­RAN.  Nous  notons  
[34].  Dans  le  DU  Cloud,  les  BBU  sont  virtualisées  (vBBU)  et  déployées  sur   que  détailler  les  blocs  fonctionnels  de  l'architecture  O­RAN  n'entre  pas  dans  le  
plusieurs  plates­formes  NFV,  qui  fournissent  des  fonctions  liées  au  traitement  en   cadre  de  ce  travail.
bande  de  base.  Tous  les  vBBU  sont  interconnectés  les  uns  avec  les  autres  via  
un  commutateur  (couche  2)  qui  est  utilisé  pour  échanger  la  signalisation  et  les  

données  entre  les  vBBU.  Le  vRAN  est  basé  sur  un  matériel  de  serveur  standard  
qui  réduit  ou  augmente  efficacement  la  mémoire,  le  traitement  et  les  ressources   1)  LE  RAN  INTELLIGENT  NON  EN  TEMPS  RÉEL
d'E/S  en  fonction  de  la  demande.  Par  conséquent,  il  permet  d'atteindre  le  plein   MANETTE
potentiel  d'une  consommation  d'énergie  réduite,  d'une  mise  à  l'échelle  dynamique   Le  RIC  non  temps  réel  (RT)  est  une  fonction  logique  mise  en  œuvre  au  niveau  
de  la  capacité,  d'une  utilisation  efficace  des  ressources  du  réseau  et  d'une  fiabilité   de  la  gestion  et  de  l'orchestration  des  services  (SMO).  Il  est  composé  de  deux  
et  d'une  qualité  de  service  améliorées. sous­fonctions  principales :  cadre  RIC  non  RT  et  applications  RIC  non  RT  
(rApps).
Le  cadre  est  une  fonctionnalité  interne  de  SMO  qui  fournit  les  services  
De  plus,  les  RRU  sont  laissées  à  la  périphérie  du  réseau  (les  sites  cellulaires). nécessaires  aux  rApps  via  l'interface  R1,  tandis  que  les  applications  RIC  non  RT  
De  plus,  les  liaisons  Fibre  Ethernet  et  IP  offrent  une  latence  plus  faible (rApps)  exploitent  les

232 VOLUME  3,  2022
Machine Translated by Google

FIGURE  5.  Architecture  de  référence  de  l'O­RAN  Alliance  pour  un  scénario  de  déploiement  de  RU,  CU  et  DU  séparés.

Services  SMO,  tels  que  la  surveillance  des  données  sur  l'interface  O1   Le  plan  de  l'O­CU  héberge  le  RRC  et  la  partie  du  plan  de  contrôle  du  
(stockées  dans  une  base  de  données  locale)  et  les  services   protocole  PDCP,  tandis  que  la  partie  du  plan  de  l'utilisateur  du  protocole  
d'approvisionnement,  afin  de  prendre  en  charge  l'optimisation  intelligente   PDCP  et  du  protocole  SDAP  est  hébergée  sur  le  plan  de  l'utilisateur  de  
des  éléments  et  des  ressources  RAN  à  une  échelle  qui  n'est  pas  en   l'O­CU  (O­CU­UP).  Les  deux  avions  s'interfacent  sur  E1  et  sont  chargés  
temps  réel  (c'est­à­dire  supérieure  à  une  seconde).  Ainsi,  Non­RT  RIC   d'assurer  principalement  la  gestion  des  procédures  de  l'UE,  des  cellules  
vise  à  fournir  une  politique  RAN  intelligente  au  contrôleur  intelligent  en   et  du  gNB,  telles  que  la  mobilité  et  la  connectivité  de  l'UE,  l'énergie  de  la  
temps  quasi  réel,  via  l'interface  A1,  basée  principalement  sur  la  formation/ station  de  base,  l'activation  des  cellules,  etc.
l'inférence  AI/DL  et  l'analyse  de  données.
4)  UNITÉ  DISTRIBUÉE  O­RAN  (O­DU)
2)  LE  RAN  INTELLIGENT  EN  PRESQUE  TEMPS  RÉEL L'O­DU  est  un  nœud  logique  comprenant  trois  couches  principales :  le  
MANETTE contrôle  de  la  liaison  radio  (RLC),  le  contrôle  d'accès  au  support  (MAC)  
Le  RIC  en  temps  quasi  réel  (RT)  contrôle  et  optimise  les  nœuds  O­RAN   et  les  couches  physiques  élevées  (High­PHY).  Interfaces  O­DU  avec  O­
(O­CU  et  O­DU)  et  leurs  ressources  sur  l'interface  E2  avec  une  boucle   CU  via  l'interface  F1  pour  fournir  de  nombreuses  fonctionnalités  liées  
de  contrôle  en  temps  quasi  réel  (c'est­à­dire  de  10  ms  à  100  ms).  Le  RIC   aux  trois  couches,  notamment  la  gestion  des  contextes  UE  et  Bearer,  
Near­RT  implémente  un  ensemble  de  primitives  pour  améliorer  les   l'émetteur  et  le  récepteur  en  mode  RLC,  l'allocation  des  ressources  radio  
performances  des  nœuds  O­RAN,  telles  que  la  surveillance,  l'arrêt/la   MAC,  le  planificateur  MAC,  la  gestion  de  la  liaison  physique  montante  
suspension,  le  contrôle  et/ou  la  dérogation. (liaison  descendante)  canaux  partagés  (de  contrôle),  etc.
Le  Near­RT  RIC  héberge  des  applications,  à  savoir  xApps,  qui  tirent  parti  
de  ces  primitives  et  utilisent  l'interface  E2  pour  surveiller  les  informations   5)  UNITÉ  RADIO  O­RAN  (O­RU)
RAN  en  temps  quasi  réel  à  partir  des  nœuds  O­RAN.  Les  xApps   O­RU  est  un  nœud  logique  hébergeant  les  fonctions  de  la  couche  
fournissent  ensuite  des  services  à  valeur  ajoutée,  en  ce  qui  concerne   physique  basse  (Low­PHY)  et  le  traitement  des  radiofréquences  (RF).  
les  données  de  politiques  reçues  du  Non­RT  RIC,  via  l'interface  A1.  Les   Nous  notons  que  dans  l'architecture  O­RAN,  la  fonctionnalité  de  la  
xApps  incluent  la  gestion  du  spectre  (SM),  la  gestion  des  ressources   couche  physique  est  divisée  en  High­PHY  dans  O­DU  et  Low­PHY  dans  O­RU.
(RM),  la  gestion  de  la  mobilité  (MM),  etc. En  outre,  une  interface  frontale  ouverte  entre  O­DU  et  O­RU  est  définie  
dans  l'architecture  O­RAN  et  adoptée  dans  l'architecture  divisée.

3)  PLANS  DE  CONTRÔLE  ET  UTILISATEURS  DE  L'UNITÉ  
CENTRALE  O­RAN  (O­CU­CP  ET  O­CU­UP) 6)  OPTIONS  SPLIT  FONCTIONNELLES  DANS  O­
O­CU  est  un  nœud  logique  hébergeant  les  protocoles  RRC  (Radio   RAN  Classiquement  et  comme  le  montre  la  Fig.  6,  le  3GPP  a  défini  neuf  
Resource  Control),  SDAP  (Service  Data  Adaptation  Protocol)  et  PDCP   blocs  fonctionnels  et  huit  options  de  point  de  partage  dans  les  réseaux  
(Packet  Data  Control  Protocol).  Le  contrôle sans  fil  4G  [36].  Cependant,  avec  la  forte  augmentation  de

VOLUME  3,  2022 233
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

FIGURE  6.  Options  de  fractionnement  des  fonctions  CU,  DU  et  RU  dans  O­RAN.  Division  5G(A)  de  la  couche  haute ;  Division  5G(B)  de  la  couche  inférieure ;  Division  en  cascade  5G(C)  [35].

débit  de  données  en  5G,  il  est  essentiel  d'assouplir  les  exigences  de   entreprise  ou  bâtiment.  De  plus,  il  n'y  a  pas  d'équipement  de  
bande  passante  et  de  latence,  tout  en  ne  centralisant  que  quelques   transport  entre  les  deux  blocs  (à  travers  la  fibre  droite  par  
fonctions.  Par  conséquent,  le  nouveau  fractionnement  fonctionnel  doit   exemple),  ce  qui  permet  de  réduire  principalement  le  coût.  •  
prendre  en  compte  et  trouver  des  compromis  rentables  entre  la  latence,   Intégration  CU,  DU  et  RU :  il  est  clair  qu'il  n'y  a  qu'un  réseau  de  
les  débits  de  données  et  la  centralisation  fonctionnelle.  En  2017,  le   liaison  dans  ce  scénario,  qui  peut  être  utilisé  pour  les  cas  de  points  
3GPP  a  considéré  l'option  2  (PDCP  et  RLC  élevé)  comme  le  point  de   d'accès  et  de  petites  cellules.
partage  de  la  couche  haute  (appelée  interface  F1)  et  les  options  6  et  7   Il  convient  de  noter  que  le  scénario  de  déploiement  adéquat  sera  
pour  le  partage  de  la  couche  basse  [37]. identifié  en  fonction  des  exigences  des  applications  ou  des  services  
La  figure  6  montre  le  mappage  de  ces  options  de  fractionnement   (ultra  faible  latence,  débits  de  données  élevés,  etc.),  de  la  technologie  
fonctionnel  aux  blocs  CU/DU/RU  O­RAN.  Comme  mentionné   de  transport  disponible  et  des  exigences  de  déploiement  des  opérateurs.
précédemment,  pour  prendre  également  en  charge  les  déploiements  
4G,  la  terminologie  pour  BBU  et  RRH  est  remplacée  par  CU/DU  et  RU,  respectivement.
8)  CAS  D'UTILISATION  DU  
Ainsi,  cinq  découpages  de  blocs  fonctionnels  CU/DU/RU  ont  été  définis :   DÉCOUPAGE  O­RAN  Récemment,  un  groupe  de  travail  de  l'alliance  O­
(i)  Un  découpage  de  couche  haute,  où  les  fonctions  CU  sont  séparées   RAN  a  commencé  à  décrire  l'architecture  de  découpage  O­RAN,  ainsi  
des  fonctions  DU/RU  (5G(A)).  (ii)  Deux  divisions  de  couche  inférieure   que  ses  cas  d'utilisation  et  ses  exigences  [38].  Ils  se  concentrent  
qui  séparent  les  fonctions  RU  de  CU/DU  (5G(B)).  (iii)  Deux  couches  en   principalement  sur  la  manière  de  découper  l'architecture  O­RAN  en  
cascade  divisées,  où  chaque  bloc  fonctionnel  est  séparé  des  autres  [36]. plusieurs  réseaux  virtuels,  prenant  en  charge  différentes  exigences  de  
service.  La  figure  7  donne  un  exemple  de  scénario  de  déploiement  de  
découpage  O­RAN,  où  certaines  fonctions  O­RAN  sont  partagées  entre  
7)  SCÉNARIOS  DE  DÉPLOIEMENT  RAN deux  tranches,  telles  que  O­RU,  O  DU  et  O­CU­CP,  tandis  que  d'autres  
Habituellement,  le  réseau  de  transport  est  composé  de  réseaux   fonctions  sont  dédiées  à  chaque  RAN.  tranche,  comme  O­CU­UP.
fronthaul,  midhaul  et  backhaul.  Néanmoins,  différents  scénarios  de   En  outre,  dans  [39],  trois  principaux  cas  d'utilisation  du  découpage  O­
déploiement  peuvent  être  utilisés  par  les  opérateurs  de  réseau. RAN  sont  identifiés  avec  leurs  exigences  et  leurs  avantages :  l'assurance  
Le  3GPP  a  identifié  quatre  scénarios  de  déploiement  RAN. SLA  (accord  de  niveau  de  service)  de  la  tranche  RAN,  les  tranches  
•  Emplacements  RU,  CU  et  DU  séparés :  Ce  scénario  comprend  les   multi­fournisseurs  et  l'optimisation  de  l'allocation  des  ressources.  Par  
trois  réseaux  de  transport  (fronthaul,  mid  haul  et  backhaul).  La   exemple,  l'assurance  SLA  de  la  tranche  RAN  implique  une  interface  RIC  
distance  entre  CU  et  DU  est  de  l'ordre  de  0  à  10  kilomètres  tandis   non­RT,  RIC  Near­RT,  E2.  Sur  la  base  des  exigences  de  la  tranche,  les  
que  celle  entre  DU  et  RU  peut  atteindre  20  kilomètres.  •  DU  et  CU   performances  de  la  tranche  peuvent  être  mesurées  en  continu  via  
co­localisés :  il  n'y  a  pas  de  mi­course  dans   l'interface  E2.  Ensuite,  le  RIC  non­RT  et  le  RIC  Near­RT  peuvent  affiner  
ce les  performances  du  RAN  pour  répondre  aux  SLA  des  tranches  RAN.  
scénario,  puisque  le  DU  et  le  CU  sont  colocalisés.  •   Pour  ce  faire,  des  modèles  ML/DL  peuvent  être  déployés  sur  le  module  
Intégration  DU  et  RU :  il  n'y  a  pas  de  liaison  directe  dans  ce  scénario,   Near­RT  RIC  qui,  sur  la  base  des  performances  de  tranche  mesurées  à  
car  DU  et  RU  sont  situés  ensemble,  par  exemple  séparés  par  des   partir  d'E2,  peut  ajuster  le  comportement  RAN  pour  garantir  les  SLA  de  
centaines  de  mètres  dans  le  même tranche.

234 VOLUME  3,  2022
Machine Translated by Google

FIGURE  7.  Scénario  de  déploiement  de  la  tranche  O­RAN.

TABLEAU  2.  Comparaison  entre  les  architectures  C­RAN,  vRAN  et  O­RAN.

E.  UNE  ÉTUDE  COMPARATIVE   proche  des  utilisateurs  (MEC),  quand  il  s'agit  de  vRAN  et  O­RAN.  
Dans  cette  sous­section,  nous  fournissons  une  étude  comparative   •  Virtualisation  
entre  le  C­RAN,  le  vRAN  et  l'O­RAN  à  partir  de  diverses  perspectives. et  découplage  des  données/plans  de  contrôle :  contrairement  au  C­
Nous  discutons  des  principales  différences  entre  eux  en  termes  de   RAN,  vRAN  et  O­RAN  exploitent  les  nouvelles  technologies  telles  
caractéristiques  dans  le  TABLEAU  2. que  SDN  et  NFV  pour  séparer  les  plans  utilisateur  et  de  contrôle  
Notons  que  nous  ne  considérons  pas  le  D­RAN  dans  notre   et  virtualiser  les  fonctions  d'accès  radio,  respectivement.  En  fait,  
comparaison  puisque,  selon  [32],  le  D­RAN  est  une  solution  efficace   le  découplage  des  plans  utilisateur  et  de  contrôle  et  la  virtualisation  
uniquement  pour  les  réseaux  3G/4G.  Cependant,  il  n'est  pas   des  fonctions  principales  dans  la  partie  RAN  améliorent  la  
suffisamment  évolutif  pour  répondre  aux  exigences  de  bande  passante   flexibilité  et  l'évolutivité  de  l'architecture  du  réseau,  optimisent  les  
fonctions  logiques  de  contrôle  centralisées,  facilitent  le  lancement  
élevée,  de  faible  latence  et  de  débit  de  données  élevé  des  réseaux  5G  et  au­delà.
•  Edge  Support :  Dans  la  partie  RAN,  les  données  sont  traitées  soit   du  découpage  du  réseau  pour  divers  secteurs  verticaux  de  
dans  le  cloud  computing  central  soit  dans  le  Multi­access  Edge   l'industrie.  •  Prise  en  charge  
Computing  (MEC),  qui  est  proche  des  utilisateurs  mobiles  [40],   multifournisseurs :  C­RAN  ne  prend  pas  en  charge  le  paradigme  
[41].  Quant  au  C­RAN,  on  distingue  deux  configurations   multifournisseurs  puisqu'aucune  virtualisation  des  fonctions  
principales :  le  C­RAN  totalement  centralisé  et  le  C­RAN   réseau  n'est  envisagée.  O­RAN  est  basé  sur  des  normes  ouvertes  
partiellement  centralisé  [3].  Ainsi,  les  données  sont  traitées  soit   plutôt  que  sur  des  interfaces  propriétaires  et  héritées,  qui  relient  
dans  des  centres  de  données  cloud  pour  la  configuration   les  parties  BBU  et  RRU.
entièrement  centralisée,  soit  au  MEC  pour  la  configuration   Cela  permet  aux  unités  de  différents  fournisseurs  d'interagir  les  
partiellement  centralisée.  Mais  les  données  sont  traitées unes  avec  les  autres.  De  même,  la  radio  et  la  bande  de  base

VOLUME  3,  2022 235
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

Le  matériel  et  les  logiciels  du  vRAN  peuvent  être  fournis  par  différents   et  cible  initialement  trois  cas  d'utilisation  principaux :  l'équilibrage  de  
fournisseurs,  car  le  vRAN  s'appuie  sur  la  technologie  NFV  pour   charge,  les  économies  d'énergie  et  l'optimisation  de  la  mobilité.  
virtualiser  ses  composants  architecturaux.  •  Dépenses  d'investissement   L'objectif  principal  est  de  concevoir  un  cadre  basé  sur  l'IA/ML  au­
et  d'exploitation  (CAPEX  et  OPEX) :  les  coûts  OPEX  et  CAPEX  sont  pris   dessus  de  l'architecture  NG­RAN.
en  compte  lors  des  étapes  de  conception  et  de  déploiement  de   •  Contrôle  et  gestion :  le  contrôle,  la  gestion  et  le  déploiement  distribués  
l'architecture  RAN.  Les  opérateurs  de  réseau  cherchent  à  réduire  les   des  fonctions  RAN  améliorent  principalement  les  performances  du  
deux  coûts  en  tirant  parti  des  infrastructures  déjà  déployées  [42].  La   réseau  telles  que  la  latence  du  RAN,  la  fiabilité  des  communications  et  
virtualisation  et  la  prise  en  charge  en  périphérie  des  architectures  RAN   les  interférences,  tandis  que  la  centralisation  de  la  gestion  du  RAN  
jouent  un  rôle  essentiel  dans  la  réduction  des  coûts  CAPEX  et  OPEX.   peut  générer  une  latence  importante  qui  pourrait  avoir  un  impact  négatif  
Par  conséquent,  OPEX  et  CAPEX  sont  moyens  dans  C­RAN,  tandis   sur  les  performances  du  réseau  et  en  particulier  les  performances  du  
que  vRAN  et  O­RAN  génèrent  de  faibles  coûts  OPEX  et  CAPEX  [43].  •   RAN.
Consommation  d'énergie :  Plus  de  50  %  de  l'énergie  des  réseaux  
cellulaires  est  consommée  par  les  stations  de  base  [44]. III.  TRAVAUX  BASÉS  SUR  L'APPRENTISSAGE  PROFOND  
POUR  LE  RAN  Dans  cette  section,  nous  passons  en  revue  les  travaux  basés  
sur  l'apprentissage  profond  existants  traitant  du  RAN  4G/5G.  Ensuite,  nous  
Ainsi,  la  diminution  de  l'énergie  consommée  par  les  stations  de  base  a   montrons  comment  ces  travaux  peuvent  être  réalisés  au­dessus  de  
un  impact  significatif  sur  la  consommation  énergétique  totale  de  la   l'architecture  O­RAN.  Plus  précisément,  nous  discutons  du  bloc  fonctionnel  
partie  RAN,  ce  qui  permettra  également  de  diminuer  la  consommation   responsable  à  chaque  niveau  d'architecture  (Near  RT  RIC,  O­CU,  O­DU  et  O­
énergétique  de  tous  les  secteurs  des  TIC  et  en  particulier  des  réseaux   RU)  ainsi  que  du  rôle  des  interfaces  O­RAN.
cellulaires  [45].  En  effet,  la  centralisation  des  fonctions  de  réseau   Pour  ce  faire,  nous  avons  choisi  de  regrouper  les  travaux  existants  en  
entraîne  une  diminution  de  la  consommation  d'énergie  et  la  virtualisation   fonction  du  module  Near­RT  RIC  auquel  ils  appartiennent.
des  fonctions  de  réseau  entraîne  une  réduction  supplémentaire  de  la   Cela  inclut  les  trois  modules  Near  RT  RIC  (cf.  Fig.  5).
consommation  d'énergie  [44].  Par  conséquent,  la  consommation  
d'énergie  du  C­RAN  est  moyenne,  tandis  que  le  vRAN  et  l'O­RAN  sont   A.  OPTIMISATION  DE  LA  GESTION  DES  RESSOURCES  Elle  
faibles  par  rapport  à  celle  du  C­RAN. couvre  principalement  l'allocation  et  l'ordonnancement  des  ressources  radio,  
l'allocation  des  ressources  de  puissance  en  liaison  montante  et  descendante  
•  Latence :  par  rapport  au  cloud  computing  centralisé,  la  prise  en  charge   [26],  [27],  [28],  [29].  Cette  classe  de  travaux  considère  les  changements  
de  l'Edge  computing  a  un  impact  significatif  sur  la  réduction  de  la   dynamiques  des  exigences  d'accès  et  de  services  radio  en  termes  de  latence,  
latence  du  réseau,  car  elle  rapproche  les  capacités  de  calcul  et  de   de  débit,  de  fiabilité,  etc.
stockage  des  utilisateurs  mobiles  [46].  Par  conséquent,  la  latence  du  
réseau  est  élevée  dans  l'architecture  C­RAN  centralisée  et  faible  à  la   1)  REVUE  DE  LA  LITTÉRATURE  
fois  dans  le  vRAN  et  l'O­RAN. Dans  [26],  les  auteurs  ont  fourni  un  cadre  de  travail  basé  sur  le  Deep  
Learning  pour  attribuer  intelligemment  les  ressources  radio  dans  les  réseaux  5G.
•  Prise  en  charge  de  l'IA  et  des  interfaces  ouvertes  et  contrôleur  RAN :   Le  cadre  vise  à  prédire  la  congestion  du  trafic  et  l'état  d'occupation  des  eNB.  
par  rapport  au  C­RAN  et  au  VRAN,  l'architecture  O­RAN  propose  deux   Un  rapport  adaptatif  de  liaison  montante  et  de  liaison  descendante  peut  
nouveaux  paradigmes  (1)  des  fonctions  RAN  désagrégées  qui   alors  être  appliqué  pour  éviter  la  congestion  du  trafic.
s'exécutent  en  tant  que  VNF ;  (2)  la  notion  de  contrôleur  RAN  intelligent   Le  cadre  proposé  implémente  un  modèle  d'arbre  profond  et  une  mémoire  
qui  exécute  des  applications  RAN  telles  que  la  gestion  de  la  mobilité,   longue  à  court  terme  (LSTM)  pour  prédire  le  trafic  futur  en  fonction  du  trafic  
la  planification  des  utilisateurs,  l'allocation  des  ressources  radio,  etc.   actuel  et  passé.  Le  modèle  arborescent  utilise  des  couches  convolutives  
Cela  peut  être  en  temps  quasi  réel  pour  les  applications  en  temps   pour  traiter  les  caractéristiques  spatiales  des  données  générées  par  les  UE.  
réel,  ou  en  temps  non  réel  pour  les  applications  tolérantes  aux  délais   Par  conséquent,  un  mécanisme  de  gestion  des  ressources  approprié  peut  
applications.  Le  contrôleur  RAN  est  chargé  d'appliquer  les  décisions   être  déployé  sur  la  base  du  trafic  futur  prévu.  De  même,  les  auteurs  ont  
d'application  en  utilisant  des  interfaces  ouvertes  avec  les  fonctions   abordé  la  question  de  la  congestion  du  trafic  dans  [28].  Ils  ont  utilisé  
RAN.  Une  caractéristique  importante  introduite  par  O­RAN  est   l'algorithme  d'apprentissage  profond  LSTM  pour  prédire  la  charge  de  trafic  à  
l'utilisation  intensive  des  techniques  d'apprentissage  automatique,  en   l'eNB.  Sur  la  base  des  prédictions,  l'algorithme  proposé  exécute  la  politique  
particulier  l'apprentissage  en  profondeur,  pour  favoriser  l'innovation  et   d'action  appropriée  afin  d'éviter/atténuer  la  congestion  de  manière  intelligente.
faciliter  le  déploiement  d'applications  RAN  intelligentes  capables  de  
répondre  aux  exigences  de  QoS  des  services  réseau  5G  et  au­delà  
envisagés.  Il  convient  de  noter  que  la  norme  3GPP  RAN3  a  récemment   Dans  [48],  les  auteurs  ont  étudié  la  gestion  des  ressources  pour  un  réseau  
commencé  à  étudier  l'intégration  des  modèles  AI/ML  au  RAN,  dans  sa   d'utilisateurs  de  réalité  virtuelle  (RV)  sans  fil.  Les  utilisateurs  VR  communiquent  
nouvelle  version  17  [47].  Le  groupe  de  travail  correspondant  vient  de   avec  des  réseaux  de  petites  cellules  (SCN)  qui  agissent  comme  centre  de  
commencer  et  se  concentre  sur  les  principales  fonctionnalités  et  leurs   contrôle  VR.  Dans  le  scénario  considéré,  les  SCN  collectent  les  informations  
entrées  et  sorties  correspondantes  (surveillance  des  données,   de  suivi  des  utilisateurs  sur  le  canal  de  liaison  montante.  Ensuite,  les  SCN  
interfaces  et  nœuds  impliqués).  De  plus,  cette  étude  se  concentre  sur   enverront,  via  le  canal  de  liaison  descendante,  les  images  3D  générées  avec  
le  RAN  de  nouvelle  génération  (NG­RAN), leur  audio  aux  utilisateurs  VR.
Par  conséquent,  les  auteurs  ont  fourni  un  schéma  d'allocation  des  ressources

236 VOLUME  3,  2022
Machine Translated by Google

qui  prend  en  compte  à  la  fois  les  canaux  de  liaison  descendante  et  de  liaison   allocation  de  puissance  max­min  dans  la  liaison  montante  d'un  système  
montante.  Ils  ont  d'abord  formulé  un  jeu  non  coopératif  où  les  joueurs  sont   MIMO  (Multiple  Input  Multiple  Output)  à  cellules  massives.  À  l'aide  d'un  
les  SCN  qui  cherchent  à  trouver  une  allocation  de  spectre  optimale  améliorant   réseau  de  neurones,  les  auteurs  ont  généré  un  modèle  d'apprentissage  qui  
la  QoE  des  utilisateurs  de  VR  en  termes  de  délai  et  de  débit.  Un  algorithme   peut  établir  une  correspondance  entre  les  données  d'entrée  et  la  solution  
d'apprentissage  basé  sur  les  réseaux  d'état  d'écho  a  ensuite  été  utilisé  pour   optimale  du  schéma  d'allocation  de  puissance.
prédire  la  valeur  QoS  VR  résultant  de  l'allocation  des  ressources  et,  par   Un  schéma  d'allocation  de  ressources  radio  pour  les  réseaux  véhiculaires
conséquent,  atteindre  un  état  d'équilibre  de  Nash  (NE). a  été  proposé  dans  [52],  afin  d'assurer  des  communications  V2V  ultra­
fiables  à  faible  latence.  Pour  modéliser  l'exigence  de  latence,  les  auteurs  
Le  défi  de  la  planification  des  ressources  dans  la  préparation  du   ont  pris  en  compte  à  la  fois  la  latence  de  transmission  et  la  latence  de  file  
découpage  du  RAN  5G  tout  en  garantissant  l'isolation  des  performances,  les   d'attente.  Ils  ont  ensuite  traité  la  latence  de  file  d'attente  en  utilisant  le  
exigences  de  service  et  la  dynamique  du  réseau  (mobilité  des  utilisateurs  et   concept  d'apprentissage  fédéré  (FL)  pour  permettre  à  chaque  véhicule  de  
états  des  canaux)  a  été  ciblé  dans  [27].  Les  auteurs  ont  fourni  un  schéma   prédire  quand  sa  longueur  de  file  d'attente  dépasse  un  seuil  prédéfini,  c'est­
intelligent  de  planification  des  ressources  (iRSS)  où  l'idée  de  base  est   à­dire  dépasse  la  latence  nécessaire  [59].
d'exploiter  à  la  fois  le  réseau  neuronal  profond  (DNN)  et  l'apprentissage  par   Les  résultats  de  la  simulation  ont  montré  que  le  schéma  basé  sur  FL  peut  
renforcement  (RL)  [58].  En  fait,  DNN  est  utilisé  pour  gérer  l'allocation  de   fournir  des  prédictions  très  précises  et  donc  aider  à  réduire  le  nombre  de  
ressources  à  grande  échelle  de  temps,  tandis  que  RL  est  utilisé  pour  fournir   véhicules  avec  des  longueurs  de  file  d'attente  excessives.
une  planification  des  ressources  en  ligne  pour  s'attaquer  à  la  dynamique  du   Dans  [53],  les  auteurs  ont  fourni  un  cadre  basé  sur  RL  pour  la  gestion  
réseau  à  petite  échelle  de  temps,  comme  les  prédictions  erronées  et  les   conjointe  des  ressources  radio  et  l'allocation  de  puissance.  Il  visait  à  trouver  
événements  réseau  inattendus.  Plus  précisément,  le  temps  est  divisé  en  un   un  compromis  entre  la  fiabilité  des  communications,  la  latence  et  le  débit  de  
ensemble  de  fenêtres  de  prédiction  (PW),  tandis  que  DNN  basé  sur  LSTM   données.  Ils  ont  d'abord  formulé  un  problème  de  minimisation  de  puissance  
est  utilisé  dans  chaque  PW  pour  prédire  le  volume  de  trafic  pour  le  prochain   sous  des  contraintes  de  fiabilité  et  de  latence  avant  de  le  résoudre  à  l'aide  
PW.  De  plus,  à  l'intérieur  de  chaque  PW,  RL  basé  sur  l'algorithme  A3C   du  cadre  basé  sur  RL  profond.  Le  cadre  proposé  peut  prédire  dynamiquement  
(Asynchronous  Benefit  Actor­Critic)  est  utilisé  pour  effectuer  la  planification   le  modèle  de  trafic  de  chaque  UE,  puis  allouer  conjointement  des  blocs  de  
des  ressources  en  ligne. ressources  (RB)  et  de  la  puissance  aux  UE  de  liaison  descendante.
Dans  [29],  les  auteurs  ont  abordé  le  défi  de  l'ordonnancement  distribué  
afin  de  faire  face  aux  interférences  inter­cellules  et  au  manque  de   Bien  que  l'apprentissage  par  renforcement  puisse  représenter  un  outil  
standardisation  des  ordonnanceurs.  Ils  ont  proposé  une  approche  basée  sur   puissant  pour  l'optimisation  radio,  il  consomme  énormément  d'énergie  au  fil  
l'apprentissage  profond  (RL)  par  renforcement  pour  sélectionner   du  temps.  Ainsi,  dans  [55],  les  auteurs  ont  discuté  des  innovations  en  
dynamiquement  le  planificateur  approprié  pour  chaque  groupe  de  petites   matière  d'algorithmes  et  d'architectures  pour  parvenir  à  un  apprentissage  par  
cellules,  en  fonction  de  la  qualité  du  canal  et  des  contraintes  de  QoS  des   renforcement  profond  (DRL)  vert  lors  de  la  gestion  des  ressources  radio  
utilisateurs.  Dans  ce  schéma,  l'ordonnancement  des  ressources  est  effectué   (RRM).  D'un  point  de  vue  architectural,  un  schéma  DRL  distribué  est  proposé  
de  manière  distribuée  en  utilisant  l'un  des  deux  ordonnanceurs :  un   pour  permettre  la  prise  de  décision  distribuée  par  les  entités  RRM.  De  plus,  
ordonnanceur  équitable  proportionnel  ou  un  ordonnanceur  max­min  à  débit   un  programme  d'apprentissage  par  transfert  est  également  conçu  pour  
garanti.  Sur  la  base  du  RL  et  de  la  QoS  expérimentée  et  de  la  qualité  des   étendre  le  programme  DRL  à  travers  les  zones  géographiques.  Un  autre  
canaux  des  utilisateurs,  un  agent  central  est  chargé  d'effectuer  une  sélection   modèle  DRL  est  proposé  pour  traiter  le  problème  de  planification  des  
dynamique  du  planificateur.  De  même,  pour  minimiser  les  retards  de  paquets   ressources  radio  dans  les  réseaux  mobiles  5G  [56].  Le  modèle  proposé  est  
et  les  taux  d'abandon,  un  autre  cadre  d'ordonnancement  basé  sur  RL  a  été   indépendant  de  la  numérologie,  qui  prend  en  charge  différentes  numérologies  
proposé  dans  [49].  Ce  cadre  est  capable  non  seulement  de  sélectionner  les   5G.  Une  étude  d'analyse  des  récompenses  est  également  fournie  pour  
règles  d'ordonnancement  appropriées  par  cellule,  mais  aussi  d'apprendre   déduire  quelles  politiques  le  modèle  DRL  a  apprises.  De  même,  les  auteurs  
quand  appliquer  chaque  ordonnanceur. ont  traité  la  question  de  la  planification  des  ressources  radio  dans  les  réseaux  
Dans  [50],  les  auteurs  ont  relevé  le  défi  de  l'allocation  de  puissance  dans   5G,  afin  d'attribuer  efficacement  les  ressources  en  fréquence  aux  utilisateurs  
les  réseaux  cellulaires  en  proposant  trois  schémas  basés  sur  le  RL  profond :   mobiles  [57].  Ils  ont  utilisé  un  critique  de  pointeur  d'avantage  pour  implémenter  
REINFORCE,  Deep  Q­Learning  et  le  gradient  de  politique  déterministe   un  agent  d'apprentissage  par  renforcement  profond.  L'agent  est  basé  sur  
profond  (DDPG),  qui  sont,  respectivement,  basés  sur  des  politiques,  basée   une  architecture  de  réseau  à  pointeur  profond  et  déployé  au  niveau  du  RAN.  
sur  les  valeurs  et  basée  sur  les  critiques  des  acteurs. Les  résultats  expérimentaux  montrent  l'efficacité  du  schéma  pour  allouer  des  
Ces  schémas  visaient  à  maximiser  le  débit  de  somme  de  cellules  de  liaison   ressources  de  fréquence  aux  utilisateurs  par  rapport  à  d'autres  schémas.
descendante.  Les  simulations  effectuées  ont  montré  que  les  schémas  
proposés  surpassent  les  méthodes  de  l'état  de  l'art  en  termes  de  taux  de  
somme  avec  un  bon  pouvoir  de  généralisation.  De  même,  un  autre  schéma  
basé  sur  le  Q­learning  a  été  proposé  dans  [51],  afin  d'obtenir  une  politique   2)  DISCUSSION  ET  INTÉGRATION  AVEC  O­RAN  Le  TABLEAU  

d'allocation  de  puissance  quasi  optimale  dans  un  système  multicellulaire.   3  illustre  une  étude  comparative  entre  les  travaux  appartenant  au  module  de  
Ce  schéma  visait  à  maximiser  le  débit  du  réseau  de  liaison  descendante   gestion  des  ressources  du  Near­RT  RIC.  Cette  étude  est  établie  en  fonction  
sous  des  contraintes  de  puissance  maximale  d'un  groupe  d'utilisateurs,   du  défi  adressé,  de  l'algorithme  d'apprentissage  utilisé,  du  lien  avec  
partageant  les  mêmes  bandes  de  fréquences.  Dans  le  même  contexte,  une   l'architecture  O­RAN  au  niveau  du  module  logiciel  et  de  ses  blocs  fonctionnels  
autre  approche  basée  sur  l'apprentissage  profond  a  été  proposée  dans  [54].   où  les  schémas  proposés  peuvent  être
Il  visait  à  effectuer  sum­rate­max  et

VOLUME  3,  2022 237
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

TABLEAU  3.  La  gestion  des  ressources  fonctionne  au­dessus  de  l'O­RAN.

appliquées,  les  interfaces  de  communication  pour  l'échange  de  trafic   ces  travaux  concerneront  principalement  la  couche  MAC  en  termes  
également. d'allocation  et  d'ordonnancement  des  ressources  et  la  couche  High­PHY  
•  Allocation  des  ressources  radio :  C'est  une  des  fonctions  principales   pour  fournir  la  puissance  nécessaire  au  canal  physique  partagé  lors  du  
téléchargement  des  données  (PDSCH  pour  Physical  Downlink  Shared  
du  RAN,  puisqu'elle  permet  aux  UE  d'émettre  (ou  de  recevoir)  leurs  
Channel).
données  tout  en  respectant  les  exigences  des  applications  (latence,  
débit,  fiabilité,  etc.).  L'apprentissage  en  profondeur  supervisé  et  par  
renforcement  a  été  utilisé  pour  traiter  ce  problème.  En  particulier,   B.  OPTIMISATION  DE  LA  GESTION  DE  LA  MOBILITÉ
l'algorithme  LSTM  est  utilisé  pour  traiter  les  données  séquence  à   Il  aborde  la  gestion  du  handover  des  utilisateurs  et  de  l'énergie  des  stations  
séquence  lors  de  la  prévision  de  la  demande  de  trafic  dans  le  temps.   de  base,  basée  sur  la  mobilité  des  utilisateurs  [62],  [63],  [64].
L'apprentissage  par  renforcement,  quant  à  lui,  a  permis  de  créer  des  
modèles  de  prédiction  des  ressources  radio  basés  sur  la  qualité  des   1)  REVUE  DE  LA  LITTÉRATURE  
expériences  des  utilisateurs  mobiles  [60],  [61].
Dans  [62],  les  auteurs  ont  ciblé  le  défi  du  transfert  conditionnel  qui  est  l'une  
des  améliorations  prometteuses  de  la  mobilité  dans  les  réseaux  5G.  Il  
•  Ordonnancement  des  ressources :  L'ordonnanceur  est  chargé  de  
consiste  à  prendre  des  décisions  de  préparation  en  amont  afin  d'améliorer  
définir  quand  chaque  utilisateur  peut  accéder  au  support  sans  fil  pour  
le  taux  de  réussite  du  Handover.  Cependant,  les  communications  5G  mm­
envoyer  (ou  recevoir)  ses  données.  Cette  fonction  du  RAN  est  
Wave  sont  vulnérables  aux  blocages  et,  par  conséquent,  des  changements  
essentielle  car,  d'une  part,  elle  permet  aux  utilisateurs  de  répondre  à  
soudains  de  la  puissance  du  signal  peuvent  conduire  à  des  préparations  
leurs  besoins  tels  que  la  latence ;  d'autre  part,  il  permet  d'éviter  les  
précoces  indésirables  du  transfert.  Les  auteurs  ont  proposé  un  schéma  
interférences  inter  et  intra­cellules.
basé  sur  un  réseau  neuronal  profond  (DNN)  qui  prend  en  compte  le  contexte  
Pour  y  faire  face,  la  plupart  des  travaux  existants  ont  utilisé  
environnemental  et  prédit  la  meilleure  prochaine  station  de  base  en  fonction  
l'apprentissage  par  renforcement  afin  de  construire  des  modèles  de  
de  la  puissance  du  signal  reçu.  Par  conséquent,  la  base  d'apprentissage  
prédiction  basés  sur  les  retours  des  utilisateurs  en  termes  de  communication.
en  profondeur  proposée  aide  à  prendre  des  décisions  de  préparation  plus  
fiabilité.
intelligentes  de  la  procédure  de  transfert.
•  Allocation  de  puissance :  C'est  une  autre  fonction  importante  du  RAN,  
Dans  le  même  contexte,  dans  [63],  les  auteurs  ont  d'abord  donné  un  
qui  vise  à  mettre  en  œuvre  une  politique  d'allocation  de  puissance  
modèle  analytique  du  coût  du  Handover  dans  la  5G,  en  termes  de  
quasi­optimale,  dans  un  système  multicellulaire.  L'apprentissage  par  
surcharge  de  signalisation,  de  latence,  d'abandon  d'appel  et  de  gaspillage  
renforcement  est  principalement  appliqué  pour  maximiser  le  débit  du  
de  ressources  radio.  Ils  ont  ensuite  proposé  un  schéma  de  prédiction  basé  
réseau  de  liaison  descendante,  tout  en  assurant  une  allocation  de  
sur  le  RNN  (Recurrent  Neural  Network)  avec  l'algorithme  LSTM  pour  
puissance  optimale.
minimiser  davantage  le  coût  du  Handover.  Il  a  été  démontré  qu'une  bonne  
En  ce  qui  concerne  le  lien  avec  O­RAN,  nous  observons  que  tous  ces   précision  de  prédiction  du  transfert  peut  réduire  considérablement  la  
travaux  appartiennent  au  module  O­DU  puisqu'ils  ciblent  le  défi  de  la  gestion   fonction  de  coût  en  termes  d'insatisfaction  de  l'utilisateur,  de  latence  HO,  
des  ressources  (radio  et  puissance).  Ainsi, de  gaspillage  de  ressources  et  de  frais  généraux.

238 VOLUME  3,  2022
Machine Translated by Google

TABLEAU  4.  La  gestion  de  la  mobilité  fonctionne  au­dessus  de  l'O­RAN.

De  même,  l'algorithme  LSTM  est  utilisé,  dans  [64],  pour  apprendre  le   pour  minimiser  le  coût  de  communication  de  l'étape  de  formation.
modèle  de  mobilité  de  chaque  UE  à  partir  de  ses  trajectoires  historiques,  et   Les  résultats  de  la  simulation  prouvent  l'efficacité  du  cadre  par  rapport  aux  
prédire  sa  prochaine  mobilité  dans  le  futur.  Sur  la  base  des  résultats  de   schémas  réactifs  pour  réduire  les  transferts  inutiles.  Le  transfert  de  
prédiction  de  mobilité,  la  station  de  base  correspondante  jugera  si  un   l'utilisateur  dans  le  découpage  du  réseau  5G  RAN  a  été  traité  dans  [69].  Les  
transfert  est  requis  pour  l'UE  ou  non. auteurs  ont  conçu  une  politique  de  transfert  intelligent  qui  tient  compte  de  
Si  oui,  une  double  connexion  sera  établie  pour  l'UE  avec  les  deux  stations   deux  contraintes  principales :  les  ressources  physiques  des  stations  de  base  
de  base  dans  l'opération  de  transfert. et  la  connexion  logique  des  tranches  de  réseau.  Pour  ce  faire,  les  auteurs  
Dans  [65],  les  auteurs  ont  étudié  le  défi  de  la  consommation  d'énergie   ont  modélisé  le  transfert  dans  le  découpage  RAN  comme  un  processus  de  
des  stations  de  base  (BS),  en  particulier  avec  la  densification  des  BS  dans   décision  de  Markov  et  ont  construit  un  modèle  d'apprentissage  utilisant  
l'architecture  5G.  Ils  ont  proposé  un  schéma  basé  sur  l'apprentissage  par   l'apprentissage  par  renforcement  profond  pour  améliorer  le  débit  du  réseau  
renforcement  qui  contrôle  les  états  des  BS  tout  en  respectant  les  exigences   et  la  qualité  de  service  des  utilisateurs.
des  utilisateurs.  Ils  ont  considéré  trois  niveaux  de  modes  de  veille,  et   Pour  réduire  la  consommation  d'énergie  des  stations  de  base,  un  cadre  
l'algorithme  choisit  la  profondeur  à  laquelle  une  BS  peut  dormir  tout  en   de  contrôle  sensible  au  trafic  est  proposé  dans  [70],  pour  activer/désactiver  
maximisant  le  compromis  entre  les  économies  d'énergie  et  la  QoS  des   efficacement  les  stations  basées  sur  la  demande  de  trafic  tout  en  
utilisateurs. garantissant  les  exigences  de  QoS  des  utilisateurs.  À  cette  fin,  un  schéma  
De  même,  un  autre  schéma  basé  sur  RL  a  été  proposé  dans  [66]. d'apprentissage  basé  sur  les  données  est  conçu  pour  prédire  les  demandes  
Il  visait  à  dériver  un  contrôleur  qui  active  efficacement  les  différents  modes   de  trafic  en  tenant  compte  de  la  relation  spatio­temporelle  sémantique  et  
de  veille  des  BS  en  fonction  de  l'utilité  ciblée. géographique  du  trafic  mobile.  Dans  le  même  contexte,  l'efficacité  
Chaque  BS  utilise  ses  informations  locales  afin  d'apprendre  la  meilleure   énergétique  du  RAN  5G  pour  prendre  en  charge  des  services  ultra  fiables  
politique  d'économie  d'énergie.  Dans  [67],  un  schéma  basé  sur   à  faible  latence  et  à  haut  débit  de  données  pour  les  UE  et  les  stations  de  
l'apprentissage  par  renforcement  profond  a  été  proposé  pour  fournir  une   base  a  également  été  abordée  dans  [71].
stratégie  d'activation  des  petites  cellules  (BS).  Le  schéma  proposé  active  le   Ce  travail  donne  un  aperçu  des  schémas  d'économie  d'énergie  basés  sur  
sous­ensemble  optimal  de  petites  stations  de  base  afin  de  réduire  la   l'apprentissage  profond  en  lien  avec  les  normes  5G.
consommation  d'énergie  sans  compromettre  la  qualité  de  service  des  
utilisateurs.  Les  auteurs  ont  formulé  le  problème  d'activation/désactivation   2)  DISCUSSION  ET  INTÉGRATION  AVEC  O­RAN  Le  TABLEAU  
des  petites  BS  en  tant  que  processus  de  décision  de  Markov  avant  de  le   4  présente  une  étude  comparative  entre  les  ouvrages  appartenant  au  module  
résoudre  à  l'aide  de  méthodes  d'apprentissage  par  renforcement  Acteur­Critique  
(AC).
de  
gestion  de  la  mobilité  du  Near­RT  RIC.
Dans  [68],  les  auteurs  ont  abordé  le  défi  du  handover  dans  les  réseaux  
de  véhicules  à  ondes  millimétriques  5G.  Ils  ont  proposé  un  cadre  proactif   •  Gestion  du  transfert :  il  s'agit  d'une  fonction  essentielle  du  RAN  qui  
basé  sur  l'apprentissage  fédéré  pour  optimiser  le  délai  de  transfert  et  ainsi   consiste  à  déplacer  (transférer)  la  connexion  des  utilisateurs  d'une  
assurer  la  qualité  de  service  pour  les  utilisateurs.  Le  cadre  proposé  permet   cellule  à  une  autre,  en  fonction  de  leur  mobilité  (utilisateurs),  afin  que  
d'éviter  les  transferts  fréquents  et  de  décider  des  transferts  en  fonction  du   les  utilisateurs  obtiennent  de  meilleures  conditions  radio  et  donc  une  
modèle  de  mobilité  des  utilisateurs.  L'apprentissage  fédéré  permet  de   meilleure  expérience.  Dans  la  littérature,  les  techniques  
générer  le  modèle  d'apprentissage  de  manière  distribuée,  ce  qui  permet d'apprentissage  supervisé  telles  que  Deep  Neural  Network  (DNN)  
sont  les  plus  utilisées  pour  traiter  ce  problème.  DNN  considère

VOLUME  3,  2022 239
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

le  contexte  environnemental,  tel  que  la  puissance  du  signal  reçu   Le  schéma  de  codage  et  de  décodage  basé  sur  DNN  peut  générer  
des  utilisateurs,  puis  prédit  la  prochaine  station  de  base  appropriée   les  mêmes  performances  que  le  code  Hamming  sans  nécessiter  de  
vers  laquelle  les  utilisateurs  migreront.  Ainsi,  DNN  permet  des   fonctions  d'encodeur  et  de  décodeur.  •  Classification  
décisions  de  préparation  précoce  de  la  procédure  de  handover,  ce   des  signaux :  pour  fournir  un  schéma  de  classification  automatique  
qui  a  pour  effet  de  réduire  le  coût  de  handover.  Dans  l'architecture   de  la  modulation  (AMC)  pour  l'environnement  et  l'identification  des  
O­RAN,  la  procédure  de  handover  agira  au  niveau  du  module  O­ émetteurs,  un  cadre  de  classification  des  signaux  basé  sur  
CU­CP,  en  particulier  le  bloc  fonctionnel  de  gestion  des  procédures   l'apprentissage  en  profondeur  a  été  développé  dans  [75].  Le  cadre  
UE  et  gNB. est  basé  sur  des  signaux  d'entrée  en  coordonnées  polaires  et  est  
•  Énergie  des  stations  de  base :  Les  stations  de  base  (BS)   formé  pour  classer  11  types  de  modulation  typiques.  Le  cadre  
représentent  la  principale  source  de  consommation  d'énergie  dans   comprend  deux  modules  principaux.  Le  premier  est  basé  sur  LSTM  
les  réseaux  cellulaires.  Par  conséquent,  l'une  des  principales   pour  la  classification  des  signaux  à  un  rapport  signal  sur  bruit  
fonctions  du  RAN  est  de  gérer  la  consommation  d'énergie  des  BS,   (SNR)  élevé,  tandis  que  le  second  est  basé  sur  le  réseau  neuronal  
en  particulier  avec  la  densification  des  BS  dans  les  réseaux  5G.   convolutif  (CNN)  pour  traiter  les  faibles  SNR.
Dans  un  tel  contexte,  l'apprentissage  par  renforcement  est  le  plus  
appliqué  pour  décider  quand  les  BS  peuvent  basculer  entre  les   Enfin,  comme  les  performances  MIMO  massives  dépendent  
modes  veille  et  actif,  tout  en  respectant  la  QoS  des  utilisateurs.  La   principalement  de  la  qualité  des  messages  CSI  (Channel  State  Information)  
fonction  énergie  de  la  station  de  base  sera  implémentée  au  niveau   surveillés,  les  auteurs  ont  proposé  un  cadre  basé  sur  DNN  pour  les  
du  module  O­CU­CP  de  l'architecture  O­RAN,  qui  assure  la  gestion   problèmes  d'estimation  de  canal  lors  de  la  collecte  de  paquets  CSI  [72].  
des  procédures  cellulaires. Les  résultats  de  la  simulation  ont  montré  que  DNN  est  un  algorithme  
Nous  en  déduisons  que  les  travaux  de  cette  classe  concernent   approprié  pour  une  reconstruction  CSI  précise  et  donc  pour  une  estimation  
principalement  le  module  O­CU­CP  qui  implémente  les  blocs  fonctionnels   de  canal  haute  performance  du  MIMO  massif.  Le  défi  massif  MIMO  de  la  
de  gestion  des  procédures  UE,  gNB  et  Cell.  Ainsi,  le  CP  O­CU  est  en   détection  optimale  au  niveau  du  récepteur  a  également  été  abordé  dans  
charge  de  traiter  la  gestion  du  handover  et  les  enjeux  énergétiques  des   [76].  Dans  ce  contexte,  l'algorithme  de  détection  de  vraisemblance  
stations  de  base,  qui  sont  principalement  abordés  par  les  travaux  de  cette   maximale  peut  obtenir  le  taux  d'erreur  binaire  (BER)  le  plus  bas,  
classe. cependant,  la  complexité  de  calcul  augmente  à  mesure  que  le  nombre  
d'antennes  augmente.  Les  auteurs  ont  fourni  un  schéma  de  détection  
basé  sur  un  réseau  de  neurones.
C.  OPTIMISATION  DE  LA  GESTION  DU  SPECTRE  Elle  
Les  résultats  expérimentaux  ont  montré  que  le  schéma  proposé  peut  
vise  à  fournir  une  efficacité  du  spectre  basée  sur  les  nouvelles  
atteindre  un  faible  BER  avec  une  faible  complexité  de  calcul.
technologies  5G  activées,  notamment  Massive  MIMO  et  mmWave  [72],  
Les  auteurs  ont  proposé  un  algorithme  d'apprentissage  en  ligne  pour  
[73],  [74],  [75].  Cette  efficacité  spectrale  peut  être  en  termes  d'estimation  
traiter  le  problème  de  sélection  de  faisceau  dans  les  communications  
de  canal,  d'encodage  et  de  décodage  de  signal,  de  détection  de  signal  
véhiculaires  à  ondes  millimétriques  [77],  [78].  Le  problème  est  modélisé  
pour  MIMO  massif,  de  sélection  de  faisceau  pour  mmWave,  etc.
comme  un  problème  contextuel  de  bandit  multi­armé,  dans  lequel  un  
agent  doit  sélectionner  un  sous­ensemble  d'actions  de  récompenses  
inconnues  dans  le  but  de  maximiser  la  récompense  au  fil  du  temps.  Ainsi,  
1)  REVUE  DE  LA  LITTÉRATURE  
cet  algorithme  permet  aux  stations  de  base  mmWave  d'apprendre  de  
Dans  [72],  les  auteurs  ont  discuté  des  performances  de  l'apprentissage   manière  autonome  l'apparition  de  blocages  et  les  changements  dans  les  
profond  pour  les  problèmes  suivants.  •   modèles  de  trafic  afin  de  sélectionner  le  meilleur  faisceau.  De  même,  un  
Estimation  de  canal :  l'apprentissage  en  profondeur  a  été  utilisé  pour   schéma  de  sélection  de  faisceau  basé  sur  l'apprentissage  profond  a  
les  systèmes  de  multiplexage  par  répartition  orthogonale  de  la   également  été  proposé  dans  [79].  Il  exploite  le  CSI  d'un  canal  inférieur  à  
fréquence  (OFDM)  [73],  où  la  sortie  du  modèle  d'apprentissage  en   6  GHz,  en  termes  de  profils  de  puissance­retard,  pour  choisir  le  faisceau  
profondeur  récupère  les  symboles  d'entrée  sans  nécessiter  de   mmWave  le  plus  approprié.
détection  de  canal.  Plus  précisément,  le  modèle  profond  prend  en   Pour  améliorer  la  précision  du  passage  de  message  approximatif  
entrée  à  la  fois  les  symboles  transmis  et  les  signaux  OFDM  reçus.   appris  (LAMP)  qui  est  basé  sur  l'apprentissage  en  profondeur,  un  schéma  
Le  modèle  profond  sera  ensuite  formé  pour  minimiser  la  différence   LAMP  à  mélange  gaussien  (GM­LAMP)  est  proposé  pour  estimer  le  canal  
entre  l'entrée  et  la  sortie  du  réseau. dans  [80].  Les  auteurs  dérivent  d'abord  une  fonction  de  rétrécissement  
pour  optimiser  le  schéma  AMP,  qui  remplace  ensuite  la  fonction  de  
•  Encodage  et  décodage  du  signal :  un  DNN  avec  plusieurs  couches   rétrécissement  d'origine  dans  le  schéma  LAMP.  Par  conséquent,  un  
denses  a  été  construit  pour  traiter  l'encodage  et  le  décodage  du   schéma  GM­LAMP  est  conçu  pour  estimer  le  canal  avec  précision.  Les  
signal  dans  [74].  Le  DNN  encode  les  signaux  transmis  sous  la   performances  du  schéma  proposé  sont  validées  par  simulation,  par  
forme  d'un  vecteur  à  chaud.  Les  signaux  transmis  via  le  canal  sans   rapport  au  modèle  de  canal  théorique.  De  même,  dans  [81],  l'apprentissage  
fil  sont  ajoutés  en  tant  que  couche  de  bruit  et  sont  transmis  au   en  profondeur  est  utilisé  pour  permettre  la  quantification  distribuée,  la  
récepteur  basé  sur  NN.  Enfin,  les  messages  décodés  sont  les   rétroaction,  l'estimation  de  canal  et  le  précodage  multi­utilisateurs  en  
signaux  de  sortie  les  plus  probables,  c'est­à­dire  que  k  bits   liaison  descendante  pour  le  MIMO  massif.
comprennent  2k  messages.  Les  résultats  de  la  simulation  ont   Les  auteurs  ont  proposé  une  conception  conjointe  des  pilotes  et  un  
montré  que  cette réseau  de  neurones  profonds,  pour  transformer  les  pilotes  reçus  en  rétroaction

240 VOLUME  3,  2022
Machine Translated by Google

TABLEAU  5.  La  gestion  du  spectre  fonctionne  au­dessus  de  l'O­RAN.

bits  au  niveau  de  l'UE,  tout  en  mappant  les  bits  de  rétroaction  des  UE   traitent  du  codage,  du  décodage  et  de  la  classification  du  signal.  
dans  la  matrice  de  précodage  du  côté  des  stations  de  base.  Les  résultats   DNN  code  le  signal  transmis  qui  est  ensuite  acheminé  vers  le  réseau  
expérimentaux  montrent  que  le  schéma  proposé  peut  donner  les  mêmes   neuronal  du  récepteur  (décodage).  Un  classificateur  DNN  peut  
performances  par  rapport  aux  approches  de  précodage  traditionnelles. également  être  construit  pour  classer  les  signaux  dans  le  type  de  
modulation  approprié.  Le  bloc  fonctionnel  PU(D)C(S)CH  (Physical  
Uplink  (Downlink)  Control  (Shared)  Channel)  de  la  couche  High­PHY  
2)  DISCUSSION  ET  INTÉGRATION  AVEC  O­RAN  Le   est  chargé  d'assurer  les  fonctions  d'encodage,  de  décodage  et  de  
TABLEAU  5  compare  les  travaux  précités  de  cette  classe,  qui  visent  trois   classification  du  signal,  le  O­RAN  O  ­Module  DU.
défis  principaux.
•  Channel  Estimation :  Cette  fonction  permet  de  récupérer
le  signal  transmis  côté  récepteur,  dans  les  systèmes  OFDM,  ce  qui   Nous  voyons  clairement  que  ces  travaux  ont  abordé  la  couche  physique  
est  très  important  pour  la  suppression  des  interférences.  En  fait,   en  termes  de  modules  O­DU  (High­PHY)  et  O­RU  (Low­PHY),  car  ils  
l'estimation  des  canaux  est  un  problème  difficile  dans  les   traitent  des  défis  liés  au  spectre  tels  que  l'estimation  de  canal  à  la  
communications  sans  fil  en  raison  de  la  sélectivité  en  fréquence  et   réception,  codage  et  décodage  des  signaux,  sélection  des  faisceaux,  etc.  
de  la  variance  temporelle  des  canaux.  Pour  résoudre  ce  problème,   Ces  défis  sont  directement  liés  aux  canaux  de  transmission  (de  contrôle  
DNN  est  généralement  utilisé  afin  de  minimiser  la  différence  entre   et  partagés)  dans  les  sens  montant  et  descendant.
les  signaux  envoyés  et  reçus.  La  fonction  d'estimation  de  canal  sera  
assurée  par  le  bloc  fonctionnel  PUCCH  (Physical  Uplink  Control   En  général,  pour  les  trois  classes  de  travaux,  nous  remarquons  que  les  
Channel)  du  module  O­RAN  O­DU.  •  Sélection  du  faisceau :  Avec   schémas  d'apprentissage  supervisé  et  par  renforcement  tels  que  DNN,  
l'émergence  des  communications  à  ondes  millimétriques   LSTM  et  RL  sont  largement  utilisés  pour  faire  face  aux  défis  émergents  au  
et  directionnelles,  la  fonction  de  sélection  du  faisceau  consiste  à   niveau  de  la  gestion  des  ressources  radio  et  de  la  couche  physique.  Ces  
sélectionner  le  meilleur  faisceau,  garantissant  des  alignements   algorithmes  sont  généralement  utilisés  hors  ligne,  c'est­à­dire  que  les  
précis  du  faisceau  entre  les  stations  de  base  et  les  utilisateurs. modèles  d'apprentissage  sont  générés  lors  d'une  étape  hors  ligne,  puis  
seuls  les  modèles  finaux  sont  exploités  en  temps  réel.  Cela  peut  affecter  
L'apprentissage  supervisé  ou  l'apprentissage  par  renforcement  sont   les  performances  de  ces  modèles  pour  faire  face  à  des  événements  qu'ils  
appliqués  pour  la  sélection  des  faisceaux.  L'apprentissage  par   ne  voyaient  pas  auparavant,  en  particulier  avec  les  changements  
renforcement  permet  de  mettre  à  jour  le  faisceau  en  fonction  des   dynamiques  des  réseaux  cellulaires  au  niveau  de  l'accès  radio.
commentaires  des  utilisateurs,  tandis  que  le  DNN  peut  aider  à   De  plus,  pour  assurer  le  bon  fonctionnement  de  ces  travaux  (les  trois  
prédire  le  meilleur  faisceau  en  fonction  du  contexte  environnemental,   classes),  l'interface  O1  de  l'O­RAN  est  chargée  de  surveiller  les  types  de  
comme  la  présence  d'obstacles.  Dans  le  contexte  O­RAN,  la  couche   données  ciblés  du  module  O­DU,  pour  la  formation  des  modèles  
Low­PHY  du  module  O­RU  sera  responsable  de  la  fonction  de   d'apprentissage  au  niveau  Non­RT  RIC.  Nous  notons  que  les  modèles  
sélection  de  faisceau. d'apprentissage  peuvent  être  formés  hors  ligne  ou  en  ligne  au  RIC  non  
•  Encodage,  décodage  et  classification  du  signal :  cette  fonction  permet   RT.  Ensuite,  l'inférence  de  modèle  générée  sera  communiquée  au  Near­
d'encoder  le  signal  avant  la  transmission,  de  décoder  le  signal  côté   RT  RIC  via  l'interface  A1  afin  d'être  exécutée  en  temps  réel  au  Near­RT  
récepteur  et  de  classer  automatiquement  le  signal  dans  le  type  de   RIC.  En  outre,  au  Near­RT  RIC,  les  résultats  d'inférence  peuvent  être  
modulation  correspondant.  Dans  ce  contexte,  DNN  est  utilisé  pour comparés  aux  données  réelles  (collectées  via  O1)  pour  aider  à  détecter

VOLUME  3,  2022 241
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

FIGURE  8.  Déploiement  de  l'apprentissage  profond  fédéré  dans  O­RAN.

violations  de  gestion  des  ressources  en  temps  réel,  par  exemple,  violations   Dans  le  contexte  O­RAN,  des  modèles  locaux  peuvent  être  construits  au  
de  latence  ou  de  débit.  Par  conséquent,  cela  aidera  à  prendre  des  décisions   niveau  O­RU,  où  les  données  générées  par  les  utilisateurs  d'une  cellule  (ou  
plus  adéquates,  par  exemple,  à  définir  de  nouvelles  politiques  pour  garantir   d'un  sous­ensemble  de  cellules)  sont  exploitées  localement  pour  construire  
les  exigences  RAN  nécessaires.  Enfin,  le  module  Near­RT  RIC  peut  appliquer   des  modèles  d'apprentissage  locaux,  par  exemple,  des  modèles  pour  prédire  
ces  décisions  sur  les  O­DU  via  l'interface  E2. les  ressources  radio  exigences  pour  traiter  le  problème  d'allocation  des  
ressources,  ou  la  mobilité  des  utilisateurs  pour  relever  le  défi  du  transfert  
(étape  1  de  la  Fig.  8).  Ensuite,  les  modèles  locaux  seront  transmis  au  module  
IV.  ÉTUDES  DE  CAS  SUR  LE  DÉPLOIEMENT  DE  L'APPRENTISSAGE  PROFOND   Non  RT­RIC  pour  agrégation,  via  l'interface  O1  (étape  2  sur  la  Fig.  8).
DANS  L'O­RAN L'agrégation  de  modèles  locaux  permet  de  générer  un  modèle  global  qui  est  
Dans  cette  section,  nous  donnons  deux  études  de  cas  pour  le  déploiement   envoyé  au  RT­RIC  proche  pour  être  déployé  dans  la  xApp  associée  (étape  3  
du  Deep  Learning  (DL)  dans  O­RAN.  Sur  la  base  de  la  revue  de  la  littérature,   sur  la  Fig.  8),  selon  le  défi  ciblé  (gestion  des  ressources  radio,  gestion  du  
deux  principales  catégories  d'AD  ont  été  utilisées :  l'apprentissage  profond   spectre,  gestion  de  la  mobilité). ,  etc.).  Ainsi,  les  prédictions  seront  
supervisé  et  l'apprentissage  profond  par  renforcement. effectuées  en  temps  quasi  réel  sur  la  base  des  données  surveillées  du  
niveau  O­RU  via  les  interfaces  O1.  Cependant,  lorsque  des  décisions  doivent  
A.  DÉPLOIEMENT  DE  L'APPRENTISSAGE  PROFOND   être  prises  pour  ajuster  les  paramètres  de  xApp,  par  exemple,  mettre  à  jour  

SUPERVISÉ  L'apprentissage  supervisé  a  été  utilisé  soit  de  manière   la  politique  d'allocation  des  ressources  radio  ou  celle  du  planificateur,  le  Near  
centralisée,  soit  de  manière  fédérée  (distribuée),  ce  qui  est  une  technique   RT­RIC  envoie  les  décisions  basées  sur  DL  au  module  O­RAN  correspondant  
récente  développée  par  Google.  L'apprentissage  fédéré  (FL)  vise  à  construire   (O­  DU  ou  O­CU),  via  l'interface  E2  (étape  4  de  la  Fig.  8).
des  modèles  de  manière  distribuée,  tout  en  préservant  la  confidentialité  des  
apprenants  et  en  réduisant  la  surcharge  du  réseau.  FL  convient  à  O­RAN,  
car  ce  dernier  est  également  basé  sur  une  architecture  divisée  désagrégée   En  outre,  les  données  sont  surveillées  en  continu  depuis  la  partie  O­RU  
et  distribuée  (O­DU  et  O­RU). et  stockées  dans  la  base  de  données  via  l'interface  O1.
Plutôt  que  de  partager  les  données  dans  un  nœud  central  (par  exemple,   Ainsi,  pour  construire  des  modèles  supervisés  de  manière  centralisée,  le  
les  centres  de  données  cloud  [82]),  FL  permet  à  chaque  apprenant  de   Non  RT­RIC  génère  directement  le  modèle  nécessaire  en  exploitant  les  
construire  localement  un  modèle  d'apprentissage  en  utilisant  ses  propres   données  surveillées  et  stockées  dans  la  base  de  données,  avant  de  les  
données  (d'apprenant).  Ensuite,  seuls  les  modèles  locaux  (c'est­à­dire  les   déployer  (modèles  d'apprentissage)  dans  les  xApps  de  Near  RT­RIC  
poids  des  modèles)  sont  envoyés  à  un  nœud  central  pour  agrégation.  Une   associées.
fois  les  modèles  locaux  agrégés,  un  modèle  global  est  généré  et  renvoyé  aux  apprenants.
En  fait,  FL  convient  bien  à  l'architecture  O­RAN  car  il  permet  non   B.  DÉPLOIEMENT  DE  L'APPRENTISSAGE  PROFOND  DE  RENFORCEMENT

seulement  de  préserver  la  vie  privée  des  apprenants,  en  particulier  dans  un   L'apprentissage  profond  par  renforcement  permet  de  déployer  un  agent  
système  multi­opérateurs,  mais  également  de  réduire  la  surcharge  du   intelligent  (ou  un  ensemble  d'agents)  qui  apprend  dans  un  environnement  
réseau  en  évitant  de  partager  et  de  transmettre  les  données  requises.  Dans interactif  par  essais  et  erreurs,  en  utilisant  le  retour  de  ses  propres  informations.

242 VOLUME  3,  2022
Machine Translated by Google

FIGURE  9.  Déploiement  de  l'apprentissage  en  profondeur  par  renforcement  dans  O­RAN.

gestes  et  expériences.  En  d'autres  termes,  chaque  agent  interagit  avec   avec  les  problèmes  d'allocation  et  de  planification  des  ressources  radio,  
son  environnement  et  obtient  soit  des  récompenses,  soit  des  pénalités   un  agent  intelligent  peut  prendre  une  mesure  pour  mettre  à  jour  la  politique  
pour  les  actions  qu'il  effectue.  Ainsi,  l'apprentissage  par  renforcement   d'allocation  et  de  planification  des  ressources  dans  la  couche  MAC  de  l'O­
vise  à  trouver  un  modèle  d'action  approprié  pour  les  agents,  qui   DU,  afin  de  répondre  aux  besoins  des  utilisateurs  ( étape  2  sur  la  Fig.  9).
maximiserait  leur  récompense  cumulée  totale  (des  agents).  Dans  un   Dans  ce  cas,  la  récompense  peut  être  déterminée  en  fonction  de  la  
tel  contexte,  les  systèmes  étudiés  sont  généralement  modélisés  à  l'aide   qualité  des  expériences  des  utilisateurs,  tandis  que  le  nouvel  état  du  
du  processus  décisionnel  de  Markov  (MDP)  [83],  avant  d'appliquer   système  peut  être  reflété  par  le  nombre  total  de  blocs  de  ressources  
alloués  
l'apprentissage  par  renforcement  pour  concevoir  la  politique  optimale  en  termes   et  la  densité  des  utilisateurs.  De  cette  manière,  l'apprentissage  
d'actions.
MDP  modélise  un  système  comme :  (i)  un  ensemble  d'états  s     S,  (ii)   par  renforcement  aide  à  concevoir  une  politique  optimale  d'affectation  
un  ensemble  d'actions  a     A,  (iii)  une  fonction  de  transition  P(s;  a;s ),   et  de  planification  des  ressources  tout  en  optimisant  la  qualité  des  
pour  passer  d'un  état  s  à  un  nouvel  état  s  lors  d'une  action  a,  et  (iv)  une   expériences  des  utilisateurs.
fonction  de  récompense  R(s;  a)  lors  de  l'exécution  d'une  action  a  à  un   Nous  notons  que  pour  DQN,  le  réseau  neuronal  prend  l'état  actuel  
état  s. comme  entrée  et  donne  la  valeur  Q  (récompense)  de  toutes  les  actions  
Dans  la  littérature,  les  algorithmes  Q­learning  et  Deep  Q­Network   possibles  comme  sortie.  Plus  précisément,  DQN  utilise  deux  réseaux  
(DQN)  ont  été  utilisés  pour  faire  face  aux  défis  RAN.  Le  Q­learning  est   de  neurones  pour  l'apprentissage :  un  réseau  de  prédiction  Q(s ;  a ;  θ )  
utilisé  pour  déterminer  une  politique  optimale,  maximisant  la  récompense   et  un  réseau  cible  Q  (s ;  a ;  θ ).  Le  réseau  de  prédiction  est  mis  à  jour  à  
totale  attendue  pour  tout  MDP  fini  où  les  espaces  d'état  et  d'action  sont   chaque  itération  et  utilisé  pour  évaluer  l'action  de  l'état  actuel.  Le  réseau  
petits.  Cependant,  lorsque  l'espace  d'état  et  d'action  devient  élevé,  DQN   cible  Q  (s ;  a ;  θ )  est  utilisé  pour  générer  la  valeur  cible.  Le  réseau  cible  
est  appliqué,  qui  est  basé  sur  un  réseau  de  neurones. est  directement  copié  à  partir  du  réseau  de  prédiction  toutes  les  plusieurs  
itérations  (étape  4  sur  la  figure  9).
Les  agents  intelligents  sont  déployés  au  niveau  du  module  RT­RIC   Ainsi,  DQN  vise  à  minimiser  l'erreur  quadratique  moyenne  (fonction  de  
proche  de  l'O­RAN,  afin  d'améliorer  les  performances  d'exécution  des   perte)  entre  les  sorties  des  deux  réseaux  de  neurones,  comme  suit :
xApps  (étape  1  sur  la  Fig.  9).  Ces  agents  interagiront  avec  l'environnement  
externe,  composé  de  O­RU,  O­DU  et  O­CU.  En  tant  que  système  MDP,  
ces  agents  prendront  périodiquement  des  mesures  pour  optimiser  les  
L  =  r  +  λmax Q  (s , un , )  −  Q(s, a,i)2  (1)
performances  du  RAN,  via  l'interface  E2  (étape  2  sur  la  Fig.  9).  Ensuite,   un   A

via  l'interface  O1,  les  agents  recevront  la  récompense  obtenue  et  le  
nouvel  état  du  système  (étape  3  sur  la  Fig.  9).  Par  exemple,  pour  traiter où  θ  représente  les  poids  d'apprentissage  du  réseau  Q,  qui  est  mis  à  
jour  par  rétropropagation  de  gradient  [84].  r

VOLUME  3,  2022 243
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

FIGURE  10.  Processus  ML  manuel  dans  O­RAN.

est  la  récompense  reçue.  λ  est  le  facteur  d'actualisation  qui  indique   former  de  nouveaux  modèles  ou  mettre  à  jour  des  modèles  existants,  compte  tenu  de  nouveaux  

l'importance  des  récompenses  futures. profils  de  données.

Il  est  à  noter  que  ce  déploiement  d'automatisation  ne  concerne  que  
les  modèles  d'apprentissage  supervisé  qui  sont  habituellement  construits  
V.  AUTOMATISATION  DE  TOUTES  LES  ÉTAPES  DE  LA  
au  niveau  du  module  O­RAN  Non  RT­RIC  et  déployés  au  niveau  du  
CONSTRUCTION  D'UN  SYSTÈME  D'APPRENTISSAGE  
module  Near  RT­RIC.  Dans  ce  qui  suit,  nous  décrivons  deux  niveaux  de  
MACHINE  DANS  O­  RAN .  Cependant,  le  véritable  défi,  dans  un  tel   MLOps,  le  niveau  le  plus  basique  (pas  d'automatisation)  et  l'automatisation  
contexte,  est  de  savoir  comment  construire  des  modèles  ML  qui   de  tous  les  niveaux  de  processus  ML.
garantissent  des  performances  stables  tout  au  long  de  leur  cycle  de  vie.  
En  effet,  les  performances  des  modèles  ML  peuvent  être  dégradées  en   A.  PROCESSUS  MLOPS  MANUEL  DANS  O­RAN  (NIVEAU  1)
raison  principalement  des  profils  de  données  en  constante  évolution  
C'est  le  niveau  de  maturité  de  base,  où  l'ensemble  du  processus  de  ML  
[85],  une  telle  dégradation  doit  donc  être  prise  en  compte  pour  assurer  
en  termes  de  création  et  de  déploiement  de  modèles  d'apprentissage  
le  bon  fonctionnement  des  applications  RAN.  Par  conséquent,  il  y  a  un  
est  manuel.  La  figure  10  montre  les  principales  étapes  de  ce  processus  
grand  besoin  non  seulement  de  surveiller  en  continu  à  la  fois  les  profils  
qui  sont  exécutées  au  niveau  du  module  non  RT­RIC  de  l'O­RAN.  
de  données  et  les  performances  en  ligne  des  modèles  déployés,  mais  
Chaque  étape  est  exécutée  manuellement,  y  compris  la  préparation  des  
également  d'automatiser  toutes  les  étapes  de  la  construction  du  système  
données,  la  formation  du  modèle  et  la  validation.  Ce  niveau  est  basé  sur  
d'apprentissage  en  profondeur,  y  compris  la  préparation  des  données,  la  
une  transition  manuelle  d'une  étape  à  l'autre,  et  piloté  par  le  code  source  
formation  des  modèles,  l'évaluation  et  la  validation  [86].
qui  est  réalisé  de  manière  interactive,  jusqu'à  ce  qu'un  modèle  exécutable  
soit  construit  et  déployé  au  niveau  du  module  Near  RT­RIC,  via  l'interface  
A1.
Cette  section  explique  comment  appliquer  les  principes  DevOps1  aux  
En  pratique,  le  processus  manuel  correspond  aux  modèles  ML  qui  
systèmes  ML  (MLOps)  afin  d'unifier  le  développement  du  système  ML  
sont  rarement  mis  à  jour,  ce  qui  n'est  pas  le  cas  avec  les  changements  
(Dev)  et  l'exploitation  du  système  ML  (Ops)  [86].  En  fait,  le  niveau  
dynamiques  du  RAN  sans  fil.  En  particulier,  les  performances  des  
d'automatisation  des  étapes  de  ML  reflète  la  vitesse  de
modèles  ML  du  RAN  peuvent  se  dégrader  en  raison  soit  de  changements  
dans  la  dynamique  de  l'environnement  d'accès  radio,  soit  de  
1.  Il  s'agit  d'une  pratique  courante  dans  la  conception,  le  développement  et  l'exploitation  
changements  dans  les  profils  de  données  décrivant  l'environnement.
de  systèmes  logiciels.  Il  repose  principalement  sur  deux  concepts  d'intégration  continue  (CI)  
et  de  livraison  continue  (CD),  pour  apporter  des  avantages  tels  que  la  réduction  des  cycles   Ainsi,  l'introduction  de  l'automatisation  dans  le  processus  du  système  
de  développement,  l'augmentation  de  la  vitesse  de  déploiement,  etc. ML  pour  la  partie  RAN  est  plus  que  nécessaire.

244 VOLUME  3,  2022
Machine Translated by Google

FIGURE  11.  Automatisation  du  processus  ML  dans  O­RAN.

B.  PROCESSUS  MLOPS  D'AUTOMATISATION  DANS  O­RAN  (NIVEAU  2) un  ou  plusieurs  déclencheurs  de  pipeline  ML.  Le  pipeline  attend  des  
Ce  niveau  vise  à  automatiser  le  processus  du  système  ML,  en  effectuant   données  fraîches  et  nouvelles  pour  construire  de  nouveaux  
une  surveillance  continue  des  performances  des  modèles  et  de  la  formation   modèles.  Par  conséquent,  une  phase  de  validation  automatisée  des  
des  modèles ;  cela  assurera  alors  une  fourniture  continue  de  service  de   données  et  des  modèles  est  nécessaire.  D'une  part,  la  validation  des  
prédiction  de  modèle.  Nous  notons  que  le  module  Non  RT­RIC  peut   données  est  nécessaire  pour  décider  si  l'exécution  du  pipeline  doit  
surveiller  les  performances  des  modèles  ML  déployés  à  partir  du  Near  RT­ être  interrompue  ou  si  les  modèles  doivent  être  recyclés.  Dans  ce  
RIC  via  l'interface  A1,  afin  de  permettre  une  telle  automatisation  du   contexte,  les  modèles  doivent  être  ré­entraînés  pour  deux  raisons  
processus  ML. principales :  (i)  biais  du  schéma  de  données,  lorsque  le  pipeline  
Pour  automatiser  le  processus  de  prise  en  compte  de  nouvelles   reçoit  des  données  qui  ne  correspondent  pas  à  celles  attendues,  
données  pour  mettre  à  jour  les  modèles  déployés,  des  phases  automatisées   comme  la  réception  de  nouvelles  fonctionnalités,  toutes  les  
de  validation  de  nouvelles  données  et  de  modèles,  ainsi  que  des   fonctionnalités  attendues  ne  sont  pas  reçu,  ou  recevoir  des  valeurs  inattendues  d
déclencheurs  de  processus  et  la  gestion  des  métadonnées  sont  introduits   Par  conséquent,  le  pipeline  ML  doit  être  arrêté  et  l'équipe  de  
dans  le  processus  ML.  La  figure  11  illustre  le  processus  ML  automatisé.   développeurs  doit  le  mettre  à  jour  pour  résoudre  ces  problèmes.  (ii)  
Les  principales  caractéristiques  et  éléments   biais  dans  les  valeurs  des  données,  lorsque  les  propriétés  
de  ce  niveau  sont  décrits  comme  suit.  •  Formation  continue  (CT)  des   statistiques  des  données  et  leurs  modèles  sont  modifiés.  Dans  ce  
modèles :  les  modèles  sont  automatiquement  formés  en  exploitant   cas,  les  modèles  doivent  être  recyclés  pour  tenir  compte  de  ces  
les  nouvelles  données  et   changements.  D'autre  part,  une  fois  les  nouveaux  modèles  formés,  
en  fonction  des  déclencheurs  du  pipeline  ML.  •  Livraison  continue  (CD)   l'étape  de  validation  intervient  pour  les  évaluer  et  les  valider  avant  
de  modèles :  le  pipeline  ML  produit  en  continu  des  services  de   de  les  déployer.  •  Gestion  des  métadonnées :  Pour  
prédiction  de  nouveaux  modèles  entraînés  basés  sur  de  nouvelles   aider  au  débogage  des  erreurs  et  des  anomalies.  Les  métadonnées  
données.  L'étape  de   enregistrent  des  informations  sur  chaque  exécution  de  pipeline  ML,  
déploiement  du  modèle  est  automatisée.  •  Déploiement  du  pipeline :  au   y  compris  les  arguments  de  paramètre  du  pipeline  et  de  son  
niveau  manuel,  seul  un  modèle  formé  est  déployé  pour  fournir  un   exécuteur,  l'horodatage  de  l'exécution  du  pipeline  en  termes  de  date  
service  de  prédiction.  Pour  le  niveau  automatisé,  un  pipeline  de   de  début  et  de  fin  de  chaque  étape  exécutée,  des  pointeurs  vers  les  
formation  complet  est  déployé,  qui  s'exécute  automatiquement  pour   sorties  de  chaque  étape  du  pipeline  ainsi  quant  aux  modèles  
fournir  un  service  de  prédiction   précédemment  construits,  si  le  retour  aux  modèles  précédents  sera  
via  un  modèle  formé.  • Validation  des  données  et  des  modèles :  lorsque   nécessaire,  etc.
le  pipeline  ML  est  déployé,  il  commence  à  s'exécuter  automatiquement,  en  fonction  de

VOLUME  3,  2022 245
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

•  Déclencheurs  de  pipeline  ML :  l'exécution  du  pipeline  ML  peut  être   Violations  des  SLA.  De  plus,  pour  assurer  l'isolation  des  tranches  de  réseau,  
automatisée  pour  mettre  à  jour  (réentraîner)  les  modèles  en  fonction   une  partition  sécurisée  des  bases  de  données  Non­RT  RIC  et  Near­RT  RIC  
de  plusieurs  cas  d'utilisation :  (i)  À  la  demande,  lorsque  le  pipeline   doit  être  dédiée  à  chaque  tranche  de  réseau.  Cela  permet  de  construire  soit  
est  exécuté  de  manière  manuelle  et  ad  hoc.  (ii)  De  manière   des  modèles  AI/DL  propres  à  chaque  tranche  de  réseau,  soit  un  modèle  
programmée,  lorsque  le  pipeline  est  alimenté  par  de  nouvelles   global  agrégeant  des  modèles  de  tranches  de  réseau,  en  utilisant,  par  
données,  qui  sont  systématiquement  disponibles.  (iii)  Disponibilité   exemple,  l'apprentissage  fédéré  distribué  [90].
de  nouvelles  données,  lorsque  de  nouvelles  données  sont   Dans  ce  contexte,  un  groupe  de  travail  sur  la  tâche  de  découpage  a  
disponibles  de  manière  ad  hoc.  (iv)  Sur  la  dégradation  des   commencé  à  examiner  ces  préoccupations,  et  donc  à  soutenir  les  NS  dans  
l'architecture  O­RAN  [6].
performances  des  modèles.  Et  (v)  les  distributions  de  données  changent.

VI.  PROBLÈMES  OUVERTS  ET  ORIENTATIONS  DE   C.  PROBLÈMES  D'INTÉGRATION  SON  ET  MEC  Les  
RECHERCHE  
fonctions  de  réseau  auto­organisé  (SON)  consistent  en  un  ensemble  de  
FUTURES  Le  développement  de  l'architecture  O­RAN  en  est  encore  à  ses   fonctions  qui  visent  à  fournir  une  auto­optimisation  de  la  gestion  RAN  [91].  
débuts.  Malgré  les  diverses  nouvelles  fonctionnalités  qu'elle  offre,  de   Ces  fonctions  concernent  principalement  le  contrôle  de  la  capacité  et  de  la  
nombreux  défis  critiques  sont  à  relever  et  à  considérer  avant  de  déployer   couverture  du  réseau,  la  QoS,  les  interférences  et  la  consommation  d'énergie.  
une  telle  architecture.  Dans  ce  qui  suit,  nous  discutons  de  certains  de  ces   SON  a  été  déployé  dans  les  réseaux  4G  [91].  Ainsi,  il  est  également  essentiel  
défis  en  plus  des  orientations  de  recherche  futures. de  prendre  en  compte  les  fonctions  SON  dans  l'architecture  O­RAN  et  de  les  
déployer  dans  les  réseaux  5G.  En  fait,  les  fonctions  SON  sont  basées  sur  
des  boucles  de  rétroaction  périodiques.  Par  conséquent,  ces  fonctions  
A.  PROBLÈMES  DE  SÉCURITÉ  LIÉS  AU  DÉPLOIEMENT  O­
peuvent  être  déployées  à  la  fois  sur  le  RIC  non  RT  d'O­RAN  pour  créer  des  
RAN  Désagréger  les  principales  fonctions  du  RAN  et  les  mettre  en  œuvre   modèles  AI/DL  et  sur  le  RIC  proche  RT,  pour  surveiller  le  RAN  et  permettre  
dans  un  logiciel  augmente  le  risque  de  surface  d'attaque  et  de  menace  du   l'automatisation  de  sa  gestion.  De  plus,  le  RIC  non  RT  peut  également  
réseau.  Ericsson  vient  de  fournir  une  étude  approfondie  sur  les  principaux   orchestrer  les  services  SON.
problèmes  de  sécurité  de  l'architecture  O­RAN,  y  compris  l'augmentation  de  
la  surface  des  menaces  via  les  nouvelles  interfaces ;  par  exemple,  A1,  open   Même  la  norme  3GPP  ne  conçoit  aucune  architecture  détaillée  de  SON ;  
front­haul,  E2,  etc.,  menaces  nouvellement  introduites  au  niveau  du  RIC   cependant,  des  travaux  sont  en  cours  sur  le  5G  SON  pour  gérer  la  gestion  
Near­RT,  une  menace  pour  Trust  Chain  lors  du  découplage  du  matériel  [87].   du  réseau  5G  de  bout  en  bout  [92].
Ces  menaces  peuvent  affecter  directement  les  performances  des  blocs  
fonctionnels  basés  sur  l'apprentissage  en  profondeur.  Par  exemple,  cette   D'autre  part,  ETSI  Multi­access  Edge  Computing  (MEC)  consiste  à  
architecture  divisée  ouvre  le  risque  d'attaques  Man­in­the­Middle  sur   déployer  des  capacités  de  calcul  et  de  stockage  à  proximité  des  UE,  et  ainsi  
l'interface  frontale  ouverte.  Ainsi,  un  adversaire  peut  manipuler  le  trafic  de   réduire  la  latence  du  réseau  [93].  Pour  ce  faire,  il  (MEC)  exploite  
gestion  et  de  contrôle  échangé  entre  les  modules  O  RU  et  O­DU.  Cela  peut   principalement  les  informations  contextuelles  RAN  pour  permettre  des  
affecter  la  précision  des  modèles  d'apprentissage  puisqu'ils  sont  construits   applications  sensibles  au  temps  et  de  redirection  du  trafic,  fournir  des  API  
sur  la  base  de  ce  trafic.  Par  conséquent,  des  mesures  de  sécurité  doivent   orientées  services  telles  que  les  conditions  radio  et  les  contextes  de  
être  mises  en  œuvre  pour  faire  face  aux  risques  de  menace  liés  au   localisation  des  utilisateurs,  etc.  Par  conséquent,  il  existe  un  grand  besoin  
déploiement  de  l'O­RAN. de  MEC  efficace.  et  l'intégration  O­RAN  afin  de  permettre  la  gestion  liée  au  
MEC.  Il  convient  de  noter  que  MEC  a  été  défini  pour  les  réseaux  4G ;  
Dans  ce  contexte,  un  groupe  de  travail  sur  la  sécurité  O­RAN  a  commencé   cependant,  son  intégration  avec  le  réseau  5G  est  toujours  en  cours.
à  traiter  ces  problèmes  de  sécurité  afin  de  s'assurer  que  le  déploiement  O­
RAN  répondra  au  niveau  de  sécurité  attendu  par  l'industrie  [88].  De  plus,  des   En  fait,  étant  donné  que  MEC  vise  à  fournir  un  réseau  à  faible  latence,  les  
solutions  récentes  ont  commencé  à  tirer  parti  de  la  technologie  Blockchain,   hôtes  MEC  peuvent  agir  au  niveau  du  RIC  proche  de  la  RT  de  l'O­RAN.  De  
afin  de  sécuriser  et  de  gérer  l'authentification  et  l'accès  au  réseau  entre  des   plus,  les  bases  de  données  O­RAN  peuvent  intégrer  le  stockage  des  bases  
entités  de  réseau  sans  confiance  [89].  Cela  représente  une  solution   de  données  MEC,  le  service  d'information  sur  le  réseau  radio  (RNIS),  les  
prometteuse  pour  l'architecture  O­RAN,  notamment  avec  ses  fonctions   performances  des  cellules,  les  emplacements  des  utilisateurs,  etc.  [94].  De  
désagrégées  et  sa  gestion  décentralisée. plus,  le  Non­RT  RIC  (orchestrateur  O­RAN)  peut  également  orchestrer  les  
applications  de  périphérie  mobile.

B.  PROBLÈMES  D'INTÉGRATION  DE  DÉCOUPAGE  DE  RÉSEAU   D.  PROBLÈMES  D'APPRENTISSAGE  DISTRIBUÉ  EN  LIGNE  ET  
L'architecture  O­RAN  devrait  prendre  en  charge  le  découpage  de  réseau   PRÉSERVANT  LA  VIE  PRIVÉE  
(NS),  ce  qui  permettra  la  création  de  plusieurs  tranches  de  réseau  adaptées   En  fait,  l'architecture  O­RAN  est  adoptée  pour  créer  des  modèles  DL  hors  
pour  répondre  à  diverses  exigences.  Ainsi,  l'intégration  de  NS  peut  avoir  un   ligne  dans  le  RIC  non  RT  avant  de  les  déployer  sur  le  RIC  Near­RT.  
impact  sur  O­RAN  de  différentes  manières.  L'orchestrateur  O­RAN  (SMO)   Cependant,  plusieurs  défis  liés  au  RAN,  tels  que  l'allocation  et  la  planification  
doit  être  configuré  pour  prendre  en  compte  le  modèle  de  tranche  de  réseau.   des  ressources  radio,  nécessitent  de  générer  des  modèles  DL  en  ligne  et  en  
Ensuite,  les  prédictions  effectuées  par  les  modèles  AI/DL,  au  RIC  proche  de   temps  réel,  en  utilisant,  par  exemple,  l'apprentissage  en  profondeur  par  
la  RT,  doivent  être  comparées  aux  exigences  des  tranches  afin  d'anticiper  les renforcement.  Cela  permet  de  les  adapter  (modèles  d'apprentissage)  en  
fonction  des  changements  dynamiques  de  la  radio

246 VOLUME  3,  2022
Machine Translated by Google

et  des  informations  contextuelles,  y  compris  la  mobilité  et  l'énergie  des   réduire  le  coût  du  réseau.  L'auteur  a  également  mentionné  plusieurs  cas  
utilisateurs,  le  débit  et  la  latence  nécessaires,  etc.  Dans  un  tel  contexte,  les   d'utilisation  du  partage  RAN,  y  compris  le  partage  MEC,  le  partage  d'énergie,  
modèles  DL  en  ligne  doivent  être  intégrés  dans  le  Near­RT  RIC  en  tant  que   le  partage  du  spectre  et  du  fronthaul,  etc.  Par  conséquent,  ces  techniques  
xApp,  pour  être  en  charge  de  la  construction  et  de  la  mise  à  jour  des   de  partage  de  réseau  peuvent  être  exploitées  dans  le  contexte  O­RAN,  afin  
modèles  temps  réel.  Cette  intégration  est  déjà  visible  pour  les  acteurs  de   non  seulement  d'assurer  un  fonctionnement  efficace.  fractionnement,  mais  
l'alliance  O­RAN,  mais  elle  doit  être  renforcée. aussi  pour  permettre  une  efficacité  énergétique  de  la  partie  RAN.
Par  ailleurs,  la  désagrégation  des  fonctions  RAN,  leur  mise  en  œuvre  
dans  le  logiciel  et  l'architecture  distribuée  divisée  (O­DU,  O­RU)  ont  motivé  
VII.  CONCLUSION
l'utilisation  de  modèles  distribués  d'apprentissage  en  profondeur,  tels  que  
Cet  article  passe  en  revue  les  travaux  basés  sur  l'apprentissage  profond  
Federated  Learning  (FL)  [16],  [90 ].
proposés  pour  améliorer  la  partie  5G  RAN  et  comment  elle  peut  être  intégrée  
Comme  mentionné  précédemment,  FL  préserve  la  confidentialité  des  
à  l'architecture  O­RAN  activée  par  l'IA.  O­RAN  Alliance  vise  à  transformer  le  
apprenants  en  ne  partageant  que  leurs  modèles  locaux  plutôt  que  leurs  
RAN  en  un  système  intelligent,  ouvert  et  interopérable,  en  désagrégeant  les  
données  confidentielles.  Cette  technique  d'apprentissage  correspond  
largement  à  l'architecture  O­RAN,  par  exemple,  pour  assurer  l'isolation  des   fonctions  RAN  traditionnelles,  en  fournissant  leur  implémentation  logicielle  et  
en  les  connectant  à  l'aide  d'interfaces  standardisées  et  ouvertes.
tranches  en  cours  d'exécution  au­dessus  de  l'O­RAN.

E.  PRÉOCCUPATIONS  DE  CONVERGENCE  ET  D'ÉVOLUTIVITÉ  DES   Nous  avons  d'abord  fourni  une  introduction  générale  sur  l'évolution  des  
TECHNIQUES  D'APPRENTISSAGE   architectures  RAN  vers  la  5G,  y  compris  l'architecture  RAN  ouverte  et  ses  
composants.  Nous  les  avons  également  comparés  en  fonction  de  diverses  
Comme  mentionné  précédemment,  l'architecture  distribuée  fractionnée  (O­
perspectives,  telles  que  la  prise  en  charge  de  la  périphérie,  la  virtualisation,  
DU  et  O­RU)  de  l'O­RAN  nécessite  l'utilisation  de  techniques  d'apprentissage  
le  contrôle  et  la  gestion,  la  consommation  d'énergie  et  la  prise  en  charge  de  
distribuées  et  multi­agents.  Cependant,  la  convergence  de  telles  techniques  
l'IA.  Ensuite,  nous  avons  examiné  les  travaux  RAN  existants  basés  sur  
est  un  problème  difficile,  où  ces  techniques  doivent  converger  efficacement  
l'apprentissage  en  profondeur,  en  plus  de  la  manière  dont  ils  peuvent  être  
et  rapidement  pour  éviter  toute  situation  d'instabilité  [95].  Dans  un  tel  contexte,  
intégrés  dans  l'architecture  O­RAN  émergente.  De  plus,  nous  avons  montré  
des  techniques  de  démarrage  rapide  peuvent  être  utilisées,  ce  qui  permet  
deux  études  de  cas  sur  le  déploiement  de  l'apprentissage  en  profondeur  
d'accélérer  la  convergence  des  schémas  d'apprentissage  [96].  De  plus,  
dans  O­RAN,  ainsi  que  la  façon  dont  les  principales  étapes  du  processus  
comme  le  nombre  d'entités  O­RAN  (O­DU  et  O­RU)  a  tendance  à  augmenter  
d'apprentissage  en  profondeur  peuvent  être  automatisées,  pour  garantir  des  
et  que  presque  toutes  les  fonctions  RAN  deviennent  intelligentes  sur  la  base  
performances  acceptables  par  les  modèles  d'apprentissage  déployés.  Enfin,  
de  modèles  ML/DL,  l'évolutivité  des  schémas  d'apprentissage  et  de  
nous  avons  discuté  des  principaux  défis  ouverts  et  des  orientations  de  
l'architecture  O­RAN  doit  être  abordée  sur  une  base  spécifique.
recherche  futures  sur  l'architecture  O­RAN  et  l'utilisation  de  techniques  
d'apprentissage  en  profondeur  dans  une  telle  architecture.
En  tant  que  travaux  futurs,  nous  travaillons  au  déploiement  d'algorithmes  

F.  PRÉOCCUPATIONS  ÉNERGÉTIQUES  AVEC  LA  DIVISION  DES   d'apprentissage  en  profondeur  dans  O­RAN  en  tant  que  preuve  de  concept,  
en  utilisant  à  la  fois  la  plate­forme  Open  Air  Interface  et  le  logiciel  open  
source  O­RAN,  Amber.
FONCTIONS  DE  L'O­RAN  Avec  l'impulsion  croissante  de  l'architecture  O­
RAN,  assurer  une  division  efficace  des  fonctions  dans  l'O­RAN,  tout  en   LES  RÉFÉRENCES
réduisant  la  consommation  d'énergie  du  matériel  et  des  logiciels  RAN  devient   [1]  W.  Saad,  M.  Bennis  et  M.  Chen,  «  Une  vision  des  systèmes  sans  fil  6G :  
très  important.  En  effet,  l'efficacité  énergétique  joue  un  rôle  essentiel  dans  le   applications,  tendances,  technologies  et  problèmes  de  recherche  ouverts  »,  
processus  décisionnel  des  réseaux  cellulaires,  en  raison  de  l'augmentation   IEEE  Netw.,  vol.  34,  non.  3,  pp.  134–142,  mai/juin.  2020.
[2]  F.  Tariq,  MRA  Khandaker,  K.­K.  Wong,  MA  Imran,  M.  Bennis  et  M.  Debbah,  «  
considérable  de  leur  coût  et  de  leur  empreinte  carbone  causée  par  la  forte  
Une  étude  spéculative  sur  la  6G  »,  IEEE  Wireless  Commun.,  vol.  27,  non.  
demande  de  données  et  la  densification  des  réseaux.  Dans  un  tel  contexte,   4,  p.  118–125,  août  2020.
tirer  parti  des  sources  d'énergie  renouvelables  au  niveau  du  RAN  est  une   [3]  MA  Habibi,  M.  Nasimi,  B.  Han  et  HD  Schotten,  «  Une  étude  complète  des  
architectures  RAN  vers  le  système  de  communication  mobile  5G  »,  IEEE  
approche  prometteuse  pour  optimiser  la  consommation  d'énergie  du  matériel   Access,  vol.  7,  pages  70371–70421,  2019.
et  des  logiciels  du  RAN. [4]  A.  Ksentini  et  N.  Nikaein,  "Vers  l'application  du  découpage  réseau  sur  RAN :  
Cependant,  les  gestionnaires  de  réseaux  doivent  optimiser  l'utilisation  de   flexibilité  et  abstraction  des  ressources",  IEEE  Commun.  Mag.,  vol.  55,  non.  
6,  p.  102–108,  juin  2017.
l'énergie  puisqu'ils  doivent  stocker  cette  énergie  dans  des  batteries  limitées   [5]  A.  Marotta,  D.  Cassioli,  K.  Kondepu,  C.  Antonelli  et  L.  Valcarenghi,  «  
en  capacité.  De  plus,  les  énergies  renouvelables  sont  intermittentes  et   Exploitation  de  la  répartition  fonctionnelle  flexible  dans  les  réseaux  d'accès  
définis  par  logiciel  convergés  »,  IEEE/OSA  J.  Opt.  Commun.  Netw.,  vol.  11,  
l'approvisionnement  n'est  pas  toujours  garanti  [97].  Par  conséquent,  sous  
non.  11,  p.  536–546,  novembre  2019.
l'instabilité  des  énergies  renouvelables  et  la  nature  dynamique  des  réseaux   [6]  « O­RAN :  vers  un  RAN  ouvert  et  intelligent »,  O­RAN  Alliance,  Alfter,  
sans  fil,  un  fractionnement  fonctionnel  efficace  dans  l'O­RAN  vert  devient  un   Allemagne,  Rép.,  octobre  2018.
[7]  S.  Abeta,  T.  Kawahara,  A.  Umesh  et  R.  Matsukawa,  «  Tendances  de  
besoin  critique  qui  peut  être  traité  par  des  schémas  d'apprentissage  
normalisation  de  l'Alliance  O­RAN  »,  NTT  DOCOMO  Technol.  J.,  vol.  21,  p.  
automatique/profond,  en  particulier  des  techniques  d'apprentissage  par   38–45,  juil.  2019.
renforcement  [20]. .  Par  ailleurs,  les  techniques  de  partage  de  réseau   [8]  « Alliance  O­RAN,  communauté  logicielle  O­RAN ».  Avr.  2019.
représentent  également  des  candidats  idéaux  pour  assurer  l'efficacité   [En  ligne].  Disponible :  https://O­RAN­sc.org/  
[9]  « Architecture  et  interfaces  RAN  de  nouvelle  génération  définies  par  
énergétique  de  l'O­RAN.  Dans  [98],  l'auteur  a  discuté  de  l'adoption  de  telles   l'opérateur ».  [En  ligne].  Disponible :  https://www.O­RAN.org/  (consulté  le  12  
techniques  pour  les  réseaux  5G,  pour février  2020).

VOLUME  3,  2022 247
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

[10]  RT  Rodoshi  et  W.  Choi,  "Une  enquête  sur  les  applications  de  l'apprentissage  en   [33]  "C­RAN  la  route  vers  le  papier  blanc  RAN  vert,"  China  Mobile  Res.  Inst.,  China  Mobile,  
profondeur  dans  le  réseau  d'accès  radio  cloud",  IEEE  Access,  vol.  9,  p.  61972–61997,   Pékin,  Chine,  Rep.  MSU­CSE­06­2,  oct.  2011.
2021.
[11]  W.  Ejaz,  SK  Sharma,  S.  Saadat,  M.  Naeem,  A.  Anpalagan  et  NA  Chughtai,  "Une  enquête   [34]  X.  Wang  et  al.,  "Réseau  d'accès  radio  cloud  virtualisé  pour  le  transport  5G",  IEEE  
complète  sur  l'allocation  des  ressources  pour  le  CRAN  dans  les  réseaux  5G  et  au­ Commun.  Mag.,  vol.  55,  non.  9,  p.  202–209,  septembre  2017.
delà",  J.  Netw .  Calcul.  Appl.,  vol.  160,  juin  2020,  art.  Non.  102638.
[35]  «  Transport  network  support  of  IMT­2020/5G  »,  UIT,  Genève,
[12]  AS  Abdalla,  PS  Upadhyaya,  VK  Shah  et  V.  Marojevic,  «  Toward  next  generation  open   Suisse,  Rép.  GSTR­TN5G,  2018.
radio  access  network­what  O­RAN  can  and  not  do !  2021,  arXiv:2111.13754. [36]  «  Spécification  technique  groupe  réseau  d'accès  radio ;  étude  sur  les  nouvelles  
technologies  d'accès  radio :  architecture  et  interfaces  d'accès  radio  »,
[13]  S.  Niknam  et  al.,  "Intelligent  O­RAN  pour  au­delà  de  la  5G  et  de  la  6G  sans  fil 3GPP,  Sophia  Antipolis,  France,  3GPP  Rep.  TR  38.801,  2017.  [37]  «  Série  
réseaux  »,  2020,  arXiv:2005.08374. 475  (ng­RAN ;  interface  F1),  3GPP  Release  15  »,  3GPP,  Sophia  Antipolis,  France,  3GPP  
[14]  A.  Garcia­Saavedra  et  X.  Costa­Pérez,  «  O­RAN :  Perturbation  de  l'écosystème  RAN   Rep.  TS  38.470,  2017.
virtualisé  »,  IEEE  Commun.  Rester.  Mag.,  vol.  5,  non.  4,  p.  96–103,  décembre  2021. [38]  "O­RAN  Slicing  Architecture  5.0—juillet  2021  (O­RAN.WG1.
Tranchage­Architecture­v05.00). » [En  ligne].  Disponible :  https://www.O  RAN.org/
[15]  H.  Kumar,  V.  Sapru  et  SK  Jaisawal,  "Optimisation  ANR  proactive  basée  sur  O­RAN",   specifications  (consulté  le  29  décembre  2021).
dans  Proc.  Ateliers  IEEE  Globecom  (GC  Wkshps,  Taipei,  Taïwan,  2020,  pp.  1–4.
[39]  "O­RAN  Slicing  Architecture  4.0—Mars  2021  (O­RAN.WG1.
Tranchage­Architecture­v04.00). » [En  ligne].  Disponible :  https://www.O  RAN.org/
[16]  PEI  Rivera,  S.  Mollahasani  et  M.  Erol­Kantarci,  "Apprentissage  en  équipe  multi­agents   specifications  (consulté  le  30  décembre  2021).
dans  les  réseaux  d'accès  radio  ouverts  virtualisés  désagrégés  (O­RAN)",  2021,  arXiv:  
[40]  B.  Brik  et  A.  Ksentini,  "Vers  un  dimensionnement  optimal  des  ressources  MEC  pour  un  
2012.04861 .
système  anticollision  de  véhicule :  une  approche  d'apprentissage  en  profondeur",
[17]  SK  Singh,  R.  Singh  et  B.  Kumbhani,  "L'évolution  du  réseau  d'accès  radio  vers  le  RAN   IEEE  Netw.,  vol.  35,  non.  3,  pp.  74–80,  mai/juin.  2021.
ouvert :  défis  et  opportunités",  dans  Proc.  Communication  sans  fil  IEEE.  Réseau  Conf.  
[41]  A.  Ksentini  et  B.  Brik,  « Un  service  de  détection  de  la  distance  sociale  basé  sur  la  
Workshops  (WCNCW),  Séoul,  Corée  du  Sud,  2020,  pp.  1–6.
périphérie  pour  atténuer  la  propagation  du  COVID­19 »,  IEEE  Internet  Things  Mag.,  
vol.  3,  non.  3,  p.  35–39,  septembre  2020.
[18]  W.  Diego,  «  Evolution  vers  le  réseau  d'accès  radio  de  nouvelle  génération  »,  dans  Proc.  
[42]  A.  Checko  et  al.,  "Cloud  RAN  pour  les  réseaux  mobiles  ­  Un  aperçu  de  la  technologie",  
Réseau  IFIP  Conf.  (Mise  en  réseau),  Paris,  France,  2020,  pp.  685–685.
IEEE  Commun.  Enquêtes  Tuts.,  vol.  17,  non.  1,  pp.  405–426,  1er  quart.,  2015.

[19]  C.­L.  I,  S.  Kuklinskí  et  T.  Chen,  "Une  perspective  d'intégration  O­RAN  avec  MEC,  SON  
[43]  "C­RAN  la  route  vers  le  RAN  vert,"  China  Mobile  Res.  Inst.,  China  Mobile,  Pékin,  Chine,  
et  le  découpage  du  réseau  à  l'ère  5G",  IEEE  Network,  vol.  34,  non.  6,  p.  3–4,  nov./déc.  
Rép.,  octobre  2011.
2020,  doi :  10.1109/MNET.2020.9277891.
[44]  J.  Lorincz,  T.  Garma  et  G.  Petrovic,  "Mesures  et  modélisation  de  la  consommation  
d'énergie  des  stations  de  base  sous  des  charges  de  trafic  réelles",  Sensors,  vol.  12,  
[20]  T.  Pamuklu,  M.  Erol­Kantarci  et  C.  Ersoy,  «  Fractionnement  des  fonctions  dynamiques  
non.  4,  pages  4281–4310,  2012.
basé  sur  l'apprentissage  par  renforcement  dans  les  RAN  ouverts  verts  désagrégés  »,  
2021,  arXiv:  2012.03213. [45]  N.  Carapellese,  A.  Pizzinat,  M.  Tornatore,  P.  Chanclou  et  S.  Gosselin,  «  Une  comparaison  
de  la  consommation  d'énergie  de  différentes  architectures  d'accès  optique  mobile  
[21]  K.  Boutiba,  A.  Ksentini,  B.  Brik,  Y.  Challal  et  A.  Balla,  «  NRflex :  Enforcing  network  slicing  
backhaul  et  fronthaul  »,  dans  Proc .  EUR.
in  5G  new  radio  »,  Comput.  Commun.,  vol.  181,  p.  284–292,  janvier  2022.
Conf.  Opt.  Commun.  (ECOC),  Cannes,  France,  2014,  pp.  1–3.  
[46]  U.  Fattore,  M.  Liebsch,  B.  Brik  et  A.  Ksentini,  "AutoMEC :  prédiction  de  la  mobilité  des  
[22]  P.  Trakadas  et  al.,  « Une  approche  architecturale  de  réseau  non  public  5G  rentable :  
utilisateurs  basée  sur  LSTM  pour  la  gestion  des  services  dans  les  ressources  MEC  
concepts  et  catalyseurs  clés,  blocs  de  construction  et  cas  d'utilisation  potentiels »,  
distribuées",  dans  Proc .  23e  Int.  ACM  Conf.  Modèle.  Anal.  Simul.
Sensors,  vol.  21,  non.  16,  p.  5578,  2021.
Wireless  Mobile  Syst.,  New  York,  NY,  États­Unis,  2020,  pp.  155–159.
[23]  M.  Polese,  L.  Bonati,  S.  D'Oro,  S.  Basagni  et  T.  Melodia,  "ColO  RAN :  Développer  des  
xApps  basées  sur  l'apprentissage  automatique  pour  le  contrôle  en  boucle  fermée  RAN   [47]  "Intelligence  artificielle  et  apprentissage  automatique  ­  3GPP,  version  17."  Juin  2021.  
ouvert  sur  des  plates­formes  expérimentales  programmables",  2021 ,  arXiv:2112.09559. [En  ligne].  Disponible :  https://www.3gpp.org/news  events/2201­ai_ml_r3  (consulté  le  
31  décembre  2021).

[24]  L.  Bonati,  S.  D'Oro,  M.  Polese,  S.  Basagni  et  T.  Melodia,  "Intelligence  et  apprentissage   [48]  M.  Chen,  W.  Saad  et  C.  Yin,  "Réalité  virtuelle  sur  les  réseaux  sans  fil :  modèle  de  qualité  
dans  O­RAN  pour  les  réseaux  cellulaires  NextG  pilotés  par  les  données",  IEEE   de  service  et  gestion  des  ressources  basée  sur  l'apprentissage",  IEEE  Trans .  
Commun .  Mag.,  vol.  59,  non.  10,  p.  101­1  21–27,  oct.  2021. Commun.,  vol.  66,  non.  11,  p.  5621–5635,  novembre  2018.

[25]  H.  Lee,  J.  Cha,  D.  Kwon,  M.  Jeong  et  I.  Park,  "Hébergement  des  workflows  AI/ML  sur  la   [49]  I.  Com¸sa  et  al.,  "Vers  la  5G :  une  solution  de  planification  basée  sur  l'apprentissage  par  
plate­forme  O­RAN  RIC",  dans  Proc .  Ateliers  IEEE  Globecom  (GC  Wkshps,  Taipei,   renforcement  pour  la  gestion  du  trafic  de  données",  IEEE  Trans.  Réseau  Gestion  des  
Taïwan,  2020,  pp.  1–6. services,  vol.  15,  non.  4,  p.  1661–1675,  décembre  2018.
[26]  MS  Hossain  et  G.  Muhammad,  "Une  distribution  de  ressources  radio  basée  sur  un   [50]  F.  Meng,  P.  Chen,  L.  Wu  et  J.  Cheng,  "Allocation  de  puissance  dans  les  réseaux  
modèle  d'arborescence  profonde  pour  les  réseaux  5G",  IEEE  Wireless  Commun.,  vol.   cellulaires  multi­utilisateurs :  Approches  d'apprentissage  par  renforcement  profond",  
27,  non.  1,  p.  62–67,  février  2020. IEEE  Trans.  Communication  sans  fil.,  vol.  19,  non.  10,  p.  6255–6267,  octobre  2020.
[27]  M.  Yan,  G.  Feng,  J.  Zhou,  Y.  Sun  et  Y.­C.  Liang,  "Ordonnancement  intelligent  des   [51]  KI  Ahmed  et  E.  Hossain,  "Une  méthode  d'apprentissage  Q  en  profondeur  pour  l'allocation  de  
ressources  pour  le  découpage  du  réseau  d'accès  radio  5G",  IEEE  Trans. puissance  en  liaison  descendante  dans  les  réseaux  multicellulaires",  2019,  arXiv:  1904.13032.
Véh.  Technol.,  vol.  68,  non.  8,  pages  7691–7703,  août  2019. [52]  S.  Samarakoon,  M.  Bennis,  W.  Saad  et  M.  Debbah,  "Apprentissage  fédéré  distribué  pour  
[28]  Y.  Zhou,  ZM  Fadlallah,  B.  Mao  et  N.  Kato,  "Une  technique  d'attribution  de  ressources   des  communications  véhiculaires  ultra­fiables  à  faible  latence",  IEEE  Trans.  Commun.,  
radio  basée  sur  l'apprentissage  en  profondeur  pour  les  réseaux  ultra  denses  5G",  IEEE   vol.  68,  non.  2,  p.  1146­1159,  fév.  2020.
Netw.,  vol.  32,  non.  6,  pp.  28–34,  nov./déc.  2018.
[29]  J.  Hall,  K.  Moessner,  R.  MacKenzie,  F.  Carrez  et  CH  Foh,  "Gestion  dynamique  du   [53]  ATZ  Kasgari  et  W.  Saad,  "Communication  ultra  fiable  à  faible  latence  (URLLC)  sans  
planificateur  utilisant  l'apprentissage  en  profondeur",  IEEE  Trans. modèle :  un  cadre  d'apprentissage  par  renforcement  profond",  dans  Proc.  IEEE  Int.  
Conn.  Commun.  Netw.,  vol.  6,  non.  2,  p.  575–585,  juin.  2020. Conf.  Commun.  (ICC),  Shanghai,  Chine,  2019,  pp.  1–6.
[30]  H.  Raza,  "Une  brève  étude  de  l'évolution  du  réseau  d'accès  radio :  Partie  II",  IEEE  
Commun.  Mag.,  vol.  51,  non.  5,  p.  170–177,  mai  2013. [54]  C.  D'Andrea,  A.  Zappone,  S.  Buzzi  et  M.  Debbah,  "Contrôle  de  puissance  de  liaison  
[31]  E.  Dahlman,  S.  Parkvall,  J.  Skold  et  P.  Beming,  3G  Evolution :  HSPA  et  LTE  pour  le  haut   montante  dans  le  MIMO  massif  sans  cellule  via  l'apprentissage  en  profondeur",  dans  Proc .
débit  mobile,  2e  éd.  Boston,  MA,  États­Unis :  universitaire,  2008. IEEE  8e  Int.  Atelier  Informatique.  Adv.  Multi­Sens.  Adapter.  Processus.
(CAMSAP),  Le  Gosier,  Guadeloupe,  2019,  pp.  554–558.  
[32]  IA  Alimi,  AL  Teixeira  et  PP  Monteiro,  « Vers  un  frontal  optique  C­RAN  efficace  pour  les   [55]  Z.  Du,  Y.  Deng,  W.  Guo,  A.  Nallanathan  et  Q.  Wu,  "Apprentissage  par  renforcement  
futurs  réseaux :  un  didacticiel  sur  les  technologies,  les  exigences,  les  défis  et  les   profond  vert  pour  la  gestion  des  ressources  radio :  architecture,  compression  
solutions »,  IEEE  Commun . d'algorithmes  et  défis",  IEEE  Veh .  Technol.  Mag.,  vol.  16,  non.  1,  p.  29–39,  mars  2021.
Enquêtes  Tuts.,  vol.  20,  non.  1,  p.  708–769,  1er  quart.,  2018.

248 VOLUME  3,  2022
Machine Translated by Google

[56]  F.  Al­Tam,  N.  Correia  et  J.  Rodriguez,  "Apprendre  à  planifier  (LEASCH):  Une  approche   [76]  Z.  Jia,  W.  Cheng  et  H.  Zhang,  "Un  schéma  de  détection  basé  sur  l'apprentissage  partiel  
d'apprentissage  par  renforcement  profond  pour  la  planification  des  ressources  radio  dans   pour  le  MIMO  massif",  IEEE  Wireless  Commun.  Lett.,  vol.  8,  non.  4,  p.  1137–1140,  août  
la  couche  MAC  5G",  IEEE  Access,  vol .  8,  pages  108088–108101,  2020. 2019.
[77]  A.  Asadi,  S.  Müller,  GH  Sim,  A.  Klein  et  M.  Hollick,  "FML :  Apprentissage  automatique  rapide  
[57]  F.  AL­Tam,  A.  Mazayev,  N.  Correia  et  J.  Rodriguez,  "Ordonnancement  des  ressources  radio   pour  les  communications  véhiculaires  5G  mmWave",  dans  Proc.  IEEE  INFOCOM  Conf.  
avec  réseaux  de  pointeurs  profonds  et  apprentissage  par  renforcement",  dans  Proc.  IEEE   Calcul.  Commun.,  Honolulu,  HI,  États­Unis,  2018,  p.  1961–1969.
25e  Int.  Modèle  d'atelier  assisté  par  ordinateur.  Dés.  Commun.
Liens  Netw.  (CAMAD),  Pise,  Italie,  2020,  pp.  1–6. [78]  GH  Sim,  S.  Klos,  A.  Asadi,  A.  Klein  et  M.  Hollick,  "Un  algorithme  d'apprentissage  automatique  
[58]  S.  Bakri,  B.  Brik  et  A.  Ksentini,  "Sur  l'utilisation  de  l'apprentissage  par  renforcement  pour  le   contextuel  en  ligne  pour  les  communications  véhiculaires  5G  mmWave",  IEEE/ACM  
contrôle  d'admission  des  tranches  de  réseau  dans  la  5G :  hors  ligne  contre  en  ligne",  Int.  J Trans.  Netw.,  vol.  26,  non.  6,  p.  2487–2500,  décembre  2018.
Commun.  Syst.,  vol.  34,  non.  7,  p.  e4757,  2021.
[59]  B.  Brik  et  A.  Ksentini,  "Sur  la  prédiction  des  performances  des  tranches  de  réseau  orientées  
[79]  MS  Sim,  Y.­G.  Lim,  SH  Park,  L.  Dai  et  C.­B.  Chae,  "Sélection  de  faisceau  mmWave  basée  
services  dans  la  5G :  une  approche  d'apprentissage  fédéré",  dans  Proc.
sur  l'apprentissage  profond  pour  la  5G  NR/6G  avec  des  informations  de  canal  inférieures  
IEEE  45e  Conf.  Calcul  local.  Réseau  (LCN),  Los  Alamitos,  Californie,  États­Unis,  
à  6  GHz :  algorithmes  et  validation  de  prototypes",
novembre  2020,  p.  164–171.
Accès  IEEE,  vol.  8,  pages  51634–51646,  2020.
[60]  W.  Chérif,  A.  Ksentini,  D.  Négru  et  M.  Sidibé,  «  A_psqa :  outil  efficace  de  QoE  de  streaming  
[80]  X.  Wei,  C.  Hu  et  L.  Dai,  "Apprentissage  en  profondeur  pour  l'estimation  du  canal  de  l'espace  
vidéo  en  temps  réel  dans  un  contexte  Internet  média  du  futur  »,  in  Proc .  IEEE  Int.  Conf.  
de  faisceau  dans  les  systèmes  MIMO  massifs  à  ondes  millimétriques",  IEEE  Trans.
Multimedia  Expo  (ICME),  Barcelone,  Espagne,  juillet  2011,  pp.  1–6.
Commun.,  vol.  69,  non.  1,  p.  182–193,  janvier  2021.

[61]  K.  Piamrat,  A.  Ksentini,  C.  Viho  et  J.­M.  Bonnin,  «  QoE­aware  vertical  handover  in  wireless   [81]  F.  Sohrabi,  KM  Attiah  et  W.  Yu,  "Apprentissage  en  profondeur  pour  la  rétroaction  des  canaux  
heterogeneous  networks  »,  dans  Proc.  7e  Int. distribués  et  le  précodage  multi­utilisateurs  dans  le  MIMO  massif  FDD",
Commun  sans  fil.  Informatique  mobile.  Conf.  (IWCMC),  Istanbul,  Turquie,  juillet  2011,  pp.   IEEE  Trans.  Communication  sans  fil.,  vol.  20,  non.  7,  p.  4044–4057,  juillet  2021.
95–100.
[62]  C.  Lee,  H.  Cho,  S.  Song  et  J.­M.  Chung,  "Transfert  conditionnel  basé  sur  la  prédiction  pour   [82]  B.  Brik,  N.  Lagraa,  N.  Tamani,  A.  Lakas  et  Y.  Ghamri­Doudane,  "Location  de  services  cloud  
les  réseaux  à  ondes  millimétriques  5G :  une  approche  d'apprentissage  en  profondeur",   dans  le  cloud  de  véhicules  mobiles",  IEEE  Trans.
IEEE  Veh.  Technol.  Mag.,  vol.  15,  non.  1,  p.  54–62,  mars  2020. Véh.  Technol.,  vol.  67,  non.  10,  p.  9882–9895,  octobre  2018.
[83]  Y.  Chen,  Y.  Gao,  C.  Jiang  et  KJR  Liu,  "Processus  de  décision  de  Markov  en  théorie  des  
[63]  M.  Ozturk,  M.  Gogate,  O.  Onireti,  A.  Adeel,  A.  Hussain  et  MA  Imran,  "Une  nouvelle  approche   jeux  pour  une  prise  de  décision  optimale  dans  les  systèmes  sociaux",  dans  Proc.  
de  prédiction  de  la  mobilité  à  faible  coût  axée  sur  l'apprentissage  profond  pour  les  réseaux   Conférence  mondiale  IEEE.  Informations  sur  le  signal  Processus.  (GlobalSIP),  Atlanta,  
cellulaires  5G :  le  cas  de  la  con  architecture  de  séparation  contrôle/données  (CDSA)  »,   Géorgie,  États­Unis,  2014,  p.  268–272.
Neurocomputing,  vol.  358,  p.  479–489,  septembre  2019. [84]  DP  Kingma  et  J.  Ba,  «  Adam :  Une  méthode  d'optimisation  stochastique  »,  dans  Proc.  3ème  
Int.  Conf.  Apprendre.  Représenter.  (ICLR),  San  Diego,  Californie,  États­Unis,  mai  2015,  
[64]  C.  Wang,  Z.  Zhao,  Q.  Sun  et  H.  Zhang,  «  Double  connectivité  intelligente  basée  sur   p.  1–14.  [En  ligne].  Disponible :  http://arxiv.org/abs/1412.6980  [85]  D.  Sculley  et  al.,  
l'apprentissage  profond  pour  la  gestion  de  la  mobilité  dans  un  réseau  dense  »,  dans   « Apprentissage  automatique :  la  
Proc .  IEEE  88e  Veh.  Technol.  Conf.  (VTC­Fall),  Chicago,  Illinois,  États­Unis,  2018,  pp.  
carte  de  crédit  à  intérêt  élevé  de  la  dette  technique »,  dans  Proc.  Logiciel  SE4ML  Ing.  Mach.  
1–5.
Apprendre.  (Atelier  NIPS),  2014,  p.  1–9.
[65]  A.  El­Amine,  M.  Iturralde,  HAH  Hassan  et  L.  Nuaymi,  "Une  approche  distribuée  
d'apprentissage  Q  pour  les  modes  de  sommeil  adaptatifs  dans  les  réseaux  5G",  dans  
[86]  "MLOps :  pipelines  de  livraison  continue  et  d'automatisation  dans  l'apprentissage  
Proc .  Communication  sans  fil  IEEE.  Réseau  Conf.  (WCNC),  Marrakech,  Maroc,  2019,  
automatique." [En  ligne].  Disponible :  https://cloud.google.com/architecture/mlops­
pp.  1–6.
continuous­delivery­and­automation­pipelines­in­machine  learning  (consulté  le  
[66]  FE  Salem,  Z.  Altman,  A.  Gati,  T.  Chahed  et  E.  Altman,  «Approche  d'apprentissage  par  
21 septembre 2021).
renforcement  pour  la  gestion  avancée  des  modes  de  veille  dans  les  réseaux  5G»,  dans  
[87]  "Considérations  de  sécurité  d'Open  RAN."  Ericsson.  [En  ligne].
Proc .  IEEE  88e  Veh.  Technol.  Conf.
Disponible :  https://www.ericsson.com/en/security/security­considerations­of­open­ran  
(VTC­Fall),  Chicago,  Illinois,  États­Unis,  2018,  pp.  1–5
(consulté  le  1er  mai  2021).
[67]  J.  Ye  et  Y.­JA  Zhang,  "Drag :  activation  de  la  station  de  base  basée  sur  l'apprentissage  par  
renforcement  profond  dans  les  réseaux  hétérogènes",  IEEE  Trans. [88]  "Le  groupe  de  travail  sur  la  sécurité  de  l'O­RAN  Alliance  s'attaque  aux  défis  de  sécurité  sur  
Informatique  mobile.,  vol.  19,  non.  9,  p.  2076­2087,  septembre  2020. toutes  les  interfaces  et  composants  O­RAN."  Alliance  O­RAN.  [En  ligne].  Disponible :  
[68]  K.  Qi,  T.  Liu  et  C.  Yang,  "Apprentissage  fédéré  basé  sur  le  transfert  proactif  dans  les   https://www.O­RAN.org/blog/2020/10/24/the­O­RAN­alliance­security­task­group­tackles­
réseaux  de  véhicules  à  ondes  millimétriques",  dans  Proc.  15e  IEEE  Int.  Conf.  Processus   security  challenges­on­all­O­RAN­interfaces  ­and­components  (consulté  le  1er  
de  signalisation.  (ICSP),  vol.  1.  Pékin,  Chine,  2020,  p.  401–406. mai  2021).

[69]  Y.  Wu,  G.  Zhao,  D.  Ni  et  J.  Du,  "Politique  de  transfert  dynamique  pour  le  découpage  RAN   [89]  X.  Ling,  J.  Wang,  T.  Bouchoucha,  BC  Levy  et  Z.  Ding,  "Réseau  d'accès  radio  Blockchain  (b­
en  exploitant  l'apprentissage  par  renforcement  profond",  EURASIP  J. RAN):  Vers  un  paradigme  d'accès  radio  sécurisé  décentralisé",  IEEE  Access,  vol .  7,  p.  
Ordinateur  sans  fil.  Netw.,  vol.  2021,  p.  61,  mars  2021. 9714–9723,  2019.
[70]  Q.  Wu,  X.  Chen,  Z.  Zhou,  L.  Chen  et  J.  Zhang,  "Apprentissage  par  renforcement  en  
profondeur  avec  prévision  du  trafic  spatio­temporel  pour  le  contrôle  du  sommeil  de  la   [90]  B.  Brik,  A.  Ksentini  et  M.  Bouaziz,  "Apprentissage  fédéré  pour  les  réseaux  sans  fil  activés  
station  de  base  basé  sur  les  données",  IEEE/ACM  Trans .  Netw.,  vol.  29,  non.  2,  p.  935– par  les  UAV :  cas  d'utilisation,  défis  et  problèmes  ouverts",
948,  avril  2021. Accès  IEEE,  vol.  8,  pages  53841–53849,  2020.
[71]  Y.­NR  Li,  M.  Chen,  J.  Xu,  L.  Tian  et  K.  Huang,  « Techniques  d'économie  d'énergie  pour  la   [91]  Gestion  des  télécommunications ;  Réseaux  auto­organisés  (SON) ;  Concepts  et  exigences,  
5G  et  au­delà »,  IEEE  Access,  vol.  8,  pages  108675–108690,  2020. V16.0.0,  norme  3GPP  TS  32.500,  juillet  2020.

[72]  H.  Huang  et  al.,  «  Apprentissage  en  profondeur  pour  les  techniques  sans  fil  5G  de  la  couche  
[92]  Réseaux  auto­organisés  (SON)  pour  le  réseau  5G,  V16.0.0,  norme  3GPP  TS  28.313,  
physique :  opportunités,  défis  et  solutions  »,  IEEE  Wireless  Commun.,  vol.  27,  non.  1,  p.  
septembre  2020.
214–222,  février  2020.
[93]  Multi­Access  Edge  Computing  (MEC);  Cadre  et  architecture  de  référence,  norme  ETSI  GS  
[73]  H.  Ye,  GY  Li  et  B.­H.  Juang,  "Puissance  de  l'apprentissage  en  profondeur  pour  l'estimation  
MEC  003  v2.1.1,  janvier  2019.
de  canal  et  la  détection  de  signal  dans  les  systèmes  OFDM",  IEEE  Wireless  Commun.  
Lett.,  vol.  7,  non.  1,  p.  114–117,  février  2018. [94]  B.  Brik,  PA  Frangoudis  et  A.  Ksentini,  « Placement  d'applications  MEC  orientées  services  

[74]  T.  O'Shea  et  J.  Hoydis,  "Une  introduction  à  l'apprentissage  en  profondeur  pour  la  couche   dans  une  architecture  cloud  de  périphérie  fédérée »,  dans  Proc.

physique",  IEEE  Trans.  Conn.  Commun.  Netw.,  vol.  3,  non.  4,  p.  563–575,  décembre   IEEE  Int.  Conf.  Commun.  (ICC),  Dublin,  Irlande,  2020,  pp.  1–6.

2017. [95]  B.  Yongacoglu,  G.  Arslan  et  S.  Yüksel,  "Apprentissage  par  renforcement  pour  le  contrôle  
[75]  S.  Rajendran,  W.  Meert,  D.  Giustiniano,  V.  Lenders  et  S.  Pollin,  "Modèles  d'apprentissage   stochastique  décentralisé",  dans  Proc.  IEEE  58e  Conf.  Décis.
en  profondeur  pour  la  classification  des  signaux  sans  fil  avec  des  capteurs  de  spectre   Control  (CDC),  Nice,  France,  2019,  pp.  5556–5561.
distribués  à  faible  coût",  IEEE  Trans .  Conn.  Commun. [96]  C.  Gelada  et  MG  Bellemare,  «Apprentissage  par  renforcement  profond  hors  politique  en  
Netw.,  vol.  4,  non.  3,  p.  433–445,  sept.  2018. amorçant  le  changement  de  covariable»,  2019,  arXiv:  1901.09455.

VOLUME  3,  2022 249
Machine Translated by Google
BRIK  et  al. :  DL  POUR  B5G  O­RAN :  ÉVOLUTION,  ENQUÊTE,  ÉTUDES  DE  CAS  ET  DÉFIS

[97]  P.­H.  Chiang,  RB  Guruprasad  et  S.  Dey,  «  Utilisation  optimale  des  ressources   KARIM  BOUTIBA  a  reçu  le  diplôme  d'ingénieur  de  l'École  
solaires,  de  stockage  hybrides  et  de  stations  de  base  récoltées  pour  les   Nationale  Supérieure  d'Informatique,  Algérie.  Il  poursuit  
réseaux  cellulaires  verts  »,  IEEE  Trans.  Commune  verte.  Netw.,  vol.  2,  non.  3,   actuellement  un  doctorat.  diplôme  avec  le  département  des  
pages  707  à  720,  septembre  2018. systèmes  de  communication,  EURECOM,  et  supervisé  par  le  
[98]  A.  Antonopoulos,  "Problème  de  faillite  dans  le  partage  de  réseau :  Fondamentaux,   professeur  A.  Ksentini.  Au  cours  de  son  stage,  il  a  travaillé  sur  
applications  et  défis",  IEEE  Wireless  Commun.,  vol.  27,  non.  4,  p.  81–87,  août   la  construction  d'un  orchestrateur  RAN  au  sommet  de  la  plate­
2020. forme  OpenAirInterface  qui  gère  le  cycle  de  vie  d'une  tranche  
de  réseau  radio.

Il  travaille  à  l'application  du  découpage  du  réseau  dans  
la  nouvelle  génération  de  réseau  d'accès  radio.
BOUZIANE  BRIK  a  obtenu  le  diplôme  d'ingénieur  (First  
Class)  en  informatique  et  le  diplôme  de  Magister  de  
l'Université  de  Laghouat,  Algérie,  en  2010  et  2013,  
respectivement,  et  le  doctorat.  diplômé  de  l'Université  de  
Laghouat  et  de  l'Université  de  La  Rochelle,  France,  en  
2017.  Il  travaille  actuellement  en  tant  que  professeur  
associé  à  l'Université  de  Bourgogne  (Bourgogne)  et  au   ADLEN  KSENTINI  (Senior  Member,  IEEE)  a  reçu  le  
laboratoire  DRIVE.  Avant  de  rejoindre  l'Université  de   doctorat.  Diplômé  en  informatique  de  l'Université  de  
Bourgogne,  il  a  été  Postdoctorant  à  l'Université  de   Cergy­Pontoise  sur  le  provisionnement  de  QoS  dans  les  
Troyes,  au  CESI  et  à  l'Eurecom.  Il  a  travaillé  sur  le   réseaux  IEEE  802.11.  Depuis  2016,  il  est  professeur  au  
network  slicing  dans  le  cadre  des  projets  européens   département  des  systèmes  de  communication,  
H2020  sur  la  5G,  dont  MonB5G  et  5GDrones.  Ses  intérêts  de  recherche  incluent   EURECOM.  Il  est  actuellement  conférencier  émérite  
également  l'Internet  des  objets  (IoT),  l'IoT  dans  les  systèmes  industriels,  les  réseaux   IEEE  COMSOC  sur  des  sujets  liés  à  la  5G  et  à  la  
intelligents  et  les  réseaux  véhiculaires.  Il  a  également  agi  ou  agit  encore  en  tant   softwarisation  des  réseaux.  Ses  sujets  de  recherche  
qu'examinateur  de  nombreuses  conférences  IFIP,  ACM  et  IEEE  (ICC,  Globecom,   actuels  portent  sur  les  améliorations  architecturales  des  
PIMRC,  WCNC,  VTC,  IM/NOMS,  IWCMC,  GIIS,  WiMob  et  Wireless  Days)  et  revues,   réseaux  centraux  mobiles,  la  mise  en  réseau  cloud  
telles  que  l'IEEE  TRANSACTIONS  SUR  LA  TECHNOLOGIE  DES  VÉHICULES ,  les   mobile,  la  virtualisation  des  fonctions  réseau  et  le  SDN.  
TRANSACTIONS  DE  L'IEEE  SUR  LES  SYSTÈMES  DE  TRANSPORT  INTELLIGENTS ,   Il  a  reçu  le  prix  du  meilleur  article  de  l'IEEE  WCNC  2018,  de  l'IEEE  IWCMC  2016,  de  
les  TRANSACTIONS  DE  L'IEEE  SUR  L'INFORMATIQUE  INDUSTRIELLE ,  le   l'IEEE  ICC  2012,  de  l'ACM  MSWiM  2005  et  du  prix  IEEE  Fred  W.  Ellersik  du  meilleur  
magazine  IEEE  Communication  et  le  magazine  IEEE  Network. magazine  de  communication  IEEE  pour  2017.

250 VOLUME  3,  2022

Vous aimerez peut-être aussi