Académique Documents
Professionnel Documents
Culture Documents
Reçu le 4 janvier 2022 ; accepté le 24 janvier 2022. Date de publication le 28 janvier 2022 ; date de la version actuelle 11 février 2022.
Identificateur d'objet numérique 10.1109/OJCOMS.2022.3146618
Deep Learning pour le réseau d'accès radio ouvert B5G :
Évolution, enquête, études de cas et défis
BOUZIANE BRIK 1, KARIM BOUTIBA2 ET ADLEN KSENTINI 2 (membre senior, IEEE)
1DRIVE EA1859, University of Bourgogne FrancheComté, 25000 Besançon, France
2Département des Systèmes de Communication, EURECOM, 06410 SophiaAntipolis, France
AUTEUR CORRESPONDANT : B. BRIK (email : bouziane.brik@gmail.com)
Ce travail a été soutenu en partie par le projet H2020 MonB5G de l'Union européenne dans le cadre de la subvention 871780, et en
partie par la 5G ! Projet de drones dans le cadre de la subvention 857031.
RÉSUMÉ L'alliance Open Radio Access Network (ORAN) a été récemment lancée pour concevoir une nouvelle
architecture RAN comprenant une architecture d'accès radio ouverte, pilotée par logiciel, virtuelle et intelligente.
L'architecture ORAN est basée sur (1) des fonctions RAN désagrégées qui s'exécutent en tant que fonction de réseau
virtuel (VNF) et fonction de réseau physique (PNF) ; (2) la notion de contrôleur RAN qui exécute de manière centralisée
des applications RAN telles que la gestion de la mobilité, la planification des utilisateurs, l'allocation des ressources radio,
etc. Le contrôleur RAN est chargé d'appliquer les décisions d'application en utilisant des interfaces ouvertes avec les fonctions RAN.
Une caractéristique importante introduite par ORAN est l'utilisation intensive des techniques d'apprentissage automatique
(ML), en particulier l'apprentissage profond (DL), pour favoriser l'innovation et faciliter le déploiement d'applications RAN
intelligentes capables de respecter la qualité de service (QoS). ) exigences des services de réseau 5G et audelà envisagés.
Dans ce travail, nous donnons d'abord un aperçu de l'évolution des architectures RAN vers la 5G et audelà, à savoir C
RAN, vRAN et ORAN. Nous les comparons également en fonction de diverses perspectives, telles que la prise en charge
de la périphérie, la virtualisation, le contrôle et la gestion, la consommation d'énergie et la prise en charge de l'IA. Ensuite,
nous passons en revue les solutions existantes basées sur DL traitant de la partie RAN. Nous montrons également comment
ils peuvent être intégrés/mappés à l'architecture ORAN puisque ces travaux n'étaient pas initialement adaptés à l'architecture
ORAN. De plus, nous présentons deux études de cas pour le déploiement de techniques DL dans ORAN.
En outre, nous décrivons comment les principales étapes des modèles DL déployés dans ORAN peuvent être automatisées,
pour assurer des performances stables de ces modèles, en introduisant le concept d'opérations du système ML (MLOps)
dans ORAN. Enfin, nous identifions les principaux défis techniques, les problèmes ouverts et les futures orientations de
recherche liées à l'architecture ORAN activée par l'intelligence artificielle (IA).
INDEX TERMES Réseaux B5G, RAN, architecture RAN ouverte, contrôleur intelligent RAN, apprentissage en profondeur,
MLOps.
INTRODUCTION monde à travers des cas d'usage inégalés [1], tels que les systèmes
autonomes connectés, la réalité étendue (englobant à la fois la réalité
L A VENIR Audelà
odu
Les réseaux, e
sloidisant
a cinquième
6G, gsénération (B5G)
ont une technologie augmentée et la réalité virtuelle), les véhicules volants, l'haptique, la
révolutionnaire censée éliminer les limites de la bande passante, de télémédecine, etc. Pour déployer avec succès ces cas d'usage, les
l'accès, de la latence et des limitations de performances sur la systèmes B5G doivent simultanément une faible latence, des débits
connectivité dans le monde entier [1], [2]. Le B5G devrait transformer de données très élevés et fiables, une efficacité énergétique élevée et
les réseaux de communication mobile de l'Internet des objets (IoT) en de larges bandes de fréquences (en THz) pour des dispositifs
"intelligence connectée", en tirant parti des techniques d'intelligence hétérogènes [2].
artificielle (IA) et en connectant des milliards de personnes et de La coexistence d'une telle variété de services nécessite un réseau
machines. Cela fait de B5G le principal catalyseur d'une large gamme polyvalent prenant en compte toutes les fonctionnalités. Cependant,
de nouveaux services améliorant la qualité de vie autour de la ces objectifs ne peuvent pas être pris en charge par la radio existante
Ce travail est sous licence Creative Commons AttributionNonCommercialNoDerivatives 4.0. Pour plus d'informations, voir https://creativecommons.org/licenses/byncnd/4.0/
228 VOLUME 3, 2022
Machine Translated by Google
Access Network (RAN), et donc l'optimisation de la partie RAN est parmi 95 chercheurs sans fil, et la majorité a déclaré que l'ORAN
grandement nécessaire [3]. Une façon de prendre en charge la sera le fondement des futurs réseaux cellulaires.
variété des exigences de service consiste à concevoir des instances Ensuite, les auteurs ont décrit les avantages de l'ORAN en plus de
de réseau distinctes, où chacune (instance) répond aux besoins d'un ses lacunes actuelles et des opportunités de recherche.
type de service donné [4]. Dans un tel contexte, les industries et les D'autre part, l'architecture générale, les concepts et les exigences de
universités tirent parti des nouvelles technologies, y compris le réseau l'ORAN introduits pour la première fois dans [13]. Ensuite, les auteurs
défini par logiciel (SDN) et la virtualisation des fonctions réseau (NFV), ont conçu un schéma intelligent d'allocation des ressources radio
pour rendre le réseau radio mobile plus virtuel, orienté logiciel, pour faire face à la congestion du trafic et montrer son efficacité en
intelligent et économe en énergie [4] . exploitant un ensemble de données du monde réel. Le travail se
conclut par des défis encore ouverts et des directions de recherche futures.
Une autre solution potentielle pour répondre aux exigences des De même, les auteurs ont donné un aperçu de l'architecture ORAN
services mentionnés cidessus est de diviser la partie RAN en et de ses principaux modules dans [14]. Les auteurs ont également
plusieurs parties en fonction de sa fonctionnalité principale, afin de présenté des scénarios RAN réalistes exploitant des modèles basés
rendre le réseau radio polyvalent et plus intelligent [5]. Dans ce sur l'IA/ML, en plus de l'architecture ORAN, soulignant leur potentiel
contexte, l'alliance Open RAN (ORAN) a récemment lancé la de perturbation. Enfin, les principaux avantages et limites de l'ORAN
conception d'une nouvelle architecture RAN pour les réseaux mobiles sont détaillés ainsi que les conclusions.
de nouvelle génération (5G et audelà) [6], [7]. ORAN est un Par ailleurs, peu de travaux ont récemment proposé des apports
changement de paradigme majeur dans l'architecture RAN visant à techniques liés à l'architecture ORAN. Dans [15], l'architecture O
diriger l'industrie vers un RAN piloté par logiciel, virtuel, ouvert et RAN est exploitée pour concevoir un schéma basé sur l'apprentissage
activé par l'IA. Plus précisément, l'idée de base de l'ORAN est de automatique afin d'optimiser la fonction de relation de voisinage
désagréger les principales fonctions du RAN traditionnel, de les automatique (ANR) du réseau autoorganisé (SON), et donc
implémenter en tant que composants logiciels (c'estàdire VNF) et de d'améliorer les transferts gNodeB (gNB). Les auteurs de [16] ont
les connecter à l'aide d'interfaces standardisées et ouvertes. Notons passé en revue les systèmes multiagents et les schémas
également que la Fondation Linux et l'Alliance ORAN ont annoncé d'apprentissage en équipe, avant de discuter de la manière dont ces
l'ORAN Software Community (OSC) en avril 2019 [8], donnant schémas peuvent être déployés audessus de l'architecture ORAN.
naissance au premier logiciel opensource ORAN, nommé Amber Dans [17], [18], les auteurs ont discuté de l'évolution du RAN vers
Release, en décembre 2019 [9]. l'OpenRAN, en termes d'architectures, de fonctionnalités et d'implémentation.
ORAN a conçu un contrôleur intelligent RAN hiérarchique (RIC), Tandis que l'intégration potentielle d'ORAN avec les concepts 5G
comprenant à la fois des RIC en temps quasi réel et non en temps Multiaccess Edge Computing (MEC), SON et Network Slicing (NS)
réel qui prennent en charge des fonctions programmables. est discutée dans [19]. La question de la séparation des fonctions
Les RIC intègrent des capacités d'apprentissage en profondeur (DL) dynamiques de l'ORAN est traitée dans [20]. Un schéma basé sur
intégrées au RAN afin d'optimiser les performances du RAN et de l'apprentissage par renforcement est conçu pour diviser
réduire la complexité opérationnelle. Il permet d'adapter les opérations dynamiquement les fonctions dans ORAN, tout en optimisant la
de gestion des ressources radio, de la mobilité et du spectre (contrôle consommation d'énergie du logiciel et du matériel RAN. Dans [21], un
d'admission, allocation et ordonnancement des ressources radio, nouveau cadre est conçu pour relever le défi de la façon de découper
allocation de puissance, gestion des liaisons radio, etc.) en fonction le RAN dans la 5G, à savoir la nouvelle flexibilité radio (NRflex).
des besoins des applications, ce qui est très appréciable dans les NRflex permet d'allouer dynamiquement la partie bande passante
réseaux B5G lors de l'adressage différentes industries verticales. (BWP) ainsi que les ressources radio aux tranches de réseau, et leurs
utilisateurs correspondants, afin de répondre aux besoins des
A. EXAMEN DES TRAVAUX CONNEXES tranches. De plus, le cadre NRflex a été mappé à l'architecture O
Plusieurs articles d'enquête traitant de la partie 4G/5G RAN ont été RAN, pour déterminer dynamiquement les tailles des BWP pour
publiés jusqu'à présent. Dans [3], les auteurs ont fourni une revue de chaque tranche RAN. Un nouveau cadre architectural de réseaux non
la littérature et une étude approfondie de CloudRAN (CRAN), publics (NPN) 5G est proposé dans [22], pour permettre des
Heterogeneous Cloud RAN (HCRAN), Virtualzied Cloud RAN (V déploiements rentables de réseaux privés 5G. Ce cadre s'appuie sur
CRAN) et Fog RAN ( FRAN). Une autre enquête axée sur le CRAN des technologies émergentes clés, telles que les modèles basés sur
et les applications détaillées d'apprentissage en profondeur pour l'IA/ML, le MEC et les fonctions RAN désagrégées, pour optimiser la
l'architecture du CRAN a été proposée dans [10]. De même, les gestion du réseau. Il permet également un partage RAN efficace en
auteurs dans [11] ont abordé l'architecture CRAN. Plus précisément, termes d'orchestration des ressources et des services requis, qui sont
ils ont donné une enquête détaillée sur l'allocation des ressources alignés sur l'architecture ORAN. Dans [23], [24], les auteurs ont
dans une telle architecture RAN. discuté de la mise en œuvre de solutions en boucle fermée basées
Dans le contexte de l'ORAN, à notre connaissance, nous ne sur ML audessus de l'architecture ORAN. Ils ont également fourni
trouvons que trois courtes études d'enquête/examen. Dans [12], les une première démonstration d'ORAN à travers un banc d'essai
auteurs ont donné une courte étude sur ce que ORAN peut faire et expérimental. Ainsi, ils ont déployé ORAN en utilisant l'émulateur de
ce qu'il ne peut pas faire (limitations). Les auteurs ont commencé par réseau Colosseum. Ensuite, ils ont utilisé l'ORAN déployé pour gérer
présenter brièvement l'architecture ORAN, suivi d'une enquête plusieurs tranches de réseau. Finalement, le
communautaire sur l'importance de l'ORAN. En effet, cette enquête a été menée
VOLUME 3, 2022 229
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
les auteurs ont introduit un flux de travail ML basé sur les spécifications ML
du groupe de travail (WG) 2 de l'alliance ORAN, dans [25].
Ils ont ensuite mis en œuvre ce flux de travail à l'aide du logiciel open source
d'ORAN. Ils ont utilisé à la fois Acumos Framework et Open Network
Automation Platform (ONAP), pour générer des modèles ML à exécuter dans
le module ORAN RIC, et pour surveiller et gérer le flux de travail conçu,
respectivement.
Même s'il existe plusieurs articles d'enquête traitant des architectures RAN
4G / 5G, la plupart d'entre eux ont étudié les architectures RAN précédentes,
notamment CRAN, HCRAN, VCRAN, etc. Ainsi, ces travaux n'ont pas
abordé, ou inclure l'architecture ORAN dans leurs études. De plus, un large
éventail d'études basées sur DL ont également été proposées pour traiter
les principaux défis RAN dans les réseaux 4G/5G [26], [27], [28], [29].
Cependant, ces études n'ont pas également pris en compte l'architecture O
RAN émergente et doivent donc être cartographiées/intégrées dans cette
FIGURE 1. La structure du document.
architecture.
D'autre part, les travaux d'enquête existants liés à l'ORAN se limitent à de Le déploiement DL dans ORAN est détaillé dans la section IV. L'automatisation
courtes études décrivant l'architecture de l'ORAN et ses principaux modules,
des principales étapes du processus DL est présentée dans la section V. La
en plus de ses principaux avantages ainsi que de ses lacunes. section VI décrit les problèmes ouverts et les futures directions de recherche.
La section VII conclut l'article. Notez que les acronymes utilisés dans ce
document sont décrits dans le tableau 1, par ordre alphabétique, pour faciliter
B. CONTRIBUTIONS
la référence.
Contrairement aux articles d'enquête existants, cet article traite de l'architecture
ORAN et vise principalement à cartographier/intégrer les études existantes II. ÉVOLUTION DES ARCHITECTURES RAN Dans cette
basées sur DL à la nouvelle architecture ORAN, via ses modules RIC section, nous passons en revue l'évolution des architectures RAN, en partant
hiérarchiques. Nous proposons également deux études de cas sur la façon du RAN centralisé vers le RAN distribué, en passant par le Cloud RAN (C
de déployer des modèles basés sur ML/DL audessus de l'architecture O RAN), en passant par le RAN virtuel (vRAN) et plus récemment l'architecture
RAN, et montrons comment l'ensemble du processus ML/DL peut être ORAN. Nous notons que nous fournissons plus de détails sur l'architecture
automatisé. Sur cette base, nous nommons les principales contributions de ORAN, car elle représente la portée principale de ce travail.
cet article comme suit.
• Nous donnons d'abord un aperçu de l'évolution de l'architecture RAN,
vers les réseaux B5G. Nous les comparons également en fonction de A. DU RAN 2G CENTRALISÉ À L'ARCHITECTURE RAN 3/4G DISTRIBUÉE
diverses perspectives, telles que la prise en charge de la périphérie, la Dans les réseaux 2G, les
virtualisation, le contrôle et la gestion, la consommation d'énergie et la fonctions de traitement en bande de base et radio sont mises en œuvre au
prise en charge de l'IA. niveau des stations de base (BS) [30]. Une BS est composée de deux
• Nous fournissons également une nouvelle étude d'examen concernant équipements fonctionnels : un contrôleur d'équipement radio (REC) et une
les travaux existants basés sur DL pour le RAN de prochaine génération. unité numérique (DU). REC est responsable du traitement du signal en bande
De plus, nous montrons comment ces travaux peuvent être réalisés au de base, de la surveillance et de la gestion des stations de base, tandis que
dessus de l'architecture ORAN. • Nous DU est responsable des fonctions radio, notamment la modulation, la
décrivons deux études de cas pour le déploiement des techniques DL démodulation, l'amplification, le filtrage des radiofréquences, la conversion
dans l'architecture ORAN, en plus de la façon dont les principales de fréquence et l'analogiquenumérique ainsi que le numériquenumérique.
étapes de déploiement des modèles DL peuvent être automatisées, afin conversion analogique.
d'assurer des performances stables et acceptables des modèles Cependant, dans les réseaux 3G/4G, les unités de traitement signal et
déployés. • Les principaux défis techniques, radio des BS 2G sont séparées les unes des autres (cf.
les questions ouvertes et les futures orientations de recherche liées à figure 2). L'unité radio est déployée à proximité de la station de base 3G/4G
l'architecture ORAN activée par l'IA sont enfin discutées. et est appelée Remote Radio Unit (RRU) ou Remote Radio Head (RRH).
L'unité de traitement du signal en bande de base est appelée unité de bande
de base (BBU). La BBU fournit les ressources nécessaires à ses RRH en ce
C. STRUCTURE DE L'ARTICLE qui concerne les exigences des applications en cours d'exécution [31].
La figure 1 illustre la structure générale de cet article. La section II donne un
aperçu général de l'évolution des architectures RAN, y compris l'architecture Cette architecture RAN est appelée Distributed RAN
ORAN et ses modules fonctionnels. Les travaux existants basés sur DL (DRAN). Chaque BBU est interconnecté à son RRH correspondant via un
traitant du RAN 5G et leur intégration à l'architecture ORAN sont examinés réseau de transport, où les microondes optiques et la fibre peuvent être
dans la section III. Deux études de cas pour déployés pour établir une liaison entre le BBU et le RRH (appelé fronthaul).
230 VOLUME 3, 2022
Machine Translated by Google
TABLEAU 1. Liste des acronymes.
B. ARCHITECTURE RAN CENTRALISÉE ET consommation d'énergie, augmenter le débit du réseau, améliorer
CLOUDIFIÉE Avec l'évolutivité du réseau et l'efficacité spectrale, faciliter la gestion du
l'augmentation du trafic de données et diverses exigences de QoS réseau et l'équilibrage de charge.
(Quality of Service), les acteurs du réseau cellulaire ont dû passer
par la cloudification et la centralisation de la partie BBU, qui contient C. ARCHITECTURE RAN VIRTUALISÉE Les
un pool de ressources réseau. Cette nouvelle architecture est connue réseaux mobiles 5G présentent diverses exigences telles que le
sous le nom de CRAN [32], [33]. Comme le montre la figure 3, l'idée nombre massif d'utilisateurs mobiles, des communications à latence
de base du CRAN est de relier les RRH à un pool de BBU cloudifié, ultra faible et un débit de données fiable et élevé. Pour répondre à
centralisé et partagé. Chaque RRH est relié à son pool de BBU via ces exigences, les acteurs du réseau tirent parti des technologies
une liaison frontale, et jusqu'à dix RRH peuvent être connectés au émergentes de NFV et SDN afin de virtualiser toutes les ressources
même pool de BBU. et fonctions de l'architecture RAN et également de découpler les
Cette architecture RAN est conçue sur le dessus de deux plans de contrôle et de données. Cette nouvelle tendance de
paradigmes : la virtualisation et la centralisation de la partie traitement virtualisation des réseaux d'accès représente un nouveau type de
en bande de base [33]. Ainsi, il permet de diminuer la RAN, connu sous le nom de RAN virtualisé ou vRAN.
VOLUME 3, 2022 231
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
FIGURE 2. Architecture DRAN. FIGURE 4. Architecture vRAN.
et un réseau frontal à bande passante plus élevée pour l'échange de signaux et
de données entre les RRU et les DU. Cela offre également des options plus
rentables aux prestataires de services pour le transport frontal.
D. ARCHITECTURE D'ALLIANCE OUVERTE
L'alliance ORAN aborde le domaine du réseau d'accès radio et promet de le
rendre plus ouvert, flexible et plus intelligent [6], [7], [9]. L'idée de base est de
séparer le matériel du logiciel et de créer des interfaces ouvertes entre eux. Par
conséquent, cela aide les réseaux à prendre en charge des interfaces ouvertes
et des normes de développement communes, à fournir des réseaux interopérables
multifournisseurs et à éviter tout blocage de fournisseur. La figure 5 montre
l'architecture de référence de l'alliance ORAN. Cette nouvelle architecture
s'appuie sur les technologies SDN et NFV pour inclure de nouvelles interfaces et
redéfinir les blocs fonctionnels RAN afin de permettre le déploiement de
nouvelles applications et de nouveaux services audessus du RAN. Il convient de
noter que la figure 5 reflète un scénario de fractionnement fonctionnel très
spécifique, où la CU (unité centrale), la DU (unité distribuée) et la RU (unité radio)
FIGURE 3. Architecture CRAN. de l'ORAN se trouvent dans des emplacements séparés. Dans les sections IID6
et IID7, nous décrivons respectivement les différentes options de fractionnement
La figure 4 montre l'architecture vRAN composée de parties de nuage d'unité fonctionnel et les scénarios de déploiement du RAN. De plus, dans ce qui suit,
numérique (nuage DU) et de RRU, interconnectées via des liaisons Fibre Ethernet nous décrivons les principaux éléments de l'architecture ORAN. Nous notons
[34]. Dans le DU Cloud, les BBU sont virtualisées (vBBU) et déployées sur que détailler les blocs fonctionnels de l'architecture ORAN n'entre pas dans le
plusieurs platesformes NFV, qui fournissent des fonctions liées au traitement en cadre de ce travail.
bande de base. Tous les vBBU sont interconnectés les uns avec les autres via
un commutateur (couche 2) qui est utilisé pour échanger la signalisation et les
données entre les vBBU. Le vRAN est basé sur un matériel de serveur standard
qui réduit ou augmente efficacement la mémoire, le traitement et les ressources 1) LE RAN INTELLIGENT NON EN TEMPS RÉEL
d'E/S en fonction de la demande. Par conséquent, il permet d'atteindre le plein MANETTE
potentiel d'une consommation d'énergie réduite, d'une mise à l'échelle dynamique Le RIC non temps réel (RT) est une fonction logique mise en œuvre au niveau
de la capacité, d'une utilisation efficace des ressources du réseau et d'une fiabilité de la gestion et de l'orchestration des services (SMO). Il est composé de deux
et d'une qualité de service améliorées. sousfonctions principales : cadre RIC non RT et applications RIC non RT
(rApps).
Le cadre est une fonctionnalité interne de SMO qui fournit les services
De plus, les RRU sont laissées à la périphérie du réseau (les sites cellulaires). nécessaires aux rApps via l'interface R1, tandis que les applications RIC non RT
De plus, les liaisons Fibre Ethernet et IP offrent une latence plus faible (rApps) exploitent les
232 VOLUME 3, 2022
Machine Translated by Google
FIGURE 5. Architecture de référence de l'ORAN Alliance pour un scénario de déploiement de RU, CU et DU séparés.
Services SMO, tels que la surveillance des données sur l'interface O1 Le plan de l'OCU héberge le RRC et la partie du plan de contrôle du
(stockées dans une base de données locale) et les services protocole PDCP, tandis que la partie du plan de l'utilisateur du protocole
d'approvisionnement, afin de prendre en charge l'optimisation intelligente PDCP et du protocole SDAP est hébergée sur le plan de l'utilisateur de
des éléments et des ressources RAN à une échelle qui n'est pas en l'OCU (OCUUP). Les deux avions s'interfacent sur E1 et sont chargés
temps réel (c'estàdire supérieure à une seconde). Ainsi, NonRT RIC d'assurer principalement la gestion des procédures de l'UE, des cellules
vise à fournir une politique RAN intelligente au contrôleur intelligent en et du gNB, telles que la mobilité et la connectivité de l'UE, l'énergie de la
temps quasi réel, via l'interface A1, basée principalement sur la formation/ station de base, l'activation des cellules, etc.
l'inférence AI/DL et l'analyse de données.
4) UNITÉ DISTRIBUÉE ORAN (ODU)
2) LE RAN INTELLIGENT EN PRESQUE TEMPS RÉEL L'ODU est un nœud logique comprenant trois couches principales : le
MANETTE contrôle de la liaison radio (RLC), le contrôle d'accès au support (MAC)
Le RIC en temps quasi réel (RT) contrôle et optimise les nœuds ORAN et les couches physiques élevées (HighPHY). Interfaces ODU avec O
(OCU et ODU) et leurs ressources sur l'interface E2 avec une boucle CU via l'interface F1 pour fournir de nombreuses fonctionnalités liées
de contrôle en temps quasi réel (c'estàdire de 10 ms à 100 ms). Le RIC aux trois couches, notamment la gestion des contextes UE et Bearer,
NearRT implémente un ensemble de primitives pour améliorer les l'émetteur et le récepteur en mode RLC, l'allocation des ressources radio
performances des nœuds ORAN, telles que la surveillance, l'arrêt/la MAC, le planificateur MAC, la gestion de la liaison physique montante
suspension, le contrôle et/ou la dérogation. (liaison descendante) canaux partagés (de contrôle), etc.
Le NearRT RIC héberge des applications, à savoir xApps, qui tirent parti
de ces primitives et utilisent l'interface E2 pour surveiller les informations 5) UNITÉ RADIO ORAN (ORU)
RAN en temps quasi réel à partir des nœuds ORAN. Les xApps ORU est un nœud logique hébergeant les fonctions de la couche
fournissent ensuite des services à valeur ajoutée, en ce qui concerne physique basse (LowPHY) et le traitement des radiofréquences (RF).
les données de politiques reçues du NonRT RIC, via l'interface A1. Les Nous notons que dans l'architecture ORAN, la fonctionnalité de la
xApps incluent la gestion du spectre (SM), la gestion des ressources couche physique est divisée en HighPHY dans ODU et LowPHY dans ORU.
(RM), la gestion de la mobilité (MM), etc. En outre, une interface frontale ouverte entre ODU et ORU est définie
dans l'architecture ORAN et adoptée dans l'architecture divisée.
3) PLANS DE CONTRÔLE ET UTILISATEURS DE L'UNITÉ
CENTRALE ORAN (OCUCP ET OCUUP) 6) OPTIONS SPLIT FONCTIONNELLES DANS O
OCU est un nœud logique hébergeant les protocoles RRC (Radio RAN Classiquement et comme le montre la Fig. 6, le 3GPP a défini neuf
Resource Control), SDAP (Service Data Adaptation Protocol) et PDCP blocs fonctionnels et huit options de point de partage dans les réseaux
(Packet Data Control Protocol). Le contrôle sans fil 4G [36]. Cependant, avec la forte augmentation de
VOLUME 3, 2022 233
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
FIGURE 6. Options de fractionnement des fonctions CU, DU et RU dans ORAN. Division 5G(A) de la couche haute ; Division 5G(B) de la couche inférieure ; Division en cascade 5G(C) [35].
débit de données en 5G, il est essentiel d'assouplir les exigences de entreprise ou bâtiment. De plus, il n'y a pas d'équipement de
bande passante et de latence, tout en ne centralisant que quelques transport entre les deux blocs (à travers la fibre droite par
fonctions. Par conséquent, le nouveau fractionnement fonctionnel doit exemple), ce qui permet de réduire principalement le coût. •
prendre en compte et trouver des compromis rentables entre la latence, Intégration CU, DU et RU : il est clair qu'il n'y a qu'un réseau de
les débits de données et la centralisation fonctionnelle. En 2017, le liaison dans ce scénario, qui peut être utilisé pour les cas de points
3GPP a considéré l'option 2 (PDCP et RLC élevé) comme le point de d'accès et de petites cellules.
partage de la couche haute (appelée interface F1) et les options 6 et 7 Il convient de noter que le scénario de déploiement adéquat sera
pour le partage de la couche basse [37]. identifié en fonction des exigences des applications ou des services
La figure 6 montre le mappage de ces options de fractionnement (ultra faible latence, débits de données élevés, etc.), de la technologie
fonctionnel aux blocs CU/DU/RU ORAN. Comme mentionné de transport disponible et des exigences de déploiement des opérateurs.
précédemment, pour prendre également en charge les déploiements
4G, la terminologie pour BBU et RRH est remplacée par CU/DU et RU, respectivement.
8) CAS D'UTILISATION DU
Ainsi, cinq découpages de blocs fonctionnels CU/DU/RU ont été définis : DÉCOUPAGE ORAN Récemment, un groupe de travail de l'alliance O
(i) Un découpage de couche haute, où les fonctions CU sont séparées RAN a commencé à décrire l'architecture de découpage ORAN, ainsi
des fonctions DU/RU (5G(A)). (ii) Deux divisions de couche inférieure que ses cas d'utilisation et ses exigences [38]. Ils se concentrent
qui séparent les fonctions RU de CU/DU (5G(B)). (iii) Deux couches en principalement sur la manière de découper l'architecture ORAN en
cascade divisées, où chaque bloc fonctionnel est séparé des autres [36]. plusieurs réseaux virtuels, prenant en charge différentes exigences de
service. La figure 7 donne un exemple de scénario de déploiement de
découpage ORAN, où certaines fonctions ORAN sont partagées entre
7) SCÉNARIOS DE DÉPLOIEMENT RAN deux tranches, telles que ORU, O DU et OCUCP, tandis que d'autres
Habituellement, le réseau de transport est composé de réseaux fonctions sont dédiées à chaque RAN. tranche, comme OCUUP.
fronthaul, midhaul et backhaul. Néanmoins, différents scénarios de En outre, dans [39], trois principaux cas d'utilisation du découpage O
déploiement peuvent être utilisés par les opérateurs de réseau. RAN sont identifiés avec leurs exigences et leurs avantages : l'assurance
Le 3GPP a identifié quatre scénarios de déploiement RAN. SLA (accord de niveau de service) de la tranche RAN, les tranches
• Emplacements RU, CU et DU séparés : Ce scénario comprend les multifournisseurs et l'optimisation de l'allocation des ressources. Par
trois réseaux de transport (fronthaul, mid haul et backhaul). La exemple, l'assurance SLA de la tranche RAN implique une interface RIC
distance entre CU et DU est de l'ordre de 0 à 10 kilomètres tandis nonRT, RIC NearRT, E2. Sur la base des exigences de la tranche, les
que celle entre DU et RU peut atteindre 20 kilomètres. • DU et CU performances de la tranche peuvent être mesurées en continu via
colocalisés : il n'y a pas de micourse dans l'interface E2. Ensuite, le RIC nonRT et le RIC NearRT peuvent affiner
ce les performances du RAN pour répondre aux SLA des tranches RAN.
scénario, puisque le DU et le CU sont colocalisés. • Pour ce faire, des modèles ML/DL peuvent être déployés sur le module
Intégration DU et RU : il n'y a pas de liaison directe dans ce scénario, NearRT RIC qui, sur la base des performances de tranche mesurées à
car DU et RU sont situés ensemble, par exemple séparés par des partir d'E2, peut ajuster le comportement RAN pour garantir les SLA de
centaines de mètres dans le même tranche.
234 VOLUME 3, 2022
Machine Translated by Google
FIGURE 7. Scénario de déploiement de la tranche ORAN.
TABLEAU 2. Comparaison entre les architectures CRAN, vRAN et ORAN.
E. UNE ÉTUDE COMPARATIVE proche des utilisateurs (MEC), quand il s'agit de vRAN et ORAN.
Dans cette soussection, nous fournissons une étude comparative • Virtualisation
entre le CRAN, le vRAN et l'ORAN à partir de diverses perspectives. et découplage des données/plans de contrôle : contrairement au C
Nous discutons des principales différences entre eux en termes de RAN, vRAN et ORAN exploitent les nouvelles technologies telles
caractéristiques dans le TABLEAU 2. que SDN et NFV pour séparer les plans utilisateur et de contrôle
Notons que nous ne considérons pas le DRAN dans notre et virtualiser les fonctions d'accès radio, respectivement. En fait,
comparaison puisque, selon [32], le DRAN est une solution efficace le découplage des plans utilisateur et de contrôle et la virtualisation
uniquement pour les réseaux 3G/4G. Cependant, il n'est pas des fonctions principales dans la partie RAN améliorent la
suffisamment évolutif pour répondre aux exigences de bande passante flexibilité et l'évolutivité de l'architecture du réseau, optimisent les
fonctions logiques de contrôle centralisées, facilitent le lancement
élevée, de faible latence et de débit de données élevé des réseaux 5G et audelà.
• Edge Support : Dans la partie RAN, les données sont traitées soit du découpage du réseau pour divers secteurs verticaux de
dans le cloud computing central soit dans le Multiaccess Edge l'industrie. • Prise en charge
Computing (MEC), qui est proche des utilisateurs mobiles [40], multifournisseurs : CRAN ne prend pas en charge le paradigme
[41]. Quant au CRAN, on distingue deux configurations multifournisseurs puisqu'aucune virtualisation des fonctions
principales : le CRAN totalement centralisé et le CRAN réseau n'est envisagée. ORAN est basé sur des normes ouvertes
partiellement centralisé [3]. Ainsi, les données sont traitées soit plutôt que sur des interfaces propriétaires et héritées, qui relient
dans des centres de données cloud pour la configuration les parties BBU et RRU.
entièrement centralisée, soit au MEC pour la configuration Cela permet aux unités de différents fournisseurs d'interagir les
partiellement centralisée. Mais les données sont traitées unes avec les autres. De même, la radio et la bande de base
VOLUME 3, 2022 235
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
Le matériel et les logiciels du vRAN peuvent être fournis par différents et cible initialement trois cas d'utilisation principaux : l'équilibrage de
fournisseurs, car le vRAN s'appuie sur la technologie NFV pour charge, les économies d'énergie et l'optimisation de la mobilité.
virtualiser ses composants architecturaux. • Dépenses d'investissement L'objectif principal est de concevoir un cadre basé sur l'IA/ML au
et d'exploitation (CAPEX et OPEX) : les coûts OPEX et CAPEX sont pris dessus de l'architecture NGRAN.
en compte lors des étapes de conception et de déploiement de • Contrôle et gestion : le contrôle, la gestion et le déploiement distribués
l'architecture RAN. Les opérateurs de réseau cherchent à réduire les des fonctions RAN améliorent principalement les performances du
deux coûts en tirant parti des infrastructures déjà déployées [42]. La réseau telles que la latence du RAN, la fiabilité des communications et
virtualisation et la prise en charge en périphérie des architectures RAN les interférences, tandis que la centralisation de la gestion du RAN
jouent un rôle essentiel dans la réduction des coûts CAPEX et OPEX. peut générer une latence importante qui pourrait avoir un impact négatif
Par conséquent, OPEX et CAPEX sont moyens dans CRAN, tandis sur les performances du réseau et en particulier les performances du
que vRAN et ORAN génèrent de faibles coûts OPEX et CAPEX [43]. • RAN.
Consommation d'énergie : Plus de 50 % de l'énergie des réseaux
cellulaires est consommée par les stations de base [44]. III. TRAVAUX BASÉS SUR L'APPRENTISSAGE PROFOND
POUR LE RAN Dans cette section, nous passons en revue les travaux basés
sur l'apprentissage profond existants traitant du RAN 4G/5G. Ensuite, nous
Ainsi, la diminution de l'énergie consommée par les stations de base a montrons comment ces travaux peuvent être réalisés audessus de
un impact significatif sur la consommation énergétique totale de la l'architecture ORAN. Plus précisément, nous discutons du bloc fonctionnel
partie RAN, ce qui permettra également de diminuer la consommation responsable à chaque niveau d'architecture (Near RT RIC, OCU, ODU et O
énergétique de tous les secteurs des TIC et en particulier des réseaux RU) ainsi que du rôle des interfaces ORAN.
cellulaires [45]. En effet, la centralisation des fonctions de réseau Pour ce faire, nous avons choisi de regrouper les travaux existants en
entraîne une diminution de la consommation d'énergie et la virtualisation fonction du module NearRT RIC auquel ils appartiennent.
des fonctions de réseau entraîne une réduction supplémentaire de la Cela inclut les trois modules Near RT RIC (cf. Fig. 5).
consommation d'énergie [44]. Par conséquent, la consommation
d'énergie du CRAN est moyenne, tandis que le vRAN et l'ORAN sont A. OPTIMISATION DE LA GESTION DES RESSOURCES Elle
faibles par rapport à celle du CRAN. couvre principalement l'allocation et l'ordonnancement des ressources radio,
l'allocation des ressources de puissance en liaison montante et descendante
• Latence : par rapport au cloud computing centralisé, la prise en charge [26], [27], [28], [29]. Cette classe de travaux considère les changements
de l'Edge computing a un impact significatif sur la réduction de la dynamiques des exigences d'accès et de services radio en termes de latence,
latence du réseau, car elle rapproche les capacités de calcul et de de débit, de fiabilité, etc.
stockage des utilisateurs mobiles [46]. Par conséquent, la latence du
réseau est élevée dans l'architecture CRAN centralisée et faible à la 1) REVUE DE LA LITTÉRATURE
fois dans le vRAN et l'ORAN. Dans [26], les auteurs ont fourni un cadre de travail basé sur le Deep
Learning pour attribuer intelligemment les ressources radio dans les réseaux 5G.
• Prise en charge de l'IA et des interfaces ouvertes et contrôleur RAN : Le cadre vise à prédire la congestion du trafic et l'état d'occupation des eNB.
par rapport au CRAN et au VRAN, l'architecture ORAN propose deux Un rapport adaptatif de liaison montante et de liaison descendante peut
nouveaux paradigmes (1) des fonctions RAN désagrégées qui alors être appliqué pour éviter la congestion du trafic.
s'exécutent en tant que VNF ; (2) la notion de contrôleur RAN intelligent Le cadre proposé implémente un modèle d'arbre profond et une mémoire
qui exécute des applications RAN telles que la gestion de la mobilité, longue à court terme (LSTM) pour prédire le trafic futur en fonction du trafic
la planification des utilisateurs, l'allocation des ressources radio, etc. actuel et passé. Le modèle arborescent utilise des couches convolutives
Cela peut être en temps quasi réel pour les applications en temps pour traiter les caractéristiques spatiales des données générées par les UE.
réel, ou en temps non réel pour les applications tolérantes aux délais Par conséquent, un mécanisme de gestion des ressources approprié peut
applications. Le contrôleur RAN est chargé d'appliquer les décisions être déployé sur la base du trafic futur prévu. De même, les auteurs ont
d'application en utilisant des interfaces ouvertes avec les fonctions abordé la question de la congestion du trafic dans [28]. Ils ont utilisé
RAN. Une caractéristique importante introduite par ORAN est l'algorithme d'apprentissage profond LSTM pour prédire la charge de trafic à
l'utilisation intensive des techniques d'apprentissage automatique, en l'eNB. Sur la base des prédictions, l'algorithme proposé exécute la politique
particulier l'apprentissage en profondeur, pour favoriser l'innovation et d'action appropriée afin d'éviter/atténuer la congestion de manière intelligente.
faciliter le déploiement d'applications RAN intelligentes capables de
répondre aux exigences de QoS des services réseau 5G et audelà
envisagés. Il convient de noter que la norme 3GPP RAN3 a récemment Dans [48], les auteurs ont étudié la gestion des ressources pour un réseau
commencé à étudier l'intégration des modèles AI/ML au RAN, dans sa d'utilisateurs de réalité virtuelle (RV) sans fil. Les utilisateurs VR communiquent
nouvelle version 17 [47]. Le groupe de travail correspondant vient de avec des réseaux de petites cellules (SCN) qui agissent comme centre de
commencer et se concentre sur les principales fonctionnalités et leurs contrôle VR. Dans le scénario considéré, les SCN collectent les informations
entrées et sorties correspondantes (surveillance des données, de suivi des utilisateurs sur le canal de liaison montante. Ensuite, les SCN
interfaces et nœuds impliqués). De plus, cette étude se concentre sur enverront, via le canal de liaison descendante, les images 3D générées avec
le RAN de nouvelle génération (NGRAN), leur audio aux utilisateurs VR.
Par conséquent, les auteurs ont fourni un schéma d'allocation des ressources
236 VOLUME 3, 2022
Machine Translated by Google
qui prend en compte à la fois les canaux de liaison descendante et de liaison allocation de puissance maxmin dans la liaison montante d'un système
montante. Ils ont d'abord formulé un jeu non coopératif où les joueurs sont MIMO (Multiple Input Multiple Output) à cellules massives. À l'aide d'un
les SCN qui cherchent à trouver une allocation de spectre optimale améliorant réseau de neurones, les auteurs ont généré un modèle d'apprentissage qui
la QoE des utilisateurs de VR en termes de délai et de débit. Un algorithme peut établir une correspondance entre les données d'entrée et la solution
d'apprentissage basé sur les réseaux d'état d'écho a ensuite été utilisé pour optimale du schéma d'allocation de puissance.
prédire la valeur QoS VR résultant de l'allocation des ressources et, par Un schéma d'allocation de ressources radio pour les réseaux véhiculaires
conséquent, atteindre un état d'équilibre de Nash (NE). a été proposé dans [52], afin d'assurer des communications V2V ultra
fiables à faible latence. Pour modéliser l'exigence de latence, les auteurs
Le défi de la planification des ressources dans la préparation du ont pris en compte à la fois la latence de transmission et la latence de file
découpage du RAN 5G tout en garantissant l'isolation des performances, les d'attente. Ils ont ensuite traité la latence de file d'attente en utilisant le
exigences de service et la dynamique du réseau (mobilité des utilisateurs et concept d'apprentissage fédéré (FL) pour permettre à chaque véhicule de
états des canaux) a été ciblé dans [27]. Les auteurs ont fourni un schéma prédire quand sa longueur de file d'attente dépasse un seuil prédéfini, c'est
intelligent de planification des ressources (iRSS) où l'idée de base est àdire dépasse la latence nécessaire [59].
d'exploiter à la fois le réseau neuronal profond (DNN) et l'apprentissage par Les résultats de la simulation ont montré que le schéma basé sur FL peut
renforcement (RL) [58]. En fait, DNN est utilisé pour gérer l'allocation de fournir des prédictions très précises et donc aider à réduire le nombre de
ressources à grande échelle de temps, tandis que RL est utilisé pour fournir véhicules avec des longueurs de file d'attente excessives.
une planification des ressources en ligne pour s'attaquer à la dynamique du Dans [53], les auteurs ont fourni un cadre basé sur RL pour la gestion
réseau à petite échelle de temps, comme les prédictions erronées et les conjointe des ressources radio et l'allocation de puissance. Il visait à trouver
événements réseau inattendus. Plus précisément, le temps est divisé en un un compromis entre la fiabilité des communications, la latence et le débit de
ensemble de fenêtres de prédiction (PW), tandis que DNN basé sur LSTM données. Ils ont d'abord formulé un problème de minimisation de puissance
est utilisé dans chaque PW pour prédire le volume de trafic pour le prochain sous des contraintes de fiabilité et de latence avant de le résoudre à l'aide
PW. De plus, à l'intérieur de chaque PW, RL basé sur l'algorithme A3C du cadre basé sur RL profond. Le cadre proposé peut prédire dynamiquement
(Asynchronous Benefit ActorCritic) est utilisé pour effectuer la planification le modèle de trafic de chaque UE, puis allouer conjointement des blocs de
des ressources en ligne. ressources (RB) et de la puissance aux UE de liaison descendante.
Dans [29], les auteurs ont abordé le défi de l'ordonnancement distribué
afin de faire face aux interférences intercellules et au manque de Bien que l'apprentissage par renforcement puisse représenter un outil
standardisation des ordonnanceurs. Ils ont proposé une approche basée sur puissant pour l'optimisation radio, il consomme énormément d'énergie au fil
l'apprentissage profond (RL) par renforcement pour sélectionner du temps. Ainsi, dans [55], les auteurs ont discuté des innovations en
dynamiquement le planificateur approprié pour chaque groupe de petites matière d'algorithmes et d'architectures pour parvenir à un apprentissage par
cellules, en fonction de la qualité du canal et des contraintes de QoS des renforcement profond (DRL) vert lors de la gestion des ressources radio
utilisateurs. Dans ce schéma, l'ordonnancement des ressources est effectué (RRM). D'un point de vue architectural, un schéma DRL distribué est proposé
de manière distribuée en utilisant l'un des deux ordonnanceurs : un pour permettre la prise de décision distribuée par les entités RRM. De plus,
ordonnanceur équitable proportionnel ou un ordonnanceur maxmin à débit un programme d'apprentissage par transfert est également conçu pour
garanti. Sur la base du RL et de la QoS expérimentée et de la qualité des étendre le programme DRL à travers les zones géographiques. Un autre
canaux des utilisateurs, un agent central est chargé d'effectuer une sélection modèle DRL est proposé pour traiter le problème de planification des
dynamique du planificateur. De même, pour minimiser les retards de paquets ressources radio dans les réseaux mobiles 5G [56]. Le modèle proposé est
et les taux d'abandon, un autre cadre d'ordonnancement basé sur RL a été indépendant de la numérologie, qui prend en charge différentes numérologies
proposé dans [49]. Ce cadre est capable non seulement de sélectionner les 5G. Une étude d'analyse des récompenses est également fournie pour
règles d'ordonnancement appropriées par cellule, mais aussi d'apprendre déduire quelles politiques le modèle DRL a apprises. De même, les auteurs
quand appliquer chaque ordonnanceur. ont traité la question de la planification des ressources radio dans les réseaux
Dans [50], les auteurs ont relevé le défi de l'allocation de puissance dans 5G, afin d'attribuer efficacement les ressources en fréquence aux utilisateurs
les réseaux cellulaires en proposant trois schémas basés sur le RL profond : mobiles [57]. Ils ont utilisé un critique de pointeur d'avantage pour implémenter
REINFORCE, Deep QLearning et le gradient de politique déterministe un agent d'apprentissage par renforcement profond. L'agent est basé sur
profond (DDPG), qui sont, respectivement, basés sur des politiques, basée une architecture de réseau à pointeur profond et déployé au niveau du RAN.
sur les valeurs et basée sur les critiques des acteurs. Les résultats expérimentaux montrent l'efficacité du schéma pour allouer des
Ces schémas visaient à maximiser le débit de somme de cellules de liaison ressources de fréquence aux utilisateurs par rapport à d'autres schémas.
descendante. Les simulations effectuées ont montré que les schémas
proposés surpassent les méthodes de l'état de l'art en termes de taux de
somme avec un bon pouvoir de généralisation. De même, un autre schéma
basé sur le Qlearning a été proposé dans [51], afin d'obtenir une politique 2) DISCUSSION ET INTÉGRATION AVEC ORAN Le TABLEAU
d'allocation de puissance quasi optimale dans un système multicellulaire. 3 illustre une étude comparative entre les travaux appartenant au module de
Ce schéma visait à maximiser le débit du réseau de liaison descendante gestion des ressources du NearRT RIC. Cette étude est établie en fonction
sous des contraintes de puissance maximale d'un groupe d'utilisateurs, du défi adressé, de l'algorithme d'apprentissage utilisé, du lien avec
partageant les mêmes bandes de fréquences. Dans le même contexte, une l'architecture ORAN au niveau du module logiciel et de ses blocs fonctionnels
autre approche basée sur l'apprentissage profond a été proposée dans [54]. où les schémas proposés peuvent être
Il visait à effectuer sumratemax et
VOLUME 3, 2022 237
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
TABLEAU 3. La gestion des ressources fonctionne audessus de l'ORAN.
appliquées, les interfaces de communication pour l'échange de trafic ces travaux concerneront principalement la couche MAC en termes
également. d'allocation et d'ordonnancement des ressources et la couche HighPHY
• Allocation des ressources radio : C'est une des fonctions principales pour fournir la puissance nécessaire au canal physique partagé lors du
téléchargement des données (PDSCH pour Physical Downlink Shared
du RAN, puisqu'elle permet aux UE d'émettre (ou de recevoir) leurs
Channel).
données tout en respectant les exigences des applications (latence,
débit, fiabilité, etc.). L'apprentissage en profondeur supervisé et par
renforcement a été utilisé pour traiter ce problème. En particulier, B. OPTIMISATION DE LA GESTION DE LA MOBILITÉ
l'algorithme LSTM est utilisé pour traiter les données séquence à Il aborde la gestion du handover des utilisateurs et de l'énergie des stations
séquence lors de la prévision de la demande de trafic dans le temps. de base, basée sur la mobilité des utilisateurs [62], [63], [64].
L'apprentissage par renforcement, quant à lui, a permis de créer des
modèles de prédiction des ressources radio basés sur la qualité des 1) REVUE DE LA LITTÉRATURE
expériences des utilisateurs mobiles [60], [61].
Dans [62], les auteurs ont ciblé le défi du transfert conditionnel qui est l'une
des améliorations prometteuses de la mobilité dans les réseaux 5G. Il
• Ordonnancement des ressources : L'ordonnanceur est chargé de
consiste à prendre des décisions de préparation en amont afin d'améliorer
définir quand chaque utilisateur peut accéder au support sans fil pour
le taux de réussite du Handover. Cependant, les communications 5G mm
envoyer (ou recevoir) ses données. Cette fonction du RAN est
Wave sont vulnérables aux blocages et, par conséquent, des changements
essentielle car, d'une part, elle permet aux utilisateurs de répondre à
soudains de la puissance du signal peuvent conduire à des préparations
leurs besoins tels que la latence ; d'autre part, il permet d'éviter les
précoces indésirables du transfert. Les auteurs ont proposé un schéma
interférences inter et intracellules.
basé sur un réseau neuronal profond (DNN) qui prend en compte le contexte
Pour y faire face, la plupart des travaux existants ont utilisé
environnemental et prédit la meilleure prochaine station de base en fonction
l'apprentissage par renforcement afin de construire des modèles de
de la puissance du signal reçu. Par conséquent, la base d'apprentissage
prédiction basés sur les retours des utilisateurs en termes de communication.
en profondeur proposée aide à prendre des décisions de préparation plus
fiabilité.
intelligentes de la procédure de transfert.
• Allocation de puissance : C'est une autre fonction importante du RAN,
Dans le même contexte, dans [63], les auteurs ont d'abord donné un
qui vise à mettre en œuvre une politique d'allocation de puissance
modèle analytique du coût du Handover dans la 5G, en termes de
quasioptimale, dans un système multicellulaire. L'apprentissage par
surcharge de signalisation, de latence, d'abandon d'appel et de gaspillage
renforcement est principalement appliqué pour maximiser le débit du
de ressources radio. Ils ont ensuite proposé un schéma de prédiction basé
réseau de liaison descendante, tout en assurant une allocation de
sur le RNN (Recurrent Neural Network) avec l'algorithme LSTM pour
puissance optimale.
minimiser davantage le coût du Handover. Il a été démontré qu'une bonne
En ce qui concerne le lien avec ORAN, nous observons que tous ces précision de prédiction du transfert peut réduire considérablement la
travaux appartiennent au module ODU puisqu'ils ciblent le défi de la gestion fonction de coût en termes d'insatisfaction de l'utilisateur, de latence HO,
des ressources (radio et puissance). Ainsi, de gaspillage de ressources et de frais généraux.
238 VOLUME 3, 2022
Machine Translated by Google
TABLEAU 4. La gestion de la mobilité fonctionne audessus de l'ORAN.
De même, l'algorithme LSTM est utilisé, dans [64], pour apprendre le pour minimiser le coût de communication de l'étape de formation.
modèle de mobilité de chaque UE à partir de ses trajectoires historiques, et Les résultats de la simulation prouvent l'efficacité du cadre par rapport aux
prédire sa prochaine mobilité dans le futur. Sur la base des résultats de schémas réactifs pour réduire les transferts inutiles. Le transfert de
prédiction de mobilité, la station de base correspondante jugera si un l'utilisateur dans le découpage du réseau 5G RAN a été traité dans [69]. Les
transfert est requis pour l'UE ou non. auteurs ont conçu une politique de transfert intelligent qui tient compte de
Si oui, une double connexion sera établie pour l'UE avec les deux stations deux contraintes principales : les ressources physiques des stations de base
de base dans l'opération de transfert. et la connexion logique des tranches de réseau. Pour ce faire, les auteurs
Dans [65], les auteurs ont étudié le défi de la consommation d'énergie ont modélisé le transfert dans le découpage RAN comme un processus de
des stations de base (BS), en particulier avec la densification des BS dans décision de Markov et ont construit un modèle d'apprentissage utilisant
l'architecture 5G. Ils ont proposé un schéma basé sur l'apprentissage par l'apprentissage par renforcement profond pour améliorer le débit du réseau
renforcement qui contrôle les états des BS tout en respectant les exigences et la qualité de service des utilisateurs.
des utilisateurs. Ils ont considéré trois niveaux de modes de veille, et Pour réduire la consommation d'énergie des stations de base, un cadre
l'algorithme choisit la profondeur à laquelle une BS peut dormir tout en de contrôle sensible au trafic est proposé dans [70], pour activer/désactiver
maximisant le compromis entre les économies d'énergie et la QoS des efficacement les stations basées sur la demande de trafic tout en
utilisateurs. garantissant les exigences de QoS des utilisateurs. À cette fin, un schéma
De même, un autre schéma basé sur RL a été proposé dans [66]. d'apprentissage basé sur les données est conçu pour prédire les demandes
Il visait à dériver un contrôleur qui active efficacement les différents modes de trafic en tenant compte de la relation spatiotemporelle sémantique et
de veille des BS en fonction de l'utilité ciblée. géographique du trafic mobile. Dans le même contexte, l'efficacité
Chaque BS utilise ses informations locales afin d'apprendre la meilleure énergétique du RAN 5G pour prendre en charge des services ultra fiables
politique d'économie d'énergie. Dans [67], un schéma basé sur à faible latence et à haut débit de données pour les UE et les stations de
l'apprentissage par renforcement profond a été proposé pour fournir une base a également été abordée dans [71].
stratégie d'activation des petites cellules (BS). Le schéma proposé active le Ce travail donne un aperçu des schémas d'économie d'énergie basés sur
sousensemble optimal de petites stations de base afin de réduire la l'apprentissage profond en lien avec les normes 5G.
consommation d'énergie sans compromettre la qualité de service des
utilisateurs. Les auteurs ont formulé le problème d'activation/désactivation 2) DISCUSSION ET INTÉGRATION AVEC ORAN Le TABLEAU
des petites BS en tant que processus de décision de Markov avant de le 4 présente une étude comparative entre les ouvrages appartenant au module
résoudre à l'aide de méthodes d'apprentissage par renforcement ActeurCritique
(AC).
de
gestion de la mobilité du NearRT RIC.
Dans [68], les auteurs ont abordé le défi du handover dans les réseaux
de véhicules à ondes millimétriques 5G. Ils ont proposé un cadre proactif • Gestion du transfert : il s'agit d'une fonction essentielle du RAN qui
basé sur l'apprentissage fédéré pour optimiser le délai de transfert et ainsi consiste à déplacer (transférer) la connexion des utilisateurs d'une
assurer la qualité de service pour les utilisateurs. Le cadre proposé permet cellule à une autre, en fonction de leur mobilité (utilisateurs), afin que
d'éviter les transferts fréquents et de décider des transferts en fonction du les utilisateurs obtiennent de meilleures conditions radio et donc une
modèle de mobilité des utilisateurs. L'apprentissage fédéré permet de meilleure expérience. Dans la littérature, les techniques
générer le modèle d'apprentissage de manière distribuée, ce qui permet d'apprentissage supervisé telles que Deep Neural Network (DNN)
sont les plus utilisées pour traiter ce problème. DNN considère
VOLUME 3, 2022 239
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
le contexte environnemental, tel que la puissance du signal reçu Le schéma de codage et de décodage basé sur DNN peut générer
des utilisateurs, puis prédit la prochaine station de base appropriée les mêmes performances que le code Hamming sans nécessiter de
vers laquelle les utilisateurs migreront. Ainsi, DNN permet des fonctions d'encodeur et de décodeur. • Classification
décisions de préparation précoce de la procédure de handover, ce des signaux : pour fournir un schéma de classification automatique
qui a pour effet de réduire le coût de handover. Dans l'architecture de la modulation (AMC) pour l'environnement et l'identification des
ORAN, la procédure de handover agira au niveau du module O émetteurs, un cadre de classification des signaux basé sur
CUCP, en particulier le bloc fonctionnel de gestion des procédures l'apprentissage en profondeur a été développé dans [75]. Le cadre
UE et gNB. est basé sur des signaux d'entrée en coordonnées polaires et est
• Énergie des stations de base : Les stations de base (BS) formé pour classer 11 types de modulation typiques. Le cadre
représentent la principale source de consommation d'énergie dans comprend deux modules principaux. Le premier est basé sur LSTM
les réseaux cellulaires. Par conséquent, l'une des principales pour la classification des signaux à un rapport signal sur bruit
fonctions du RAN est de gérer la consommation d'énergie des BS, (SNR) élevé, tandis que le second est basé sur le réseau neuronal
en particulier avec la densification des BS dans les réseaux 5G. convolutif (CNN) pour traiter les faibles SNR.
Dans un tel contexte, l'apprentissage par renforcement est le plus
appliqué pour décider quand les BS peuvent basculer entre les Enfin, comme les performances MIMO massives dépendent
modes veille et actif, tout en respectant la QoS des utilisateurs. La principalement de la qualité des messages CSI (Channel State Information)
fonction énergie de la station de base sera implémentée au niveau surveillés, les auteurs ont proposé un cadre basé sur DNN pour les
du module OCUCP de l'architecture ORAN, qui assure la gestion problèmes d'estimation de canal lors de la collecte de paquets CSI [72].
des procédures cellulaires. Les résultats de la simulation ont montré que DNN est un algorithme
Nous en déduisons que les travaux de cette classe concernent approprié pour une reconstruction CSI précise et donc pour une estimation
principalement le module OCUCP qui implémente les blocs fonctionnels de canal haute performance du MIMO massif. Le défi massif MIMO de la
de gestion des procédures UE, gNB et Cell. Ainsi, le CP OCU est en détection optimale au niveau du récepteur a également été abordé dans
charge de traiter la gestion du handover et les enjeux énergétiques des [76]. Dans ce contexte, l'algorithme de détection de vraisemblance
stations de base, qui sont principalement abordés par les travaux de cette maximale peut obtenir le taux d'erreur binaire (BER) le plus bas,
classe. cependant, la complexité de calcul augmente à mesure que le nombre
d'antennes augmente. Les auteurs ont fourni un schéma de détection
basé sur un réseau de neurones.
C. OPTIMISATION DE LA GESTION DU SPECTRE Elle
Les résultats expérimentaux ont montré que le schéma proposé peut
vise à fournir une efficacité du spectre basée sur les nouvelles
atteindre un faible BER avec une faible complexité de calcul.
technologies 5G activées, notamment Massive MIMO et mmWave [72],
Les auteurs ont proposé un algorithme d'apprentissage en ligne pour
[73], [74], [75]. Cette efficacité spectrale peut être en termes d'estimation
traiter le problème de sélection de faisceau dans les communications
de canal, d'encodage et de décodage de signal, de détection de signal
véhiculaires à ondes millimétriques [77], [78]. Le problème est modélisé
pour MIMO massif, de sélection de faisceau pour mmWave, etc.
comme un problème contextuel de bandit multiarmé, dans lequel un
agent doit sélectionner un sousensemble d'actions de récompenses
inconnues dans le but de maximiser la récompense au fil du temps. Ainsi,
1) REVUE DE LA LITTÉRATURE
cet algorithme permet aux stations de base mmWave d'apprendre de
Dans [72], les auteurs ont discuté des performances de l'apprentissage manière autonome l'apparition de blocages et les changements dans les
profond pour les problèmes suivants. • modèles de trafic afin de sélectionner le meilleur faisceau. De même, un
Estimation de canal : l'apprentissage en profondeur a été utilisé pour schéma de sélection de faisceau basé sur l'apprentissage profond a
les systèmes de multiplexage par répartition orthogonale de la également été proposé dans [79]. Il exploite le CSI d'un canal inférieur à
fréquence (OFDM) [73], où la sortie du modèle d'apprentissage en 6 GHz, en termes de profils de puissanceretard, pour choisir le faisceau
profondeur récupère les symboles d'entrée sans nécessiter de mmWave le plus approprié.
détection de canal. Plus précisément, le modèle profond prend en Pour améliorer la précision du passage de message approximatif
entrée à la fois les symboles transmis et les signaux OFDM reçus. appris (LAMP) qui est basé sur l'apprentissage en profondeur, un schéma
Le modèle profond sera ensuite formé pour minimiser la différence LAMP à mélange gaussien (GMLAMP) est proposé pour estimer le canal
entre l'entrée et la sortie du réseau. dans [80]. Les auteurs dérivent d'abord une fonction de rétrécissement
pour optimiser le schéma AMP, qui remplace ensuite la fonction de
• Encodage et décodage du signal : un DNN avec plusieurs couches rétrécissement d'origine dans le schéma LAMP. Par conséquent, un
denses a été construit pour traiter l'encodage et le décodage du schéma GMLAMP est conçu pour estimer le canal avec précision. Les
signal dans [74]. Le DNN encode les signaux transmis sous la performances du schéma proposé sont validées par simulation, par
forme d'un vecteur à chaud. Les signaux transmis via le canal sans rapport au modèle de canal théorique. De même, dans [81], l'apprentissage
fil sont ajoutés en tant que couche de bruit et sont transmis au en profondeur est utilisé pour permettre la quantification distribuée, la
récepteur basé sur NN. Enfin, les messages décodés sont les rétroaction, l'estimation de canal et le précodage multiutilisateurs en
signaux de sortie les plus probables, c'estàdire que k bits liaison descendante pour le MIMO massif.
comprennent 2k messages. Les résultats de la simulation ont Les auteurs ont proposé une conception conjointe des pilotes et un
montré que cette réseau de neurones profonds, pour transformer les pilotes reçus en rétroaction
240 VOLUME 3, 2022
Machine Translated by Google
TABLEAU 5. La gestion du spectre fonctionne audessus de l'ORAN.
bits au niveau de l'UE, tout en mappant les bits de rétroaction des UE traitent du codage, du décodage et de la classification du signal.
dans la matrice de précodage du côté des stations de base. Les résultats DNN code le signal transmis qui est ensuite acheminé vers le réseau
expérimentaux montrent que le schéma proposé peut donner les mêmes neuronal du récepteur (décodage). Un classificateur DNN peut
performances par rapport aux approches de précodage traditionnelles. également être construit pour classer les signaux dans le type de
modulation approprié. Le bloc fonctionnel PU(D)C(S)CH (Physical
Uplink (Downlink) Control (Shared) Channel) de la couche HighPHY
2) DISCUSSION ET INTÉGRATION AVEC ORAN Le est chargé d'assurer les fonctions d'encodage, de décodage et de
TABLEAU 5 compare les travaux précités de cette classe, qui visent trois classification du signal, le ORAN O Module DU.
défis principaux.
• Channel Estimation : Cette fonction permet de récupérer
le signal transmis côté récepteur, dans les systèmes OFDM, ce qui Nous voyons clairement que ces travaux ont abordé la couche physique
est très important pour la suppression des interférences. En fait, en termes de modules ODU (HighPHY) et ORU (LowPHY), car ils
l'estimation des canaux est un problème difficile dans les traitent des défis liés au spectre tels que l'estimation de canal à la
communications sans fil en raison de la sélectivité en fréquence et réception, codage et décodage des signaux, sélection des faisceaux, etc.
de la variance temporelle des canaux. Pour résoudre ce problème, Ces défis sont directement liés aux canaux de transmission (de contrôle
DNN est généralement utilisé afin de minimiser la différence entre et partagés) dans les sens montant et descendant.
les signaux envoyés et reçus. La fonction d'estimation de canal sera
assurée par le bloc fonctionnel PUCCH (Physical Uplink Control En général, pour les trois classes de travaux, nous remarquons que les
Channel) du module ORAN ODU. • Sélection du faisceau : Avec schémas d'apprentissage supervisé et par renforcement tels que DNN,
l'émergence des communications à ondes millimétriques LSTM et RL sont largement utilisés pour faire face aux défis émergents au
et directionnelles, la fonction de sélection du faisceau consiste à niveau de la gestion des ressources radio et de la couche physique. Ces
sélectionner le meilleur faisceau, garantissant des alignements algorithmes sont généralement utilisés hors ligne, c'estàdire que les
précis du faisceau entre les stations de base et les utilisateurs. modèles d'apprentissage sont générés lors d'une étape hors ligne, puis
seuls les modèles finaux sont exploités en temps réel. Cela peut affecter
L'apprentissage supervisé ou l'apprentissage par renforcement sont les performances de ces modèles pour faire face à des événements qu'ils
appliqués pour la sélection des faisceaux. L'apprentissage par ne voyaient pas auparavant, en particulier avec les changements
renforcement permet de mettre à jour le faisceau en fonction des dynamiques des réseaux cellulaires au niveau de l'accès radio.
commentaires des utilisateurs, tandis que le DNN peut aider à De plus, pour assurer le bon fonctionnement de ces travaux (les trois
prédire le meilleur faisceau en fonction du contexte environnemental, classes), l'interface O1 de l'ORAN est chargée de surveiller les types de
comme la présence d'obstacles. Dans le contexte ORAN, la couche données ciblés du module ODU, pour la formation des modèles
LowPHY du module ORU sera responsable de la fonction de d'apprentissage au niveau NonRT RIC. Nous notons que les modèles
sélection de faisceau. d'apprentissage peuvent être formés hors ligne ou en ligne au RIC non
• Encodage, décodage et classification du signal : cette fonction permet RT. Ensuite, l'inférence de modèle générée sera communiquée au Near
d'encoder le signal avant la transmission, de décoder le signal côté RT RIC via l'interface A1 afin d'être exécutée en temps réel au NearRT
récepteur et de classer automatiquement le signal dans le type de RIC. En outre, au NearRT RIC, les résultats d'inférence peuvent être
modulation correspondant. Dans ce contexte, DNN est utilisé pour comparés aux données réelles (collectées via O1) pour aider à détecter
VOLUME 3, 2022 241
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
FIGURE 8. Déploiement de l'apprentissage profond fédéré dans ORAN.
violations de gestion des ressources en temps réel, par exemple, violations Dans le contexte ORAN, des modèles locaux peuvent être construits au
de latence ou de débit. Par conséquent, cela aidera à prendre des décisions niveau ORU, où les données générées par les utilisateurs d'une cellule (ou
plus adéquates, par exemple, à définir de nouvelles politiques pour garantir d'un sousensemble de cellules) sont exploitées localement pour construire
les exigences RAN nécessaires. Enfin, le module NearRT RIC peut appliquer des modèles d'apprentissage locaux, par exemple, des modèles pour prédire
ces décisions sur les ODU via l'interface E2. les ressources radio exigences pour traiter le problème d'allocation des
ressources, ou la mobilité des utilisateurs pour relever le défi du transfert
(étape 1 de la Fig. 8). Ensuite, les modèles locaux seront transmis au module
IV. ÉTUDES DE CAS SUR LE DÉPLOIEMENT DE L'APPRENTISSAGE PROFOND Non RTRIC pour agrégation, via l'interface O1 (étape 2 sur la Fig. 8).
DANS L'ORAN L'agrégation de modèles locaux permet de générer un modèle global qui est
Dans cette section, nous donnons deux études de cas pour le déploiement envoyé au RTRIC proche pour être déployé dans la xApp associée (étape 3
du Deep Learning (DL) dans ORAN. Sur la base de la revue de la littérature, sur la Fig. 8), selon le défi ciblé (gestion des ressources radio, gestion du
deux principales catégories d'AD ont été utilisées : l'apprentissage profond spectre, gestion de la mobilité). , etc.). Ainsi, les prédictions seront
supervisé et l'apprentissage profond par renforcement. effectuées en temps quasi réel sur la base des données surveillées du
niveau ORU via les interfaces O1. Cependant, lorsque des décisions doivent
A. DÉPLOIEMENT DE L'APPRENTISSAGE PROFOND être prises pour ajuster les paramètres de xApp, par exemple, mettre à jour
SUPERVISÉ L'apprentissage supervisé a été utilisé soit de manière la politique d'allocation des ressources radio ou celle du planificateur, le Near
centralisée, soit de manière fédérée (distribuée), ce qui est une technique RTRIC envoie les décisions basées sur DL au module ORAN correspondant
récente développée par Google. L'apprentissage fédéré (FL) vise à construire (O DU ou OCU), via l'interface E2 (étape 4 de la Fig. 8).
des modèles de manière distribuée, tout en préservant la confidentialité des
apprenants et en réduisant la surcharge du réseau. FL convient à ORAN,
car ce dernier est également basé sur une architecture divisée désagrégée En outre, les données sont surveillées en continu depuis la partie ORU
et distribuée (ODU et ORU). et stockées dans la base de données via l'interface O1.
Plutôt que de partager les données dans un nœud central (par exemple, Ainsi, pour construire des modèles supervisés de manière centralisée, le
les centres de données cloud [82]), FL permet à chaque apprenant de Non RTRIC génère directement le modèle nécessaire en exploitant les
construire localement un modèle d'apprentissage en utilisant ses propres données surveillées et stockées dans la base de données, avant de les
données (d'apprenant). Ensuite, seuls les modèles locaux (c'estàdire les déployer (modèles d'apprentissage) dans les xApps de Near RTRIC
poids des modèles) sont envoyés à un nœud central pour agrégation. Une associées.
fois les modèles locaux agrégés, un modèle global est généré et renvoyé aux apprenants.
En fait, FL convient bien à l'architecture ORAN car il permet non B. DÉPLOIEMENT DE L'APPRENTISSAGE PROFOND DE RENFORCEMENT
seulement de préserver la vie privée des apprenants, en particulier dans un L'apprentissage profond par renforcement permet de déployer un agent
système multiopérateurs, mais également de réduire la surcharge du intelligent (ou un ensemble d'agents) qui apprend dans un environnement
réseau en évitant de partager et de transmettre les données requises. Dans interactif par essais et erreurs, en utilisant le retour de ses propres informations.
242 VOLUME 3, 2022
Machine Translated by Google
FIGURE 9. Déploiement de l'apprentissage en profondeur par renforcement dans ORAN.
gestes et expériences. En d'autres termes, chaque agent interagit avec avec les problèmes d'allocation et de planification des ressources radio,
son environnement et obtient soit des récompenses, soit des pénalités un agent intelligent peut prendre une mesure pour mettre à jour la politique
pour les actions qu'il effectue. Ainsi, l'apprentissage par renforcement d'allocation et de planification des ressources dans la couche MAC de l'O
vise à trouver un modèle d'action approprié pour les agents, qui DU, afin de répondre aux besoins des utilisateurs ( étape 2 sur la Fig. 9).
maximiserait leur récompense cumulée totale (des agents). Dans un Dans ce cas, la récompense peut être déterminée en fonction de la
tel contexte, les systèmes étudiés sont généralement modélisés à l'aide qualité des expériences des utilisateurs, tandis que le nouvel état du
du processus décisionnel de Markov (MDP) [83], avant d'appliquer système peut être reflété par le nombre total de blocs de ressources
alloués
l'apprentissage par renforcement pour concevoir la politique optimale en termes et la densité des utilisateurs. De cette manière, l'apprentissage
d'actions.
MDP modélise un système comme : (i) un ensemble d'états s S, (ii) par renforcement aide à concevoir une politique optimale d'affectation
un ensemble d'actions a A, (iii) une fonction de transition P(s; a;s ), et de planification des ressources tout en optimisant la qualité des
pour passer d'un état s à un nouvel état s lors d'une action a, et (iv) une expériences des utilisateurs.
fonction de récompense R(s; a) lors de l'exécution d'une action a à un Nous notons que pour DQN, le réseau neuronal prend l'état actuel
état s. comme entrée et donne la valeur Q (récompense) de toutes les actions
Dans la littérature, les algorithmes Qlearning et Deep QNetwork possibles comme sortie. Plus précisément, DQN utilise deux réseaux
(DQN) ont été utilisés pour faire face aux défis RAN. Le Qlearning est de neurones pour l'apprentissage : un réseau de prédiction Q(s ; a ; θ )
utilisé pour déterminer une politique optimale, maximisant la récompense et un réseau cible Q (s ; a ; θ ). Le réseau de prédiction est mis à jour à
totale attendue pour tout MDP fini où les espaces d'état et d'action sont chaque itération et utilisé pour évaluer l'action de l'état actuel. Le réseau
petits. Cependant, lorsque l'espace d'état et d'action devient élevé, DQN cible Q (s ; a ; θ ) est utilisé pour générer la valeur cible. Le réseau cible
est appliqué, qui est basé sur un réseau de neurones. est directement copié à partir du réseau de prédiction toutes les plusieurs
itérations (étape 4 sur la figure 9).
Les agents intelligents sont déployés au niveau du module RTRIC Ainsi, DQN vise à minimiser l'erreur quadratique moyenne (fonction de
proche de l'ORAN, afin d'améliorer les performances d'exécution des perte) entre les sorties des deux réseaux de neurones, comme suit :
xApps (étape 1 sur la Fig. 9). Ces agents interagiront avec l'environnement
externe, composé de ORU, ODU et OCU. En tant que système MDP,
ces agents prendront périodiquement des mesures pour optimiser les
L = r + λmax Q (s , un , ) − Q(s, a,i)2 (1)
performances du RAN, via l'interface E2 (étape 2 sur la Fig. 9). Ensuite, un A
via l'interface O1, les agents recevront la récompense obtenue et le
nouvel état du système (étape 3 sur la Fig. 9). Par exemple, pour traiter où θ représente les poids d'apprentissage du réseau Q, qui est mis à
jour par rétropropagation de gradient [84]. r
VOLUME 3, 2022 243
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
FIGURE 10. Processus ML manuel dans ORAN.
est la récompense reçue. λ est le facteur d'actualisation qui indique former de nouveaux modèles ou mettre à jour des modèles existants, compte tenu de nouveaux
l'importance des récompenses futures. profils de données.
Il est à noter que ce déploiement d'automatisation ne concerne que
les modèles d'apprentissage supervisé qui sont habituellement construits
V. AUTOMATISATION DE TOUTES LES ÉTAPES DE LA
au niveau du module ORAN Non RTRIC et déployés au niveau du
CONSTRUCTION D'UN SYSTÈME D'APPRENTISSAGE
module Near RTRIC. Dans ce qui suit, nous décrivons deux niveaux de
MACHINE DANS O RAN . Cependant, le véritable défi, dans un tel MLOps, le niveau le plus basique (pas d'automatisation) et l'automatisation
contexte, est de savoir comment construire des modèles ML qui de tous les niveaux de processus ML.
garantissent des performances stables tout au long de leur cycle de vie.
En effet, les performances des modèles ML peuvent être dégradées en A. PROCESSUS MLOPS MANUEL DANS ORAN (NIVEAU 1)
raison principalement des profils de données en constante évolution
C'est le niveau de maturité de base, où l'ensemble du processus de ML
[85], une telle dégradation doit donc être prise en compte pour assurer
en termes de création et de déploiement de modèles d'apprentissage
le bon fonctionnement des applications RAN. Par conséquent, il y a un
est manuel. La figure 10 montre les principales étapes de ce processus
grand besoin non seulement de surveiller en continu à la fois les profils
qui sont exécutées au niveau du module non RTRIC de l'ORAN.
de données et les performances en ligne des modèles déployés, mais
Chaque étape est exécutée manuellement, y compris la préparation des
également d'automatiser toutes les étapes de la construction du système
données, la formation du modèle et la validation. Ce niveau est basé sur
d'apprentissage en profondeur, y compris la préparation des données, la
une transition manuelle d'une étape à l'autre, et piloté par le code source
formation des modèles, l'évaluation et la validation [86].
qui est réalisé de manière interactive, jusqu'à ce qu'un modèle exécutable
soit construit et déployé au niveau du module Near RTRIC, via l'interface
A1.
Cette section explique comment appliquer les principes DevOps1 aux
En pratique, le processus manuel correspond aux modèles ML qui
systèmes ML (MLOps) afin d'unifier le développement du système ML
sont rarement mis à jour, ce qui n'est pas le cas avec les changements
(Dev) et l'exploitation du système ML (Ops) [86]. En fait, le niveau
dynamiques du RAN sans fil. En particulier, les performances des
d'automatisation des étapes de ML reflète la vitesse de
modèles ML du RAN peuvent se dégrader en raison soit de changements
dans la dynamique de l'environnement d'accès radio, soit de
1. Il s'agit d'une pratique courante dans la conception, le développement et l'exploitation
changements dans les profils de données décrivant l'environnement.
de systèmes logiciels. Il repose principalement sur deux concepts d'intégration continue (CI)
et de livraison continue (CD), pour apporter des avantages tels que la réduction des cycles Ainsi, l'introduction de l'automatisation dans le processus du système
de développement, l'augmentation de la vitesse de déploiement, etc. ML pour la partie RAN est plus que nécessaire.
244 VOLUME 3, 2022
Machine Translated by Google
FIGURE 11. Automatisation du processus ML dans ORAN.
B. PROCESSUS MLOPS D'AUTOMATISATION DANS ORAN (NIVEAU 2) un ou plusieurs déclencheurs de pipeline ML. Le pipeline attend des
Ce niveau vise à automatiser le processus du système ML, en effectuant données fraîches et nouvelles pour construire de nouveaux
une surveillance continue des performances des modèles et de la formation modèles. Par conséquent, une phase de validation automatisée des
des modèles ; cela assurera alors une fourniture continue de service de données et des modèles est nécessaire. D'une part, la validation des
prédiction de modèle. Nous notons que le module Non RTRIC peut données est nécessaire pour décider si l'exécution du pipeline doit
surveiller les performances des modèles ML déployés à partir du Near RT être interrompue ou si les modèles doivent être recyclés. Dans ce
RIC via l'interface A1, afin de permettre une telle automatisation du contexte, les modèles doivent être réentraînés pour deux raisons
processus ML. principales : (i) biais du schéma de données, lorsque le pipeline
Pour automatiser le processus de prise en compte de nouvelles reçoit des données qui ne correspondent pas à celles attendues,
données pour mettre à jour les modèles déployés, des phases automatisées comme la réception de nouvelles fonctionnalités, toutes les
de validation de nouvelles données et de modèles, ainsi que des fonctionnalités attendues ne sont pas reçu, ou recevoir des valeurs inattendues d
déclencheurs de processus et la gestion des métadonnées sont introduits Par conséquent, le pipeline ML doit être arrêté et l'équipe de
dans le processus ML. La figure 11 illustre le processus ML automatisé. développeurs doit le mettre à jour pour résoudre ces problèmes. (ii)
Les principales caractéristiques et éléments biais dans les valeurs des données, lorsque les propriétés
de ce niveau sont décrits comme suit. • Formation continue (CT) des statistiques des données et leurs modèles sont modifiés. Dans ce
modèles : les modèles sont automatiquement formés en exploitant cas, les modèles doivent être recyclés pour tenir compte de ces
les nouvelles données et changements. D'autre part, une fois les nouveaux modèles formés,
en fonction des déclencheurs du pipeline ML. • Livraison continue (CD) l'étape de validation intervient pour les évaluer et les valider avant
de modèles : le pipeline ML produit en continu des services de de les déployer. • Gestion des métadonnées : Pour
prédiction de nouveaux modèles entraînés basés sur de nouvelles aider au débogage des erreurs et des anomalies. Les métadonnées
données. L'étape de enregistrent des informations sur chaque exécution de pipeline ML,
déploiement du modèle est automatisée. • Déploiement du pipeline : au y compris les arguments de paramètre du pipeline et de son
niveau manuel, seul un modèle formé est déployé pour fournir un exécuteur, l'horodatage de l'exécution du pipeline en termes de date
service de prédiction. Pour le niveau automatisé, un pipeline de de début et de fin de chaque étape exécutée, des pointeurs vers les
formation complet est déployé, qui s'exécute automatiquement pour sorties de chaque étape du pipeline ainsi quant aux modèles
fournir un service de prédiction précédemment construits, si le retour aux modèles précédents sera
via un modèle formé. • Validation des données et des modèles : lorsque nécessaire, etc.
le pipeline ML est déployé, il commence à s'exécuter automatiquement, en fonction de
VOLUME 3, 2022 245
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
• Déclencheurs de pipeline ML : l'exécution du pipeline ML peut être Violations des SLA. De plus, pour assurer l'isolation des tranches de réseau,
automatisée pour mettre à jour (réentraîner) les modèles en fonction une partition sécurisée des bases de données NonRT RIC et NearRT RIC
de plusieurs cas d'utilisation : (i) À la demande, lorsque le pipeline doit être dédiée à chaque tranche de réseau. Cela permet de construire soit
est exécuté de manière manuelle et ad hoc. (ii) De manière des modèles AI/DL propres à chaque tranche de réseau, soit un modèle
programmée, lorsque le pipeline est alimenté par de nouvelles global agrégeant des modèles de tranches de réseau, en utilisant, par
données, qui sont systématiquement disponibles. (iii) Disponibilité exemple, l'apprentissage fédéré distribué [90].
de nouvelles données, lorsque de nouvelles données sont Dans ce contexte, un groupe de travail sur la tâche de découpage a
disponibles de manière ad hoc. (iv) Sur la dégradation des commencé à examiner ces préoccupations, et donc à soutenir les NS dans
l'architecture ORAN [6].
performances des modèles. Et (v) les distributions de données changent.
VI. PROBLÈMES OUVERTS ET ORIENTATIONS DE C. PROBLÈMES D'INTÉGRATION SON ET MEC Les
RECHERCHE
fonctions de réseau autoorganisé (SON) consistent en un ensemble de
FUTURES Le développement de l'architecture ORAN en est encore à ses fonctions qui visent à fournir une autooptimisation de la gestion RAN [91].
débuts. Malgré les diverses nouvelles fonctionnalités qu'elle offre, de Ces fonctions concernent principalement le contrôle de la capacité et de la
nombreux défis critiques sont à relever et à considérer avant de déployer couverture du réseau, la QoS, les interférences et la consommation d'énergie.
une telle architecture. Dans ce qui suit, nous discutons de certains de ces SON a été déployé dans les réseaux 4G [91]. Ainsi, il est également essentiel
défis en plus des orientations de recherche futures. de prendre en compte les fonctions SON dans l'architecture ORAN et de les
déployer dans les réseaux 5G. En fait, les fonctions SON sont basées sur
des boucles de rétroaction périodiques. Par conséquent, ces fonctions
A. PROBLÈMES DE SÉCURITÉ LIÉS AU DÉPLOIEMENT O
peuvent être déployées à la fois sur le RIC non RT d'ORAN pour créer des
RAN Désagréger les principales fonctions du RAN et les mettre en œuvre modèles AI/DL et sur le RIC proche RT, pour surveiller le RAN et permettre
dans un logiciel augmente le risque de surface d'attaque et de menace du l'automatisation de sa gestion. De plus, le RIC non RT peut également
réseau. Ericsson vient de fournir une étude approfondie sur les principaux orchestrer les services SON.
problèmes de sécurité de l'architecture ORAN, y compris l'augmentation de
la surface des menaces via les nouvelles interfaces ; par exemple, A1, open Même la norme 3GPP ne conçoit aucune architecture détaillée de SON ;
fronthaul, E2, etc., menaces nouvellement introduites au niveau du RIC cependant, des travaux sont en cours sur le 5G SON pour gérer la gestion
NearRT, une menace pour Trust Chain lors du découplage du matériel [87]. du réseau 5G de bout en bout [92].
Ces menaces peuvent affecter directement les performances des blocs
fonctionnels basés sur l'apprentissage en profondeur. Par exemple, cette D'autre part, ETSI Multiaccess Edge Computing (MEC) consiste à
architecture divisée ouvre le risque d'attaques ManintheMiddle sur déployer des capacités de calcul et de stockage à proximité des UE, et ainsi
l'interface frontale ouverte. Ainsi, un adversaire peut manipuler le trafic de réduire la latence du réseau [93]. Pour ce faire, il (MEC) exploite
gestion et de contrôle échangé entre les modules O RU et ODU. Cela peut principalement les informations contextuelles RAN pour permettre des
affecter la précision des modèles d'apprentissage puisqu'ils sont construits applications sensibles au temps et de redirection du trafic, fournir des API
sur la base de ce trafic. Par conséquent, des mesures de sécurité doivent orientées services telles que les conditions radio et les contextes de
être mises en œuvre pour faire face aux risques de menace liés au localisation des utilisateurs, etc. Par conséquent, il existe un grand besoin
déploiement de l'ORAN. de MEC efficace. et l'intégration ORAN afin de permettre la gestion liée au
MEC. Il convient de noter que MEC a été défini pour les réseaux 4G ;
Dans ce contexte, un groupe de travail sur la sécurité ORAN a commencé cependant, son intégration avec le réseau 5G est toujours en cours.
à traiter ces problèmes de sécurité afin de s'assurer que le déploiement O
RAN répondra au niveau de sécurité attendu par l'industrie [88]. De plus, des En fait, étant donné que MEC vise à fournir un réseau à faible latence, les
solutions récentes ont commencé à tirer parti de la technologie Blockchain, hôtes MEC peuvent agir au niveau du RIC proche de la RT de l'ORAN. De
afin de sécuriser et de gérer l'authentification et l'accès au réseau entre des plus, les bases de données ORAN peuvent intégrer le stockage des bases
entités de réseau sans confiance [89]. Cela représente une solution de données MEC, le service d'information sur le réseau radio (RNIS), les
prometteuse pour l'architecture ORAN, notamment avec ses fonctions performances des cellules, les emplacements des utilisateurs, etc. [94]. De
désagrégées et sa gestion décentralisée. plus, le NonRT RIC (orchestrateur ORAN) peut également orchestrer les
applications de périphérie mobile.
B. PROBLÈMES D'INTÉGRATION DE DÉCOUPAGE DE RÉSEAU D. PROBLÈMES D'APPRENTISSAGE DISTRIBUÉ EN LIGNE ET
L'architecture ORAN devrait prendre en charge le découpage de réseau PRÉSERVANT LA VIE PRIVÉE
(NS), ce qui permettra la création de plusieurs tranches de réseau adaptées En fait, l'architecture ORAN est adoptée pour créer des modèles DL hors
pour répondre à diverses exigences. Ainsi, l'intégration de NS peut avoir un ligne dans le RIC non RT avant de les déployer sur le RIC NearRT.
impact sur ORAN de différentes manières. L'orchestrateur ORAN (SMO) Cependant, plusieurs défis liés au RAN, tels que l'allocation et la planification
doit être configuré pour prendre en compte le modèle de tranche de réseau. des ressources radio, nécessitent de générer des modèles DL en ligne et en
Ensuite, les prédictions effectuées par les modèles AI/DL, au RIC proche de temps réel, en utilisant, par exemple, l'apprentissage en profondeur par
la RT, doivent être comparées aux exigences des tranches afin d'anticiper les renforcement. Cela permet de les adapter (modèles d'apprentissage) en
fonction des changements dynamiques de la radio
246 VOLUME 3, 2022
Machine Translated by Google
et des informations contextuelles, y compris la mobilité et l'énergie des réduire le coût du réseau. L'auteur a également mentionné plusieurs cas
utilisateurs, le débit et la latence nécessaires, etc. Dans un tel contexte, les d'utilisation du partage RAN, y compris le partage MEC, le partage d'énergie,
modèles DL en ligne doivent être intégrés dans le NearRT RIC en tant que le partage du spectre et du fronthaul, etc. Par conséquent, ces techniques
xApp, pour être en charge de la construction et de la mise à jour des de partage de réseau peuvent être exploitées dans le contexte ORAN, afin
modèles temps réel. Cette intégration est déjà visible pour les acteurs de non seulement d'assurer un fonctionnement efficace. fractionnement, mais
l'alliance ORAN, mais elle doit être renforcée. aussi pour permettre une efficacité énergétique de la partie RAN.
Par ailleurs, la désagrégation des fonctions RAN, leur mise en œuvre
dans le logiciel et l'architecture distribuée divisée (ODU, ORU) ont motivé
VII. CONCLUSION
l'utilisation de modèles distribués d'apprentissage en profondeur, tels que
Cet article passe en revue les travaux basés sur l'apprentissage profond
Federated Learning (FL) [16], [90 ].
proposés pour améliorer la partie 5G RAN et comment elle peut être intégrée
Comme mentionné précédemment, FL préserve la confidentialité des
à l'architecture ORAN activée par l'IA. ORAN Alliance vise à transformer le
apprenants en ne partageant que leurs modèles locaux plutôt que leurs
RAN en un système intelligent, ouvert et interopérable, en désagrégeant les
données confidentielles. Cette technique d'apprentissage correspond
largement à l'architecture ORAN, par exemple, pour assurer l'isolation des fonctions RAN traditionnelles, en fournissant leur implémentation logicielle et
en les connectant à l'aide d'interfaces standardisées et ouvertes.
tranches en cours d'exécution audessus de l'ORAN.
E. PRÉOCCUPATIONS DE CONVERGENCE ET D'ÉVOLUTIVITÉ DES Nous avons d'abord fourni une introduction générale sur l'évolution des
TECHNIQUES D'APPRENTISSAGE architectures RAN vers la 5G, y compris l'architecture RAN ouverte et ses
composants. Nous les avons également comparés en fonction de diverses
Comme mentionné précédemment, l'architecture distribuée fractionnée (O
perspectives, telles que la prise en charge de la périphérie, la virtualisation,
DU et ORU) de l'ORAN nécessite l'utilisation de techniques d'apprentissage
le contrôle et la gestion, la consommation d'énergie et la prise en charge de
distribuées et multiagents. Cependant, la convergence de telles techniques
l'IA. Ensuite, nous avons examiné les travaux RAN existants basés sur
est un problème difficile, où ces techniques doivent converger efficacement
l'apprentissage en profondeur, en plus de la manière dont ils peuvent être
et rapidement pour éviter toute situation d'instabilité [95]. Dans un tel contexte,
intégrés dans l'architecture ORAN émergente. De plus, nous avons montré
des techniques de démarrage rapide peuvent être utilisées, ce qui permet
deux études de cas sur le déploiement de l'apprentissage en profondeur
d'accélérer la convergence des schémas d'apprentissage [96]. De plus,
dans ORAN, ainsi que la façon dont les principales étapes du processus
comme le nombre d'entités ORAN (ODU et ORU) a tendance à augmenter
d'apprentissage en profondeur peuvent être automatisées, pour garantir des
et que presque toutes les fonctions RAN deviennent intelligentes sur la base
performances acceptables par les modèles d'apprentissage déployés. Enfin,
de modèles ML/DL, l'évolutivité des schémas d'apprentissage et de
nous avons discuté des principaux défis ouverts et des orientations de
l'architecture ORAN doit être abordée sur une base spécifique.
recherche futures sur l'architecture ORAN et l'utilisation de techniques
d'apprentissage en profondeur dans une telle architecture.
En tant que travaux futurs, nous travaillons au déploiement d'algorithmes
F. PRÉOCCUPATIONS ÉNERGÉTIQUES AVEC LA DIVISION DES d'apprentissage en profondeur dans ORAN en tant que preuve de concept,
en utilisant à la fois la plateforme Open Air Interface et le logiciel open
source ORAN, Amber.
FONCTIONS DE L'ORAN Avec l'impulsion croissante de l'architecture O
RAN, assurer une division efficace des fonctions dans l'ORAN, tout en LES RÉFÉRENCES
réduisant la consommation d'énergie du matériel et des logiciels RAN devient [1] W. Saad, M. Bennis et M. Chen, « Une vision des systèmes sans fil 6G :
très important. En effet, l'efficacité énergétique joue un rôle essentiel dans le applications, tendances, technologies et problèmes de recherche ouverts »,
processus décisionnel des réseaux cellulaires, en raison de l'augmentation IEEE Netw., vol. 34, non. 3, pp. 134–142, mai/juin. 2020.
[2] F. Tariq, MRA Khandaker, K.K. Wong, MA Imran, M. Bennis et M. Debbah, «
considérable de leur coût et de leur empreinte carbone causée par la forte
Une étude spéculative sur la 6G », IEEE Wireless Commun., vol. 27, non.
demande de données et la densification des réseaux. Dans un tel contexte, 4, p. 118–125, août 2020.
tirer parti des sources d'énergie renouvelables au niveau du RAN est une [3] MA Habibi, M. Nasimi, B. Han et HD Schotten, « Une étude complète des
architectures RAN vers le système de communication mobile 5G », IEEE
approche prometteuse pour optimiser la consommation d'énergie du matériel Access, vol. 7, pages 70371–70421, 2019.
et des logiciels du RAN. [4] A. Ksentini et N. Nikaein, "Vers l'application du découpage réseau sur RAN :
Cependant, les gestionnaires de réseaux doivent optimiser l'utilisation de flexibilité et abstraction des ressources", IEEE Commun. Mag., vol. 55, non.
6, p. 102–108, juin 2017.
l'énergie puisqu'ils doivent stocker cette énergie dans des batteries limitées [5] A. Marotta, D. Cassioli, K. Kondepu, C. Antonelli et L. Valcarenghi, «
en capacité. De plus, les énergies renouvelables sont intermittentes et Exploitation de la répartition fonctionnelle flexible dans les réseaux d'accès
définis par logiciel convergés », IEEE/OSA J. Opt. Commun. Netw., vol. 11,
l'approvisionnement n'est pas toujours garanti [97]. Par conséquent, sous
non. 11, p. 536–546, novembre 2019.
l'instabilité des énergies renouvelables et la nature dynamique des réseaux [6] « ORAN : vers un RAN ouvert et intelligent », ORAN Alliance, Alfter,
sans fil, un fractionnement fonctionnel efficace dans l'ORAN vert devient un Allemagne, Rép., octobre 2018.
[7] S. Abeta, T. Kawahara, A. Umesh et R. Matsukawa, « Tendances de
besoin critique qui peut être traité par des schémas d'apprentissage
normalisation de l'Alliance ORAN », NTT DOCOMO Technol. J., vol. 21, p.
automatique/profond, en particulier des techniques d'apprentissage par 38–45, juil. 2019.
renforcement [20]. . Par ailleurs, les techniques de partage de réseau [8] « Alliance ORAN, communauté logicielle ORAN ». Avr. 2019.
représentent également des candidats idéaux pour assurer l'efficacité [En ligne]. Disponible : https://ORANsc.org/
[9] « Architecture et interfaces RAN de nouvelle génération définies par
énergétique de l'ORAN. Dans [98], l'auteur a discuté de l'adoption de telles l'opérateur ». [En ligne]. Disponible : https://www.ORAN.org/ (consulté le 12
techniques pour les réseaux 5G, pour février 2020).
VOLUME 3, 2022 247
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
[10] RT Rodoshi et W. Choi, "Une enquête sur les applications de l'apprentissage en [33] "CRAN la route vers le papier blanc RAN vert," China Mobile Res. Inst., China Mobile,
profondeur dans le réseau d'accès radio cloud", IEEE Access, vol. 9, p. 61972–61997, Pékin, Chine, Rep. MSUCSE062, oct. 2011.
2021.
[11] W. Ejaz, SK Sharma, S. Saadat, M. Naeem, A. Anpalagan et NA Chughtai, "Une enquête [34] X. Wang et al., "Réseau d'accès radio cloud virtualisé pour le transport 5G", IEEE
complète sur l'allocation des ressources pour le CRAN dans les réseaux 5G et au Commun. Mag., vol. 55, non. 9, p. 202–209, septembre 2017.
delà", J. Netw . Calcul. Appl., vol. 160, juin 2020, art. Non. 102638.
[35] « Transport network support of IMT2020/5G », UIT, Genève,
[12] AS Abdalla, PS Upadhyaya, VK Shah et V. Marojevic, « Toward next generation open Suisse, Rép. GSTRTN5G, 2018.
radio access networkwhat ORAN can and not do ! 2021, arXiv:2111.13754. [36] « Spécification technique groupe réseau d'accès radio ; étude sur les nouvelles
technologies d'accès radio : architecture et interfaces d'accès radio »,
[13] S. Niknam et al., "Intelligent ORAN pour audelà de la 5G et de la 6G sans fil 3GPP, Sophia Antipolis, France, 3GPP Rep. TR 38.801, 2017. [37] « Série
réseaux », 2020, arXiv:2005.08374. 475 (ngRAN ; interface F1), 3GPP Release 15 », 3GPP, Sophia Antipolis, France, 3GPP
[14] A. GarciaSaavedra et X. CostaPérez, « ORAN : Perturbation de l'écosystème RAN Rep. TS 38.470, 2017.
virtualisé », IEEE Commun. Rester. Mag., vol. 5, non. 4, p. 96–103, décembre 2021. [38] "ORAN Slicing Architecture 5.0—juillet 2021 (ORAN.WG1.
TranchageArchitecturev05.00). » [En ligne]. Disponible : https://www.O RAN.org/
[15] H. Kumar, V. Sapru et SK Jaisawal, "Optimisation ANR proactive basée sur ORAN", specifications (consulté le 29 décembre 2021).
dans Proc. Ateliers IEEE Globecom (GC Wkshps, Taipei, Taïwan, 2020, pp. 1–4.
[39] "ORAN Slicing Architecture 4.0—Mars 2021 (ORAN.WG1.
TranchageArchitecturev04.00). » [En ligne]. Disponible : https://www.O RAN.org/
[16] PEI Rivera, S. Mollahasani et M. ErolKantarci, "Apprentissage en équipe multiagents specifications (consulté le 30 décembre 2021).
dans les réseaux d'accès radio ouverts virtualisés désagrégés (ORAN)", 2021, arXiv:
[40] B. Brik et A. Ksentini, "Vers un dimensionnement optimal des ressources MEC pour un
2012.04861 .
système anticollision de véhicule : une approche d'apprentissage en profondeur",
[17] SK Singh, R. Singh et B. Kumbhani, "L'évolution du réseau d'accès radio vers le RAN IEEE Netw., vol. 35, non. 3, pp. 74–80, mai/juin. 2021.
ouvert : défis et opportunités", dans Proc. Communication sans fil IEEE. Réseau Conf.
[41] A. Ksentini et B. Brik, « Un service de détection de la distance sociale basé sur la
Workshops (WCNCW), Séoul, Corée du Sud, 2020, pp. 1–6.
périphérie pour atténuer la propagation du COVID19 », IEEE Internet Things Mag.,
vol. 3, non. 3, p. 35–39, septembre 2020.
[18] W. Diego, « Evolution vers le réseau d'accès radio de nouvelle génération », dans Proc.
[42] A. Checko et al., "Cloud RAN pour les réseaux mobiles Un aperçu de la technologie",
Réseau IFIP Conf. (Mise en réseau), Paris, France, 2020, pp. 685–685.
IEEE Commun. Enquêtes Tuts., vol. 17, non. 1, pp. 405–426, 1er quart., 2015.
[19] C.L. I, S. Kuklinskí et T. Chen, "Une perspective d'intégration ORAN avec MEC, SON
[43] "CRAN la route vers le RAN vert," China Mobile Res. Inst., China Mobile, Pékin, Chine,
et le découpage du réseau à l'ère 5G", IEEE Network, vol. 34, non. 6, p. 3–4, nov./déc.
Rép., octobre 2011.
2020, doi : 10.1109/MNET.2020.9277891.
[44] J. Lorincz, T. Garma et G. Petrovic, "Mesures et modélisation de la consommation
d'énergie des stations de base sous des charges de trafic réelles", Sensors, vol. 12,
[20] T. Pamuklu, M. ErolKantarci et C. Ersoy, « Fractionnement des fonctions dynamiques
non. 4, pages 4281–4310, 2012.
basé sur l'apprentissage par renforcement dans les RAN ouverts verts désagrégés »,
2021, arXiv: 2012.03213. [45] N. Carapellese, A. Pizzinat, M. Tornatore, P. Chanclou et S. Gosselin, « Une comparaison
de la consommation d'énergie de différentes architectures d'accès optique mobile
[21] K. Boutiba, A. Ksentini, B. Brik, Y. Challal et A. Balla, « NRflex : Enforcing network slicing
backhaul et fronthaul », dans Proc . EUR.
in 5G new radio », Comput. Commun., vol. 181, p. 284–292, janvier 2022.
Conf. Opt. Commun. (ECOC), Cannes, France, 2014, pp. 1–3.
[46] U. Fattore, M. Liebsch, B. Brik et A. Ksentini, "AutoMEC : prédiction de la mobilité des
[22] P. Trakadas et al., « Une approche architecturale de réseau non public 5G rentable :
utilisateurs basée sur LSTM pour la gestion des services dans les ressources MEC
concepts et catalyseurs clés, blocs de construction et cas d'utilisation potentiels »,
distribuées", dans Proc . 23e Int. ACM Conf. Modèle. Anal. Simul.
Sensors, vol. 21, non. 16, p. 5578, 2021.
Wireless Mobile Syst., New York, NY, ÉtatsUnis, 2020, pp. 155–159.
[23] M. Polese, L. Bonati, S. D'Oro, S. Basagni et T. Melodia, "ColO RAN : Développer des
xApps basées sur l'apprentissage automatique pour le contrôle en boucle fermée RAN [47] "Intelligence artificielle et apprentissage automatique 3GPP, version 17." Juin 2021.
ouvert sur des platesformes expérimentales programmables", 2021 , arXiv:2112.09559. [En ligne]. Disponible : https://www.3gpp.org/news events/2201ai_ml_r3 (consulté le
31 décembre 2021).
[24] L. Bonati, S. D'Oro, M. Polese, S. Basagni et T. Melodia, "Intelligence et apprentissage [48] M. Chen, W. Saad et C. Yin, "Réalité virtuelle sur les réseaux sans fil : modèle de qualité
dans ORAN pour les réseaux cellulaires NextG pilotés par les données", IEEE de service et gestion des ressources basée sur l'apprentissage", IEEE Trans .
Commun . Mag., vol. 59, non. 10, p. 1011 21–27, oct. 2021. Commun., vol. 66, non. 11, p. 5621–5635, novembre 2018.
[25] H. Lee, J. Cha, D. Kwon, M. Jeong et I. Park, "Hébergement des workflows AI/ML sur la [49] I. Com¸sa et al., "Vers la 5G : une solution de planification basée sur l'apprentissage par
plateforme ORAN RIC", dans Proc . Ateliers IEEE Globecom (GC Wkshps, Taipei, renforcement pour la gestion du trafic de données", IEEE Trans. Réseau Gestion des
Taïwan, 2020, pp. 1–6. services, vol. 15, non. 4, p. 1661–1675, décembre 2018.
[26] MS Hossain et G. Muhammad, "Une distribution de ressources radio basée sur un [50] F. Meng, P. Chen, L. Wu et J. Cheng, "Allocation de puissance dans les réseaux
modèle d'arborescence profonde pour les réseaux 5G", IEEE Wireless Commun., vol. cellulaires multiutilisateurs : Approches d'apprentissage par renforcement profond",
27, non. 1, p. 62–67, février 2020. IEEE Trans. Communication sans fil., vol. 19, non. 10, p. 6255–6267, octobre 2020.
[27] M. Yan, G. Feng, J. Zhou, Y. Sun et Y.C. Liang, "Ordonnancement intelligent des [51] KI Ahmed et E. Hossain, "Une méthode d'apprentissage Q en profondeur pour l'allocation de
ressources pour le découpage du réseau d'accès radio 5G", IEEE Trans. puissance en liaison descendante dans les réseaux multicellulaires", 2019, arXiv: 1904.13032.
Véh. Technol., vol. 68, non. 8, pages 7691–7703, août 2019. [52] S. Samarakoon, M. Bennis, W. Saad et M. Debbah, "Apprentissage fédéré distribué pour
[28] Y. Zhou, ZM Fadlallah, B. Mao et N. Kato, "Une technique d'attribution de ressources des communications véhiculaires ultrafiables à faible latence", IEEE Trans. Commun.,
radio basée sur l'apprentissage en profondeur pour les réseaux ultra denses 5G", IEEE vol. 68, non. 2, p. 11461159, fév. 2020.
Netw., vol. 32, non. 6, pp. 28–34, nov./déc. 2018.
[29] J. Hall, K. Moessner, R. MacKenzie, F. Carrez et CH Foh, "Gestion dynamique du [53] ATZ Kasgari et W. Saad, "Communication ultra fiable à faible latence (URLLC) sans
planificateur utilisant l'apprentissage en profondeur", IEEE Trans. modèle : un cadre d'apprentissage par renforcement profond", dans Proc. IEEE Int.
Conn. Commun. Netw., vol. 6, non. 2, p. 575–585, juin. 2020. Conf. Commun. (ICC), Shanghai, Chine, 2019, pp. 1–6.
[30] H. Raza, "Une brève étude de l'évolution du réseau d'accès radio : Partie II", IEEE
Commun. Mag., vol. 51, non. 5, p. 170–177, mai 2013. [54] C. D'Andrea, A. Zappone, S. Buzzi et M. Debbah, "Contrôle de puissance de liaison
[31] E. Dahlman, S. Parkvall, J. Skold et P. Beming, 3G Evolution : HSPA et LTE pour le haut montante dans le MIMO massif sans cellule via l'apprentissage en profondeur", dans Proc .
débit mobile, 2e éd. Boston, MA, ÉtatsUnis : universitaire, 2008. IEEE 8e Int. Atelier Informatique. Adv. MultiSens. Adapter. Processus.
(CAMSAP), Le Gosier, Guadeloupe, 2019, pp. 554–558.
[32] IA Alimi, AL Teixeira et PP Monteiro, « Vers un frontal optique CRAN efficace pour les [55] Z. Du, Y. Deng, W. Guo, A. Nallanathan et Q. Wu, "Apprentissage par renforcement
futurs réseaux : un didacticiel sur les technologies, les exigences, les défis et les profond vert pour la gestion des ressources radio : architecture, compression
solutions », IEEE Commun . d'algorithmes et défis", IEEE Veh . Technol. Mag., vol. 16, non. 1, p. 29–39, mars 2021.
Enquêtes Tuts., vol. 20, non. 1, p. 708–769, 1er quart., 2018.
248 VOLUME 3, 2022
Machine Translated by Google
[56] F. AlTam, N. Correia et J. Rodriguez, "Apprendre à planifier (LEASCH): Une approche [76] Z. Jia, W. Cheng et H. Zhang, "Un schéma de détection basé sur l'apprentissage partiel
d'apprentissage par renforcement profond pour la planification des ressources radio dans pour le MIMO massif", IEEE Wireless Commun. Lett., vol. 8, non. 4, p. 1137–1140, août
la couche MAC 5G", IEEE Access, vol . 8, pages 108088–108101, 2020. 2019.
[77] A. Asadi, S. Müller, GH Sim, A. Klein et M. Hollick, "FML : Apprentissage automatique rapide
[57] F. ALTam, A. Mazayev, N. Correia et J. Rodriguez, "Ordonnancement des ressources radio pour les communications véhiculaires 5G mmWave", dans Proc. IEEE INFOCOM Conf.
avec réseaux de pointeurs profonds et apprentissage par renforcement", dans Proc. IEEE Calcul. Commun., Honolulu, HI, ÉtatsUnis, 2018, p. 1961–1969.
25e Int. Modèle d'atelier assisté par ordinateur. Dés. Commun.
Liens Netw. (CAMAD), Pise, Italie, 2020, pp. 1–6. [78] GH Sim, S. Klos, A. Asadi, A. Klein et M. Hollick, "Un algorithme d'apprentissage automatique
[58] S. Bakri, B. Brik et A. Ksentini, "Sur l'utilisation de l'apprentissage par renforcement pour le contextuel en ligne pour les communications véhiculaires 5G mmWave", IEEE/ACM
contrôle d'admission des tranches de réseau dans la 5G : hors ligne contre en ligne", Int. J Trans. Netw., vol. 26, non. 6, p. 2487–2500, décembre 2018.
Commun. Syst., vol. 34, non. 7, p. e4757, 2021.
[59] B. Brik et A. Ksentini, "Sur la prédiction des performances des tranches de réseau orientées
[79] MS Sim, Y.G. Lim, SH Park, L. Dai et C.B. Chae, "Sélection de faisceau mmWave basée
services dans la 5G : une approche d'apprentissage fédéré", dans Proc.
sur l'apprentissage profond pour la 5G NR/6G avec des informations de canal inférieures
IEEE 45e Conf. Calcul local. Réseau (LCN), Los Alamitos, Californie, ÉtatsUnis,
à 6 GHz : algorithmes et validation de prototypes",
novembre 2020, p. 164–171.
Accès IEEE, vol. 8, pages 51634–51646, 2020.
[60] W. Chérif, A. Ksentini, D. Négru et M. Sidibé, « A_psqa : outil efficace de QoE de streaming
[80] X. Wei, C. Hu et L. Dai, "Apprentissage en profondeur pour l'estimation du canal de l'espace
vidéo en temps réel dans un contexte Internet média du futur », in Proc . IEEE Int. Conf.
de faisceau dans les systèmes MIMO massifs à ondes millimétriques", IEEE Trans.
Multimedia Expo (ICME), Barcelone, Espagne, juillet 2011, pp. 1–6.
Commun., vol. 69, non. 1, p. 182–193, janvier 2021.
[61] K. Piamrat, A. Ksentini, C. Viho et J.M. Bonnin, « QoEaware vertical handover in wireless [81] F. Sohrabi, KM Attiah et W. Yu, "Apprentissage en profondeur pour la rétroaction des canaux
heterogeneous networks », dans Proc. 7e Int. distribués et le précodage multiutilisateurs dans le MIMO massif FDD",
Commun sans fil. Informatique mobile. Conf. (IWCMC), Istanbul, Turquie, juillet 2011, pp. IEEE Trans. Communication sans fil., vol. 20, non. 7, p. 4044–4057, juillet 2021.
95–100.
[62] C. Lee, H. Cho, S. Song et J.M. Chung, "Transfert conditionnel basé sur la prédiction pour [82] B. Brik, N. Lagraa, N. Tamani, A. Lakas et Y. GhamriDoudane, "Location de services cloud
les réseaux à ondes millimétriques 5G : une approche d'apprentissage en profondeur", dans le cloud de véhicules mobiles", IEEE Trans.
IEEE Veh. Technol. Mag., vol. 15, non. 1, p. 54–62, mars 2020. Véh. Technol., vol. 67, non. 10, p. 9882–9895, octobre 2018.
[83] Y. Chen, Y. Gao, C. Jiang et KJR Liu, "Processus de décision de Markov en théorie des
[63] M. Ozturk, M. Gogate, O. Onireti, A. Adeel, A. Hussain et MA Imran, "Une nouvelle approche jeux pour une prise de décision optimale dans les systèmes sociaux", dans Proc.
de prédiction de la mobilité à faible coût axée sur l'apprentissage profond pour les réseaux Conférence mondiale IEEE. Informations sur le signal Processus. (GlobalSIP), Atlanta,
cellulaires 5G : le cas de la con architecture de séparation contrôle/données (CDSA) », Géorgie, ÉtatsUnis, 2014, p. 268–272.
Neurocomputing, vol. 358, p. 479–489, septembre 2019. [84] DP Kingma et J. Ba, « Adam : Une méthode d'optimisation stochastique », dans Proc. 3ème
Int. Conf. Apprendre. Représenter. (ICLR), San Diego, Californie, ÉtatsUnis, mai 2015,
[64] C. Wang, Z. Zhao, Q. Sun et H. Zhang, « Double connectivité intelligente basée sur p. 1–14. [En ligne]. Disponible : http://arxiv.org/abs/1412.6980 [85] D. Sculley et al.,
l'apprentissage profond pour la gestion de la mobilité dans un réseau dense », dans « Apprentissage automatique : la
Proc . IEEE 88e Veh. Technol. Conf. (VTCFall), Chicago, Illinois, ÉtatsUnis, 2018, pp.
carte de crédit à intérêt élevé de la dette technique », dans Proc. Logiciel SE4ML Ing. Mach.
1–5.
Apprendre. (Atelier NIPS), 2014, p. 1–9.
[65] A. ElAmine, M. Iturralde, HAH Hassan et L. Nuaymi, "Une approche distribuée
d'apprentissage Q pour les modes de sommeil adaptatifs dans les réseaux 5G", dans
[86] "MLOps : pipelines de livraison continue et d'automatisation dans l'apprentissage
Proc . Communication sans fil IEEE. Réseau Conf. (WCNC), Marrakech, Maroc, 2019,
automatique." [En ligne]. Disponible : https://cloud.google.com/architecture/mlops
pp. 1–6.
continuousdeliveryandautomationpipelinesinmachine learning (consulté le
[66] FE Salem, Z. Altman, A. Gati, T. Chahed et E. Altman, «Approche d'apprentissage par
21 septembre 2021).
renforcement pour la gestion avancée des modes de veille dans les réseaux 5G», dans
[87] "Considérations de sécurité d'Open RAN." Ericsson. [En ligne].
Proc . IEEE 88e Veh. Technol. Conf.
Disponible : https://www.ericsson.com/en/security/securityconsiderationsofopenran
(VTCFall), Chicago, Illinois, ÉtatsUnis, 2018, pp. 1–5
(consulté le 1er mai 2021).
[67] J. Ye et Y.JA Zhang, "Drag : activation de la station de base basée sur l'apprentissage par
renforcement profond dans les réseaux hétérogènes", IEEE Trans. [88] "Le groupe de travail sur la sécurité de l'ORAN Alliance s'attaque aux défis de sécurité sur
Informatique mobile., vol. 19, non. 9, p. 20762087, septembre 2020. toutes les interfaces et composants ORAN." Alliance ORAN. [En ligne]. Disponible :
[68] K. Qi, T. Liu et C. Yang, "Apprentissage fédéré basé sur le transfert proactif dans les https://www.ORAN.org/blog/2020/10/24/theORANalliancesecuritytaskgrouptackles
réseaux de véhicules à ondes millimétriques", dans Proc. 15e IEEE Int. Conf. Processus security challengesonallORANinterfaces andcomponents (consulté le 1er
de signalisation. (ICSP), vol. 1. Pékin, Chine, 2020, p. 401–406. mai 2021).
[69] Y. Wu, G. Zhao, D. Ni et J. Du, "Politique de transfert dynamique pour le découpage RAN [89] X. Ling, J. Wang, T. Bouchoucha, BC Levy et Z. Ding, "Réseau d'accès radio Blockchain (b
en exploitant l'apprentissage par renforcement profond", EURASIP J. RAN): Vers un paradigme d'accès radio sécurisé décentralisé", IEEE Access, vol . 7, p.
Ordinateur sans fil. Netw., vol. 2021, p. 61, mars 2021. 9714–9723, 2019.
[70] Q. Wu, X. Chen, Z. Zhou, L. Chen et J. Zhang, "Apprentissage par renforcement en
profondeur avec prévision du trafic spatiotemporel pour le contrôle du sommeil de la [90] B. Brik, A. Ksentini et M. Bouaziz, "Apprentissage fédéré pour les réseaux sans fil activés
station de base basé sur les données", IEEE/ACM Trans . Netw., vol. 29, non. 2, p. 935– par les UAV : cas d'utilisation, défis et problèmes ouverts",
948, avril 2021. Accès IEEE, vol. 8, pages 53841–53849, 2020.
[71] Y.NR Li, M. Chen, J. Xu, L. Tian et K. Huang, « Techniques d'économie d'énergie pour la [91] Gestion des télécommunications ; Réseaux autoorganisés (SON) ; Concepts et exigences,
5G et audelà », IEEE Access, vol. 8, pages 108675–108690, 2020. V16.0.0, norme 3GPP TS 32.500, juillet 2020.
[72] H. Huang et al., « Apprentissage en profondeur pour les techniques sans fil 5G de la couche
[92] Réseaux autoorganisés (SON) pour le réseau 5G, V16.0.0, norme 3GPP TS 28.313,
physique : opportunités, défis et solutions », IEEE Wireless Commun., vol. 27, non. 1, p.
septembre 2020.
214–222, février 2020.
[93] MultiAccess Edge Computing (MEC); Cadre et architecture de référence, norme ETSI GS
[73] H. Ye, GY Li et B.H. Juang, "Puissance de l'apprentissage en profondeur pour l'estimation
MEC 003 v2.1.1, janvier 2019.
de canal et la détection de signal dans les systèmes OFDM", IEEE Wireless Commun.
Lett., vol. 7, non. 1, p. 114–117, février 2018. [94] B. Brik, PA Frangoudis et A. Ksentini, « Placement d'applications MEC orientées services
[74] T. O'Shea et J. Hoydis, "Une introduction à l'apprentissage en profondeur pour la couche dans une architecture cloud de périphérie fédérée », dans Proc.
physique", IEEE Trans. Conn. Commun. Netw., vol. 3, non. 4, p. 563–575, décembre IEEE Int. Conf. Commun. (ICC), Dublin, Irlande, 2020, pp. 1–6.
2017. [95] B. Yongacoglu, G. Arslan et S. Yüksel, "Apprentissage par renforcement pour le contrôle
[75] S. Rajendran, W. Meert, D. Giustiniano, V. Lenders et S. Pollin, "Modèles d'apprentissage stochastique décentralisé", dans Proc. IEEE 58e Conf. Décis.
en profondeur pour la classification des signaux sans fil avec des capteurs de spectre Control (CDC), Nice, France, 2019, pp. 5556–5561.
distribués à faible coût", IEEE Trans . Conn. Commun. [96] C. Gelada et MG Bellemare, «Apprentissage par renforcement profond hors politique en
Netw., vol. 4, non. 3, p. 433–445, sept. 2018. amorçant le changement de covariable», 2019, arXiv: 1901.09455.
VOLUME 3, 2022 249
Machine Translated by Google
BRIK et al. : DL POUR B5G ORAN : ÉVOLUTION, ENQUÊTE, ÉTUDES DE CAS ET DÉFIS
[97] P.H. Chiang, RB Guruprasad et S. Dey, « Utilisation optimale des ressources KARIM BOUTIBA a reçu le diplôme d'ingénieur de l'École
solaires, de stockage hybrides et de stations de base récoltées pour les Nationale Supérieure d'Informatique, Algérie. Il poursuit
réseaux cellulaires verts », IEEE Trans. Commune verte. Netw., vol. 2, non. 3, actuellement un doctorat. diplôme avec le département des
pages 707 à 720, septembre 2018. systèmes de communication, EURECOM, et supervisé par le
[98] A. Antonopoulos, "Problème de faillite dans le partage de réseau : Fondamentaux, professeur A. Ksentini. Au cours de son stage, il a travaillé sur
applications et défis", IEEE Wireless Commun., vol. 27, non. 4, p. 81–87, août la construction d'un orchestrateur RAN au sommet de la plate
2020. forme OpenAirInterface qui gère le cycle de vie d'une tranche
de réseau radio.
Il travaille à l'application du découpage du réseau dans
la nouvelle génération de réseau d'accès radio.
BOUZIANE BRIK a obtenu le diplôme d'ingénieur (First
Class) en informatique et le diplôme de Magister de
l'Université de Laghouat, Algérie, en 2010 et 2013,
respectivement, et le doctorat. diplômé de l'Université de
Laghouat et de l'Université de La Rochelle, France, en
2017. Il travaille actuellement en tant que professeur
associé à l'Université de Bourgogne (Bourgogne) et au ADLEN KSENTINI (Senior Member, IEEE) a reçu le
laboratoire DRIVE. Avant de rejoindre l'Université de doctorat. Diplômé en informatique de l'Université de
Bourgogne, il a été Postdoctorant à l'Université de CergyPontoise sur le provisionnement de QoS dans les
Troyes, au CESI et à l'Eurecom. Il a travaillé sur le réseaux IEEE 802.11. Depuis 2016, il est professeur au
network slicing dans le cadre des projets européens département des systèmes de communication,
H2020 sur la 5G, dont MonB5G et 5GDrones. Ses intérêts de recherche incluent EURECOM. Il est actuellement conférencier émérite
également l'Internet des objets (IoT), l'IoT dans les systèmes industriels, les réseaux IEEE COMSOC sur des sujets liés à la 5G et à la
intelligents et les réseaux véhiculaires. Il a également agi ou agit encore en tant softwarisation des réseaux. Ses sujets de recherche
qu'examinateur de nombreuses conférences IFIP, ACM et IEEE (ICC, Globecom, actuels portent sur les améliorations architecturales des
PIMRC, WCNC, VTC, IM/NOMS, IWCMC, GIIS, WiMob et Wireless Days) et revues, réseaux centraux mobiles, la mise en réseau cloud
telles que l'IEEE TRANSACTIONS SUR LA TECHNOLOGIE DES VÉHICULES , les mobile, la virtualisation des fonctions réseau et le SDN.
TRANSACTIONS DE L'IEEE SUR LES SYSTÈMES DE TRANSPORT INTELLIGENTS , Il a reçu le prix du meilleur article de l'IEEE WCNC 2018, de l'IEEE IWCMC 2016, de
les TRANSACTIONS DE L'IEEE SUR L'INFORMATIQUE INDUSTRIELLE , le l'IEEE ICC 2012, de l'ACM MSWiM 2005 et du prix IEEE Fred W. Ellersik du meilleur
magazine IEEE Communication et le magazine IEEE Network. magazine de communication IEEE pour 2017.
250 VOLUME 3, 2022