Vous êtes sur la page 1sur 4

à partir des parties ci-dessus, nous avons maintenant une bonne compréhension de la façon dont

l'apprentissage automatique est mis en œuvre dans une application réelle. nous allons maintenant
discuter de la façon dont l'apprentissage automatique est utilisé dans le domaine des réseaux.

mais la question qui est posée, pourquoi utiliser l'apprentissage automatique dans le domaine de la
mise en réseau. Comme discuté au chapitre 4: application l'apprentissage automatique offre à la
machine la capacité d'apprendre et de s'adapter à une nouvelle situation d'une manière
remarquablement rapide et efficace.

nous savons que la machine a de nombreuses qualités et qualités qui la rendent adaptée au domaine
de mise en réseau, tel que la classification et la prédiction qui jouent des rôles importants dans les
problèmes de réseau tels que la détection des intrusions et la prévision des performances. Dans en
outre, l'apprentissage automatique peut également aider à la décision faire, ce qui facilitera la
planification du réseau et adaptation des paramètres , selon aux états actuels de l'environnement. En
plus, de nombreux problèmes de réseau doivent interagir avec des environnements système
compliqués. Ce n'est pas facile à construire des modèles précis ou analytiques pour représenter des
comportements système complexes tels que la charge évolution des modèles de CDN et de débit
caractéristiques. L'apprentissage automatique peut fournir un modèle estimé de ces systèmes avec
une précision acceptable. La figure si dessous représente le processus du création d’une application
dans le domaine de réseau :

La figure 1 montre le flux de travail de base pour appliquer l'apprentissage automatique dans le
domaine du réseau, y compris formulation de problèmes, collecte de données, analyse de données,
construction de modèle, modèle validation, déploiement et inférence. Thèse les stades ne sont pas
indépendants mais ont des relations.

Les étapes sont comme les suivant :

Collecte de données: le but de cette étape est de collecter une grande quantité de réseau
représentatif données sans biais. Les données du réseau (par exemple, le trafic les traces et les
journaux de session avec des mesures de performances) sont enregistrés à partir de différentes
couches réseau selon les besoins de l'application. Par exemple, le problème de classification du trafic
nécessite souvent jeux de données contenant des traces de niveau paquet étiquetées avec les classes
d'application correspondantes.

Analyse des données: chaque problème de réseau a ses propres caractéristiques et est influencé par
de nombreux facteurs, mais seuls plusieurs facteurs (c'est-à-dire la fonctionnalité) ont le plus d'effet
sur la mesure de performance du réseau cible. Par exemple, RTT et le temps d'arrivée entre ACK
peuvent être les caractéristiques critiques dans le choix de la meilleure taille de la fenêtre de
congestion TCP.

Construction du modèle: Construction du modèle implique la sélection, la formation et le réglage du


modèle. UNE un modèle d'apprentissage ou un algorithme approprié doit être sélectionnés en
fonction de la taille de l'ensemble de données, des caractéristiques typiques d'un scénario de réseau.

Validation du modèle: la validation hors ligne est un étape indispensable dans le flux de travail MLN
pour évaluer si l'algorithme d'apprentissage fonctionne bien suffisant. Au cours de cette étape, la
validation croisée est généralement utilisée pour tester la précision globale du modèle afin de
montrer si le modèle est trop adapté ou sous-ajustement.

Déploiement et inférence: lors de la mise en œuvre du modèle d'apprentissage dans un réseau


opérationnel l'environnement, certaines questions pratiques devraient être pris en considération.

Ainsi les application de réseau appartient souvent à ses catégories :

Prévision du trafic :

La prévision du trafic réseau joue un rôle clé dans les opérations et la gestion du réseau pour les
réseaux de plus en plus complexes et diversifiés d'aujourd'hui. Elle implique la prévision du trafic
futur et a été traditionnellement traitée via la prévision de séries chronologiques (TSF). L'objectif de
TSF est de construire un modèle de régression capable d'établir une corrélation précise entre le
volume de trafic futur et les volumes de trafic précédemment observés.

Classification du trafic :

La classification du trafic est essentielle pour que les opérateurs de réseau effectuent un large
éventail d'activités d'exploitation et de gestion du réseau. Il s'agit notamment de la planification des
capacités, de la sécurité et de la détection des intrusions, de la différenciation de la qualité de service
et des services, de la surveillance des performances et de l'approvisionnement en ressources, pour
n'en nommer que quelques-uns. Par exemple, un opérateur d'un réseau d'entreprise peut souhaiter
hiérarchiser le trafic pour les applications critiques, identifier le trafic inconnu pour la détection des
anomalies ou effectuer une caractérisation de la charge de travail pour concevoir des schémas de
gestion des ressources efficaces qui satisfont les diverses performances des applications et les
besoins en ressources.

Contrôle de la congestion :

Le contrôle de la congestion est fondamental pour les opérations réseau et est responsable de la
limitation du nombre de paquets entrant dans le réseau. Il garantit la stabilité du réseau, l'équité
dans l'utilisation des ressources et un taux de perte de paquets acceptable. Différentes architectures
de réseau déploient leur propre ensemble de mécanismes de contrôle de congestion. Les
mécanismes de contrôle de congestion les plus connus sont ceux mis en œuvre dans TCP, car TCP et
IP constituent la base de l'Internet actuel. Les mécanismes de contrôle de congestion TCP
fonctionnent dans les systèmes d'extrémité du réseau pour limiter le débit d'envoi des paquets
lorsqu'une congestion est détectée. Un autre mécanisme de contrôle d'encombrement bien connu
est la gestion de file d'attente qui fonctionne à l'intérieur des nœuds intermédiaires du réseau (par
exemple, les commutateurs et les routeurs) pour compléter TCP. Plusieurs améliorations ont été
apportées aux mécanismes de contrôle de la congestion pour Internet et aux architectures de
réseaux évolutifs, tels que les réseaux à tolérance de retard (DTN) et les réseaux de données
nommés (NDN). Malgré ces efforts, il existe diverses lacunes dans des domaines tels que la
classification des pertes de paquets, la gestion des files d'attente, la mise à jour de la fenêtre de
congestion (CWND) et l'inférence de congestion.

Le tableau si dessous donne des exemple des application utilisé dans le domaine du réseau :

Tableau : Prévision du trafic(Prévision de trafic TSF et non TSF)

Nom/Ref Techniqu Application Dataset Caractéristique production Evaluation


e ML :
NBP Supervisé: Prévision de NSF TeraGrid Charge Bande Taux d’erreur
· MLP-NN disponibilit dataset  maximale, passante maximal :8%
(hors é de bande minimale et disponible
ligne) passante de moyenne sur un
bout en observée au
chemin
bout (TSF) cours des 10
de bout
dernières
secondes ∼ 30 en bout à
secondes une
époque
future
Cortez et Supervisé: Prédiction Données de Volume de Volume de 1h
al · NNE de la liaison trafic SNMP trafic observé trafic d'anticipation:
formé et du provenant de 2 au cours des prévu Taux d’erreur
avec Rp volume de réseaux ISP, · dernières =1.43%∼5.23%
(hors trafic dans trafic sur une minutes ver 1h ∼ 24h
ligne) les réseaux liaison plusieurs jours Taux d’erreur
ISP (TSF) transatlantique =6.34%∼23.48%
·
Tableau2 : Classification du trafic

Nom/Ref Technique Application Dataset Classes Evaluation


ML :
Roughan Supervisedk- Propriétaire: Fonctionnalités Telnet, Taux
et al. NN univ. au niveau du FTP-data, d’erreur =5.1%
réseaux, paquet et au Kazaa,
service de niveau du flux RealMedia
streaming
Streaming,
DNS,
HTTPS

Erman et Unsupervise Univ. Fonctionnalités HTTP, P2P, Précision


al. d AutoClass Auckland au niveau du SMTP, globale =
propriétaire paquet et au IMAP, 75,6%
: Univ. niveau du flux POP3,
Calgary MSSQL,
OTHER

Tableau3 : Contrôle de la congestion 

Nom/Ref Technique Type de Dataset Classification Evaluation


ML : reseau
Liu et al Unsupervised Filaire et Synthetic HMM
: · EM for sans fil data: · ns-2 Perte de precision:
HMM hybride simulation · congestion · 44−98%
4-linear Perte sans fil
topology
Data
distribution: ·
Training =
10k

Supervised: · Filaire et Synthetic Perte de AUC (%): ·


El Khayat Boosting DT · sans fil data: · ns-2 congestion · 98.40 
et al DT hybride simulation · Perte sans fil
4-linear
topology
Data
distribution: ·
Training =
10k