l'apprentissage automatique est mis en œuvre dans une application réelle. nous allons maintenant
discuter de la façon dont l'apprentissage automatique est utilisé dans le domaine des réseaux.
mais la question qui est posée, pourquoi utiliser l'apprentissage automatique dans le domaine de la
mise en réseau. Comme discuté au chapitre 4: application l'apprentissage automatique offre à la
machine la capacité d'apprendre et de s'adapter à une nouvelle situation d'une manière
remarquablement rapide et efficace.
nous savons que la machine a de nombreuses qualités et qualités qui la rendent adaptée au domaine
de mise en réseau, tel que la classification et la prédiction qui jouent des rôles importants dans les
problèmes de réseau tels que la détection des intrusions et la prévision des performances. Dans en
outre, l'apprentissage automatique peut également aider à la décision faire, ce qui facilitera la
planification du réseau et adaptation des paramètres , selon aux états actuels de l'environnement. En
plus, de nombreux problèmes de réseau doivent interagir avec des environnements système
compliqués. Ce n'est pas facile à construire des modèles précis ou analytiques pour représenter des
comportements système complexes tels que la charge évolution des modèles de CDN et de débit
caractéristiques. L'apprentissage automatique peut fournir un modèle estimé de ces systèmes avec
une précision acceptable. La figure si dessous représente le processus du création d’une application
dans le domaine de réseau :
La figure 1 montre le flux de travail de base pour appliquer l'apprentissage automatique dans le
domaine du réseau, y compris formulation de problèmes, collecte de données, analyse de données,
construction de modèle, modèle validation, déploiement et inférence. Thèse les stades ne sont pas
indépendants mais ont des relations.
Collecte de données: le but de cette étape est de collecter une grande quantité de réseau
représentatif données sans biais. Les données du réseau (par exemple, le trafic les traces et les
journaux de session avec des mesures de performances) sont enregistrés à partir de différentes
couches réseau selon les besoins de l'application. Par exemple, le problème de classification du trafic
nécessite souvent jeux de données contenant des traces de niveau paquet étiquetées avec les classes
d'application correspondantes.
Analyse des données: chaque problème de réseau a ses propres caractéristiques et est influencé par
de nombreux facteurs, mais seuls plusieurs facteurs (c'est-à-dire la fonctionnalité) ont le plus d'effet
sur la mesure de performance du réseau cible. Par exemple, RTT et le temps d'arrivée entre ACK
peuvent être les caractéristiques critiques dans le choix de la meilleure taille de la fenêtre de
congestion TCP.
Validation du modèle: la validation hors ligne est un étape indispensable dans le flux de travail MLN
pour évaluer si l'algorithme d'apprentissage fonctionne bien suffisant. Au cours de cette étape, la
validation croisée est généralement utilisée pour tester la précision globale du modèle afin de
montrer si le modèle est trop adapté ou sous-ajustement.
Prévision du trafic :
La prévision du trafic réseau joue un rôle clé dans les opérations et la gestion du réseau pour les
réseaux de plus en plus complexes et diversifiés d'aujourd'hui. Elle implique la prévision du trafic
futur et a été traditionnellement traitée via la prévision de séries chronologiques (TSF). L'objectif de
TSF est de construire un modèle de régression capable d'établir une corrélation précise entre le
volume de trafic futur et les volumes de trafic précédemment observés.
Classification du trafic :
La classification du trafic est essentielle pour que les opérateurs de réseau effectuent un large
éventail d'activités d'exploitation et de gestion du réseau. Il s'agit notamment de la planification des
capacités, de la sécurité et de la détection des intrusions, de la différenciation de la qualité de service
et des services, de la surveillance des performances et de l'approvisionnement en ressources, pour
n'en nommer que quelques-uns. Par exemple, un opérateur d'un réseau d'entreprise peut souhaiter
hiérarchiser le trafic pour les applications critiques, identifier le trafic inconnu pour la détection des
anomalies ou effectuer une caractérisation de la charge de travail pour concevoir des schémas de
gestion des ressources efficaces qui satisfont les diverses performances des applications et les
besoins en ressources.
Contrôle de la congestion :
Le contrôle de la congestion est fondamental pour les opérations réseau et est responsable de la
limitation du nombre de paquets entrant dans le réseau. Il garantit la stabilité du réseau, l'équité
dans l'utilisation des ressources et un taux de perte de paquets acceptable. Différentes architectures
de réseau déploient leur propre ensemble de mécanismes de contrôle de congestion. Les
mécanismes de contrôle de congestion les plus connus sont ceux mis en œuvre dans TCP, car TCP et
IP constituent la base de l'Internet actuel. Les mécanismes de contrôle de congestion TCP
fonctionnent dans les systèmes d'extrémité du réseau pour limiter le débit d'envoi des paquets
lorsqu'une congestion est détectée. Un autre mécanisme de contrôle d'encombrement bien connu
est la gestion de file d'attente qui fonctionne à l'intérieur des nœuds intermédiaires du réseau (par
exemple, les commutateurs et les routeurs) pour compléter TCP. Plusieurs améliorations ont été
apportées aux mécanismes de contrôle de la congestion pour Internet et aux architectures de
réseaux évolutifs, tels que les réseaux à tolérance de retard (DTN) et les réseaux de données
nommés (NDN). Malgré ces efforts, il existe diverses lacunes dans des domaines tels que la
classification des pertes de paquets, la gestion des files d'attente, la mise à jour de la fenêtre de
congestion (CWND) et l'inférence de congestion.
Le tableau si dessous donne des exemple des application utilisé dans le domaine du réseau :