Académique Documents
Professionnel Documents
Culture Documents
Semestre 8
SUPERVISION ET
MONITORING DES RESEAUX
La gestion d'un parc de serveurs est un travail à temps réel. Un bon administrateur
réseau doit savoir à tout moment l'état des différentes machines et des différents
services.
Cependant, l'administrateur ne peut pas se permettre de passer son temps devant
un tableau avec des voyants verts en attendant qu'un voyant passe au rouge pour
agir, son temps est occupé à d'autres tâches, donc il ne peut pas surveiller les statuts
des machines en permanence. L'examen quotidien des logs systèmes est un bon
début, mais, si un problème survient, on s'en rend compte seulement le lendemain,
ce qui peut être trop tard.
Pour simplifier leur travail, les administrateurs utilisent généralement ce qu'on
appelle un `'moniteur de supervision informatique'', un tel moniteur permet d'avoir
une vue globale du fonctionnement de réseau ainsi que du niveau de performances
des systèmes, et d'alerter par différents moyens l'apparition d'une anomalie.
En informatique, la supervision est une technique de suivi, qui permet de surveiller,
analyser, rapporter et d'alerter les fonctionnements anormaux des systèmes
informatiques.
Définition de la supervision
La supervision se définit comme une technique utilisant au mieux les ressources
informatiques pour obtenir des informations sur l'état des réseaux et de leurs
composants. Ces données seront ensuite traitées et affichées afin de mettre en
lumière d'éventuels problèmes.
La supervision peut résoudre les problèmes automatiquement ou dans le cas
contraire prévenir via un système d'alerte (email ou SMS par exemple) les
administrateurs. Cette définition de la supervision est décrite plus en détail dans la
norme ISO7498/4.
Plusieurs actions sont ainsi réalisées : Acquisition de données, analyse, puis
visualisation et réaction.
Un tel processus est réalisé à plusieurs niveaux d'un parc de machines : Au niveau
interconnexions (Réseau), au niveau de la machine elle-même (Système) et au niveau
des services offerts par cette machine (Applications).
Supervision réseau
Par le terme réseau on entend ici l'aspect communication entre les machines. Le rôle
est de s'assurer du bon fonctionnement des communications et de la performance
des liens (débit, latence, taux d'erreurs). C'est dans ce cadre que l'on va vérifier par
Supervision système
La surveillance se cantonne dans ce cas à la machine elle-même et en particulier ses
ressources. Si l'on souhaite par exemple contrôler la mémoire utilisée ou la charge
processeur sur le serveur voire analyser les fichiers de logs système.
Supervision applicative
Cette technique est plus subtile, c'est elle qui va nous permettre de vérifier le
fonctionnement d'une application lancée sur une machine. Cela peut être par
exemple une tentative de connexion sur le port de l'application pour voir si elle
retourne ou demande bien les bonnes informations, mais aussi de l'analyse de logs
applicatifs.
En effet rien ne garantit qu'un port X ouvert veut dire que l'application qui tourne
derrière n'est pas "plantée".
La surveillance réseau est essentielle quel que soit la taille de votre entreprise.
Une solution de surveillance efficace ne vous prévient pas seulement en cas de
Présentation
SNMP (Simple Network Management Protocol) est un protocole de couche
applicative qui a pour but de superviser les réseaux. Il a été conçu en 1988
par l'IETF (Internet Engineering Task Force) avec pour idée directrice de créer
un protocole simple qui ne vienne pas gêner le trafic du réseau qu'il supervise.
Depuis sa création, le protocole a évolué par soucis de sécurité: La version 2
qui est pour l'instant la plus utilisée possède une notion de communauté qui
est utilisée comme un mot de passe, la version 3 durcit un peu plus le
protocole en y ajoutant le chiffrement.
Ping
Voilà un outil très simple, qui remplit une tâche très importante. C'est en effet ce
programme qui va nous permettre, en utilisant le protocole ICMP, de savoir si une
machine destination est accessible (dans le cas contraire, connaître
approximativement la raison via le code d'erreur ICMP) et de mesurer la latence
existante entre les deux extrémités.
L'implémentation est simple, Ping envoi une requête ICMP Echo et attend en retour
une requête ICMP Echo Reply. Ping est par exemple souvent utilisé pour réaliser
une alerte qui prévient l'administrateur d'une machine quand celle-ci n'est plus
joignable.
Outils SNMP
Il existe bien évidemment des programmes simples destinés à utiliser le protocole
SNMP. Leurs noms indiquent quelle requête ils peuvent envoyer, par exemple :
snmpget, snmpgetnext, snmpinform, snmpset etc...
Chacune de ses commandes permet de réaliser la requête en utilisant une des trois
versions du protocole SNMP. Elles sont énormément utilisées dans le cadre de
scripts qui stockent les valeurs obtenues afin de réaliser des statistiques ou des
alertes. (exemple d'utilisation fournis en Fig 1).
Depuis sa création il y a vingt ans, l'Internet connaît une mutation au niveau de ses
usages. De réseau mono service pour transporter des fichiers binaires ou textuels,
l'Internet est aujourd'hui un réseau multiservices pour le transport de données
diverses et variées comme des données audio et vidéo (films, vidéo à la demande,
téléphonie, etc.). Ainsi, il est nécessaire de faire évoluer la technologique du réseau
de façon à le rendre capable de transporter avec des QoS adéquates les différents
types d'informations proposées par toutes les applications utilisant l'Internet.
L'amélioration de ces technologies devra donc passer par une meilleure connaissance
du réseau et de ces utilisations actuelles.
La métrologie des réseaux de l'Internet - "la science des mesures" appliquée à
l'Internet - doit permettre d'apporter une réponse à ces problèmes. En premier lieu,
s'il faut fournir des services ayant des qualités prédéfinies, il faut être capable de
mesurer ces qualités. La métrologie des réseaux se décompose en deux parties
distinctes : - La métrologie passive - La métrologie active
Nous étudierons donc par la suite ces deux domaines. Nous verrons ainsi pour chacun
leurs principes de fonctionnement ainsi que quelques outils.
Définitions de la Métrologie des Réseaux
Par définition, la métrologie désigne la science des mesures. Dans le cadre des
réseaux, son objectif est de connaître et comprendre le réseau afin de pouvoir, non
seulement intervenir dans l'urgence en cas de problème, mais aussi anticiper
l'évolution du réseau, planifier l'introduction de nouvelles applications et améliorer
les performances pour les utilisateurs
La métrologie des réseaux désigne la mesure des caractéristiques d'un réseau sous
de nombreux aspects. La complexité du réseau étant en augmentation constante, la
mesure du comportement de ce réseau est devenue essentielle pour avoir une
compréhension de son fonctionnement et de l'interaction des protocoles mis
successivement en œuvre. Selon le résultat attendu, la nature des mesures et les
méthodes employées seront bien différentes.
I. La métrologie passive
Principe
Les mesures passives ont pour objectif la mesure des flots réseaux dans un point
particulier du réseau. Ces mesures peuvent être effectuées soit au niveau
microscopique, soit au niveau macroscopique (agrégé):
Les mesures passives microscopiques tendent à enregistrer des informations sur
chacun des paquets qui traversent un point (un routeur ou un point de présence POP)
du réseau. Ces informations, qui sont fréquemment l'entête des paquets ainsi que la
taille des paquets, permettent ensuite de dépiler les connections qui ont partagées
une ressource à un instant donné.
Les mesures passives macroscopiques sont effectuées sur des métriques agrégées
comme le débit total, le débit par flot ou le nombre de connexions traversant le
point de mesures.
Problématique
La métrologie passive est confrontée à plusieurs problèmes :
Il est nécessaire d'adapter la précision et la capacité de traitement en fonction du
débit, car on ne peut mesurer de la même manière le débit d'un réseau LAN et celui
du backbone d'un opérateur.
Il faudrait avoir la possibilité de corréler les événements de plusieurs traces et de
suivre les flux à travers le réseau.
Il est également nécessaire de trouver un moyen de ramener les données vers les
machines d'analyse de façon efficace et sans trop influer sur le réseau et sa charge
Enfin, il se pose un problème juridique lié aux données collectées : en effet, en
France, la CNIL interdit de créer des fichiers contenant des données sur les individus
et leurs usages. Typiquement, la collecte de traces de trafic entre sous le coup de
cette loi. Il faut donc, pour être en toute légalité, demander une autorisation à la
CNIL pour constituer de tels fichiers de traces. En effet, une trace contient les
adresses IP des machines source et destination, et à ce titre, les ordinateurs étant
de plus en plus individuels, cela identifie une personne physique, dont on pourra
analyser les faits et gestes sur le réseau.
Quelques outils
Voici quelques outils de métrologie active :
TCPDump, Ethéreal, qui sont les outils de métrologie passive de base.
SNMP et les MIBs
Traffic Designer
IPANEMA
NAGIOS
DAG
Principe
Le principe des mesures actives est fondé sur l'hypothèse que la qualité offerte de
bout en bout ne peut être évaluée que par une application qui emprunte ce lien. Les
mesures actives visent à mesurer directement la qualité de service du réseau telle
qu'elle est ressentie par une application quelconque sur le réseau.
Pour les mécanismes de mesures actives chaque paquet émis est une sonde qui en
traversant le réseau se charge de l'information de qualité du lien. Le trafic généré
par un mécanisme de mesures actives est restreint de façon à ne pas perturber l'état
du réseau. Les métriques mesurées par les mesures actives sont généralement le
processus de pertes et la variation de délai observé par les paquets sondes.
Problématique
Tout d'abord, il faut faire face à un inconvénient de taille : en effet, les outils de
métrologie active doivent générer du trafic pour effectuer leurs mesures, ce qui peut
engendrer des perturbations sur le réseau. En effet, si l'on souhaite mesurer la bande
passante à un instant X, il faut envoyer des trames de plus en plus grande, jusqu'à
constater des pertes (et donc la saturation du lien)
Ensuite, la précision des mesures est difficiles à assurer : par exemple, le calcul du
délai de transmission d'un paquet peut poser problème dans le cas ou l'on souhaite
avoir uniquement le temps du trajet aller (cela pose moins de problèmes pour les
temps d'aller-retour comme ping peut le faire). Il faut donc trouver un moyen pour
s'assurer que les sondes sont bien synchronisées sur la même heure, car dans le cas
contraire, la mesure n'aurait plus d'intérêt.
Quelques outils
Voici quelques outils de métrologie active :
Ping, Traceroute, qui sont les outils de métrologie active de base.
MGEN
CoSMon
Cisco SAA
NIMI
RIPE-TTM
Nous étudierons plus loin NIMI ainsi que RIPE-TTM