Académique Documents
Professionnel Documents
Culture Documents
Introduction
Actuellement toutes les entreprises sont quipes dun rseau local au minimum, et de rseaux de longues distances pour les plus importantes dentre elles. Leurs parcs informatiques englobent une dizaine voir une centaine dquipements, engendrs par des serveurs de bases de donnes et des serveurs de traitements. Vu que ces systmes informatiques sont au cur des activits des entreprises, leur maitrise devient primordiale. Ils doivent fonctionner pleinement et en permanence pour garantir la fiabilit et lefficacit exiges, et surtout travailler rduire les problmes de dfaillances, les pannes, les coupures et les diffrents problmes techniques qui peuvent causer des pertes considrables. De ce fait, les administrateurs rseau font appel des logiciels de surveillance et de supervision de rseaux afin de vrifier l'tat du rseau en temps rel de l'ensemble du parc informatique sous leur responsabilit. Et tre aussi informs automatiquement (par email, par SMS) en cas de problmes. Grce un tel systme, les dlais d'interventions sont fortement rduits et les anomalies peuvent tre aussitt prises en main avant mme quun utilisateur peut sen apercevoir. Ainsi, la supervision des rseaux savre ncessaire et indispensable. Elle permet entre autre davoir une vue globale du fonctionnement et des problmes pouvant survenir sur un rseau mais aussi davoir des indicateurs sur la performance de son architecture. Dans ce cadre, le prsent rapport se base sur trois axes principaux : * Prsenter les notions de base de la supervision informatique et de ses logiciels les plus utiliss actuellement. * Etudier la solution choisie parmi plusieurs en numrant ses fonctionnalits et apports. * la ralisation, et la mise en place de cette solution.
Travail demand: Recherche, Implmentation et configuration d'une solution Open Source qui vise superviser des serveurs dans un environnement multiplateformes.
Plan du travail : Le but principal du projet est de pouvoir tablir ou choisir et installer une station de surveillance des serveurs qui remplit les conditions suivantes : Cots financiers les plus rduits possibles. Rcupration des informations permettant la dtection des pannes, lindisponibilit des serveurs et de leurs services. Des renseignements supplmentaires de monitoring sur la charge CPU, Espace disque, mmoire disponible, input/output, etc La Gestion des alertes. Notification par mail ou SMS en cas de problme. Gnrer des rapports sur le fonctionnement des serveurs. Gnrer des graphes (cartographie du rseau,) Une interface graphique claire pour linteraction utilisateur/Logiciel.
1.2 La supervision:
1.2.1 Dfinition: La supervision de rseaux peut tre dfinie comme lutilisation de ressources rseaux adaptes dans le but dobtenir des informations (en temps rel ou non) sur lutilisation ou la condition des rseaux et de leurs lments afin dassurer un niveau de service garanti, une bonne qualit et une rpartition optimale et de ceux-ci. La mise en place dune supervision rseau, a donc pour principale vocation de collecter intervalle rgulier les informations ncessaires sur ltat de
linfrastructure et des entits qui y sont utiliss, de les analyser et de les rapporter.
1.2.2 Objectives: Lobjectif de la supervision de rseaux peut ainsi se rsumer en trois points : Etre ractif en alertant ladministrateur (e-mail ou sms) en cas de dysfonctionnement dune partie du systme dinformation. Etre pro actif en anticipant les pannes possibles. Cibler le problme ds son apparition afin dagir rapidement de la faon la plus pertinente possible. 1.2.3 Questions cls : Avant dentamer le projet de supervision il faut rpondre ces questions : Qu'est-ce que la supervision ? Superviser...quoi ? Superviser...pourquoi ? Superviser...comment ? La supervision Supervision = fonction qui consiste Indiquer et commander l'tat d'un Appel, d'un systme ou d'un rseau - Visualiser - Surveiller - Analyser - Piloter - Agir Superviser quoi ? Le Systme d'informations : - Le rseau et ses quipements - Les serveurs - Les applications - Le workflow - Les imprimantes - La machine caf
4
Superviser, pourquoi ? L'informatique au cur de l'entreprise = Systme nerveux Ex: secteur bancaire 1sec panne <=> 1M perdu
Superviser, comment ? - Analyser les fichiers de log - Rcuprer des rsultats de commandes / scripts locaux ou distants (Ping, commandes via ssh...) SNMP: Simple Network Management Protocol.
Un des rles des administrateurs est justement de grer cela. Ils doivent concevoir larchitecture du systme dinformation de telle manire quune panne ait un impact minimal sur le reste du systme. Ils doivent aussi grer les ventuels problmes, ce qui reste une part importante de leur charge de travail les systmes tant de plus en plus imbriqus, une simple erreur peut en produire un nombre incalculable dautres, alors il faut rsoudre le problme rapidement, les autres lments peuvent tre pargns. Il gagne donc doublement du temps en prvenant lapparition dautres problmes. Certains problmes sont prcds de signes avant de devenir bloquants, la rptition de ces signes est une plus-value non ngligeable des outils de supervision. Les administrateurs peuvent ainsi rgler le problme avant mme quil ne se produise.
5
Surveiller le systme dinformation y compris pendant les priodes non ouvres prsente bien des avantages. Durant ces priodes, aucun utilisateur nest prsent pour relever les ventuels problmes. Cela ne signifie pas que le systme en est exempt. Ils peuvent tre annonciateurs de problmes futurs. tre proactif face aux problmes est une demande croissante de la part des directions des systmes dinformation. On ne peut tre proactif, rsoudre les problmes avant mme quils ne se prsentent, qu condition dtre bien inform.
Les ressources ncessaires pour mettre en place une telle solution se justifient parce quelle permet, dune part, de rpondre la demande de pro activit et, dautre part, de raliser des gains de temps importants sur lensemble du systme dinformation.
Un des rles de ladministrateur est galement de prvoir les besoins futurs afin de dimensionner au mieux le systme dinformation. Sil prvoit trop large, il dpense trop, sil ne prvoit pas assez, on arrive une situation de contention. Celle-ci peut dboucher sur de trs graves problmes de disponibilit du systme dinformation.
Pour effectuer correctement ce travail de dimensionnement au plus juste, il a besoin de connatre ltat rel de la consommation des ressources et une estimation, de la part des utilisateurs, de lvolution des demandes. Cette dernire information est malheureusement une denre extrmement difficile obtenir. Alors il doit tudier lvolution des besoins en ressources sur une priode significative afin dextrapoler et de prvoir au mieux leur volution future. Il a besoin deffectuer des mesures prcises sur diffrents lments du systme dinformation, grce un outil de mtrologie.
Solutions propritaires couteuses. Utilisation d'outils open source qui ont fait leurs preuves.
Nanmoins, lorsque l'on commence une tude afin de mettre en place un systme de supervision, il est indispensable de se demander ce que l'on souhaite superviser. En effet, le nombre d'information supervise est "quasi" infini :
Serveurs : CPU, mmoire, processus, espace disque, services... Matriels : Disques, cartes Raid, cartes rseau, temprature, alimentations, onduleurs... Rseaux : Bande passante, protocoles, switchs, routeurs, Firewall, accs externes, bornes wifi...
Le choix des outils de supervision pour ce comparatif c'est bas sur plusieurs facteurs :
Totalement Open-source, Encore supports, Permettent une gnration de graphs , Fonctionnent sur diffrents quipements (switchs, routeurs, serveurs, ...), Dispose d'une interface web, Gre le SNMPv2c, Avertissent les administrateurs en cas de problmes.
Comparaison des diffrents outils: Logiciel Caractristiques ZABBIX -Offre une interface web de consultation et dadministration. -Peut gnrer des graphes. NAGIOS CENTREON -Offre une interface web base sur les CGL avec gestion des droits pour la consultation -Gnre des rapports de surveillance. U20000 Huawei Application autonome qui peut tre install sur une varit de systmes d'exploitation et bases de donnes.
-Permet de visualiser -Peut lever des et trier les services alertes en envoyant concerns par leur des mails. -Il a la possibilit de type d'alarme. monitorer distance -Supervise des travers un -Fournit une varit de quipementsSNMP firewall. mthodes de dtection . et de diagnostic pour -Il peut dfinir des vrifier rapidement la -Gre les pannes et serveurs esclaves connectivit de service les performances qui prennent le et de localiser les relais si le serveur dfauts. maitre tombe en panne. -Prise en charge des requtes de -Surveillance des performance base sur ressources des les services, le seuil de serveurs (CPU, pr-alerte des alarmes, mmoire) et l'analyse des tendances dans -Surveillance des l'interface graphique. services rseaux. -Arrt temporaire de la supervision locale ou globale.
8
Les Plus
-Multiplateforme. -Des plugins qui tendent les -Utilise peu de possibilits de ressources Nagios.
-Une trs grande communaut qui participe activement au dveloppement. -solution complte permettant le reporting, la gestion des pannes et dalarmes, gestion des utilisateurs -Des plugins permettent aux utilisateurs de dvelopper facilement ses propres vrifications de services. -Possibilit de repartir la supervision entre plusieurs administrateurs. -Offre la possibilit de dvelopper ses propres modules
- offre des solutions haut de gamme pour les rseaux grande chelle et des solutions faible cot pour les rseaux de petite et moyenne chelle.
11
Offrant les possibilits suivantes : - Superviser des protocoles rseaux : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP, etc.) ; - Superviser les ressources des serveurs (charge du processeur, occupation des disques durs, utilisation de la mmoire pagine) et ceci sur les systmes d'exploitations les plus rpandus ; - Superviser via le protocole SNMP, notamment pour des quipements rseaux (switchs, firewall) ;
2.1.3.2 Centreon :
Centreon fournit une interface de visualisation de la supervision diffrente de celle de Nagios. Elle permet de rendre la consultation plus accessible moyen de filtres de recherche, des graphes de mtrologie, de reporting, d'une meilleure gestion des ACLs. Cette interface a l'avantage d'tre plus ddie des personnes recherchant moins d'informations techniques, cependant elle ne remplace pas totalement l'interface de Nagios. Ses fonctionnalits : - Une interface multi-utilisateur intuitive et personnalisable ; - Une interface de configuration volue pour configurer le primtre superviser ; - Des aides la configuration ; - Une gestion de l'ensemble des fichiers de configuration de Nagios (cgi, nagios.cfg...) ; - Un module de chargement de configuration de Nagios ; - Une compatibilit Nagios 1.x, Nagios 2.x, Nagios 3.x ; - Un test de validit des configurations avec le debugger de Nagios ; - Des fiches d'identits serveurs/quipements rseaux regroupant les informations de base sur ces types de ressource ; - Des reprsentations graphiques labores et personnalisables sur la mtrologie ; - Une gestion des accs trs fine, comprenant les ressources comme les pages de l'interface ; - Un systme de modules qui permet l'inclusion d'autres applications dans Centreon, par exemple le module syslog ; - Un compte-rendu complet sur les incidents ; - Un systme de calcul de la qualit de service en temps rel avec alerte
12
en cas de diminution de la qualit de service ; - Une map Java pour une vision simplifie de l'tat du systme d'information (proprit de la socit Merethis).
2.1.3.3 NagVis : Nagvis est un module de cartographie. Il permet de crer des vues mtiers de la supervision. Il est possible de coupler Nagvis un schma rseau et ainsi mettre en relation les donnes de Nagios en temps rel sur le schma. Nagvis utilise la base Ndo pour rcuprer les donnes de supervision. Il supporte aussi les moteurs vnementsMklivestatus, ndo2fs, merlin. Son principal atout rside dans son systme de Drag and Drop pour venir configurer ses cartes.
La grande majorit des solutions de supervision se base sur l'utilisation du protocole SNMP pour fonctionner.
Le protocole SNMP fonctionne sous forme de questions-rponses entre un serveur (dans notre cas Nagios) et des quipements rseau (htes) (Serveurs, Switch, Hubs, Ordinateur, routeurs) ayant ce protocole install.
Le client peut mettre un message vers le serveur sans ncessiter de rponse : le message visant alerter ladministrateur dune dfaillance (par exemple, lespace disque dun serveur ayant dpass un seuil dfini au pralable par le technicien). Il peut rcuprer toutes sortes dinformations sur
13
ltat actuel dun quipement rseau. Ces informations sont stockes dans une base de donnes arborescente appele MIB Management Information Base .
Ce protocole nest plus lunique moyen de supervision : en effet les logiciels de supervision daujourdhui tendent vers lutilisation dagents propritaires afin de remplacer le protocole SNMP et ce dans le but de fournir toujours plus dinformations lutilisateur.
Cependant le protocole SNMP reste le seul moyen de surveiller lactivit dquipements rseaux tels que les commutateurs ou les routeurs, tant donn que ces matriaux offrent rarement la possibilit dinstaller des logiciels tiers.
14
16
On peut accder aux trois interfaces pour lutilisation de loutil de supervision Nagios, Centreon et Nagvis .
17
3.4.1 Nagios
Avant de pouvoir consulter Nagios une authentification est requise
Page daccueil de Nagios, gauche le menu qui permet la navigation avec plusieurs menus et sous menus.
18
TacticalOverview permet davoir une vue globale sur les statuts des quipements et des services. Une vue trs lgre pour avoir un aperu rapide de ltat rseau.
La partie Nagvisoverview sera dtaille plus tard car depuis cette interface il est moins agrable (Fentre de vision beaucoup plus petite).
Host Detail permet de voir le statut de manire globale de tous les quipements, savoir si ils sont en ligne (UP) ou si ils ont un autre statut (Warning, Critical, Unknown).
19
Service detail montre une vue totale de tous les services que lon a souhait superviser, on peut y voir leur statut et un statut avanc pour le service (par exemple le pourcentage despace libre/occup quil reste sur un disque). On peut savoir aussi leur Uptime (Indique depuis quand ils sont UP).
Pour avoir une vue sur tous les matriaux et services qui ont un souci on peut utiliser les deux catgories Service Problems et Host Problems.
20
Une partie Reporting qui sert de logs et qui permet de visualiser tous les quipements ou services qui ont eu un problme un moment prcis. Elle se compose de: Trends : Sert crer des graphiques sur une priode choisie, pour un quipement ou un service afin de faire un graphique de ses statuts.
Availability : Permet de donner prcisment le/les statuts des quipements et des services par groupes ou spars sur une priode choisie.
21
La partie Alerts regroupe trois parties : Histogram qui permet de faire des graphiques du nombre dvnements (Recovery, Warning, Unknown, Critical) sur une priode choisie.
History qui regroupe les toutes les alertes positives et ngatives quil y a eu le jour voulu.
22
Summary fait une liste des 25 alertes les plus critiques sur les matriaux ou services choisis.
La partie Event Log regroupe toutes les notifications de Nagios et tous les changements de statuts des quipements.
23
24
3.4.2 Centreon
Une interface un peu plus conviviale que Nagios.
Authentification : La premire tape faire avant daccder linterface de Centreon cest douvrir un navigateur web et crire dans la barre de navigation http://localhost/centreon . Une page dauthentification saffiche demandant le nom de lutilisateur ainsi que le mot de passe.
TacticalOverview : La figure ci-dessous est la premire vue aprs lauthentification, elle nous propose lessentiel des informations importantes qui sont : ltat de fonctionnement du systme dinformation supervis, le nombre dalertes actuelles, etc.
25
Sant globale : Cette vue nous permet davoir en reprsentation dite en camembert, un tat de sant globale de notre supervision.
Statistique de Nagios : Dans cette vue, on retrouve les performances de notre supervision (temps de check, latence etc..) et des graphiques traant lhistorique de performance de chacun de nos instances.
26
Graphique de performance
Monitoring : Cette vue va nous permettre daccder nos htes et nos services superviss. Htes
27
Les services
Event logs: Dans cette vue, nous aurons accs tout lhistorique des journaux dvnements concernant Centreon (Nagios).
28
Views : Cette vue permet de voir, de crer, de paramtrer des Templates de graphiques pour les exploiter ensuite pour vos htes et services.
Reporting : Cette vue vous permet davoir des statistiques de fiabilit de chaque hte sur une priode de tempsdonnes.
29
3.4.3 NagVis :
Nagvis est un module de cartographie. Il permet de crer des vues mtiers de la supervision. Donc nous avons coupl Nagvis au schma de notre maquette rseau et ainsi nous lavons mis en relation les donnes de Nagios.
30
Conclusion
Dans ce rapport, on sest pench sur laspect pratique de notre projet, et on a ainsi pu prouver lapport important de Centreon Nagios, qui est principalement, la facilit de la configuration, mais aussi la livraison de comptes rendus et danalyses plus rapidement et dune manire beaucoup plus prcise pour le seul but de gagner et optimiser la gestion de son temps.
En outre, nous avons pu acqurir un tas de connaissances et des informations substantielles propos le processus de supervision.
Au cours de ce semestre, on a apprhend beaucoup de choses sur les logiciels libres (open source) quils facilitent la surveillance.
Ce projet a galement permis d'apprendre considrablement sur le monde libre, sur sa philosophie et sa culture, sur sa puissance d'organisation grce aux communauts, et les alternatives qu'il apporte aux solutions commerciales.
Enfin, nous sommes trs satisfaits de ce projet qui a ajout une dimension idale sur nos comptences, et connaissances professionnelles.
31