Vous êtes sur la page 1sur 106

SUPERVISION BASE SUR SHINKEN .

THSE DE BACHELOR PRSENTE PAR

Monsieur Huseyin BILGIN


Pour lobtention du titre Bachelor of Science HES-SO en
Ingnierie des technologies de linformation avec orientation en Logiciel et Systmes
Complexes

Septembre 2015

Professeur HES responsable TB En collaboration avec


Grald Litzistorf Jacques Daudel / Qim info
Printemps 2015
Session de bachelor

INGNIERIE DES TECHNOLOGIES DE LINFORMATION


ORIENTATION EN LOGICIELS
SUPERVISION BASE SUR SHINKEN
Descriptif :
Mise en place dun outil de surveillance dun systme dinformation htrogne.
Ce systme doit permettre de visualiser des alertes ponctuelles et de surveiller les variations de performances des
diffrents systmes. Il devra surveiller lensemble des couches que lon trouve sur de telles architectures :
hardware, systmes bas niveau, communication/rseau, couches middleware, couches applicatives etc
Le projet consiste identifier un sous-ensemble reprsentatif et de dployer un systme qui permet de surveiller
ce sous-ensemble.
Le systme se limitera la surveillance et ne devra pas dclencher dactions correctives.
Il devra tre robuste pour assurer la surveillance en toute circonstance et peu intrusif pour ne pas dstabiliser les
systmes de production.
Travail demand :
Le travail se dcompose en plusieurs phases. Il part de lanalyse des besoins la mise en vidence de la
pertinence de la solution propose.
Nous pouvons distinguer les grandes phases suivantes :
Inventaire des types dlments surveiller ;
stratgie du dploiement de la surveillance. Cela peut-tre un dploiement horizontal (couche par couche)
ou un dploiement vertical (par application mtier) ;
Slection dun outil de surveillance avec les arguments prouvant sa puissance, sa robustesse et sa prennit;
Identification dun primtre pour la ralisation dun prototype (POC ou Proof Of Concept). Il sagira
certainement de surveiller plusieurs systmes en environnement UAT (User Acceptance Tests) ;
Dploiement de la surveillance sur le primtre slectionn pour le POC avec un travail particulier sur la
reprsentation des informations ;
Grandes lignes et estimations pour un dploiement global sur le systme dinformation.

A la fin du stage nous attendons les 4 livrables suivants, dont un optionnel :


Un schma darchitecture ;
Un POC oprationnel ;
Un plan de dploiement.
(option) Des bauches de procdures de dploiement (ex : comment intgrer la surveillance dune nouvelle
application, dun nouveau routeur et

Candidat : Professeur(s) responsable(s) : Timbre de


Litzistorf Grald
M. Bilgin Huseyin En collaboration avec : Qim info

Filire dtudes : ITI Travail de bachelor soumis une


convention
de stage en entreprise : non
Travail de bachelor soumis un
contrat de
confidentialit : non
Rsum : Supervision base sur Shinken
Les infrastructures informatiques deviennent assez
complexes et nous navons plus de temps pour surveiller
manuellement les systmes. Les administrateurs doivent tre aussi proactifs car le core business repose de plus
en plus sur le systme informatique.
Les solutions de monitoring permettent de remonter des informations techniques et fonctionnelles du systme
dinformation.
Outre cette dfinition sommaire, ce domaine vaste dborde largement de ce rle et inclut donc plusieurs
activits :
Surveiller: fonction consistant
connaitre l'tat des lments de la
structure informatique.
Visualiser: prsenter sous une
forme quelconque l'tat global de la
structure informatique.
Analyser: permettre d'tablir les
rapports voulus sur la sant globale,
partielle, particulire.
Agir: permettre d'tre proactif pour
viter les problmes (Prvenir les
dfaillances.)
[Ragir: permettre de corriger
automatiquement les problmes
(Relancer des services interrompus)]
Alerter: permettre d'avertir les
personnes concernes qui peuvent
ainsi rester passives vis--vis de
l'outil.
Le but de ce travail est de mettre en
place un outil de surveillance dun
systme dinformation htrogne.
Un scnario de surveillance sera dfini pour tre inclus dans la supervision. Il faut choisir par rapport aux
besoins de lentreprise parmi plusieurs outils existants.
La supervision dfinit des mtriques pour les lments superviss et vrifie plusieurs couches comme matriel
ou applicative. Le traitement, grce aux donnes rcupres, permet de gnrer lhistorique des pannes et
des rapports sur le systme surveill.

Cette mise en uvre fournit une solution complte qui offre surveillance, mtrologie, reporting et
cartographie et montre en mme temps la faisabilit de la supervision et ses limites.

Candidat : Professeur(s) responsable(s) : Timbre de


Litzistorf Grald
M. Bilgin Huseyin En collaboration avec : Qim
info
Filire dtudes : ITI Travail de bachelor soumis
une convention
de stage en entreprise : non
Travail de bachelor soumis
un contrat de
confidentialit : non

Avant-Propos
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
08.07. 2015 3/106
Sommaire

1. Avant-Propos .......................................................................................................................................... 6

1.1. Remerciements ..................................................................................................................................6

1.2. Rgles typographiques ......................................................................................................................7

1.3. Structure du Rapport .........................................................................................................................8

2. Cahier de Charges ................................................................................................................................... 9

2.1. Contexte ............................................................................................................................................9

2.2. Supervision ......................................................................................................................................10

2.3. Quest-ce que la supervision ? .........................................................................................................10

2.4. Que superviser ? ..............................................................................................................................11

2.5. pourquoi superviser, les enjeux? .....................................................................................................11

2.6. Comment superviser ? .....................................................................................................................11

2.7. Fonctionnalit ..................................................................................................................................14

3. Etude et Choix de lOutil ....................................................................................................................... 16

3.1. Critres dtudes .............................................................................................................................16

3.2. conclusion de ltude .......................................................................................................................17

3.3. Shinken ............................................................................................................................................18

4. Scnario ................................................................................................................................................ 28

4.1. Scnario Intranet .............................................................................................................................28

4.2. Dpendances ...................................................................................................................................29

4.3. Mesures de supervision ...................................................................................................................30

4.4. Business activit monitoring............................................................................................................31

4.5. Rgles Mtier (Business Rules) ........................................................................................................32

4.6. Stratgie de dploiement ................................................................................................................35

5. Mise en uvre ...................................................................................................................................... 36

5.1. Choix de larchitecture et du systme dexploitation ......................................................................36

5.2. Les Outils Rseaux ...........................................................................................................................36

5.1. Prrequis..........................................................................................................................................36

Avant-Propos
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
08.07. 2015 4/106
5.2. Activer ou dsactiver SELinux ..........................................................................................................37

5.1. Installation Shinken .........................................................................................................................37

5.2. Installation Graphite ........................................................................................................................54

5.3. Installation Thruk et Nagvis ............................................................................................................56

5.4. Problmes frquents. ......................................................................................................................64

6. Bilan du projet ...................................................................................................................................... 65

6.1. Conclusion technique ......................................................................................................................65

6.2. Conclusion Personnelle ...................................................................................................................66

6.1. Difficults rencontrs ......................................................................................................................66

6.2. Restauration du serveur de supervision ..........................................................................................67

6.3. Axes damliorations .......................................................................................................................67

6.4. Cahier de tests .................................................................................................................................68

Annexe A. Gestion de Projet ..................................................................................................................... 72

Annexe B. Lexiques ................................................................................................................................... 78

Annexe C. Liens Utiles ............................................................................................................................... 78

Annexe D. Procdure dinstallation Hyperviseur Esxi 5.5 et VSphere Client.............................................. 79

Annexe E. Procdure dinstallation vSphere ............................................................................................. 83

Annexe F. Procdure de cration VM via client vSphere ........................................................................... 84

Annexe G. Procdure dinstallation Centos sur une VM via VSphere ......................................................... 88

Annexe H. Capture des tests...................................................................................................................... 93

Annexe I. Captures des sondes via Wireshark ........................................................................................ 101

Annexe J. Figures.................................................................................................................................... 103

Annexe K. Tableaux................................................................................................................................. 106

Avant-Propos
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
08.07. 2015 5/106
1. Avant-Propos
1.1. REMERCIEMENTS

Je ddie ce travail de mmoire mon frre Duzgun qui ma encourag tout au long de mes tudes.

Je souhaiterais remercier sincrement Monsieur LITZISTORF pour ces prcieux conseils, qui a toujours suivi
mes travaux et ma orient dans la bonne direction.

Je remercie beaucoup M Jacques DAUDEL, directeur technique chez Qim info, pour mavoir donn lopportunit
de raliser un tel projet dans un cadre professionnel pour se montrer toujours disponible et l'coute tout au
long de la ralisation de ce travail.

Je remercie galement mes collgues de Qim info, surtout M Loc MALOT chef de projet et M William REY
consultant, pour leurs encouragements et pour les merveilleux moments passs ensemble.

Je remercie M Grgoire Hostettler, ingnieur systme, pour sa collaboration durant le projet.

Enfin je souhaite remercier spcialement ma chre pouse, Meral, qui ma aid de poursuivre mes tudes
jusqu aujourdhui.

Merci toutes et tous.

Avant-Propos
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
08.07. 2015 6/106
1.2. RGLES TYPOGRAPHIQUES

La documentation est faite avec la police Lato Regular 10 pt en suivant les rgles typographique des modles
de documents de la Qim Info. Pour certains

Commande shell : Lato en gras


[root@qgemnt001]# /etc/init.d/shinken restart
[root@qgemnt001]# signifie utilisateur root
[shinken@shinken]$ signifie utilisateur shinken
Certaines commandes sont montres avec des captures dcran texte blanc sur
fond noir.
Si la commande est facultative en Lato normale 9pt

Code ou paramtres : Sont faits avec des captures texte noir sur fond blanc. Les parties
importantes sont surlignes en jaune.
Chemins de fichiers : Italique /etc/shinken
Les liens de pages web : Lato, bleu et soulign
Les liens dans le document : Cahier de charges (Lato soulign)
Les lgendes des figures : * Police de taille 9pt en italique.
Mots importants : En gras.
Puce liste bleu ou verte pour les listes.
Texte cit depuis une source : Italique

Avant-Propos
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
08.07. 2015 7/106
1.3. STRUCTURE DU RAPPORT

Le rapport est compos de 5 grands chapitres plus les annexes et un avant-propos pour rendre mon
travail plus facile lire et comprendre. Le but principal de la cette structure est de donner la possibilit de
mettre en place un superviseur bas sur Shinken tout en apprenant la vision de la supervision.

Pour vous ramener au contexte, je commence avec lentreprise Qim info et je dcris la supervision pour
donner un rsum du monde de Supervision . Suite cette introduction je dfinis le cahier de charges
suivant les protocoles utiliss pour la supervision. Les fonctionnalits du systme de supervision sont
expliques brivement.

Le chapitre suivant nous donne ltat de lart sur les outils de supervision et justifie mon choix qui sest
port sur Shinken. Ce chapitre aborde galement larchitecture et le fonctionnement. Jexplique aussi
dautres outils que jai coupls avec Shinken.

Le scnario dtaille les lments superviser, leurs facteurs, les mesures et la stratgie de supervision.
Cette partie constitue le cur du projet en dfinissant la mthodologie suivre.
La partie mise en uvre comprend toute la partie dinstallation, et de configuration de Shinken, aussi les
outils coupls au systme de supervision.

Dans le bilan du projet, janalyse les rsultats obtenus et les tests de validation. Je dnombre les
problmes rencontrs pendant la mise en uvre et je donne des axes damliorations pour que le systme
devienne plus profitable au sein de lentreprise.

La partie annexe donne des dtails comme les termes techniques, les rfrences ou les procdures
techniques. Jexplique les tapes de ralisation du projet dans la partie gestion de projet .

Avant-Propos
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
08.07. 2015 8/106
2. Cahier de Charges
2.1. CONTEXTE
La Qim Info SA a t fonde en 2004 par des personnes
issues du domaine du service informatique. Ses locaux
sont situs dans la ville de Carouge. Depuis 2010, la
socit dispose galement de locaux dans la ville de
Lausanne.
ce jour, la socit compte plus de 120 collaborateurs
mais seule une vintaine dentre eux sont prsents dans
les locaux. En effet, la plupart des collaborateurs de Qim
info sont envoys pour des missions de plus ou moins
* Figure 1 Logo de Qim info longue dure chez le client. Les prestations proposes
par la socit sont diverses et varies : dveloppement
dapplications mobiles, conception de site internet en passant par lanalyse et la maintenance de solutions
existantes, etc.
Qim info possde une infrastructure informatique disperse sur 3 sites : Genve, Lausanne et OVH.
Le local de Genve comprend
9 serveurs physiques
2 onduleurs
1 imprimante rseaux
1 parc informatique compos de 19 PC, 3 mac mini, 7 laptops, tablettes ,1 tv Samsung,
1imprimante
3 switch ,2 routeurs, 2 modems
2 points de sortie vers le rseau internet avec 2 diffrents fournisseurs daccs (Swisscom et VTX)
3 machines ddies pour les units de stockage
borne wifi
une centrale tlphonique IP PABX
Le bureau de Lausanne comprend :
1 routeur
1 imprimante
2 PCs
Le site distant chez OVH :
1 serveur physique avec Hyperviseur Esxi qui hberge 3 VM (Machine Virtuelle) avec CentOS
1 Serveur physique de backup FTP
1 VM avec hbergement Windows pour une application web
1 VM avec centos comme serveur APNS
Tous les employs utilisent les ressources et les services informatiques constamment. Les produits
fabriqus (logiciels, applications) sont hbergs sur les serveurs. Ces serveurs hbergent aussi les
applications et les services ncessaires pour faire tourner les activits. A lintrieur des locaux, le rseau
LAN regroupe linfrastructure et 2 points de sorties garantissent laccs au rseau internet (providers
Swisscom et VTX). Comme une importante infrastructure est hberge chez OVH, laccs celui-ci doit
toujours tre oprationnel.
Le business dpend fortement de la fiabilit du systme informatique. Nous devons tre en mesure de
dtecter toutes les pannes survenues sur ce systme, surtout celles qui peuvent empcher les activits
normales (Business as Usual). Ces pannes peuvent avoir un cot important sil ny pas dintervention. Mais
la dtection dune panne lors de son apparition ne suffit pas car seul un systme prdictif peut empcher
une panne.

Cahier de Charges
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
08.07. 2015 9/106
2.1.1. Problmatique
Actuellement la surveillance est assure par lintervention de M Hostettler (Ingnieur systme) qui est
contrl par M Daudel (Directeur Technique) et M Malot (Chef de projet) dune faon non automatise.
Cette manire ne suffit plus aux besoins de lentreprise.
La ncessit dun systme de surveillance automatis est vitale. Ce systme doit dtecter certaines
anomalies en avance et ne doit pas nuire aux performances du systme. Mais il doit tre aussi adaptable
pour une infrastructure distribue et htrogne.

2.2. SUPERVISION
La figure ci-dessous ma permis de rflchir sur la mthodologie et la technique utiliser pour la
supervision. Elle rsume les parties tudier :

Qui?

Que Comment?
superviser? Supervision

O et
quand?

* Figure 2 Mind map pour la supervision

2.3. QUEST-CE QUE LA SUPERVISION ?


Depuis quelques annes la surveillance des infrastructures informatiques est devenue incontournable. Cette
manire de surveiller apporte la possibilit davoir une vue globale sur ltat de linfrastructure mais aussi sur
les possibilits dauditer les systmes, surveiller la disponibilit et les performances et alerter les responsables.

Une supervision consiste mesurer divers mtriques permettant de renseigner les responsables sur la qualit
dun service. Un systme de supervision est compos de fonctions qui consistent mettre en place des
indicateurs dtat sur une infrastructure informatique.

Cahier de Charges 10/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
La supervision peut permettre une entreprise de :
Vrifier ltat dun priphrique ou dun service
Remonter des alertes
Dtecter des anomalies et pannes

Surveiller Alerter Visualiser Analyser

* Figure 3 Chane de la supervision

2.4. QUE SUPERVISER ?


La pondration des lments surveills dpend de limportance dun lment pour le business. Cela veut dire
que certains machines, serveur ou dautre lment du systme informatique peuvent avoir un effet plus
importance que les autres concernant la productivit de lentreprise. Exemple : si un routeur tombe en utilisant
le 2me routeur on peut facilement continuer travailler, par contre si cest le serveur dintranet ou un serveur
de production sur lequel on hberge les applications importantes qui tombe, cela peut perturber le travail des
dveloppeurs ou administration.

Supervision peut tre dcompos en 4 grandes parties ;


La supervision technique (systme) :
Elle va consister surveiller le rseau, linfrastructure et les machines du systme
dinformation
La supervision applicative :
Cette partie consiste surveiller les applications.
La supervision mtier :
Consiste surveiller les processus mtiers.
La supervision de la scurit :
Surveillances des attaques contre le systme informatique.

* Figure 4 Couches des lments pour la supervision


2.5. POURQUOI SUPERVISER, LES ENJEUX?

Linfrastructure informatique comprend de nombreux systmes qui peuvent mal fonctionner. Si un problme
nest pas dtect au bon moment, il peut engendrer des srieux dgts lentreprise vu que le business dpend
fortement du systme informatique. Avec un superviseur nous avons la possibilit danticiper une panne et la
rsoudre plus rapidement. Cela permet aussi de surveiller la sant du systme.

Prvenir en cas de problme et rduire les dlais et cot des interventions sont les enjeux principaux. Une bonne
supervision aide aux responsables informatiques pour rendre des comptes, tre au courant et corriger QoS
(Quality of Service).

2.6. COMMENT SUPERVISER ?


Le principe de supervision implique lutilisation de beaucoup de services et cela est complexe : le superviseur
teste les services et les quipements avec des outils dacquisition et il va alerter le responsable en cas de panne.

Cahier de Charges 11/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Il fournit galement une interface pour surveiller le systme en temps rel. Ces tests se font via lexcution de
certains binaires ou scripts qui se trouvent sur le superviseur.

Ces tests quon appelle sonde (check) se font distinguer par deux approches : avec ou sans un agent. La diffrence
de ces deux mthodes repose sur linstallation ncessaire sur llment superviser. Les sondes sans agent
comme des sondes tcp, http, ssh se font souvent sans rien installer sur llment. Mais dans le cas dune sonde
avec ssh, si llment na pas de serveur ssh, il faut linstaller. Alors que dans le cas dune sonde via SNMP ou
encore nrpe il faut faire des installations et des configurations. Dans mon cas, vu le nombre de machines
surveilles, je nai pas beaucoup dinstallation faire mais pour un systme plus volumineux ces installations
peuvent crer des soucis. Les problmes de scurit sajoutent car chaque protocole oblige louverture de
certains ports sur les firewalls.

Pour une sonde en SSH la cl publique de shinken doit se trouver aussi dans les cls autorises de cette machine.
Lavantage de cette mthode est aussi la facilit dautomatiser le processus de dploiement de la cl SSH avec
un script ou Snake ol.

2.6.1. Comparaison de deux sondes (HTTP et SNMP)

La manire de rcuprer les donnes pour les sondes (check) varie beaucoup selon les mthodes utilises. Par
exemple dans le cas dune sonde en http, loutil fait tout simplement une requte http vers une url et analyse la
rponse reue pour dterminer ltat de service.

Dans le cas dune sonde snmp, on fait une requte snmp (encapsule dans UDP) vers une machine surveille.
Cette machine doit avoir le service snmp activ pour couter les requtes snmp depuis lextrieur. Ds la
rception dune requte la base de donnes des objets (MIB) est consulte. Le service peut envoyer une
information demande avec son identifiant (OID) ou toutes les informations quil possde.

a) Exemple sondes http en perl :

my $url = $protocol . "://" . $o_host . ":" . $o_port . $o_url ;


my $request = HTTP::Request->new('GET', $url);
my $response = ..->request($request);
# Get the HTTP Responde Code (200, 404, 500 ...)
my $code = $response->code();
my $content = $response->content();
if($code .)

b) Exemple sondes SNMP en perl :

#Connexion avec la machine


foreach $oid (@oids)
($session,$error) = Net::SNMP->session(Hostname => $host,
Community => $community, Port => $port);
$get = $session->get_request("$oid");
$session->close;
$value = $get->{$oid};
#recuperation des donnes
push @{ $results{$label} },($value,$warn,$crit,$v,$an);

Le monde de la supervision possde des standards et la supervision est faite via des protocoles. Les principaux
protocoles sont :

Cahier de Charges 12/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
2.6.2. SNMP Simple Network Management Protocol

Ce protocole est plus utilis dans le monde de supervision, la premire version (SNMP v1) date de 1987, mais la
tendance est dabandonner le SNMP et daller vers dautres outils qui conviennent mieux aux besoins du monde
informatique comme la supervision applicative. Ce protocole est encapsul dans UDP et la communication se
fait via les ports 161/162.

Snmp est un protocole de communication pour superviser et diagnostiquer les quipements de rseau. Il permet
principalement de :
Fournir des informations dtailles concernant les quipements et le rseau
Paramtrer les quipements du rseau
Alerter les responsables
Beaucoup doutils de supervision utilisent SNMP pour avoir ltat des quipements. (Centrerons, Net Crunch 5,
MRTG, Cati, Schinkel, Nagios, Zarbi).
Un agent install sur lquipement gr transmet les
donnes au format SNMP. Un nom de communaut est
dfini pour la communication. Une restriction est
possible au niveau des adresses IP pour communiquer
avec lextrieur. Les responsables peuvent grer et
visualiser les quipements depuis une centrale. SNMP
obtient les informations depuis une base de donnes
depuis MIB (Management Information Base) mais malgr
que MIB contienne beaucoup de donnes, one ne peut
pas obtenir les informations de haut niveau comme tat
dun service http ou autre.

* Figure 5 Schma du fonctionnement SNMP

2.6.3. IPMI Intelligent Platform Management Interface

L'Interface de gestion intelligente de matriel, est un ensemble de spcifications d'interfaces communes avec du
matriel informatique (principalement des serveurs) permettant de surveiller certains composants (ventilateur,
sonde de temprature, ...), mais galement de contrler l'ordinateur distance, reboot, interrupteur, console
distance.

2.6.4. CIM- Common Interface Model

Le standard ouvert pour dfinir comment reprsenter les lments administrs sous forme dun ensemble unifi
et cohrent.

2.6.5. JMX Java Management Interface

API pour la gestion de fonctionnement dun logiciel java.

2.6.1. WBEM Web Based Enterprise Management

Lensemble de standards pour unifier la gestion des infrastructures.

Cahier de Charges 13/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
2.6.2. SBLIM- Standard Based Linux Instrumentation for Manageability

Permet dutiliser les technologies de WBEM depuis des machines Linux.

2.6.3. WS-MANAGEMENT - Web Services for Management

Utilise services web bass sur SOAP pour la gestion.

2.6.4. WMI - Windows Maganement Instrumentation

Cest une implmentation du Web-Based Entreprise Management pour les plates-formes Windows qui tend le
modle CIM (Common Information Model). Elle est puissante au niveau de ses fonctionnalits.

2.7. FONCTIONNALIT

2.7.1. Objectifs
Mise en place dun outil de surveillance dun systme dinformation htrogne.
Ce systme doit permettre de visualiser des alertes ponctuelles et de surveiller les diffrents systmes.
Il devra surveiller lensemble des couches que lon trouve sur de telles architectures : hardware, systme bas
niveau, communication rseau, couches middleware, couches applicatives (sur tous les trois sites existants).
Les paramtres des lments de linfrastructure surveiller :
Charge CPU
Charge RAM
Quota de disque
Bande passante
Etat de lhte (Rponse au Ping etc.)
Etat des services (web, SQL etc.)
Le systme se limitera la surveillance et ne devra pas dclencher dactions correctives.
Il devra tre robuste pour assurer la surveillance en toute circonstance et peu intrusif pour ne pas dstabiliser
les systmes de production.
Un affichage en temps rel aidera les administrateurs rsoudre le problme aprs avoir reu lalerte en aide
au diagnostic.

2.7.2. Fonctions de surveillance


Serveurs
Charge (CPU, RAM, disque, rseau), surveiller avec un seuil
tat des services
Applications, services hberges par les serveurs
Etat de services
VMware avec Hyperviseur ESXi
tat de lhte : Charge (CPU, RAM, Disque, Rseaux)
Machine virtuelle
Charge (CPU, RAM, Disque, Rseaux), surveiller avec un seuil
Postes de travail : Pc, Mac, laptops
Allum ou pas, pour certains
Charge (CPU, RAM), surveiller avec un seuil
Quota disque, surveiller avec un seuil

Cahier de Charges 14/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Switch
Disponibilit
Routeurs
Disponibilit
Accs vers lextrieur
Modem
Disponibilit
Accs vers lextrieur
Imprimante
Disponibilit
Borne daccs Wifi
Disponibilit

2.7.3. Fonctions de communication


Le systme envoie un mail une liste de distribution it@qiminfo.ch avec un message clair contenant la source
de panne, le degr et le plus de dtails possibles.
Le systme doit envoyer des notifications aux responsables. (Dautres mthodes de communication peuvent
tre implmentes dans le futur, choisir le responsable selon la panne et lhoraire peut tre une possibilit
aussi)
Niveau des alertes
Le systme de surveillance remonte une alerte mais des fois cela nempche pas le blocage du service
informatique. Le systme peut tre prdictif pour certains cas et lancer des alertes avant la production de
lerreur. Exemple : lancer une alerte quand le quota de disque atteint 90% au lieu de lancer lalerte 100%.
Ce type d'avertissement peut avoir un niveau moins important mais facilite le travail de ladministrateur.
Il faudra aussi dfinir les seuils dutilisation acceptables pour dclencher des alertes quand on sapproche de la
limite (ex : CPU utilise pendant plus de 5 minutes plus de 80%).

2.7.4. Fonction daffichage

Le systme de supervision affiche en temps rel ltat des systmes avec plusieurs vues. On peut afficher une
vue globale et des vues dtailles.
Les administrateurs veulent voir ltat gnral du systme et ils ont la possibilit de choisir les lments
visualiser. Nous pouvons par exemple vouloir afficher ltat de systme par couche. Ex: afficher juste les
serveurs web ou les quotas de disques.

Interface web personnalis pour surveiller linfrastructure en temps rel. Crer plusieurs vue ventuellement
une premire vue gnrale qui rsume ltat gnral du systme.

Proposer des vues dtailles pour les lments surveiller.

Cahier de Charges 15/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
3. Etude et Choix de
lOutil
3.1. CRITRES DTUDES

Les critres de choix se basent sur le cahier de charge dfinie dans la section2.7. Nayant pas dassez de temps
pour installer et essayer ces outils, je me suis bas sur les tudes et les comparaisons existantes avec les
spcifications fournies.

Comp Ractivit de
Paramtra Fonctionnalit de
tabilit Dploiement la
ge, supervision (quels Interface
sur systme communaut Performan Platform
Modularit quipements et quels web, vue
avec distribu et et quipe de ce (Win/Lin)
, ajout des facteurs sur ces custom
VMw htrogne dveloppeme
plugins quipements)
are nt

++
++
+++ (interfac +
+ ++ (rapide car
e de (Linux)
-+++ +- crit en C)
base)

+++ ++
+++
(efficace (plus
+ -+++ (idal pour ++ +++ ++
car moderne
distribuer)
optimis) )
-
(nagios+cact + +-++ ++ -+ +++ ++ ++ (os ddi
i+..) centos)

+ -++ ++ ++ +++ ++ ++
(Nagios)

+++
+ -+- ++ ++ ++ ++ ++
++
+ -+- ++ -+ + +- ++
+++ +
+ -+- ++ -- + ++
(Nagios) (Linux)

* Tableau 1 Tableau de comparaison des outils

Etude et Choix de lOutil 16/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
3.2. CONCLUSION DE LTUDE
Parmi les outils tudis Nagios et Shinken sont les plus adapts au projet.
Interface : Shinken possde une interface plus moderne et linterface de lutilisateur marche sans un serveur
apache ou autre.
Performance : Malgr que Nagios soit crit en C, Shinken fournit des performances amliores par rapport
Nagios.
Le nombre max de sondes en 5minutes.
Nagios 3 (C) <=> icinga 1.6 (C) = 30K
Centreon-engine (C) = 25K
Shinken = 120K
Source : Jean Gabs http://fr.slideshare.net/JeanGabs/confrence-shinken-sophiaconf2012-jean-gabs
Modularit : Shinken est totalement modulaire avec systme de multiples dmons.
Systme distribu : Shinken est dvelopp surtout pour permettre de superviser un systme distribu. Sa
configuration est plus simple que Nagios. Il donne aussi la possibilit du degr de distribution. Nous pouvons
configurer tous les sites facilement avec une seule configuration et choisir les parties dployer dans les sites
distants.
Business rule(Rgles mtier) : Shinken introduit la rgles mtier dans ses implmentations ce qui est bnfique
pour les socits services informatiques.
Plateforme : Shinken peut galement tourner sous Windows alors que Nagios ne peut pas.
Mais Nagios comporte quand mme des avantages comme des modules binaires dj compils et une
interface dtaille.
Shinken se diffrencie avec sa modularit et adaptation pour un systme distribu. Il est aussi optimis pour
une meilleure performance. Son amlioration au niveau des performances est nettement considrable auprs
Jean Gabs.
Malgr que Shinken soit nouveau par rapport Nagios, il a une communaut trs ractive. Shinken possde au
moins un millier de contributeurs et cela ne cesse daugmenter.
Finalement mon choix se porte sur Shinken aprs cette comparaison de critres. La figure 6 ci-dessous illustre
bien larchitecture de Shinken sur un systme distribu qui convient aussi lentreprise Qim info.

La prsentation de M
Sbastien Pasche, la
date du 11 mai 2015, qui
est ingnieur de systme
chez le shop nous a bien
confirm tout ceci.
Contributeur de Fedora,
Shinken et plusieurs
projets dopen source M
Pasche pense aussi que
Shinken volue trs
rapidement et Nagios
subit beaucoup et il ne
change plus depuis
plusieurs annes.

* Figure 6 Exemple
d'architecture Shinken pour
un systme distribu

Source : http://shinken.readthedocs.org/en/latest/07_advanced/distributed-with-realm.html

Etude et Choix de lOutil 17/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
3.3. SHINKEN

* Figure 7 Logo Shinken

Shinken est un outil de supervision, une implmentation de Nagios en Python from scratch qui a pour
objectifs principaux de simplifier la vie des administrateurs de grands parcs et de coller au mieux lvolution de
lIT des dix dernires annes, et si possible prparer les dix prochaines...
Jean Gabs, le crateur de Shinken lors dune interview en 2011.

Le projet Shinken a commenc avec un fork de Nagios par Jean Gabs pour corriger certains bugs quil avait
dcouverts. Il rcrit en Python en obtenant des rsultats excellents surtout au niveau des performances et
avertit lquipe de Nagios mais lquipe de Nagios nacceptait pas les changements.
Alors le Shinken est n comme un petit frre de Nagios en 2009 pourtant il a trs vitre volu grce aux
nombreux contributeurs. Lide principale tait de dcouper le cur monologique de Nagios en plusieurs
parties par rapport aux diffrents rles.
Shinken rvolutionne larchitecture de Nagios mais galement apporte des solutions pour la scalabilit, la
supervision des impacts de business. Son dcoupage fonctionnel nous permet dadapter loutil sur une
infrastructure distribu. Il offre une haute disponibilit et la rpartition de charges.
Cet outil facilite aussi la dtection de la source des incidents et viter des fausses alertes.
Il a t dvelopp pour devenir une solution complte de supervision mais lheure actuelle il est considr
comme un framework de supervision. Et lquipe prfre lintgration des outils comme les outils de
mtrologie la place de tout dvelopper dans le projet Shinken.
Lutilisation de Shinken est sous licence GNU (AGPL- Licence publique gnrale Affero).

* Figure 8 Architecture Shinken

Source : http://blog.nicolargo.com/2012/11/installation-pas-a-pas-dun-serveur-de-supervision-
shinken.html/shinken-architecture

Etude et Choix de lOutil 18/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
3.3.1. Architecture
Shinken a mise beaucoup sur son architecture qui le diffrencie des outils de supervision. Il est compos de six
dmons (daemon -service) et sa modularit repose sur ce principe. Chaque dmon a son rle. part lunique
dmon arbiter , nous pouvons multiplier et dployer les dmons lendroit voulu. Cet endroit peut tre un
site distant un le DMZ(Demilitarized Zone) qui convient mieux par rapport larchitecture de linfrastructure.
Cette modularit supporte des grandes charges et fournit la haute disponibilit.

a) Arbiter

Ce dmon unique a comme rle de grer tous les autres dmons. Il lit la configuration, la dcoupe, et
lenvoie aux lments de larchitecture. Il gre aussi la haute disponibilit : si un lment meurt, il envoie la
configuration un autre dmon disponible.

b) Scheduler

Il ordonnance les tests et gre des actions en cas de soucis lors des sondes. Son rle nest pas lancer les
sondes mais de planifier lheure des sondes pour le Poller et rcuprer les rsultats de ces tests pour envoyer
au Reactionner et Broker. On peut en avoir autant quon veut, lArbiter dcoupe la configuration par rapport
au nombre de schedulers dfinis comme dans la figure 8 ci-dessus.

c) Poller

Le rle dun Poller est lancer une sonde en excutant un binaire ou un script mais aussi retourner les rsultats
au Scheduler. On peut en avoir autant quon en a besoin. Pour des systmes distribus, volumineux ou
complexe les Pollers peuvent tre positionns dans diffrents endroits pour contourner les problmes de
performances et scurit.

d) Reactionner

Le Reactionner gre lenvoie des notifications selon les directions de Scheduler. Souvent il envoie des mails
mais aussi il peut envoyer des sms via des modules.

e) Broker

Il est charg de rcuprer les donnes depuis le Scheduler et de les mettre dans dautres outils via des
modules. Par exemple il peut exporter des donnes de mtrologie vers Graphite ou PNP4Nagios via le module
Livestatus. Linterface web de Shinken rcupre les informations depuis le broker via le module Webui.

f) Receiver

Le seul dmon facultatif, utilis pour recevoir les donnes de sonde passif qui est lanc par un lment surveill
contrairement une sonde actif lanc par un Poller.

3.3.2. Plugins
Un plugin est un excutable, peu importe le langage de codage. Cela peut tre un binaire compil ou un script.
Tant que ce plugin envoie le bon code de retour, il est compatible avec Shinken. Le plugin peut envoyer des
donnes de type performance data pour tre traits avec des outils externes. Si le plugin envoie de
donnes, le code de retour doit tre spar avec |. Le plugin peut envoyer plusieurs lignes de donnes.
Cest finalement plugin qui indique au Shinken ltat de llment surveill avec quatre types de code de
retours bas sur POSIX. Le retour de lun de ces est obligatoire.
0 - OK : Tout va bien.

Etude et Choix de lOutil 19/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
1 Warning : Risque potentiel problme (Les mtriques tests ont atteint le
niveau warning).
2 Critical : Problme survenu.
3 Unknown : Le check na eu lieu.

La plupart de ces plugins sont crit en Perl et Python.

* Figure 9 Exemple du rsultat des plugins dans Shell

* Figure 10Performance data retourn par le check disk via SSH sur interface Web

Les donnes retournes sont gardes dans trois macros (variables).


$SERVICEOUTPUT$ DISK OK - free space: / 3326 MB (56%);
/=2643MB;5948;5958;0;5968/boot=68MB;88;93;0;98/ho
$SERVICEPERFDATA$ me=69357MB;253404;253409;0;253414/var/log=818MB;
970;975;0;980
/ 15272 MB (77%);n/boot 68 MB (69%);n/var/log 819 MB
$LONGSERVICEOUTPUT$
(84%);

Etude et Choix de lOutil 20/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Shinken peut accepter au maximum 8KB de donnes par dfaut mais on peut le modifier via la variable
max_pluginsnet_output_length.
Ces plugins sont trouvables sur le site monitoring plugins mais aussi on peut utiliser les plugins de Nagios qui
sont disponibles sur le portail de Nagios.

3.3.3. Modules
Les modules sont ajouts pour tendre la fonctionnalit de supervision. Ils sont intgrs dans les dmons tels
que Broker ou Arbiter. Chaque module doit tre dfinie dans Shinken et li au dmon concern.
Certains modules comme Livestatus, webui ou encore les modules de log sont des indispensables pour Shinken.
Le module webui permet davoir linterface web de shinken native. Un module de log est ncessaire pour le
systme log.

Etude et Choix de lOutil 21/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 11 dclaration d'un module dan /etc/shinken/modules

Suite la dclaration du module, il faut aussi ajouter dans le dmon concern. En loccurrence pour
linterface web, cest le dmon broker qui sen occupe pour fournir les donnes.

* Figure 12 Ajout du module webui dans le dmon broker

Etude et Choix de lOutil 22/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
3.3.4. Check (sonde)
Un Check est la base dun systme de supervision car ce sont les sondes qui font le travail. Une sonde est une
vrification dun lment surveiller. Cela peut tre un Ping pour tester un host ou une requte http afin de
vrifier la disponibilit dune URL. Une sonde est utilis dans la configuration dun host ou service vie une
commande. La commande dtermine utilisation dun plugin avec les paramtres passer lexcutable.
Shinken, comme Nagios, dfinit 4 niveaux de message de retour pour les sondes. Pour une vrification (check)
il faut dfinir des niveaux pour warning et critical. Ces niveaux peuvent tre ajusts au fur et mesure. Dans la
possibilit je privilgie des check par SSH. Une sonde en SSH est scurise et faite sans installer un agent sur
llment surveiller. Mais il faut envoyer la cl SSH publique du serveur de monitoring vers lhte surveill.
Pour chaque type dlments vous avez les facteurs surveiller, les mthodes et les niveaux. En cas
dimpossibilit de sonde SSH, deuxime mthode sera des sondes par SNMP. Concernant les machines avec
Windows des sondes via WMI sont prvus car cette mthode se fait sans installation spcifique sur la machine
monitor. Cela consiste rcuprer les informations depuis la gestion interne Windows avec un utilisateur
existant. Donc il faut pralablement avoir un compte pour le Shinken dans lAD. Une troisime catgorie de
sondes est http qui est trs utiles pour la supervision applicative. Par rapport lapplication supervise il y a des
check bas en tcp ou udp pour tester les services comme MySQL, FTP ou DNS.
Dans notre cas les sondes sont en mode actif, cela veut dire que cest le serveur de monitoring qui interroge les
lments surveiller alors quen mode passif cest contraire.

* Figure 13 Fonctionnement d'un check en SSH

3.3.5. Agent
Un agent est un programme qui est dploy sur un systme supervis afin de fournir les donnes
ncessaires au Poller. Exemple typique de ces agents ; nsclient qui sinstalle sur machine Windows. Le
dploiement dun agent est une grande problmatique car, pour une infrastructure assez htrogne et
grande le travail est complexe.
Lapproche actuelle est une supervision sans agent. Mais supervision sans agent ne veut pas dire quil ny
rien dinstall sur la machine. Cest plutt de superviser avec des programmes ou protocoles dj installs.
Dans la plupart de cas des services comme SSH, SNMP, WMI existent sur les machines.
Je privilgie aussi la supervision sans agent dans le but de faciliter le travail et faire moins dinstallation
possible sur linfrastructure existante.
Mais une configuration est souvent ncessaire pour pouvoir faire supervision sans agent.

Etude et Choix de lOutil 23/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
3.3.6. Interface Web de Shinken
Shinken vient avec sa propre interface web qui est assez moderne et ergonomique. Linterface de base est
responsive et marche assez bien sur des appareils mobiles avec des vues plus simples. Lauthentification de
base est gre avec un fichier et les prfrences des utilisateurs sont sauvegardes dans une base de donnes
simple comme sqLite ou mongoDB. Lauthentification peut tre couple avec lannuaire LDAP.

* Figure 15 Vues de l'interface web sur un smartphone

* Figure 14 Interface Web Shinken - Vue Dashboard


Les vues principales :
Dasboard : vue personnalis pour chaque utilisateur.
All : affiche tous les lments surveills.
Impacts : affiches les rgles mtier.
IT problems : Affiches les problmes, dans le cas de problmes lis entre eux, elle affiche les sources des
problmes.
Wall : Impacts et les IT problems.
System : affiche les tats des dmons.
Currently : affiche une vue globale des lments.

Etude et Choix de lOutil 24/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
3.3.7. Outil de mtrologie ou reporting
Shinken nest pas une solution de supervision complte donc il faut ajouter des outils pour faire plus
comme analyser les donnes de check (mtrologie) ou faire des rapports de panne et disponibilit reporting.
Le couplage avec dautres outils est assez facile ct Shinken mais linstallation de ces outils est souvent
problmatique. Le cahier de charge ncessite un outil de reporting et loutil de mtrologie est un complment
de cet outil. Mais en cours de route javais la possibilit de prendre linitiative et discuter des possibilits
ajouter. La cartographie peut fournir un certain confort pour les administrateurs mais en mme temps il peut
aider trouver la source physique dun problme plus facilement.

a) Mtrologie

Les outils de mtrologie sont utiles pour analyser les performances dun systme informatique. Ces outils sont
complmentaires aux de lhistorique pour pouvoir comprendre tout ce qui se passe. Les outils historiques sont
limits au niveau des dtails et plutt orients vers les vnements, changements dtat ou log .Le couplage
de ces deux outils cre la supervision. Car la supervision comprend aussi lanalyse de donnes.
Graphite et pnp4nagios sont plus utiliss et conseills. Pnp4nagios a besoin du service npcd activ dans le
shinken. Jai pris Graphite car cela donne des graphiques assez comprhensibles avec des priodes mais aussi il
rcupre les donnes depuis Shinken avec le module Livestatus qui est disponible avec Shinken. Graphite a
deux points vitaux.
Sauvegarder les mtriques time-series data.
Faire des graphiques partir de ces donnes.
Graphite est compos de trois parties
carbon le dmon qui coute pour les donnes temporelle.
whisper une librairie simple pour sauvegardes les donnes.
webapp - a (Django) application web pour afficher les graphiques.

Etude et Choix de lOutil 25/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
b) Reporting

Thruk, Mk_multisite, Adagios sont des outils connus et fiables pour crer des rapports, surveiller les
disponibilits du systme informatique. Ces outils fournissent galement des interfaces web compltes pour la
supervision. On peut aussi regrouper plusieurs serveurs de supervision via ces outils.
Jai install multisite et thruk pour pouvoir comparer les possibilits et jai prfr le thruk car la gestion de
reporting est plus avance. Mais en mme temps il est complt au niveau de linterface, lentreprise peut
dsactiver linterface Shinken et rester sur thruk pour monopoliser laffichage. Le thruk permet aussi de
regrouper plusieurs moteur de surveillance comme Shinken et Nagios. Dans le cas ou on doit dployer un autre
serveur de surveillance chez OVH ou ailleurs le Thruk peut regrouper tous ces serveurs sur une seule interface.
Il permet en mme temps dafficher les cartes crer partir de Nagvis.

c) Cartographie

Il y a aussi des outils pour afficher le systme surveill via des cartes gographique, des images ou des schmas
crs manuellement. Le plus connu et utilis, Nagvis, marche assez bien et je nai pas trouv dautre outils
open source

* Figure 16 Interface Web avec Graphite

3.3.8. Flux de donnes entre Shinken et les outils

Livestatus est le r implmentation du module


mk_livestatus de Nagios et il fait la brique de lien
entre Shinken et dautre outil comme Graphite,
Thruk, Multisite etc. Module Livestatus communique
en http sur le port 50000. Il est rapide et permet
dobtenir ltat des machines, services, la
configuration de shinken, des rapports et statiques
mais aussi envoyer des commandes vers Shinken via
un langage de requte similaire SQL mais
performant. Il est unique module pour obtenir les
impacts business et dpendances intelligents. Il peut
marcher sans une base de donnes tout simplement
avec un systme de log.

* Figure 17 Schma de communications entre shinken et


dautres outils

Source : http://shinken.readthedocs.org/en/branch-
1.4/89_packages/livestatus_shinken.html

3.3.9. Commun avec Nagios


Les configurations sont assez similaires que Nagios et on peut garder les paramtres pour les lments
surveills. On peut utiliser les mmes plugins.

Etude et Choix de lOutil 26/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
3.3.10. Corrlation de donnes avec Shinken

Shinken a introduit la corrlation de donnes dans le monde supervision bas sur Nagios. Il est capable de
dterminer la corrlation de base avec sa configuration standard. En plus de sa fonctionnalit de dterminer la
source dun problme quil appelle root , il ajoute le terme dpendance et bp_rules. Il y a deux type de
dpendances celui entre les htes et mais aussi un deuxime entre les services. Les rgles mtiers aident
beaucoup pour faire la corrlation aussi. Avec activation problme impacts states change , Shinken ne va
pas alerter sans analyser les relations entre lments surveiller. Cela vite des alertes inutiles. Ex. : si un hte
tombe, on ne va pas alerter pour les services hbergs par cet hte.

Etude et Choix de lOutil 27/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
4. Scnario
4.1. SCNARIO INTRANET

* Figure 18 Schma du scnario

Intranet Qim utilis pour la gestion des diffrents lments administratifs. Lintranet contient les fonctionnalits
qui permettent de grer :
L'annuaire des collaborateurs
Les comptes rendus d'activit
Les demandes de congs
Les notes de frais
La facturation

Scnario 28/10
08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Serveur FTP utilis pour permettre aux clients de dposer des fichiers directement sur le serveur public de Qim
info hberg par OVH.

Comme lintranet est utilis en permanence il sera important de superviser linfrastructure qui est derrire. Ce
scnario consiste superviser une infrastructure intranet qui est bas sur un hyperviseur Esxi. Les employs
utilisent intranet depuis le parc informatique de Genve. Pour ce scnario les lments intressant sont les
dpendances car lutilisation dintranet passe par une chane depuis un pc jusquaux services.

Le schma reprsente la connectivit depuis un pc de parc informatique dans le local de Genve vers lintranet
qui est hberg chez OVH. Ce schma aide comprendre la chane de dpendances et il dvoile juste la partie
concernant le scnario.

4.2. DPENDANCES
Les lments physiques et les services surveiller dpendent dautres lments de linfrastructure ou service.
Typiquement pour pourvoir accder un site internet on doit passer par le switch qgeswi002, le routeur
qgertr002, modem qgeesi002 donc laccs internet dpend de tous ces quipements du rseau. Dans le cas
dune panne de cet quipement, les lments dpendants seront touchs aussi. Cela veut dire que on ne peut
avoir accs internet sans avoir le switch qgeswi002, le routeur qgertr002 et le modem qgeesi002 qui
marchent. Si lun de ces quipements tombe en panne on ne peut pas savoir ltat des quipements qui sont
derrire de cet quipement. Le serveur de supervision doit prendre en compte toutes ces dpendances pour
grer la source des pannes correctement. Le paramtrage de dpendances est aussi indispensable pour la
corrlation de donnes. Si le routeur est en panne le serveur va pouvoir dterminer les quipements et
services dpendants et il ne va pas faire des notifications pour ces lments.

* Figure 19 Schma de dpendances

Scnario 29/10
08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
4.3. MESURES DE SUPERVISION

Que surveiller ? Comment ?

Retourne le rsultat de la commande


mpstat sur lhte linux. Pour les htes
Charge CPU : La charge moyenne de CPU. Windows un check via WMI peut fournir les
mmes informations.
Niveau warning :80%, niveau critical : 90%.
Retourne le rsultat de la commande free
k sur lhte linux. Pour les htes Windows
RAM: Le taux de consommation de mmoire vive, un check via WMI peut fournir les mmes
le taux de consommation de mmoire Swap. informations.
Niveau warning :80%, niveau critical : 90%.
Retourne le rsultat de la commande df l
Pour les Htes T k -P sur le hte linux. Pour les htes
Disque : Lespace disponible sur disque. Windows un check via WMI peut fournir les
mmes informations.

Niveau warning :75%, niveau critical : 90%.

Ping (ICMP avec des paramtres) La


commande peut tre modifi si lhte
UP ou DOWN : Si le hte allum. refuse celle-l ou utiliser nping la place.

Ex :Icmp H IP w 3000,100% -c
5000,100% -p 10

Un check en SSH retourne le rsultat de la


commande mpstat sur lhte. On peut
Charge CPU : La charge moyenne de CPU. obtenir mme info via un check
SNMP.Niveau warning :80%, niveau
critical : 90%.

quipements Ping (ICMP avec des paramtres) La


rseaux UP ou DOWN : Si le hte allum.
commande peut tre modifi si le hte
refuse celle-l ou utiliser nping la place.
(Switch,
Routeur,
Modem)
Via un check par Ping, on compte les
Paquets perdus paquets perdus. Mais aussi un check ssh
peut fournir des informations de rseau.

Via le log de mrtg ex :


Bande passante /var/lib/mrtg/192.168.1.253_1.log

Scnario 30/10
08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Check_ftp essaie de se connecter sur le
serveur ftp avec le login dun client. Un
FTP Tester le port 21 et le login ftp
autre check tcp consiste surveiller /proc
(ftp.xxx.net)
et /sys avec une connexion SSH.

Le check MySQL se connecte au serveur


MySQL (connexion serveur MySQL)
avec un login pour tester la connexion.
Le check ssh plugin va tester la connexion
en essayant de se connecter au serveur
SSH connexion ssh SSH. Le plugin utilise la librairie pramiko
pour se connecter en tant que client dans
python.
Service,
Application Le plugin apache de nagios retourne le
Serveur Apache
statu de serveur Apache. On peut aussi
tester si le processus apache tourne avec
Si le serveur tourne
un check ssh.

Tester les URI


Application mtiers Tester les certificats
Check lentr DNS
https://uat.xxx.net/
Avec le check http fournit par nagios. Le
(Site Intranet en PHP) plugin se base sur des requtes http afin
de vrifier les applications. Mais il faut
http://jira.xxx.net encore tester laccs ces application
depuis rseaux externe de QIM Info soit
(Dashboard. Site versionning en java) en passant par un proxy, soit installant un
Poller chez OVH ou encore en utilisant le
plugin check my website.

Accs internet Ping simple vers un serveur dans


FAI
(Si on peut accder internet depuis local Genve) linternet.

* Tableau 2 Dtails de mesures de la supervision

4.4. BUSINESS ACTIVIT MONITORING


Le concept de business activit monitoring (BAM) comprend l'acquisition, lagrgation, l'analyse et la
prsentation en temps rel de donnes (typiquement des squences de valeurs temporelles et leur volution)
associes des processus d'entreprise. Ces donnes sont souvent obtenues dans le contexte dun processus
dentreprise modlis par des activits amont de modlisation de procdure d'entreprise (BPM). Cependant, le
BAM peut tre employ indpendamment de l'existence d'une solution de BPM. Le BAM consiste en une
solution dentreprise destine fournir en temps rel un rsum de la situation des activits mtiers aux
responsables des oprations et la direction.

* Source :http://fr.wikipedia.org/wiki/Business_activity_monitoring

Scnario 31/10
08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Le but d'une solution BAM est, entre autres, de permettre une raction au plus tt grce un systme
d'alarmes en cas de drive et, dans le meilleur des cas, pouvoir agir de manire proactive.
On utilisera une approche TOP-DOWN (du mtier vers la technique) pour mettre en place une solution de ce
type.

4.5. RGLES MTIER (BUSINESS RULES)

Rgles business et notion dimportance business sont des points forts de Shinken par rapport Nagios. Cela
permet aux administrateurs de se concentrer sur ce qui est important . Surveillance IT nest plus suffisant, il
faut savoir surveiller ceux qui ont un impact important sur le business de lentreprise.
Pour cela il faut un service supplmentaire dans la supervision pour agrger certains lments.
Parmi les lments surveiller deux applications mtiers (ERP) ont une importance pour le business de
lentreprise.

4.5.1. Dfinir des rgles mtiers (Business rule)


On peut ajouter une rgle mtier comme un host ou service. La seule diffrence sera mettre bp_rule comme
commande en prcisant les lments de la rgle. Il ne faut pas implmenter cette commande car elle est
interne Shinken. On peut combiner plusieurs lments pour dfinir une rgle avec des expressions rgulires
comme et, ou, non etc.
Jai dfini deux rgles pour lintranet car il y a deux accs diffrent qui impliquent lutilisation dlments
diffrents ; la premire est pour laccs interne (depuis local Qim Info de Genve) et la deuxime est pour
laccs depuis internet (pour les collaborateurs externes).
Lapplication intranet est utilise depuis local de Genve mais aussi depuis internet pour collaborateurs.

Intranet interne :
URI&mysql & http_serveur & VM & machine_Esxi & acces_internet & routeur & modem &switch
Intranet_externe :
URI &mysql & http_serveur & VM & machine_Esxi & ping_externe
intranet_Dashboard:
URI &mysql & http_serveur & VM & machine_Esxi & acces_internet & routeur & modem &switch

& : Et exemple ; site_web=mysql& http_serveur on doit avoir mysql et serveur http oprationnel pour que le
business site_web tourne.
| : Ou ; site_web1=(mysql1 | mysql2) & (http_serveur) le business site_web1 a besoin lun des serveurs mysql1
ou mysql2 et le serveur http en mme temps

Scnario 32/10
08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 20 Schma Rgler mtier (Business Rule) utilisation intranet depuis local de Genve

Une rgle mtier explique ce quil faut pour faire tourner le business avec certaines expressions rgulires
comme la figure-21 ci-dessous.

Scnario 33/10
08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 21 Composition dun Rgles mtier (Business rule)

Scnario 34/10
08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
4.6. STRATGIE DE DPLOIEMENT
Loutil de supervision sinstalle sur un serveur dans le local de Genve.
Le logigramme ci-dessous montre les tapes de ralisations pour la supervision mais elle donne en mme temps
une vision globale du projet et aide la dcomposition du projet.

* Figure 22 Logigramme de dploiement

Scnario 35/10
08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
5. Mise en uvre
La partie de mi sen en uvre comprend la ralisation des tches dfinies dans le cahier de charges (section
2.7)

5.1. CHOIX DE LARCHITECTURE ET DU SYSTME DEXPLOITATION


Lentreprise possde dj des hyperviseurs Esxi (Esxi 5.0 et Esxi 5.5) et des machines virtuelles avec Centos
(version 6.2 et 6.3) comme systme dexploitation. Centos est utilis aussi par les dveloppeurs de
Shinken. Donc le choix de larchitecture se porte sur une machine virtuelle bas Hyperviseur Esxi 5.5 avec
Centos 7.1 par lintrt de lentreprise. La machine virtuelle peut facilement tre exporte et dploye sur
un autre hyperviseur dans le local.

5.2. LES OUTILS RSEAUX


Certains outils rseaux peuvent tre utiles pour la surveillance afin de comprendre ce qui se passe dans le
rseau. Jai choisi les indispensables et jai install nmap et Wireshark ntaient pas dj install avec
Centos.

nmap
tcpdump
nping
netcat
wireshark
Avec ces outils on peut :
Dtecter les ports ouverts
Dtecter les quipements rseaux
Dtecter si un nud de rseau est atteignable
Installation namp et Wireshark :
[hbi@qgemnt001]#sudo yum install nmap
[hbi@qgemnt001]# sudo yum install wireshark

5.1. PRREQUIS
Il faut installer les dpendances comme pip, pycurl et cherrypy3. Le Shinken a besoin au moins le Python 2.6
mais 2.7 est conseill. Python 3.0 nest pas encore tout a fait compatible avec Shinken.
La plupart des OS vient avec Python install. La version 7.1 de Centos inclut la version 2.7 de Python.
[hbi@qgemnt001]# sudo install python-pip python-pycurl python-cherrypy3
[hbi@qgemnt001]# sudo useradd --user-group shinken

Mise en uvre 36/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
5.2. ACTIVER OU DSACTIVER SELINUX

SELinux est le systme disponible sous des distributions rcentes de Linux permettant de dfinir une politique
de scurit d'accs trs fine par rapport au systme d'exploitation. Il se positionne en plus des classiques
Firewall (permettant seulement un filtrage au niveau rseau). Dans notre cas SELinux peut perturber la
supervision car certains modules ne marchent pas avec SELinux activ.

Pour le dsactiver, deux solutions: La premire est d'diter le fichier /etc/selinux/config et de remplacer la ligne
SELINUX=enforcing par SELINUX=disabled puis de rebooter le systme.
La seconde, plus rapide et bien utile pour faire des tests est de taper en ligne de commande (root):
[hbi@qgemnt001]# sudo /usr/sbin/setenforce 0 -> ici, pas de reboot ncessaire.

5.1. INSTALLATION SHINKEN


Il faut toujours continuer installer avec mme mthode dinstallation sinon il faut tout dsinstaller et
rinstaller (PIP dans notre cas). Il faut se connecter en tant que root mais les commandes sont lances avec
shinken via utilisateur shinken. Avec la commande pip on installe la dernire version. Actuellement la dernire
version est 2.4 RC mais comme il vient de sortir, jai install la version 2.4. Pour savoir la version de Shinken
utilis il faut excuter
Les installation deivent tre faites en tant que root.
[hbi@qgemnt001]# sudo pip install shinken
[hbi@qgemnt001]# sudo shinken --init

A partir de la version 2, Shinken utilise LSB pour la hirarchie de ces rpertoires.


/etc/shinken for fichier de configurations
/var/lib/shinken for shinken modules
/var/log/shinken for fichiers de log
/var/run/shinken for fichiers de pid
Aprs linstallation la premire chose est faire est dinstaller et configurer linterface web.Lutilisation de
linterface web ncessite un module pour grer lauthentification et un module de base de donnes pour
sauvegarder les prfrences des utilisateurs. Le module auth-cfg-password gre lauthentification via les fichiers
de contact. Pour la sauvegarde on peut utiliser mongodb ou sqlitedb.
Jai test les deux modules et jai choisi sqlitedb, dans le cas de mongodb il faut installer mongod sur la machine.
[shinken@qgemnt001] # shinken install webui
[shinken@qgemnt001] # shinken install auth-cfg-password
[shinken@qgemnt001] # shinken install sqlitedb (OU shinken install mod-mongodb pour une bd NOSQL)
*Dans le cas de mongodb le serveur mongod doit tre install sur le serveur en suivant les instructions :
http://docs.mongodb.org/manual/tutorial/install-mongodb-on-red-hat/

Pour modifier le mot de passe par dfaut:


[shinken@qgemnt001] # vi /etc/shinken/contacts/admin.cfg
Modifier le champ password, on peut aussi modifier le nom avec contact_name.

Les modules dauthentification et sauvegarde sont ajouts dans modules webui.


[shinken @qgemnt001] # vi /etc/shinken/modules/webui.cfg
Et ajouter les modules :
Modules auth-cfg-password, sqlitedb
Le module webui est lanc par le broker donc il faut ajouter webui comme module dans la configuration du
broker.
[shinken @qgemnt001] # vi /etc/shinken/broker/broker-master.cfg
Et ajouter webui
modules webui
Dmarrage automatique de Shinken au dmarrage dordinateur :

Mise en uvre 37/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
[root@qgemnt001]# chkconfig shinken on

Dmarrage de shinken manuellement :


[shinken@qgemnt001]# /etc/init.d/shinken start
Option d permet de dmarrage en mode debugg.
[shinken @qgemnt001]# /etc/init.d/shinken d start

Ou encore les commandes suivantes :


[shinken @qgemnt001]# service shinken start
[shinken @qgemnt001]# systemctl start shinken
Dans le cas o le module dauthentification nest pas charg correctement interface web refusera le login. Un
autre problme frquent est lactivation du module de sauvegarde. Linterface web affiche une erreur comme
ci-dessous en cas de problme avec ce module.

* Figure 23 Message derreur si le module de sauvegarde nest pas activ.

Aprs le redmarrage de Shinken la premire erreur arrive car la page Wall de linterface web ne saffiche
pas.
Message derreur : Error 404: Not Found
Sorry, the requested URL 'http://localhost:7767/wall' caused an error:
Ce problme est connu est la solution est :
[root@qgemnt001#] vi /var/lib/shinken/modules/webui/plugins/wall/wall.py
Remplacer la ligne 31 import.helper par import shinken.misc.sorter et recompiler le fichier.

Les processus de Shinken sont excuts avec lutilisateur shinken en tant que des processus Python avec des
fichiers de configurations prciss. Le nombre de processus subit des changements par rapport la
configuration. La figure 24, ci-dessous, montre le nombre des processus aprs tous les ajouts de services et les
machines qui ont augment par rapport au nombre de processus de dbut.

Mise en uvre 38/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 24 Listes de processus de Shinken aprs le dmarrage

5.1.1. Installation des modules, packs et plugins pour Shinken


Les packs contiennent les fichiers de configuration ncessaires pour ajouter les lments et ces
facteurs dans la supervision. Un fichier de pack contient la dfinition dun host, ces paramtres, les
services et commandes utiliss. Ils ont conu pour que certains lments puissent tre superviss plus
facilement. Ils sont comme des templates et on les utilise juste mettant leurs nom dans la configuration
dun host ou service comme ci-dessous :
use linux-snmp
Linstallation des packs ou modules se fait de la mme manire.
On peut chercher les packs ou des modules via la commande
[shinken @qgemnt001#] shinken search nom_pack_ou_module
Jai install les packs ci-dessous aprs les recherches avec la commande :
[shinken @qgemnt001] # shinken install nom_pack_ou_module
Mais on peut aussi trouver ces packs ou modules sur le site de Shinken : http://shinken.io

Pour afficher tous les paquets disponibles :


[shinken @qgemnt001] # shinken search all
Pour avoir une interface web qui marche-t-il faut installer les modules webui, auth-conf pour le login et un
module de base de donnes pour les prfrences des utilisateurs comme mod-mongodb ou sqlitedb.
Afficher les paquets que vous avez installs
[shinken @qgemnt001] # shinken inventory
Vue la diversit de la couche matriel et applicative infrastructure de lentreprise jai essay dinstaller tous
les packs qui peuvent tre utiles.
Sqlitedb -> base de donnes pour webui
logstore-sqlite -> pour les logs
linux-ssh -> pour le check de machines linux en SSH
webui - > pour avoir linterface web native de Shinken
mongodb,mod-mongodb -> module de mondodb pour sauvegarde de donnes
auth-cfg-password -> module dauthentification

Mise en uvre 39/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
wmware -> check machine WMWare
check_mywebsite -> pack pour le plugin check mywebsite
http -> pack pour check en http
iis (w server) -> pack pour check dun serveur Windows
windows (w checks) -> pack pour check machine Windows
linux snmp -> pack pour le check en snmp
router -> pack pour check de routeur
switch -> pack pour le check de switch
mysql -> pack pour le check de serveur base de donnes
ftp -> pack pour le check de service ftp
cisco -> pack pour le check des quipements Cisco
dhcp -> pack pour le check service DHCP
dns -> pack pour le check service Dns
cups (imprimantes) -> pack pour les check dimprimante

Cette configuration nous permet dajouter des services, hosts mais pour faire des check il faut aussi installer
des plugins (excutables). Shinken et dautre outils de supervision comme Icinga, Nagios, Semsu ont des check
communs regroup dans un package nomm monitoring plugins sous le site :
https://www.monitoring-plugins.org/ .
Tlcharger les plugins.

[hbi@qgemnt001]# sudo wget --no-check-certificate https://www.monitoring-


plugins.org/download/monitoring-plugins-2.1.1.tar.gz

[hbi@qgemnt001]# sudo tar -xvf monitoring-plugins-2.1.1.tar.gz


[hbi@qgemnt001]# sudo cd monitoring-plugins-2.1.1
Configurer et installer les plugins suite linstallation du compilateur GCC.
[hbi@qgemnt001]# sudo yum enabledrepo=rpmforge intall gcc
[hbi@qgemnt001]# sudo ./configure
( O configuration optimale pour Shinken
[root@qgemnt001]# ./configure --with-nagios-user=shinken --with-nagios-group=shinken --enable-libtap --enable-extra-opts
--enable-perl-modules --libexecdir=/var/lib/shinken/libexec )
[hbi@qgemnt001]# sudo make install

On peut installer aussi les plugins faits pour Nagios car il y a enormoments de plugins pou Nagios.
[hbi@qgemnt001]# sudo install nagios-plugins
Le site https://exchange.nagios.org/directory/Plugins nous aide trouver des plugins presque pour tout et
lutilisation est aussi explique sur le site.
Aprs installations de ces plugins il faut tester chaque plugin en commande ligne avant dutilisation. Pour les
plugins tlchargs depuis le monitoring-plugin.org une page de manuel existe pour leurs utilisations.
Page de manuel pour le monitoring plugins : https://www.monitoring-plugins.org/doc/man/index.html
Tous les plugins donnent aussi son utilisation avec loption h ou help.

Mise en uvre 40/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 25 Aide pour lutilisation dun plugin

Les plugins de Shinken se trouvent dans /var/lib/shinken/libexec et les plugins de Nagios se trouvent
/usr/lib/Nagios/Plugins mais par rapport la version tlcharg les plugins de Nagios peuvent se trouver aussi
dans /usr/local/Nagios/libexec. Le rpertoire dinstallation na pas de grande importance car dans les
configurations de Shinken on dfinit les rpertoires des plugins dans le fichier
/etc/shinken/ressource.d/paths.cfg et dans chaque commande on donner le chemin absolu dun plugin avec
ces macros.

* Figure 26 Figure Configuration de chemins de plugins.

5.1.2. Paramtrage de Shinken


La configuration de Shinken se trouve dans le rpertoire /etc/shinken et chaque dmarrage Shinken
lit tous les fichiers qui finissent avec lextension cfg qui se trouvent dans ce rpertoire ou dans les sous-
rpertoires de celui-ci. Le fichier principal de la configuration est /etc/shinken/shinken.cfg . Aprs chaque
changement de la configuration il faut dabord tester si la configuration est accepte par Shinken via la
commande ci-dessous.
[shinken @qgemnt001]# /usr/bin/shinken-arbiter v c /etc/shinken/shinken.cfg
Jai ajout un raccourci pour cette commande afin de faciliter la tche.
[shinken @qgemnt001]# vim ~/.bashrc
Ajoute la ligne ;
alias chkShinken=/usr/bin/shinken-arbiter v c /etc/shinken/shinken.cfg
Cette commande vrifie toute la configuration et indique un message derreur pour identifier le problme.
Dans certains cas cela peut tromper car si on met un nom de template faux il ne va pas dtecter a comme
erreur. Je lai constat pendant les tests. Ayant mal crit le generic-host pour un host shinken nas indiqu
aucune erreur mais le host est considr UP car en cas de manque de check un service ou host est toujours Ok.

Mise en uvre 41/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 27 Message derreur aprs une vrification de la configuration.
La configuration de Shinken dtaille est explique sur site officiel de la documentation Shinken :
http://shinken.readthedocs.org/en/latest/08_configobjects/index.html
Je vais donner quelques exemples de configuration que jai faite.

a) Ajouter un host (machine, hte)

Le rpertoire /etc/shinken/hosts est prvu pour les htes. Pour faciliter le paramtrage chaque host dclar est
dans un fichier part avec le nommage nom_mahcine.cfg. Les noms de fichiers ou hosts sont dfinies avec la
convention de nommage de la Qim info. Pour la dclaration certaines champs sont obligatoires comme :
host_name : nom de la machine
address : IP ou FQDN de la machine
max_check_attempts : nombre dessai de check en cas de problme
contacts : contact pour les notifications
contacts_groups : groupe de contact pour les notifications
notification_interval : lintervalle de notification en cas de problme
Il y a dautre champs utiles mais pas obligatoires comme :
parents : la relation entre les machines, cela permet au Shinken de
dterminer si un hte est down ou unreachable(inaccessible), ce champ est trs utile pour
trouver la source dans le cas plusieurs problme si cela vient dun lment perturbateur. On
peut mme annuler les notifications pour les htes unreachable avec les options de
notifications.
use : le Template utiliser
hostgroups : tiquette pour regrouper les machines
check_commande : commande excuter pour tester la machine

Mise en uvre 42/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
check_period : le nom de la priode pour excuter le check
notification_enabled : si la notification est active
business_impact : limpact de la machine sur business
icon_set : licne afficher pour la machine

Au lieu de configurer toutes les paramtres on peut crer des templates ou utiliser les
templates existants comme generic-host. Dans la plupart de cas jai utilis generic-host qui
teste la disponibilit dune machine avec un Ping. Mme si on utilise un template pour une
machine on peut toujours modifier les configurations en surchargeant le mmes variables
dans le fichier de la configuration.

* Figure 28 Dfinition dun routeur via SNMP

Le protocole ICMP est bloqu au niveau du firewall du routeur (qgertr002) donc pour contourner le problme
je vrifie laccessibilit du serveur extsrv003 via un port avec une requte TCP. Jai cr un autre template
partir du generic-host sans la commande Ping pour cela.

Mise en uvre 43/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 29 Dfinition d'un serveur et configuration SSH

b) Ajouter un service

Un service est li un hte et il doit tre dclar via un fichier situ dans /etc/shinken/services. Un service fait
appel une commande qui se trouve dans /etc/shinken/commandes. part les htes tous les lments
surveills sont dclars en tant quun service. Chaque service est li un hte via host_name. Les champs ci-
dessous sont obligatoires. En utilisant des template on dclare le minimum ncessaire et les autres paramtres
sont pris en compte depuis les templates.
host_name : le nom de lhte dont le service dpend
service_description : le template du service utiliser
check_command : nom de la commande excuter
max_check_attempts : nombre dessai maximum de check en cas du rsultat non OK
check_interval : lintervalle des checks
retry_interval : lintervalle de recheck en cas du rsultat non OK
check_period : priode de lancement de check
notification_interval : dure de notification en cas de changement dtat
contacts : contacte pour les notifications
contact_groups : groupe de contact pour les notifications

Mise en uvre 44/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 30 Dfinition d'un service pour connexion SSH

c) Ajouter un contact

Un contact est utilis pour les


notifications et pour lauthentification
de linterface web en cas de lutilisation
du module auth-cfg-password. En
utilisant un template on doit juste
dfinir le nom, ladresse mail, mot de
passe et les rles. Les fichiers de
contacts se trouvent dans
/etc/shinken/contacts.

* Figure 31 Ajout d'un contact

d) Ajouter un groupe de contact

Un groupe de contact permet de faire des notifications par liste.

* Figure 32 Ajout d'un groupe de contact

e) Ajouter une commande

Les commandes se trouvent dans /etc/shinken/commandes et /etc/shinken/packs pour les commandes des
packs installs. Chaque lment surveill est contrl par une commande qui dfinit lutilisation dun plugin et
les paramtres. Dans une commande on doit dfinir le nom de la commande et la commande excuter. Cette
commande est la syntaxe de lappel du plugin. Avec linstallation de Shinken et packs nous avons toutes les
commandes disponibles. Mais on peut faire des commandes sur mesures. Dans une commande on peut
directement passer les macros, variables ou arguments dun hte ou service.

Mise en uvre 45/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 33 Commande check http

Excutable avec son chemin macro argument

f) Ajouter Template

Shinken fournit par dfaut des templates gnriques pour la dfinition dun host, service, timeperiode
et contact. Dans ce templates certains paramtres comme les intervalles de check et notifications sont dfinis.
Lutilisation de ces templates se fait par le champ use dans une dfinition dun service, hte, contact ou autre.
Linstallation des packs fournit galement des templates. Un template peut inclure uniquement une seule
dfinition comme un service, un hte ou plusieurs en mme temps. Les templates des packs comprennent
souvent une dfinition dhte et des services lis. Jai utilis souvent les templates gnrique de base fournit
par Shinken. On peut aussi gnrer des template pour faciliter les ajouts des lments surveills.

Mise en uvre 46/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 34 Template generic-host

g) Ajouter timeperiode

Les priodes sont utiliss pour dterminer quand les sondes et les notifications auront lieu. On peut ne pas
sonder et notifier certaines services ou htes pour certaines priodes. On peut dfinir des heures du travail,
des vacances ou des jours spciaux. Je surveille un PC dans le parc informatique et ce PC est teints en dehors
des heures du travail. En loccurrence il ne faut pas sonder ni notifier en dehors des heures du travail. Le
template qui dfinit les heures du travail du lundi au vendredi pour rgle ce problme.

Mise en uvre 47/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 35 dfinition d'un timeperiode 7j/7 24h/24

* Figure 36 Dfinition d'un timeperiode pour les heures du travail

h) Ajouter dpendance de host

La dfinition des dpendances est assez vitale pour un systme de supervision car la corrlation des donnes
dpend fortement de dpendances.
La dfinition de dpendances permet denlever des check et notifications inutiles qui compliquent les tches
des administrateurs. Ces dfinitions sont ajoutes suite ltablissement de dpendances dans le chapitre
dpendances 4.2 . Dans le cas du serveur chez OVH la vrification de celui-l dpend des autres lments qui se
situent avant le serveur comme lquipement du rseau. Le systme dtermine lancement dun check ou dune
notification avec la dfinition dune dpendance. Pour chaque dfinition on dtermine des critres pour les
check et notifications. Les critres sont :
o = chec de ltat UP
d = chec de ltat DOWN
u = chec de ltat UNREACHABLE
p = chec de ltat pending (le check nas pas encore eu lieu)
n (none) : dpendance est toujours vrifi donc pas de critres
Avant chaque check ou notification il va dabord regarder si les critres de notification et check sont bons par
rapport la dfinition. Si les critres ne sont pas appliqus le check et/ou la notification sont annuls. Jai
utilis les critres d, u, p, cela veut dire que si lun des htes est dans un tat down, unreachable ou pending les
htes dpendants ne vont pas tre contrl. Si le routeur qgertr002 est inaccessible le Shinken ne contrle pas
le serveur (extsrv003).

Mise en uvre 48/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 37 Dfinition dune dpendance

i) Ajouter dpendances de service

La dfinition de dpendance de service est faite de la mme manire que la dpendance dhte. On doit dfinir
les critres pour les notifications et check.
o = chec de ltat OK
w = chec de ltat WARNING
u = chec de ltat UNKNOWN
c = chec de ltat CRITICAL
p = chec de ltat pending (le check nas pas encore eu lieu)
n (none) : dpendance est toujours vrifi donc pas de critres

* Figure 38 Dfinition dune dpendance de service

j) Ajouter un Business rule (Rgles mtier)

Une rgle mtier est dclare comme un service dans /etc/shinken/services avec une commande spciale.

Mise en uvre 49/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 39 Dfinition dune rgles mtier
Limportance pour le business ET service et son hte

5.1.3. Supervision Sans agent via SSH

Un check en SSH a besoin une connexion SSH via une cl sans mot de passe. Le service sshd est install par
dfaut sur des machines linux mais pour certaines machines il faut activer ce service comme lhyperviseur Esxi.
Pour la machine linux distante:
[shinken @qgemnt001] # service sshd start
Pour lhyperviseur Esxi :Selon procdure dactivation ssh en annexe D.
La librairie python-paramiko doit tre installe pour la connexion ssh.
[hbi@qgemnt001] # sudo yum install python-paramiko

Pour lancer des commandes de mesure il faut une connexion ssh donc une cl ssh
[shinken @qgemnt001] #ssh-keygen
Il faut envoyer la cl vers la machine distante suite la cration de lutilisateur shinken .
[shinken @qgemnt001] #ssh-copy-id i ~/.ssh/id_rsa shinken@ipserveur
Cet utilisateur shinken doit avoir le droit(644) de lecture sur cl sur la machine surveiller. La cl se trouve
~/.ssh/authorized_keys, pour lutilisateur concern.
Tester la connexion en SSH
[shinken @qgemnt001] # ssh i /.ssh/id_rsa shinken@IP_hte
Suite la russite en connexion SSH, on peut soit utiliser le pack linux-SSH soit dclarer tous les services et
paramtres manuellement. Pour avoir un contrle total jai utilis la solution manuelle mais jai profit des
packs pour crer mes services. Les commandes de ces packs ont t utiles aussi.
Aprs le premier test jai eu un problme avec le check cpu en SSH qui donne le message derreur suivante :
can not fetch stats from cpu
Solution :
1- Vrification du paquet sysstat sur la machine surveiller- OK
2- Le plugin est fait pour des systmes en anglais alors que la machine est en franais. Jai modifi le
plugin pour rendre compatible avec franais.
[shinken @qgemnt001]# vi /var/lib/shinken/libexec/check_load_average_by_ssh.py
Ligne 81 : Remplacer (not line.startswith('Average')) par (not line.startswith('Moyenne'))
Il vaut mieux garder deux versions de ce fichier.

5.1.4. Supervision via SNMP


La surveillance par le protocole SNMP a besoin des outils SNMP installs sur le serveur de la supervision.
[hbi@qgemnt001] # sudo yum -y install net-snmp net-snmp-utils
Les outils SNMP nous aident tester la communication avec un lment surveiller en ligne de commande
avant de lajouter dans supervision.

Si la machine surveiller nas pas le protocole SNMP install, il faut linstaller.


Installation et configuration du protocole SNMP pour une machine Centos

Mise en uvre 50/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
[root@machine_distant] # yum instal snmp
[root@qgemnt001]# chkconfig snmpd on

Modifier config pour interroger le host


[root@machine_distant] # vim /etc/smp/smpd.conf
Ajouter les lignes suivantes:
agentAddress udp:0.0.0.0:161
rocommunity nom_de_community
Ce nom de community est un plus pour la scurit car sans avoir la connaissance du mot, on ne peut pas
interroger la base MIB.
[root@machine_distant] # /etc/init.d/snmpd restart
On peut tester le service snmpd sur cette machine
[root@qgemnt001] # netstat -an |grep -i udp | grep 161

Dans le cas des quipements rseau on peut faire cette opration avec une connexion Telnet si une connexion
est disponible. La mthode plus facile est daller faire cela directement sur linterface web de gestion. Les
quipements professionnel comme le routeur Cisco et Switch Netgear supporte la gestion SNMP via leurs
interface web.
Test louverture du port 161 depuis le serveur shinken
[shinken@machine_distant] # nmap Ip_machine_distant p 161

Et scanner le port udp 161 -> OK

On peut tester directement les donnes obtenue via la commande :


[shinken@qgemnt001 ] # snmpwalk -v 2c -c public IP_machine_supervise -> OK
OID information

* Figure 40 Affichage dbut d'une MIB avec snmpwalk

Les plugins standards permettent de surveiller les quipements


standards. Ces plugins interroge la base de MIB et rcupre
directement le facteur voulu avec lidentificateur de lOID.
Mais dans le cas des quipements pas trs rpandus, nous sommes
obligs daller trouver lidentificateur OID correspondant dans la base
de MIB. Cette base est volumineuse et difficile chercher une
information prcieuse. Mais il existe des outils comme Oidview pour
visualiser la base dun quipement facilement. Le plugin check_snmp
permet de rcuperer une information avec un argument OID.
Aprs avoir rcupr lidentificateur on peut rcuprer linformation en
passant comme paramtre au plugin check _snmp.

* Figure 41 La hirarchie de la MIB obtenue avec Oidview

Mise en uvre 51/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
5.1.5. Supervision applicative

a) URL

Une requte http permet de tester la disponibilit dun site internet. Le rsultat de ce check est la rponse reu
du site. Un site peut tre aussi text avec une requte https si le site comporte un certificat SSL.

* Figure 42 Service check URL jira

* Figure 43 Commande check URL

b) Check FTP

Un check pour le service FTP existe dans les plugins de Nagios. Il fait une requte ftp pour vrifier la
disponibilit du serveur FTP.

* Figure 44 service FTP

Mise en uvre 52/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 45 Commande check FTP

c) MySQL

Le plugin va simuler une connexion MySQL avec un compte cre sur le serveur distant pour Shinken.

* Figure 46 Service MySQL

* Figure 47 Commande check MySQL

d) DNS

Un plugin vrifie lentre


dune url dans la base de
DNS.

* Figure 48 service entre


DNS

Mise en uvre 53/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 49 Check commande DNS

e) Serveur Apache

Le plugin va chercher des informations via la page statuts du service httpd.

* Figure 50 Service serveur Apache

* Figure 51 Check commande Apache

5.2. INSTALLATION GRAPHITE


Installation de dpendances :
[root@qgemnt001 ] # yum install -y graphite-web* python-carbon* pycairo* python3-cairo* node npm
mod_wsgi
[root@qgemnt001 ] # pip install 'django<1.6'
[root@qgemnt001 ] # pip install 'Twisted<12'
[root@qgemnt001 ] # pip install django-tagging
[root@qgemnt001 ] # pip install whisper
[root@qgemnt001 ] # pip install graphite-web
[root@qgemnt001 ] # pip install carbon

Creation de la base de donnes :


[root@qgemnt001 ] # /opt/graphite/webapp/graphite/ python manage.py syncdb
Configuration

Mise en uvre 54/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
[root@qgemnt001 ] # cp /opt/graphite/examples/example-graphite-vhost.conf
/etc/httpd/conf.d/graphite.conf
[root@qgemnt001 ] # cp /opt/graphite/conf/storage-schemas.conf.example /opt/graphite/conf/storage-
schemas.conf
[root@qgemnt001 ] # cp /opt/graphite/conf/storage-aggregation.conf.example
/opt/graphite/conf/storage-aggregation.conf
[root@qgemnt001 ] # cp /opt/graphite/conf/graphite.wsgi.example /opt/graphite/conf/graphite.wsgi
[root@qgemnt001 ] # cp /opt/graphite/conf/graphTemplates.conf.example
/opt/graphite/conf/graphTemplates.conf

Dmarrage de Graphite :
[root@qgemnt001 ] # systemctl restart httpd
[root@qgemnt001 ] # /opt/graphite/bin/carbon-cache.py start
[root@qgemnt001 ] # /opt/graphite/bin/run-graphite-devel-server.py /opt/graphite/

Graphite ne dmarre pas correctement cause des problmes de droits :


IOError: [Errno 13] Permission denied: '/opt/graphite/storage/*
Pour rgler tous les problmes lis aux droits.
[root@qgemnt001 ] chown -R apache:apache /opt/graphite/storage/
[root@qgemnt001 ] chmod -R a+w /opt/graphite/storage
[root@qgemnt001 ] chmod 644 /opt/graphite/storage/*
[root@qgemnt001 ] sudo chmod a+w /opt/graphite/storage/log/webapp

Procdure dinstallation Graphite :


http://www.rampmeupscotty.com/blog/2012/08/07/installing-graphite-on-centos-6-dot-2/
https://mespotesgeek.fr/des-graphiques-sur-shinken-via-graphite/

5.2.1. Jonction Shinken

On installe le module Graphite depuis les dpts Shinken


[shinken@qgemnt001 ] # shinken install ui-graphite
[shinken @qgemnt001 ] # shinken install graphite
On ajoute le module graphite-ui la WebUI :
[shinken @qgemnt001 ] # vi /etc/shinken/modules/webui.cfg
et ajouter : modules auth-cfg-password,SQLitedb,ui-graphite

On ajoute le module graphite au broker :


[shinken @qgemnt001 ] # vi /etc/shinken/brokers/broker-master.cfg
et ajouter : modules webui,graphite

On configure le module graphite :


[shinken @qgemnt001 ] # vi /etc/shinken/modules/graphite.cfg

* Figure 52 Configuration du module Graphite

On configure laccs la webui graphite sous /etc/shinken/modules/ui-graphite.cfg

Mise en uvre 55/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 53 Configuration Interface Web Graphite

Si on met slash la fin de lURL les liens ne fonctionneraient pas.On rdemarre tout en tant que root.
[root@qgemnt001 ] # systemctl start httpd
[root@qgemnt001 ] # /opt/graphite/bin/carbon-cache.py start
Pour commencer on peut lancer le Graphite en mode dveloppement pour voir ce qui se passe.
[root@qgemnt001 ] # /opt/graphite/bin/run-graphite-devel-server.py /opt/graphite/
On relance Shinken pour prendre en compte tout cela.
[shinken @qgemnt001 ] # /etc/init.d/shinken restart
Envoyer une donne de test :
[root@qgemnt001 ] # echo "carbon.installation.test $RANDOM `date +%s`" | nc -w 1 localhost 2003
Les donnes envoyes doivent
tre disponible dans linterface
web de Graphite.

* Figure 54 Test de fonctionnement


Graphite

5.3. INSTALLATION THRUK ET NAGVIS


Suite plusieurs essais dinstallation par source, jai eu des problmes lis aux dpendances de librairies
Perl. Pour faire marcher certains plugins en Perl javais chang la version Perl du serveur, malgr la
rinstallation de toutes les libraires manuellement le problme nest pas rsolu. Linstallation par source est
dconseille pour linstallation de ces outils.
Jai trouv une distribution nomm OMD et qui contient les outils thruk, Nagvis, multisite et les outils de
suppression. Ces outils doivent tre coupls avec Shinken aprs linstallation.
Tlcharger le paquetage depuis
http://files.omdistro.org/releases/centos_rhel/omd-1.20.rhel7.x86_64.rpm et loutil sinstall et il faut
configurer.
Installer les package manquants.
[root@qgemnt001 ] # omd setup
Crer un site.
[root@qgemnt001 ] # omd create monitoring
Configurer le site et mettre les fichiers par dfaut.
[root@qgemnt001 ] # omd init monitoring

Mise en uvre 56/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Il faut configurer les outils.
[monitoring@qgemnt001 ] # omd config monitoring
Aprs la configuration le thruk et Nagvis sont disponibles sous les
liens :
http://localhost/monitoring/thruk
http://localhost/monitoring/nagvis
Les interfaces sont vides car il faut ajouter le socket du module
Livestatus du Shinken.
Thruk : aller dans Config Tool et Backends/sites pour ajouter Shinken
avec le socket de connexion localhost :5000.
Nous passons ladresse localhost cat tous les outils install sur le
mme serveur mais pour rcuprer des donnes depuis un * Figure 55 Config Tool de Thruk
Shinken distance, il suffit de mettre son adresse IP publique.
Thruk fournit la fonctionnalit de surveillance en temps rel comme Shinken mais linterface est compliqu
et il sera utilis pour toutes fonctionnalits que Shinken ne fournissent pas.

* Figure 56 interface web de Thruk

Donc dans notre cas le Thruk sera utilis plutt pour faire le reporting pour :
Availability :montre disponibilit des machines et services
Trends : permet de grapher des donnes mesurables en fonction du temps
Alerts: permet d'avoir un historique des alertes et des notifications
Reporting : gnre des rapports de SLA automatiques et manuels.
Historiques des pannes peuvent tre visualis dans ces diffrentes vues, on peut aussi
gnrer un rapport avec la vue reporting.
Il peut tre utile pour voir toute la configuration aussi. Car sous shinken pour voir les
commandes ou les configurations dun lment surveill, il faut consulter les fichiers de
Shinken. Alors que thruk nous affiche tout sur linterface.

Mise en uvre 57/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 57 Rapport de disponibilit des machines sur une semaine

Gnration dun rapport se fait via le menu reporting et create new report.
Thruk nous permet de gnrer des rapports assez facilement et sur
mesures. On peut programmer la gnration dun rapport avec une
priode et envoie par mail. Un rapport peut tre fait pour
Un service ou groupe de service
Une machine ou un groupe de machines
Toutes les pannes survenues
Un Rapport contient une
graphique de disponibilit
et les dernires
interruptions.

* Figure 58 Rapport pour un switch

* Figure 59 Gnration d'un rapport

Mise en uvre 58/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Nagvis gre la connexion avec Shinken de la mme manire que le Thruk. On doit ajouter la connexion du
Shinken via le menu option et gre les Backends.

* Figure 60 Ajouter Shinken dans Nagvis

Pour crer des cartes nous devons envoyer des images sur Nagvis. Jai utilis les schmas et des photos de la
salle de serveur pour crer des cartes.

Mise en uvre 59/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 61 ajout d'une image dans Nagvis

* Figure 62 Crer une carte dans Nagvis

Aprs la cration des cartes, on peut ajouter les lments surveills dans ces cartes.

* Figure 63 Ajouter un lment surveill

Nagvis permet dajouter une machine, un service, une rgles mtier et un lment peut tre symbolis avec un
icne ou une ligne.

Mise en uvre 60/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure Cart Nagvis base sur Schma du scnario de lutilisation de lIntranet Chapitre 4

* Figure 64 Carte de la salle de serveur

Mise en uvre 61/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure Cart Nagvis base sur rgles mtier du scnario de lutilisation de lIntranet Chapitre 4

Mise en uvre 62/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 65 Carte du parc informatique de Genve

On doit configurer les urls dans Nagvis pour quon puisse aller sur linterface Shinken pour un lment cliqu
dans Nagvis. Dans le menu option -> configuration gnrale et modifier les templates des urls pour Shinken.

* Figure 66 direction url de Nagvis vers Shinken

Mise en uvre 63/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
5.4. PROBLMES FRQUENTS.

Il est possible davoir des erreurs en cas de mauvaise configuration, manque de librairies ou problmes avec les
plugins. Si lerreur viens du shinken il faut savoir que toutes les infos par rapport ces erreurs sont enregistres
dans les fichiers log sous le rpertoire /var/log/shinken/. Il faut regarder dans broker.log, scheduler.log et
arbiter.log.

5.4.1. [Errno 2] No such file or directory

Quand vous voyez ceci, cest que la commande nest pas prsente dans le dossier /var/lib/shinken/libexec/.
Je vous conseille de vrifier votre fichier de service (/etc/shinken/services/<fichier>.cfg) en vrifiant la ligne
check_command.

Ensuite vrifier votre fichier de commande (/etc/shinken/commands/<fichier>.cfg) en vrifiant la ligne


command_line.Et pour terminer, voir si la commande est bien prsente dans le dossier /var/lib/shinken/libexec

5.4.2. [Errno 13] Permission denied

Cette erreur vous dis que Shinken na pas les permissions adquates pour lancer les commandes dans le
dossier /var/lib/shinken/libexec/.
Voici comment rsoudre ceci de manire scurise (STOP AU CHMOD 777)
Tout dabord, on va redfinir le propritaire de la commande en erreur (pour savoir lequel :
ls -ail /var/lib/shinken/libexec) :
[root@qgemnt001]# chown shinken:shinken /var/lib/shinken/libexec/<fichier>

Puis nous allons redfinir les droits daccs de ce fichier en 755. Ce qui quivaut :
Propritaire : Lire, crire, Excuter
Groupe : Lire, Excuter
Publics : Lire, Excuter

Revenons nos moutons, la commande pour dfinir les droits est :


[root@qgemnt001]# chmod 755 /var/lib/shinken/libexec/<fichier>
Une fois fini, slectionner le service sur linterface web et faite Recheck. Patientez une petite dizaine de
secondes et rafrachissez la page.

5.4.3. Interface nest pas accessible depuis le rseau local

Linterface web est accessible via http://IP_du_serveur:7767/ mais le port tait bloqu pour laccs externe
depuis le rseau. Jai dabord ajout une rgle dans le firewall de lhyperviseur (qgeesx005) malgr cela laccs
tait toujours bloqu car cest le firewall du serveur de la supervision qui bloquait laccs. Jai ajout une rgle
pour le port 7767 avec le protocole TCP.
[root@qgemnt001]# firewall-cmd --new-zone=special
[root@qgemnt001]# firewall-cmd --zone=special --add-source=192.168.10.0/24
[root@qgemnt001]# firewall-cmd --zone=special --add-port=7767/tcp

Mise en uvre 64/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
5.4.4. Adresse IP dynamique

Les quipements rseaux et les serveurs ont des IP fixes mais les postes de travail surveills ont des IP
dynamique donc en cas de supervision avec une adresse IP le changement dIP est un grand problme. Pour
contourner celui-l jajoute les postes avec leur nom de lannuaire de lActive Directory.

5.4.5. Pip broken

[root@qgemnt001]# yum remote python-pip


Si cela ne marche pas :
[root@qgemnt001]# rm /usr/lib/python2.7/site-packages/pip*
Rinstaller le pip :
[root@qgemnt001]# yum reinstall python pip

5.4.6. Problme libraire Perl

Comme il ny pas mal de plugins en Perl, on a souvent affaire au problme de Cant locate *.pm . Souvent
lerreur vient le manque dune librairie ou incompatibilit avec version Perl. Dans le cas de la mande dune
librairie on peut linstaller via CPAN.
[hbi@qgemnt001]# sudo cpan nom_libraire
Les plugins en Perl ou python incluent le chemin du Perl ou Python au dbut du script, des fois les chemins sont
mal renseigns et le plugin ne sexcute pas. Il faut corriger les chemins. Vue la diversit des outils ou des plugins
installs, il peut y avoir un problme de comptabilit des libraires. Comme cela a t le cas avec Thruk. On peut
installer les diffrentes versions du Perl dans des rpertoires spars et renseigns les chemins de celles-ci dans
les programmes qui les utilisent. Suite nombre problmes que jai eu, jai dcid dinstaller le Thruk avec un
package pour rsoudre ces problmes. Car une installation par package automatise linstallation des
dpendances.

6. Bilan du projet
6.1. CONCLUSION TECHNIQUE
Les objectifs dfinis dans le cahier de charges (chapitre 2) ont t atteints. Shinken permet de
superviser tous les lments dfinis dans le scnario sauf lhyperviseur nsXX.ovh.net car cause dun
problme technique, il nest pas accessible.
Le choix du Centos comme systme dexploitation na pas facilit la mise en uvre. Ce choix est un choix
historique pour lentreprise mais la distribution Debian gre les dpendances dune manire plus
automatise que Centos. Et jai trouv plus de package pour Debian concernant les outils de la supervision.
La difficult technique est lie aux dpendances des librairies et aux installations des outils.
Le choix de loutil a t correct car le moteur de Shinken est assez performant et modulaire, jai pu
constater tous ces spcifications dfinis dans ltude loutil (Chapitre 3). Le surplus de Shinken par rapport
Nagios est remarquable surtout pour la supervision du business. Et les vues de linterface web de Shinken
sont assez comprhensibles pour les responsables de lentreprise qui ne sont pas forcment des

Bilan du projet 65/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
informaticiens. Larchitecture distribuable de Shinken permet de superviser des grandes infrastructures.
Linstallation et le paramtrage du shinken nest pas trs compliqu contrairement ce que je croyais.
Grce dpendances dclares les notifications sont intelligentes, on ne reoit des notifications que pour
les sources des problmes. Le superviseur est proactif grce au seuil de warning car on reoit une
notification avant ltat critique avec ce seuil.
Le reporting par Thruk fournit des services assez intressants car la disponibilit du systme informatique
sera visualise facilement. Le systme de reporting est assez comprhensible avec des graphiques. Mais le
ct bnfique du reporting sera visible une fois que le systme est tendu sur linfrastructure.
Le couplage de plusieurs outils nous donne une bonne solution complte car la fois on peut visualiser le
systme supervis sur une interface simple, moderne et claire et on peut voir des graphiques de mesures
temporelles dans celle-l. Le thruk nous gnre des rapports simple et efficace de la manire automatique
programm ou manuels quand on en a besoin. Les cartes de Nagvis rendent laffichage en temps rel trs
pratique et facile.
La manire de ce couplage nous permet de changer ou modifier chaque outil indpendamment. Dans le
cas dune supervision distribue le systme peut sadapter facilement.
Un autre aspect important est loverhead cre comme charge rseau. Les latences et dure des sondes
affichs dans linterfaces web restent entre 0,1 et 3 secondes.
Auprs des captures faits avec Wireshark (Annexe I) le volume dune sonde reste entre dans lordre de
quelques octets. Taille dun sonde pour FTP : 1,1 ko, SNMP 3,6 ko, SSH 6,1 ko, Windows 12 ko. Au total
nous avons 64 services et 10 htes superviss donc le volume total des sondes est moins dun mgaoctet.
Le 99% de ces 74 sondes lancs chaque 3 minutes. En moyenne cela ne reprsente pas plus que quelques
centaines doctets doverhead par minute. Cet overhead reste assez raisonnable avec moins de 1% du
Traffic rseau de lentreprise.
La supervision devient un lment vital pour les entreprises qui disposent un systme informatique
fournissant des services.

6.2. CONCLUSION PERSONNELLE


Ce projet formateur ma permis dapprofondir mes connaissances techniques de ladministration dune
infrastructure. Jai fait la connaissance avec le monde de la supervision et les outils de la supervision.
Au-del de lenjeu technique, un des vritables acquis tait la gestion du projet. Nous avons fait des
projets tout au longs de nos tudes mais la question comment bien mener un projet ? a t concrtis
avec cette exprience. Lenvironnement de la ralisation ma permis de connaitre la vie professionnelle et
la discipline de travail que jai suivi au sein de lentreprise maidera beaucoup pour intgrer le monde du
travail. En suivant les procdures internes lentreprise jai appris les tapes de ralisation dun projet
dans un cas rel.

Je peux dire, sans retenue, que je suis pleinement satisfait de cette aventure.

6.3. DIFFICULTS RENCONTRS

Avant de commencer ce projet je navais aucune ide sur le monitoring donc linitialisation du projet a
t un peu difficile car ce travail moblige tre beaucoup plus rigoureux par rapport un projet de
dveloppement. Au dbut jai eu des difficults au niveau de linfrastructure de lentreprise car le schma
existant montre le fonctionnement mais il nest pas dtaill techniquement.
La difficult majeure ne reposait pas sur Shinken car jai pu rgler facilement les problmes que jai eus avec
Shinken mais elle reposait sur les checks et les outils coupls avec Shinken.
Le plus grand problme technique tait au niveau des dpendances des libraires. Jai test et utilis beaucoup
de plugins avec des langages diffrents et des fois il y avait des incompatibilits entre les versions des librairies.
Certains plugins ne marchaient pas avec les nouvelles versions des librairies comme le check_http de Shinken
qui ne marchait pas avec openssl 1.0.1. A la place de celui-l jai utilis le plugin de check_http de Nagios.
Linstallation de la Graphite a t difficile aussi. Au dbut jai utilis le script dinstallation fourni par lquipe du
shop.ch mais cela nas pas march et jai utilis les procdures dinstallations que jai trouv dans des blogs

Bilan du projet 66/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
(Installation Graphite chapitre 5.2 ). Il a fallu regarder le plus prs chaque composant comme carbon, webapp
ou module Graphite de Shinken et rinstaller et tester chacun part.
Linstallation des outils de reporting a t problmatique aussi. Surtout le thruk ne dmarrait pas cause des
problmes de dpendances. Il ne fallait pas changer les libraires Perl existant pour le Centos 7.1 car malgr
linstallation de toutes les libraires via CPAN ou yum le problme ntait toujours pas rsolu. La solution ultime
a t dinstaller les outils via un package spcial qui incluait les libraires ncessaires.
Aprs linstallation de ces outils la connexion entre shinken et ces outils ont provoqu des soucis mineurs. Le
thruk narrivait pas rcuprer les donnes du Shinken avec un socket Unix et le module Livestatus du Shinken
tait cass. Jai rinstall le module Livestatus et la connexion a march avec un socket tcp.

6.4. RESTAURATION DU SERVEUR DE SUPERVISION


La VM est export en tant que template OVF (open virtulization format) et il prt tre dploy sur une
machine Esxi via le vSphere client. Les fichiers de configuration de Shinken sont sauvegards dans le SVN de
lentreprise.

6.5. AXES DAMLIORATIONS


Etendre le systme sur linfrastructure :
La salle des serveurs dans le local de Genve doit tre surveille en premier lieu car il y a de nombreux
serveurs et dapplications hbergs. Comme la plupart des serveurs sont virtualiss une surveillance profonde
de linfrastructure virtuelle peut tre bnfique.
Limprimante peut tre surveille pour dtecter les niveaux des cartouches qui permettent de les remplacer
avant que quelquun se rendre compte en essayant de faire une impression.
La deuxime sortie (switch + routeur+ modem + fournisseur Swisscom) pour laccs internet doit tre surveill
car certains applications et VPN en utilisent constamment.
Une autre partie importante qui doit tre surveill assez rapidement est les serveurs de productions chez OVH.
Surtout une supervision de la couche applicative est ncessaire pour ces serveurs.
Supervision de la Couche applicative :
On peut surveiller la couche applicative plus profondment. La supervision actuelle de la couche applicative est
plutt la vrification de disponibilit des services mais on peut aller plus loin et surveiller la qualit de ces
services, les tats des processus, les threads, le temps de rponse, le nombre de connexion, les logs etc.
Le dploiement dun Poller au bureau de Lausanne et chez OVH peut tre prvu sil y a beaucoup dlments
surveiller.
On peut mme prvoir une installation Shinken ailleurs comme chez un client et regrouper celui-ci avec le
superviseur existant via linterface Thruk.
Supervision de la scurit :
Il existe des plugins qui permettent de dtecter des ports ouverts (backdoor) qui peuvent tre
dangereux pour la scurit.
On peut ajouter la surveillance de ces backdoor sur les machines importantes.
On peut aussi surveiller la scurit des applications web contre les attaques. Un exemple sera
la surveillance dun hte contre des attaques DDos.
On peut contrler les certificats SSL sil est valide.
On peut vrifier lintgrit des documents importants avec des check MD5.
Surveiller le VPN : le nombre dutilisateur connect, le tunnel de la connexion etc.
On peut surveiller es attaques connues sur un pare-feu.
Notification : On peut ajouter le module Android ou utiliser des scripts faits pour Nagios pour envoyer des
notifications vis SMS. Les priodes de notification et surveillance (timeperiod) peuvent tre adapt encore
mieux pour les postes de travail comme les priodes de vacances.

Bilan du projet 67/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Gestion des incidents(Handler) : La supervision actuelle ne gre pas les incidents. Une gestion pour les
incidents importants peut tre trs bnfique pour lentreprise. Certains incidents peuvent tre rsolus
facilement comme redmarrage dun service dune VM.
Shinken a la possibilit dexcuter une commande en cas de panne. Pour les machines ou services trs critiques
on peut crer des commandes partir des plugins existants ou des scripts dvelopps sur mesures. Lune de
possibilit sera redmarrer une machine ou un service distance.
Ou un autre exemple : Si le fournisseur daccs internet tombe active deuxime FAI. Ou encore rveiller un
serveur ou poste teigne distance via Wake on Lan.
Accs linterface web : Laccs est restreint au rseau local et il faut une connexion VPN pour pouvoir
surveiller en temps rel mais on peut installer un site chez OVH pour avoir laccs partout. Ce site va
communiquer avec shinken pour avoir les donnes.
Ajout des lments via interface Web : Lentreprise nas pas une infrastructure trs volumineuse et les ajouts
des lments peuvent se faire directement par fichier mais dans le cas o on doit ajouter beaucoup
dlments, on doit prvoir une interface pour ajouter plus facilement. Il faut configurer Thruk pour pouvoir
grer les ajouts directement sur linterface de thruk.
Pour linstant loutil gratuit convient trs bien aux besoins de lentreprise mais il faut savoir que Shinken
possde aussi une version payante qui fournit quelques valeurs ajoutes comme :
Systme de reporting
La gestion et configuration automatis pour un systme de supervision distribu
Supervision de business avanc
Dtection des aberrations
Comme lentreprise fournit des services de ladministration de linfrastructure ces clients, cette version peut
tre bnfique pour des grands projets.
On peut ajouter des icnes dans Shinken afin de permet rendre laffichage des quipements plus
comprhensible et visible. Les icnes se trouvent dans /var/lib/shinken/modules/webui/htdocs/images/sets.

6.6. CAHIER DE TESTS


Les tests sont prvus pour chaque lment supervis dfinis dans le scnario (chapitre 4.2) . Chaque test est
valid avec trois critres. Le premier critre est laffichage dun problme simul sur linterface de Shinken.
Deuxime critre est la rception dun mail pour lments surveill. Et le dernier critre est la gestion de
dpendances et corrlation de donnes. Les deux premiers critres ne posaient pas de souci mais le troisime
critre a t valid aprs avoir reconfigur les dpendances.
Quelques captures sont donnes en annexe H pour servir lexemple.

Bilan du projet 68/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Test case Actions Rsultat attendu Affichage sur WEBUI Alerte Par Mail Dpendances appliqus

OVH - Panne chez OVH sur serveur UAT(extsrv003) 0 KO 0 non tests 0 KO 0 non 0 KO 0 non tests
Affichage de la panne sur WebUI et
Serveur FTPD Arrter le serveur ftpd envoie d'alerte pour l'lment
mais aussi pour 4 rgles mtiers . ok ok ok
Affichage de la panne sur WebUI et
envoie d'alerte pour l'lment
aussi pour 4 rgles mtiers .
Serveur Apache Arrter serveur apache
L'intranet UAT tombe en panne
aussi mais on devrait pas checker ni
envoyer alerte pour intranet avec ok ok ok
Arrter serveur MySQL Affichage de la panne sur WebUI et
envoie d'alerte pour l'lment et
pour 4 rgles mtiers aussi.
Serveur MySQL pour BD
L'intranet UAT tombe en panne
aussi mais on devrait pas checker ni
envoyer alerte pour intranet avec ok ok ok
Arrter application Affichage de la panne sur WebUI et
Intranet UAT Interne envoie d'alerte pour l'lment
mais aussi pour 1 rgle mtiers . ok ok ok
Faire chouer le check en
Affichage de la panne sur WebUI et
changeant le port de
Intranet UAT externe envoie d'alerte pour l'lment
l'application de check. Le
mais aussi pour 1 rgle mtiers .
check se fait via un serveur ok ok ok
Faire chouer le check en
Affichage de la panne sur WebUI et
changeant le port de
Jira UAT externe envoie d'alerte pour l'lment
l'application de check. Le
mais aussi pour 1 rgle mtiers .
check se fait via un serveur ok ok ok
Arrter application Affichage de la panne sur WebUI et
Jira UAT interne envoie d'alerte pour l'lment
mais aussi pour 1 rgle mtiers . ok ok ok
Arrter SSH Affichage de la panne sur WebUI et
Connexion SSH
envoie d'alerte pour l'lment. ok ok ok
Augmenter la consommation Affichage de la panne sur WebUI et
CPU sur serveur envoie d'alerte pour l'lment
aussi pour 4 rgles mtiers . ok ok ok
Crer des gros fichiers pour Affichage de la panne sur WebUI et
Disque remplir le disque. envoie d'alerte pour l'lment
aussi pour 4 rgles mtiers . ok ok ok
Augmenter la consommation Affichage de la panne sur WebUI et
RAM sur serveur en lanant des envoie d'alerte pour l'lment
processus. mais aussi pour 4 rgles mtiers . ok ok ok

VTX - Coupure d'accs internet- FAI VTX 0 KO 0 non tests 0 KO 0 non 0 KO 0 non tests
Affichage de la panne sur WebUI et
envoie d'alerte pour l'lment
Enlever cble vdsl sur la prise murale. aprs cela devient OK. Pas d'alerte
pour les lments qui dpendent
l'accs internet. Pas d'alerte pour ok ok ok

Bilan du projet 69/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
ISP - Panne sur modem qgeisp002 0 KO 0 non tests 0 KO 0 non 0 KO 0 non tests
Eteindre le modem. Ou enlever le cble rseau. ok ok ok

SWI -Panne sur switch net gear (qgeswi002) 0 KO 0 non tests 0 KO 0 non 0 KO 0 non tests
Enlever le cble. Affichage de la panne sur WebUI et
Port 4
envoie d'alerte pour l'lment. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
envoie d'alerte pour l'lment
aprs tout devient OK. La machine
Port 5
qgeesx0005 (hberge monitoring)
est li ce port. Pas d'alerte pour
les lments qui dpendent ce ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
Port 6
envoie d'alerte pour l'lment. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
Port 8
envoie d'alerte pour l'lment. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
envoie d'alerte pour l'lment. Ce
Port 9 port relie le switch au routeur. Pas
d'alerte pour les lments qui
dpendent ce port. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
Port 11
envoie d'alerte pour l'lment. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
Port 12
envoie d'alerte pour l'lment. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
Port 14
envoie d'alerte pour l'lment. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
Port 17
envoie d'alerte pour l'lment. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
Port 21
envoie d'alerte pour l'lment. ok ok ok
Enlever le cble. Affichage de la panne sur WebUI et
Port 23
envoie d'alerte pour l'lment. ok ok ok
Eteindre ou enlever le cble Affichage de la panne sur WebUI et
de la machine qgeesx005. envoie d'alerte pour l'lment.
Switch DOWN Tous les lment derrier
(extsrv,qgeswii002,qgeisp002 en
panne mais pas d'alerte grce aux ok ok ok

RTR- Panne sur routeur Cisco ASA (qgertr002) 0 KO 0 non tests 0 KO 0 non 0 KO 0 non tests
Enlever le cble. Affichage de la panne sur WebUI,
alerte aprs avoir tout devient OK.
Interface eth0/0
Pas d'alerte pour les lments plus
loin que routeur dclars comme ok ok ok
Enlever le cble. Affichage de la panne sur WebUI,
alerte aprs avoir tout devient OK.
Interface eth0/1
Pas d'alerte pour les lments plus
loin que routeur dclars comme ok ok ok
Envoyer beaucoup de paquets. Affichage de la panne sur WebUI et
CPU w:85 c:95
envoie d'alerte pour l'lment. ok ok ok

Bilan du projet 70/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
ESX - Panne sur serveur Esxi de monitoring (qgeesx005) 0 KO 0 non tests 0 KO 0 non 0 KO 0 non tests
Arrter le service SSH. Affichage de la panne sur WebUI et
envoie d'alerte pour l'lment.
Connexion SSH.
Service ntp doit tre en panne
aussi car ntp est test via une ok ok ok
Charge la RAM avec des gros webui
processus. devient Retard
Affichage de la panne sur WebUI et
inaccessi pour
CPU-RAM w:85c:95 envoie d'alerte pour l'lment.
ble en envoie
Possible retard et blocage.
cas de comme
100% ok attendu. ok ok
Remplir le disque avec des Affichage de la panne sur WebUI et
gros fichier. envoie d'alerte pour l'lment.
Disque w:98c:99 Disque vm statique prends toute la place
Disque vm statique prends toute la
place donc les seuils sont trs ok ok ok
Arrter NTP. Affichage de la panne sur WebUI et
Serveur NTP(Heure)
envoie d'alerte pour l'lment. ok ok ok
Enlever cble rseau. webui
Pas d'accs WEbUI, envoie d'alerte
devient
aprs tout devient OK. Pas d'alerte
inaccessi
Host DOWN. pour les autres htes qui ne sont
ble en
pas accessible cause de cette
cas de
panne.
100% ok ok ok

MNTR - Panne sur VM de serveur de monitoring (qgemnt001) 0 KO 0 non tests 0 KO 0 non 0 KO 0 non tests
Charge la RAM avec des gros webui Retard 1-
processus. devient 2 min
Affichage de la panne sur WebUI et
inaccessi pour
CPU w:90 c:95 envoie d'alerte pour l'lment.
ble en envoie
Possible retard et blocage.
cas de comme
100% ok attendu. ok ok
Remplir le disque avec des Affichage de la panne sur WebUI et
Disque w:85 c:95 gros fichiers. envoie d'alerte pour l'lment.
Possible retard et blocage. ok ok ok
Charge la RAM avec des gros webui
processus. Script en C qui fait devient Retard
Affichage de la panne sur WebUI et
des alloc. inaccessi pour
RAM/swap w:90 c:90 envoie d'alerte pour l'lment.
ble en envoie
Possible retard et blocage.
cas de comme
100% ok attendu. ok ok
Faire chouer le ping en Retard
coupants bloquant la webui pour
Pas d'accs sur webui, alerte aprs
Host DOWN. communications sur devient envoie
avoir tout devient OK.
qgemnt001. Dsactive icmp et inaccessi comme
enlver cble rseau. ble ok attendu. ok ok

PC 19- Panne sur le poste 19 dans le local de Genve (Pc19) 0 KO 0 non tests 0 KO 0 non 0 KO 0 non tests
Charge la RAM avec des gros Affichage de la panne sur WebUI et
CPU w:90 c:95
processus. envoie d'alerte pour l'lment. ok ok ok
Remplir le disque avec des Affichage de la panne sur WebUI et
Disque w:90 c:95
gros fichiers. envoie d'alerte pour l'lment. ok ok ok
Charge la RAM avec des gros Affichage de la panne sur WebUI et
RAM w:90 c:95
processus. envoie d'alerte pour l'lment. ok ok ok
Enlever cble rseau. Affichage de la panne sur WebUI et
Host DOWN.
envoie d'alerte pour l'lment. ok ok ok

* Tableau 3 Cahier de tests

Bilan du projet 71/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Annexe A. Gestion de
Projet
a. Droulement et gestion du projet
La macro planning ci-dessous dtermine les grandes dates du projet. Le cahier de charge et macro planning
sont valids par le directeur technique de Qim info, Jacques DAUDEL.
Le projet est ralis en 3 lots.
Le premier lot (Lot 0) est la partie tude pour tudier linfrastructure de lentreprise et la supervision.
Lot 1 est la grande partie de mise en uvre du serveur de supervision. Ce lot valide aussi le bon choix de loutil.
Aprs la premire russite de POC en lot 1, lot 2 permet de valider le systme de supervision et ajouter dautre
outil comme outil de reporting. Comme la solution bta est ralise il faut bien sassure que tous lments
surveills sont correctement surveills. Ce lot comprend principalement les tests avec divers scnarios et
installation dun produit pour avoir un historique de panne. Les tests dacceptations sont essentiels pour ce lot.

i. Macro Planning
Je dtermine les grandes tapes du projet avec une macro planning et les tches sont dfinies dans le planning
avec des estimations de dure.
Dates importantes : Dbut 20 avril
Remise du rapport hepia 8 juillet
Prsentation le 2 septembre
Etude : Etudier les outils, technologies, linfrastructure etc.
Rdaction : Ecrire les documents.
Mise en uvre : Installation, configuration, paramtrage et test.
Mises jour : Appliquer le changement et correction aprs la dmo.
Livrables sont les documents et le serveur de supervision livrer lentreprise.

ETAPE Semaine Livrables Activits

tude du systme, solutions


LOT 0
existantes
TUDE Cahier de charges
1 Prendre en main la solution
RDACTION Comparaison des outils
tablir planning
Initiation avec planning
Documentations
Runion avec consultant pour
revoir planification
TUDE LOT1
tude de la solution
MISE EN OEUVRE 2 Versions amliors de ce document et un serveur avec
Installation du serveur de
REDACTION loutil install si le choix est fait
surveillance
Configuration du serveur
TUDE
Un manuel dinstallation de la solution
MISE EN UVRE 3 Installation et configuration su serveur
REDACTION supervision.
MISE EN UVRE Un manuel de paramtrage de la solution Activer les plugins et ajouter les
4
REDACTION lments surveiller.
MISE EN UVRE 5
Ajout des lments surveiller.
MISE EN UVRE 6 V 0.9 (Bta) Ajout des lments surveiller.

Bilan du projet 72/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
REDACTION
TUDE
Planification 2me tape de mises en uvre
MISE EN UVRE 7 Etudier les rsultats obtenus avec POC.
LOT 2
REDACTION Tester les scnarios de pannes.
Etudier divers modules et outils pour
MISE EN UVRE
8 historique ou mtrologie. Installer et
REDACTION
configurer loutil de lhistorique.
Installer et configurer loutil de
MISE EN UVRE
9 lhistorique. Faire des mesures de
REDACTION
volume de checks et charge rseau.
Des bauches de procdures de dploiement (ex : Rdiger le mmoire et documents
RECETTAGE comment intgrer la surveillance dune nouvelle
10 technique. Finaliser la solution.
application, dun nouveau routeur etc) Rdiger les procdures de
REDACTION V 1.0 (Release) dploiement.
Des bauches de procdures de dploiement
Manuel oprationnel
RECETTAGE
Les axes damliorations possibles Rdiger le mmoire et documents
REDACTION 11
technique. Livrer les documents
MISES JOUR
lentreprise. Trouver des axes
damliorations possibles.

* Tableau 4 Cahier Macro planification

b. Backlog du produit
A partir du cahier de charge (chapitre 2.7) jai identifi les tches raliser. Comme lentreprise voulait
avoir une premire preuve pour la faisabilit du systme jai divis le projet en 2 lots. Le premire consiste
dterminer un scnario de supervision cela veut dire slectionner des lments importants pour lentreprise et
mettre en place le serveur de supervision pour la partie concerne. Et le deuxime lot consiste valider la
supervision et ajouter dautre outil afin damliorer la supervision.
Cette manire de planification me donne la possibilit de changer loutil et les mthodes de supervision si je
rencontre un problme srieux lors du lot 1.
Chaque fonctionnalit comporte une description pour expliquer la tche et une dure de ralisation pour la
planification.
Ce backlog de produit a t valid par le directeur technique aprs la premire semaine.

Bilan du projet 73/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Facteu Charge
Fonctionnalit Description Poids Jours
r (jours et)
Etude 4.00 4.00 4.00
Prise en main de l'out il de la supervision. Lire les document at ion et
P0-001 Et ude de l'out il 1.00 2.00 2.00
comprendre son fonct ionnement .
Et udier les modules et plugins pour choisir cert aines parmi eux qui
P0-002 Et ude des plugins, modules 1.00 1.00 1.00
peuvent t re ut iles pour le projet .
Et udier plus profondment la part ie de l'infrast ruct ure concernant le
P0-003 Et ude de l'infrast ruct ure du scnario scnario. Reprer les lment s pert urbant s firewall et c. Ident ifier t ous les 1.00 1.00 1.00
mat riels et applicat ions.
POC (M ise en uvre) 20.00 20.00 20.00
Prot ocoles de communicat ion, st rat gie de dploiement . Trouver comment
P1-001 Dfinir l'archit ect ure de supervision 1.00 1.00 1.00
dployer sur sit e dist ant chez OVH.
Crer une VM sur hyperviseur Esxi et la configurer. Inst aller un Cent os
P1-002 Met t re en place une VM avec Cent os 1.00 0.50 0.50
pour hberger le superviseur.
P1-003 Inst allat ion des out ils de t est de rseau. Inst aller les out ils ut iles pour le rseau. Nmap, wireshark, net st at et c. 1.00 0.50 0.50
P1-004 Inst allat ion de l'out il de supervision. Prparer l'environnement de t ravail et inst aller l'out il. 1.00 0.50 0.50
P1-005 Configurat ion de l'out il. 1.00 1.00 1.00
inst aller serveur de base de donnes et le configurer dans le superviseur.
'P1-006 Act iver, configurer base de donnes. 1.00 1.00 1.00
Act iver la fonct ionnalit de sauvegarde dans BD. Test er les sauvegardes.

Inst aller les services ncessaires pour faire marcher int erface web.
'P1-007 Act iver, configurer int erface web. Inst aller le module d'int erface web et coupler avec le superviseur 1.00 0.50 0.50
Configurer l'accs depuis int erne et ext erne.
Inst aller les plugins et les configurer pour ajout er les lment s surveiller.
'P1-008 Inst allat ion des plugins. Act iver ces fonct ionnement dans le superviseur. Inst allat ion sur les 1.00 2.00 2.00
quipement s monit or si ncessaire.
Ajout er une machine physique dans la configurat ion de l'out il. Paramt rer
'P1-009 Ajout er un host . les fact eurs surveiller. Dfinir les seuils, les frquences de check et les 1.00 1.00 1.00
alert es.
Ajout er l'quipement dans le superviseur. Paramt rer les fact eurs
'P1-010 Ajout er un swit ch. 1.00 0.50 0.50
surveiller. Dfinir les seuils, les frquences de check et les alert es.
Ajout er l'quipement dans le superviseur. Paramt rer les fact eurs
'P1-011 Ajout er rout eur. 1.00 1.00 1.00
surveiller. Dfinir les seuils, les frquences de check et les alert es.
Dfinir les dpendances des quipement s ajout s et de les ajout er dans la
'P1-012 Ajout er dpendances. 1.00 0.50 0.50
configurat ions du superviseur.
Ajout er configurat ion pour t est er accs int ernet depuis le point de sort ie du
'P1-013 Ajout er FAI. 1.00 1.00 1.00
rout eur.
Crer compt e vSphere superviseur. Ajout er configurat ion vSphere dans le
superviseur. Ajout er l'hyperviseur dans la configurat ion de l'out il.
'P1-014 Ajout er Hyperviseur Esxi OVH. 1.00 1.00 1.00
Dploiement sur serveur Esxi. Paramt rer les fact eurs surveiller. Dfinir
les seuils, les frquences de check et les alert es. Test er la surveillance.
Ajout er VM dans la configurat ion de l'out il. Paramt rer les fact eurs
'P1-015 Ajout er VM. surveiller. Dfinir les seuils, les frquences de check et les alert es. Test er la 1.00 1.00 1.00
surveillance.
Ajout er les dpendances ncessaires pour la VM et hyperviseur. Test er les
'P1-016 Ajout er dpendances et t est er. 1.00 1.00 1.00
dpendances.
Crer compt e MySQL pour superviseur. Configurer le plugin et ajout er
'P1-017 Ajout er Serveur MySQL. 1.00 1.00 1.00
serveur MySQL dan le superviseur.
Ajout er un serveur HTTP dans la configurat ion de l'out il. Paramt rer les
'P1-018 Ajout er Serveur HTTP. fact eurs surveiller. Dfinir les seuils, les frquences de check et les 1.00 1.00 1.00
alert es.
Ajout er un serveur FTP dans la configurat ion de l'out il. Paramt rer les
'P1-019 Ajout er serveur FTP fact eurs surveiller. Dfinir les seuils, les frquences de check et les 1.00 1.00 1.00
alert es.
'P1-020 Ajout er modem. 1.00 1.00 1.00
Rdact ions des manuels d'inst allat ions et configurat ions concernant le
'P1-021 Manuel d'inst allat ion et configurat ion. 1.00 1.00 1.00
serveur de supervision, l'out ils et les plugins ut iliss.
Simuler cert ains scnarios de panne. Faire t omber les quipement ou les
applicat ions de t est . Ce t est comprend un mal fonct ionnement d'un service
'P1-022 Test er scnario de panne. hberg sur VM, panne d'une VM, problme dans Hyperviseur, problme 1.00 1.00 1.00
du rseau, anomalie dans rseau et post e int erne. Visualiser ces t at s dans
int erface. Surveiller les not ificat ions envoys. Observer les acquit t ions.

Bilan du projet 74/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Ce lot 2 tait prvu au dbut pour tendre le systme de supervision mais aprs la runion de la fin du POC,
nous avons dcid de le consacrer pour les tests, loutil historique et rdactions de documents.

Lot 2 : Tests et historique 21.50 21.00 21.00


Trouver des out ils ut iles pour faire hist orique, mt rologie, rapport ing.
P3-001 Et udier des out ils int grer dans shinken 1.00 2.00 2.00
Et udier la communicat ions et int grat ion avec le mot eur shinken.
P3-002 Gest ion de projet . Suivi du projet , runion et dmos. 1.00 0.50 0.50
Faire des mesures pour les volumes de check et charge rseau.
P3-003 Faire des mesures. 1.00 1.00 1.00
Pour vrifier que les checks ne surcharge pas le rseau.
Int grat ion des out ils de mt rologie et report ing Inst allat ion des out ils pour avoir un hist orique, pour faire la mt rologie
'P3-004 1.00 7.00 7.00
dans shinken. avec des graphiques.
Finir d'ajout er les dpendances et des lment s de Dt erminer et ajout er les dpendances dans shinken. Ajout er les lment s
'P3-005 1.00 1.00 0.50
corrlat ions dans shinken. parent s. Dfinir le alert es par rapport aux dpendances.
Rdiger les cas de t est .
Simuler cert ains scnarios de panne. Faire t omber les quipement ou les
'P3-006 Test er scnario de panne. applicat ions de t est . Visualiser ces t at s dans int erface. Surveiller les 1.00 4.00 4.00
not ificat ions envoys. Observer les acquit t ions. Debugger l'out il en cas de
problme.
'P3-007 Validat ion des lment s superviss Test er le superviseur pour vrifier les fonct ionnalit s ident ifis. 1.00 1.00 1.00
Rdiger des document at ions t echnique pour expliquer les procdures de
dploiement . Comment ajout er un service ou quipement dans
Rdact ion des bauches de procdures de
superviseur. Comment changer la configurat ion des lment s surveilles ;
dploiement et les axes d'amliorat ions possibles.
P3-008 frquence d'alert e, les cont act s, IP d'un host et c. Comment modifier les 1.00 5.00 5.00
rgles de surveillance. Ident ifier les amliorat ions possibles. Met t re jour
Fin de t ravail de diplme.
les schmas, procdure, base de login de Qim info. rdact ion du mmoire
du diplme.

* Tableau 5 Backlog du produit

c. Rentabilit
Faible cot. Tous les outils installs sont open source et gratuits. Mais linstallation de ces outils prend
beaucoup de temps.

d. Cot
Heures de travail pour mise en uvre
Serveur de supervision

e. Gains
On peut estimer quelques gains mais les vrais gains, on verra une fois que le systme est tendu sur
linfrastructure.
Heures de travail de ladmin est optimis et il sera proactif.
Rapidit de la rsolution des problmes.
Moins dinterventions urgentes et coteuses.
Identification des faiblesses et supervision sur la base de mtriques.

f. Contraintes

i. Dlais

Le projet dbute le 20 avril et prend la fin le 8 juillet ce qui fait 11 semaines. Mais une semaine est
prvue pour les mises jour aprs cette date.

ii. Technique
Etre facile dutilisation
Etre facile paramtrer
Envoyer des mails en cas dalerte

Bilan du projet 75/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Etre compatible avec VMware
Etre compatible avec systme distribu pour des sites dispers gographiquement
Etre compatible avec systme htrogne
Les lments surveiller peuvent varier ou linfrastructure peut subir des modifications. La
solution doit sadapter linfrastructure. Une souplesse est ncessaire pour ajouter des
modules, pour faire des modifications.

g. Livrables

Le systme de supervision oprationnel


Schma de l architecture du monitoring
Une tude sur les diffrentes solutions de supervision libre
Un manuel oprationnel (utilisateur)
Un manuel dinstallation de la solution
Un manuel de paramtrage de la solution
Les axes damliorations possibles
(option) Des bauches de procdures de dploiement (ex : comment intgrer la surveillance dune
nouvelle application, dun nouveau routeur etc)

h. Critres dacceptations
La solution fournie doit remplir certaines conditions pour tre une solution acceptable.
Supporter infrastructure distribu et htrogne
Doit donner la possibilit de la dployer. (Ex. : ajouter un parc, un serveur )
Le systme doit dtecter la panne en prenant en compte les dpendances. (Ex. : switch en panne et il ne doit
pas dire tous ce qui lis ce switch sont en panne)
Alerter au bon moment et dans certaines limites de temps et degr dimportance

i. EQUIPE
Le projet sera ralis par Huseyin et surveill par le directeur technique de Qim info M. DAUDEL et M.
Hostettler qui est ingnieur de systme en tant que collaborateur externe. Le chef de projet M. Loc est l pour
le bon droulement du projet.

j. Recettage

La solution de supervision installe doit tre teste afin de vrifier les spcifications indiques dans le chapitre
10.4.1 et dans le cahier de charges 4.2 .
Un tableau de test prpar montre les tests effectuer avant la sortie dune version Bta de la solution.

k. Risques
Jai commenc dterminer les risques partir de ce que je devais raliser et je devais toucher. Les retours des
autres ralisations mont aid pour identifier les risques aussi. Avec les projets qui touchent linfrastructure,
nous avons toujours certaines risques comme ; dtre bloqu par les quipements ou applications, provoquer
certaines pannes ou charger le rseau. Comme il y a un systme denvoie mail avec la source de panne, cela
risque des envois excises et avec des fausses alertes. Le choix doutil peut aussi tre un risque car en cas de
dun mauvais choix jai un risque. Un pour un projet informatique peut facilement comporter le risque de
dpassement comptences sil est men par un dbutant dans les domaines.
A partir de tous ces risques jai tabli ma carte de risque en identifiant aussi son impact, son type, ses
consquences mais aussi les actions prventives mener. Jai dtermin des dates pour fermer les risques par
rapport aux tapes des ralisations.
Tous les risques doivent tre ferms au plus tard aprs les tests. Cette gestion de risque est suivie par le
consultant William Ray et les fermetures de risques sont confirmes par lui.

Bilan du projet 76/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Description du risque : description textuelle des facteurs de risque ainsi que de leur contexte d'apparition. Si
de nouveaux lments apparaissent venant complter le contexte d'apparition du risque, ils sont ajouts au fur
et mesure dans cette case, prcds par la date de mise jour
Poids : poids est calcul avec la multiplication de limpact et de la probabilit dun risque.
Actions prventives : actions engages ou engager dans le but de rduire le risque.

Proba Impa Pour


Date Description du risque Impacts Type bilit ct Poids le Actions prventives
Les configurations des
outils de scurit (ex. :
firewall, anti-virus, Charge de
architecture virtuelle) ou travail
Identifier les lments bloquants comme
certaines quipements (dlais,
27.04 Technique 3 3 9 8.5.15 firewall et ajouter les rgles.Demande
(routeur, modem) peuvent cot
l'aide de Grgoire.
empcher certaines formation
communications du )
systme de surveillance
sans tre repr.
Les
Administrateurs peuvent administr Rduire le nombre de notifications.
tre dpasss suite aux ateurs 14.5.1 Limiter le nombre d'objet surveill en
27.04 Technique 3 4 12
nombres de messages ignorent 5 dfinissant l'architecture d'envoi des
reus. les alertes.
messages
Problme de dpendances, Bien tudier le systme et rtablir tous
le systme peut se tromper 14.5.1 les dpendances sur le superviseur. Bien
27.04 Technique 2 3 6
pour la source de panne. 5 comprendre le fonctionnement de
Fausses alertes. l'architecture technique de Qim info.
Charge de
travail
(dlais+co 14.5.1
27.04 Comptences collaborateur Technique 2 3 6 Collaborer avec Grgoire.
t 5
formation
)
Saturation du rseau
14.5.1 Limiter la frquence de test par le
27.04 cause de volume de flux Technique 2 4 8
5 superviseur.
gnr.
Charge de
travail
Dfinir les lments principaux
Superviser les lments (dlais+co Fonctionn
27.04 2 1 2 surveiller par rapport leurs
inutilement. t el
importances.
formation
)
Dvelopp
Comprhension Fonctionn Avoir une documentation technique et
27.04 ements 1 3 3
fonctionnelle el fonctionnelle
inadquat
Un test va perturber le Rpercuss
fonctionnement normal de ions sur le Organisati Contrler le fonctionnement normal des
27.04 1 4 4
la ressource teste cause Business on appareils lors des tests.
d'un effet de bord. As Usual.

* Tableau 6 Cahier de Risques

Bilan du projet 77/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Annexe B. Lexiques
BAM (Business Activity Monitoring): Supervision de lactiv mtier.
Mtrologie : La science de la mesure. Cest donc lensemble des techniques et des savoir-faire permettant de
donner une valeur une observation, en bref de mesurer.
OVH : OVH est un hbergeur de sites web franais. Avec environ 180 000 serveurs en octobre 2014, OVH dispose
de l'un des plus grands parcs de serveurs au monde.
ESXI MRTG (Multi Router Traffic Grapher) : Logiciel gratuit bas sur SNMP permettant la traduction graphique de
donnes
MIB (Management Information Base), Base d'informations structure dun quipement utilis par SNMP
NRPE (Nagios Remote Plugin Executor) : Module Nagios pour excuter des plugins sur une machine distance.
FORK : Un nouveau logiciel cre partir du code source don logiciel existant.
POSIX : Une famille de normes techniques en informatique dfinie depuis 1988 per IEEE.
POC (Proof of concept) : Dmonstration de faisabilit, une ralisation dune mthode pour dmontrer sa
faisabilit.
SNMP (Simple network Management Protocol): Protocole de communication pour grer les quipements
travers le rseau.
OID (Object Identifier) : Nom dfinissant un objet dans le MIB de SNMP.
WMI (Windows Management Instrumentation) : Gestion interne de surveillance de Windows.

Annexe C. Liens Utiles


1-Business monitoring : http://fr.wikipedia.org/wiki/Business_activity_monitoring
2- Doc officiel Shinken - http://shinken.readthedocs.org
3- Forum Shinken en anglais: http://forum.shinken-monitoring.org/
4- Forum Monitoring : http://forums.monitoring-fr.org/
5- Travaux Shinken hepia : http://www.tdeig.ch/shinken/
6-Limiter les alertes : http://connect.ed-diamond.com/GNU-Linux-Magazine/GLMF-137/Ne-pas-devenir-
dingue-avec-sa-supervision
7- Interview avec Jean Gabs- http://blog.nicolargo.com/2012/09/interview-de-jean-gabes-pour-la-sortie-de-
shinken-1-2.html
8- Introduction au Shinken 2.2 : http://shinkenlab.io/release-2-2/
9 -Plugins pour monitoring : https://www.monitoring-plugins.org/

Bilan du projet 78/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Annexe D. Procdure
dinstallation Hyperviseur
Esxi 5.5 et VSphere Client
a. Tlchargement de limage depuis WMWare

Crer un compte sur le site Wmware.com pour pouvoir tlcharger limage et avoir une licence gratuite. On peut
choisir la version dEsxi grce au comparateur mise en disposition. Il faut choisir la version par rapport au
matriel, lOS de la VM installer. Le matriel disposition support Esxi 5.5 mais pas 6.0.

Guide Esxi http://www.vmware.com/resources/compatibility/search.php

Pour installer et utiliser Esxi 5.5, vos ressources matrielles et systme doivent rpondre aux exigences suivantes
:

Esxi 5.5 n'installera et n'excutera que les serveurs dots de CPU x86 64 bits.
Esxi 5.5 ncessite une machine hte disposant d'au moins deux curs.
Esxi 5.5 ne prend en charge que les instructions de CPU LAHF et SAHF.
Esxi 5.5 ncessite d'activer le bit NX/XD pour le processeur dans le BIOS.

Les cartes rseaux de Realtek R8168/8169 ne sont pas prises en charges mais la modification de limage Esxi est
possible. Pour modifier une image tlcharger le logiciel Esxi customizer et les pilotes pour les cartes rseaux sur
le mme site.

Esxi customizer : http://www.v-front.de/p/esxi-


customizer.html

Lancer lEsxi customizer aprs linstallation.


Slectionner limage Esxi et le pilote ajouter comme
le

* Figure 67 Modifier limage Esxi

Bilan du projet 79/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
b. Prparer le support de dmarrage

Tlcharger le logiciel unetbootin pour


prparer une cl de dmarrage avec Esxi.

Site de tlchargement :
http://unetbootin.sourceforge.net/

Lancer le et slectionner limage et la cl USB.

* Figure 68 Prparer cl USB de dmarrage

c. Installation Esxi

* Figure 69 Chargement des composants de lEsxi

* Figure 70 Menu dinstallation Esxi

Dmarrer lordinateur sur la cl USB et slectionner linstallation Esxi dans le menu qui est affich.

* Figure 71 Choisir mot de passe root

Bilan du projet 80/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 72 Fin de l'installation Esxi

Il faut dmarrer le PC et configurer la carte rseau avec une IP fixe. Appuyer sur F2 et entrer le mot de passe du
root.

* Figure 73 Menu de configuration d'Esxi

La machine se configure via le DHCP au dmarrage et il faut modifier pour un avoir une IP fixe.

* Figure 74 Menu Configuration de lIP

Choisir configuration manuel, entrer lIP du serveur DNS, choisir un nom et une IP disponible.

Bilan du projet 81/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 75 Configuration IP

Il faut aussi activer le SSH sur machine Esxi pour la gestion via VSphere.

* Figure 76 Menu TroubleShooting

* Figure 77 Activer SSH

Le hyperviseur Esxi 5.5 comporte une vulnrabilit li OpenSSL et Heartbleed, il faut appliquer les corrections
KB2076121 et KB2076589. La procdure est explique sur le site de WMWare.
http://kb.vmware.com/selfservice/search.do?cmd=displayKC&docType=kc&docTypeID=DT_KB_1_1&externalId
=2076692

Bilan du projet 82/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Annexe E. Procdure
dinstallation vSphere
Ouvrir un navigateur et taper lIP de la machine Esxi et la page web
affich contient un lien pour tlcharger le client vSphere. Aprs
linstallation de lexcutable lancer le logiciel vSphere. Il faut entrer
lIP du serveur avec login root et mot de passe choisi sur la machine
pendant linstallation.

* Figure 78 Login VSphere

Pour la premire connexion il faut soit installer le certificat de la


machine soit ignorer pour se connecter.

* Figure 79 Message concernant certificat de la machine

La dernire tape consiste entrer la cl de la licence obtenue sur le site WMWare.com. Elle est gratuite et
affich dans longlet de tlchargement de votre compte WMWare. Sinon un avertissement (Votre licence
expire dans 60 jours et vos machines virtuelles seront dsactives)
Il faut slectionner la machine dans VSphere et aller dans :
Configuration -> Fonctions autorises -> Modifier -> Affecter une cl -> Entrer cl et entrer la cl que vous
avec pris.

Bilan du projet 83/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 80 Entrer la cl de la licence

Annexe F. Procdure de
cration VM via client
vSphere
Dans menu fichier -> nouveau et machine virtuelle.

Bilan du projet 84/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 81 configurer VM personnalise * Figure 82 Slectionner le nom de la VM

* Figure 83 Choisir stockage * Figure 84 Choisir la version de la VM

Bilan du projet 85/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Note : Il faut slectionner Red Hat au lieu de Centos pour pouvoir * Figure 86 Choisir le nombre sockets virtuels pour CPU
installer diffrents SCSI connecteurs virtuels.

* Figure 85 Version de lOS installer

* Figure 87 Configurer la mmoire * Figure 88 Contrleur SCSI

Bilan du projet 86/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 89 Type de disque * Figure 90 Taille du disque

* Figure 91 Options avances pour le disque virtuel * Figure 92 Fin de la cration de la VM

Bilan du projet 87/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Annexe G. Procdure
dinstallation Centos sur une
VM via VSphere

a. Tlchargement de limage Centos


Il faut tester la comptabilit de lOS avant dinstaller sur VM. Centos 7.X est support par Esxi 5.5 update2.

* Figure 93 Esxi compatibilits OS

Tlcharger Centos 7.1 depuis le site :


http://isoredirect.centos.org/centos/7/isos/x86_64/CentOS-7-x86_64-Minimal-1503-01.iso

b. Ajouter limage dans la machine Esxi


Pour pouvoir installer un OS vis vSphere on peut mettre le cd/dvd dinstallation dans le lecteur de la machine
ou transfrer le fichier via SCP ou ftp vers la machine. Vu que le SSH est dj activ sur Esxi aprs linstallation,
on peut envoyer limage via SCP avec WinSCP. En cas denvoi par FTP, il faut activer FTP sur la machine Esxi.

Tlcharger WinSCP depuis http://winscp.net/eng/download.php et lancer le avec login de la machine Esxi.

Bilan du projet 88/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 94 Connexion avec machine Esxi via WinSCP

Slectionner limage depuis local et mettre vers la machine dans longlet droit.

* Figure 95 Slectionner le lecteur et connecter avec image de banque et choisir lemplacement de limage transfr

Bilan du projet 89/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 96 Connecter limage avec VM pour linstaller

Sans connecter le lecteur la VM, VM ne peut pas dmarrer sur limage.

* Figure 97 Connecter le lecteur CD/DVD la VM

Bilan du projet 90/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 98 installer Wm tools pour pourvoir grer la VM correctement avec vSphere

Maintenant on peut dmarrer la VM et elle dmarre sur limage et on peut lancer linstallation.

* Figure 99 Slectionner la langue durant installation

Bilan du projet 91/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 100 Configurer lIP et rseau manuellement

* Figure 101 Slectionner mot de passe root

Linstallation minimum ne contient pas linterface dutilisateur. Il faut installer manuellement.


[root@qgemnt001]# yum groupinstall "GNOME Desktop" "Graphical Administration Tools"
Pour dmarrer toujours avec linterface :
[root@qgemnt001]# #ln -sf /lib/systemd/system/runlevel5.target /etc/systemd/system/default.target
Au premier dmarrage une erreur affich mais lOS dmarre.
Message : Assuming drive cache: write through
Cause : Linterface de login.
Solution : Il faut changer linterface de login dans grub. Dans le menu de grub appuyer sur e et modifier le
script. Enlever le mot rhgb .

Bilan du projet 92/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
Linstallation est finie.

Annexe H. Capture des


tests
Suite aux tests jai pris de nombreuses captures dcrans. Je mets quelques crans concernant les accs
internet, poste de Windows (PC19) et serveur extsrv003 hberg chez OVH.

a. Coupure accs internet


En cas de coupure accs internet le Shinken ne va pas notifie les lments dpendants. Sous la vue All il va
afficher tous les problmes.

* Figure 102 Vue All en cas de coupure internet

Mais dans la vue IT problems le Shinken affiche juste llments perturbateur car il peut faire la corrlation
de donnes grce aux dpendances.

Bilan du projet 93/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 103 Vue IT problems pour coupure internet

La vue Currently (Vue globale) affiche un rsum du systme. Les impacts sont les rgles mtier touches
par le problmes. IT problme affiche un seul problme car il ne peut pas dterminer ltat de
linfrstructure OVH qui dpend de laccs internet. Laccs internet est dclar comme hte donc le
systme considre un hte DOWN. (8 htes total- chaque hte represente 12,50 % des htes)

* Figure 104 Vue Currently

La vue Wall affiche les impacts de business et les IT problems dans une seule vue.

Bilan du projet 94/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 105 vue Wall pour coupure internet

Shinken gnere une seule notification pour laccs internet et il ne vas notifier tous les lments dpendants
comme le serveur extsrv003 chez OVH.

* Figure 106 Mails reus pour la coupure internet

* Figure 107 Mail host down accs internet

Bilan du projet 95/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 108 Mail host Up accs internet

b. Charge CPU du PC 19
Vue dtaille de la charge CPU du PC19.

* Figure 109 Etat charge CPU du pc19 sur interface web Shinken

Mail recu suite ltat critique de la charge CPU.

Bilan du projet 96/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 110 Mail reu pour problme de la charge cpu du PC 19

La notification recue suite la rsolution du problme.

* Figure 111 Mail reu pour la rsolution du problme

c. Tests sur serveur extsrv003


Tests serveur Apache

Dans la vue All on voit tous les problmes li ou pas au serveur Apache.

Bilan du projet 97/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
* Figure 112 Vue all pour le problme serveur Apache

Par contre dans la vue IT problems Shinken dtecte un seul problme car les autres problmes sont lis au

prblme du serveur Apache.

* Figure 113 La vue IT problems pour problme serveur Apache

Bilan du projet 98/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
La vue Walle affiche le business touch et la sources des problmes.

* Figure 114 Vu Wall pour problme serveur Apache

Sous la vue Impacts on peut les dpendances du business et les problme lis.

* Figure 115 Vue Impacts pour problme serveur Apache

Bilan du projet 99/10


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
6
La vue currenlty.

* Figure 116 Vu Currently pour problme serveur Apache

Les mails recus. On recoit des notifications pour les rgles mtier aussi.

* Figure 117 Mails reus pour problme serveur Apache

Dtails du mail recu pour problme serveur Apache.

* Figure 118 Dtail du mail reu pour problme serveur Apache

Bilan du projet 100/1


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
06
Dtails du mail pour la rsolution du problme du serveur Apache.

* Figure 119 Dtail du mail de la rsolution du problme serveur Apache

Annexe I. Captures des


sondes via Wireshark
a. Sonde en SSH

* Figure 120 Capture d'une sonde en SSH via Wireshark

Bilan du projet 101/1


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
06
* Figure 121 Taille d'une sonde SSH via Wireshark

b. Sonde FTP

* Figure 122 Capture d'une sonde FTP via Wireshark

* Figure 123 Capture la taille d'une sonde SNMP via Wireshark

c. Sonde SNMP
La conversation entre le superviseur et routeur pour une sonde avec le SNMP .

* Figure 124 Capture d'une sonde SNMP via Wireshark

Bilan du projet 102/1


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
06
* Figure 125 Capture taille d'une sonde SNMP via Wireshark

Annexe J. Figures
* Figure 1 Logo de Qim info ................................................................................. 9
* Figure 2 Mind map pour la supervision ............................................................ 10
* Figure 3 Chane de la supervision .................................................................... 11
* Figure 4 Couches des lments pour la supervision ..................................... 11
* Figure 5 Schma du fonctionnement SNMP .................................................... 13
* Figure 6 Exemple d'architecture Shinken pour un systme distribu ............... 17
* Figure 7 Logo Shinken ..................................................................................... 18
* Figure 8 Architecture Shinken .......................................................................... 18
* Figure 9 Exemple du rsultat des plugins dans Shell ....................................... 20
* Figure 10Performance data retourn par le check disk via SSH sur int. Web .. 20
* Figure 11 dclaration d'un module dan /etc/shinken/modules .......................... 22
* Figure 12 Ajout du module webui dans le dmon broker ................................. 22
* Figure 13 Fonctionnement d'un check en SSH ................................................ 23
* Figure 15 Vues de l'interface web sur un smartphone ..................................... 24
* Figure 14 Interface Web Shinken - Vue Dashboard ........................................ 24
* Figure 16 Interface Web avec Graphite ........................................................... 26
* Figure 17 Schma de communications entre shinken et dautres outils .......... 26
* Figure 18 Schma du scnario ........................................................................ 28
* Figure 19 Schma de dpendances ................................................................ 29
* Figure 20 Schma Rgler mtier (Business Rule) utilisation intranet depuis local
de Genve ................................................................................................................ 33
* Figure 21 Composition dun Rgles mtier (Business rule)............................. 34
* Figure 22 Logigramme de dploiement .......................................................... 35
* Figure 23 Message derreur si le module de sauvegarde nest pas activ. . 38
* Figure 24 Listes de processus de Shinken aprs le dmarrage....................... 39
* Figure 25 Aide pour lutilisation dun plugin ...................................................... 41
* Figure 26 Figure Configuration de chemins de plugins. ................................... 41
* Figure 27 Message derreur aprs une vrification de la configuration. .......... 42
* Figure 28 Dfinition dun routeur via SNMP ..................................................... 43
* Figure 29 Dfinition d'un serveur et configuration SSH ................................... 44
* Figure 30 Dfinition d'un service pour connexion SSH .................................... 45
* Figure 31 Ajout d'un contact ............................................................................. 45

Bilan du projet 103/1


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
06
* Figure 32 Ajout d'un groupe de contact............................................................ 45
* Figure 33 Commande check http ..................................................................... 46
* Figure 34 Template generic-host ..................................................................... 47
* Figure 35 dfinition d'un timeperiode 7j/7 24h/24 ............................................. 48
* Figure 36 Dfinition d'un timeperiode pour les heures du travail ...................... 48
* Figure 37 Dfinition dune dpendance ............................................................ 49
* Figure 38 Dfinition dune dpendance de service .......................................... 49
* Figure 39 Dfinition dune rgles mtier ........................................................... 50
* Figure 40 Affichage dbut d'une MIB avec snmpwalk ...................................... 51
* Figure 41 La hirarchie de la MIB obtenue avec Oidview ................................ 51
* Figure 42 Service check URL jira ..................................................................... 52
* Figure 43 Commande check URL .................................................................... 52
* Figure 44 service FTP ...................................................................................... 52
* Figure 45 Commande check FTP .................................................................... 53
* Figure 46 Service MySQL ................................................................................ 53
* Figure 47 Commande check MySQL ............................................................... 53
* Figure 48 service entre DNS .......................................................................... 53
* Figure 49 Check commande DNS .................................................................... 54
* Figure 50 Service serveur Apache ................................................................... 54
* Figure 51 Check commande Apache ............................................................... 54
* Figure 52 Configuration du module Graphite ................................................... 55
* Figure 53 Configuration Interface Web Graphite .............................................. 56
* Figure 54 Test de fonctionnement Graphite ..................................................... 56
* Figure 55 Config Tool de Thruk........................................................................ 57
* Figure 56 interface web de Thruk ..................................................................... 57
* Figure 57 Rapport de disponibilit des machines sur une semaine ................. 58
* Figure 58 Rapport pour un switch .................................................................... 58
* Figure 59 Gnration d'un rapport ................................................................... 58
* Figure 60 Ajouter Shinken dans Nagvis ........................................................... 59
* Figure 61 ajout d'une image dans Nagvis ........................................................ 60
* Figure 62 Crer une carte dans Nagvis ........................................................... 60
* Figure 63 Ajouter un lment surveill ............................................................. 60
* Figure 64 Carte de la salle de serveur ............................................................. 61
* Figure 65 Carte du parc informatique de Genve ............................................ 63
* Figure 66 direction url de Nagvis vers Shinken ................................................ 63
* Figure 67 Modifier limage Esxi ....................................................................... 79
* Figure 68 Prparer cl USB de dmarrage ...................................................... 80
* Figure 69 Chargement des composants de lEsxi ............................................ 80
* Figure 70 Menu dinstallation Esxi .................................................................... 80
* Figure 71 Choisir mot de passe root ................................................................ 80
* Figure 72 Fin de l'installation Esxi .................................................................... 81
* Figure 73 Menu de configuration d'Esxi ........................................................... 81
* Figure 74 Menu Configuration de lIP ............................................................... 81
* Figure 75 Configuration IP ............................................................................. 82
* Figure 76 Menu TroubleShooting ..................................................................... 82
* Figure 77 Activer SSH ...................................................................................... 82
* Figure 78 Login VSphere ................................................................................. 83
* Figure 79 Message concernant certificat de la machine .................................. 83
* Figure 80 Entrer la cl de la licence ................................................................. 84
* Figure 81 configurer VM personnalise ........................................................... 85

Bilan du projet 104/1


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
06
* Figure 82 Slectionner le nom de la VM .......................................................... 85
* Figure 83 Choisir stockage............................................................................... 85
* Figure 84 Choisir la version de la VM .............................................................. 85
* Figure 85 Version de lOS installer ................................................................ 86
* Figure 86 Choisir le nombre sockets virtuels pour CPU ................................... 86
* Figure 87 Configurer la mmoire...................................................................... 86
* Figure 88 Contrleur SCSI ............................................................................... 86
* Figure 89 Type de disque................................................................................. 87
* Figure 90 Taille du disque ................................................................................ 87
* Figure 91 Options avances pour le disque virtuel .......................................... 87
* Figure 92 Fin de la cration de la VM .............................................................. 87
* Figure 93 Esxi compatibilits OS ..................................................................... 88
* Figure 94 Connexion avec machine Esxi via WinSCP .................................... 89
* Figure 95 Slectionner le lecteur et connecter avec image de banque et choisir
lemplacement de limage transfr .......................................................................... 89
* Figure 96 Connecter limage avec VM pour linstaller ...................................... 90
* Figure 97 Connecter le lecteur CD/DVD la VM ............................................. 90
* Figure 98 installer Wm tools pour pourvoir grer la VM avec vSphere ........... 91
* Figure 99 Slectionner la langue durant installation ......................................... 91
* Figure 100 Configurer lIP et rseau manuellement ......................................... 92
* Figure 101 Slectionner mot de passe root...................................................... 92
* Figure 102 Vue All en cas de coupure internet ................................................ 93
* Figure 103 Vue IT problems pour coupure internet .......................................... 94
* Figure 104 Vue Currently ................................................................................. 94
* Figure 105 vue Wall pour coupure internet ...................................................... 95
* Figure 106 Mails reus pour la coupure internet .............................................. 95
* Figure 107 Mail host down accs internet ........................................................ 95
* Figure 108 Mail host Up accs internet ............................................................ 96
* Figure 109 Etat charge CPU du pc19 sur interface web Shinken .................... 96
* Figure 110 Mail reu pour problme de la charge cpu du PC 19 ..................... 97
* Figure 111 Mail reu pour la rsolution du problme ....................................... 97
* Figure 112 Vue all pour le problme serveur Apache ...................................... 98
* Figure 113 La vue IT problems pour problme serveur Apache ...................... 98
* Figure 114 Vu Wall pour problme serveur Apache ........................................ 99
* Figure 115 Vue Impacts pour problme serveur Apache ................................ 99
* Figure 116 Vu Currently pour problme serveur Apache ............................... 100
* Figure 117 Mails reus pour problme serveur Apache ................................. 100
* Figure 118 Dtail du mail reu pour problme serveur Apache ..................... 100
* Figure 119 Dtail du mail de la rsolution du problme serveur Apache ....... 101
* Figure 120 Capture d'une sonde en SSH via Wireshark ................................ 101
* Figure 121 Taille d'une sonde SSH via Wireshark ......................................... 102
* Figure 122 Capture d'une sonde FTP via Wireshark.................................... 102
* Figure 123 Capture la taille d'une sonde SNMP via Wireshark ..................... 102
* Figure 124 Capture d'une sonde SNMP via Wireshark .................................. 102
* Figure 125 Capture taille d'une sonde SNMP via Wireshark ......................... 103

Bilan du projet 105/1


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
06
Annexe K. Tableaux
* Tableau 1 Tableau de comparaison des outils ................................................. 16
* Tableau 2 Dtails de mesures de la supervision ............................................. 31
* Tableau 3 Cahier de tests ................................................................................ 71
* Tableau 4 Cahier Macro planification ............................................................... 73
* Tableau 5 Backlog du produit........................................................................... 75
* Tableau 6 Cahier de Risques ........................................................................... 77

Bilan du projet 106/1


08.07. 2015
Huseyin Bilgin Supervision base sur shinken sous la direction de Prof. Litzistorf
06

Vous aimerez peut-être aussi