Vous êtes sur la page 1sur 78

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

TOME IV

Jean-Franois CASQUET jfcasquet@yahoo.fr Septembre 2004


Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Pourquoi superviser un rseau ?

TOME IV chapitre 1

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ceLes Origines du LAN quun Rseau ?

4.1.1

A quelle date a t invent le LAN ?

Un rseau informatique = mise en communication entre machines informatiques dans le but de partager des informations (ressources).

Le support de communication dans le temps (grand-public)


Dbits 2 Mb 10 Mb 100 Mb 1 Gb Par fils WiFi InfraRouge WiMAX Satellite
1975 1994 1998 2001 2004

IMPORTANT

Qui sait ce que seront les Rseaux de demain ?

CE QUIL FAUT RETENIR

Un rseau provoque la communication entre lments informatiques - mais peut-tre aussi votre insu !

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Que veut dire Superviser ?


4.1.2

Super = au dessus Viser = regarder

Regarder au dessus = regarder linformation

! ?
EXEMPLE

Regarder linformation = espionner Regarder au dessus de linformation = surviser

Dans un Rseau informatique, que veut dire superviser ? Il sagit de regarder TOUT sauf linformation.

t es T

Espionner = on a imprim Test Superviser = on a imprim 1 feuille

IMPORTANT

Superviser ne vous autorise pas regarder linformation.

CE QUIL FAUT RETENIR

Il faut vrifier que la frontire entre superviser et espionner n a pas t franchie.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Diffrence entre superviser et surveiller


4.1.3

Surveiller = Veiller Sur Superviser = Regarder au-dessus

! !
EXEMPLE

La surveillance = Regarder quelque chose de prcis. Par exemple : surveiller la porte dentre (rien dautre).

Superviser cest, en ralit, surveiller plusieurs organes.


T r ille LNE rve s TE Su c lac

Remonte des informations


r ille P rve s FT Su c lac

Superviser sans vrifier les dtails

IMPORTANT

Superviser cest veiller sur les organes en remontant les informations quantitatives
CE QUIL FAUT RETENIR

Avant de superviser, il faut que je sache ce que jai besoin de surveiller.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Pourquoi superviser ?
4.1.4

! !
:-( :-( :-(

Je supervise dans le but dtre inform sur ltat de mon rseau ou de mes applications

Je supervise pour ne pas tomber des nues !

Si je ne supervise pas :

! ! ! ! !

Je peux tre pirat sans le savoir Mes serveurs peuvent tre fatigus Mes performances peuvent tomber Les utilisateurs prviennent en cas de panne - je perds toute crdibilit Ma Direction se lasse : linformatique est toujours en panne

IMPORTANT

Je supervise pour ma tranquillit et ma crdibilit

CE QUIL FAUT RETENIR

Jai besoin de la supervision pour mon image.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Pourquoi ne pas simplement attendre la panne ? Tout

4.1.5

En plus de ma crdibilit - quels sont les enjeux de ma passivit ?

Si jattends la panne
Dure de la Panne Rparation
Signes avant coureurs PANNE Appel S.O.S utilisateurs Intervention Remise en service

Si je supervise mal (post-panne)


Dure de la Panne Rparation
Signes avant coureurs PANNE Intervention Remise en service

Je supervise correctement (tolrance aux pannes)

Rparation
Intervention Signes avant coureurs Remise en service

Limitation des interventions les utilisateurs sont prvenus avant pour que lintervention puisse tre planifie Limage de linformatique samliore Les motifs des pannes peuvent tre trouvs pour amliorer les systmes

IMPORTANT

Superviser sert aussi prvenir des pannes.

CE QUIL FAUT RETENIR

Plus les interventions sont courtes, plus on communique sur les actions prventives - plus les usagers travailleront en nous donnant la confiance et les crdits.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Oui mais : comment faire ?


4.1.6

!
EXEMPLE

Il faut trouver les tests faire - savoir ce quil faut vrifier

En face de chaque test faire il faut trouver LA ou LES fonctions (commandes) de surveillance. En face de chaque commande de surveillance il faut construire les trames de rsultat qui permettront la supervision.

T r ille LNE rve s TE Su c lac

/var/log/.....

| grep .... > /var/log/alertes

Remonte des informations


r ille P rve s FT Su c lac

Superviser sans vrifier les dtails

IMPORTANT

Prparer vos tests de surveillance en considrant tout de mme la charge CPU - faire trop de tests tue le test !

CE QUIL FAUT RETENIR

Il est capital de vrifier que ce qui est surveill remonte bien les 2 tats : OK et KO - car un tat intermdiaire peut cacher un problme...

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quels sont les impacts rels dune dfaillance ?

TOME IV chapitre 2

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ce quune dfaillance ?


4.2.1

Dfaillance = passer dun tat normal un tat dgrad.

Niveaux de dfaillance : Lgre : il sagit dun critre qui prsente un tat instable Passagre : un lment dfaille dune manire prvisible et prvue (action de maintenance qui provoque une interruption de service) Localise : la dfaillance ne provoque pas de problme de qualit de service Grave : La dfaillance affecte la qualit de service

IMPORTANT

Une dfaillance peut tre normale - lorsquelle est prvue.

CE QUIL FAUT RETENIR

Le niveau de gravit dune dfaillance DOIT TRE value avant quelle ne se produit - le niveau est dfini et caractris par le choix technique de surveillance.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Suis-je responsable dune dfaillance ?


4.2.2

Puisquune dfaillance peut intervenir sans prvenir - sans notre volont En serais-je responsable pour autant ?

Premier cas :Une dfaillance grave est apparue avec des lments annonciateurs (disque dur ventilateurs ...) Jen suis responsable Second cas : Une dfaillance sans lments annonciateurs (alimentation ...) Je nen suis pas responsable
A condition, toutefois, de dmontrer quaucun lment naurait pu lannoncer.

Troisime cas : Une dfaillance prvue et organise (arrt pour maintenance ...) Jen suis responsable
moins davoir communiqu suffisamment tt

IMPORTANT

Si une dfaillance tait prvisible, je suis responsable de mon immobilisme.

CE QUIL FAUT RETENIR

Suivant le cas, la dfaillance, mme pour des oprations de routine, peut entraner notre responsabilit personnelle.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

O se trouve ma responsabilit ?
4.2.3

Chaque mtier de linformatique a sa responsabilit. Il faut donc savoir o se trouve la ntre : le primtre de ma responsabilit est dcrite par lintraction avec mes collaborateurs (et prestataires).

Maintenance matrielle Dveloppement Sauvegardes Architecte Scurit Installateur

Maintenance logiciel

Administration Systme

Exploitation

IMPORTANT

Dans lorganigramme de la Socit, nous trouvons les autres intervenants afin de dbusquer les mtiers manquants : car, nous, lAdministrateur rcuprons ces fonctions dune manire intuitive !

CE QUIL FAUT RETENIR

Il ne faut pas tre laxiste en pensant que la dfaillance pourrait tre attribue quelquun dautre.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment mesurer limpact rel dune dfaillance ?


4.2.4

Recette de cuisine : Simuler la dfaillance au pire des cas !

Par exemple : (pour ce qui concerne les sauvegardes) afin de connatre limpact rel dune dfaillance, disons quil y a eu le feu, les sauvegardes sont brles Combien de temps faut-il pour tout refaire (si cest possible) ! Mesurez le cot .... A ce moment l, tout naturellement, le responsable apparat lvidence - car cest le rle de personne dautre !

Devant le cot et les consquences : cest nous de mettre en place ce quil faut pour prvenir la panne, voire mme, le sinistre

IMPORTANT

Il faut simuler le sinistre pour que chacun se mouille vraiment.

CE QUIL FAUT RETENIR

Veillez ce que les consquences dune dfaillance ne vous fasse pas tomber avec elle !

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment rpartir ma responsabilit sur les vrais acteurs ?


4.2.5

Recette de cuisine : Faites le schma et crivez ce que chacun fait en cas de sinistre.

Par exemple : Je suis responsable dune liaison WAN. Je dois donc me demander qui sera pnalis en cas de dfaillance. Il faut donc noter les responsables et les lments qui rclament une qualit de service.

Responsable A

Responsable B

}
Prvenir quand on passe en mode dgrad

Ma responsabilit

IMPORTANT

Il faut trouver les intervenants qui dpendent de mes services afin de leur cder une part de responsabilit.

CE QUIL FAUT RETENIR

Rpartir notre responsabilit permet de faire correctement notre travail.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Que dit la loi sur mapas responsabilit ? Salari ou

4.2.6

Les devoirs dun salari : Respecter le Code du Travail Accder au devoir dAlerte Ne pas mettre en pril la Socit par notre ngligence

Si votre Socit est mise en pril cause de votre ngligence - elle peut non-seulement vous licencier pour faute grave mais aussi entreprendre des actions civiles sur le motif a cherch nuire (dommages et intrts) !

Que vous soyez Salari ou pas (prestataire, consultant ...) vous avez un Devoir dAlerte. En clair : ne pas alerter = laisser une faille qui peut nuire = il faudra en cas de poursuites, dmontrer que les faits ne vous donneraient dune manire ou dune autre, aucun avantage (vous tes considrs comme coupables !)

IMPORTANT

Notre mtier est important / Soyons PRO !

CE QUIL FAUT RETENIR

Ne jamais rester sans rien dire devant des choses qui peuvent provoquer une panne.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment faire la frontire entre la supervision et la maintenance prventive ?


TOME IV chapitre 3

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ce que la maintenance prventive ?


4.3.1

Maintenance en prvention en prvention de panne ventuelle

La supervision permet de dterminer quune panne (bien souvent logicielle) arrive (la face cache dun Bug). Un processus qui ne libre pas la mmoire correctement provoque une saturation - avec le temps. Un reboot est bien souvent suffisant (tous les programmeurs ne sont pas forcment bons !) Le problme arrive assez souvent avec les Routeurs. Un fichier LOG qui gonfle trop peut entraner un plantage
EXEMPLE

Ecouter un serveur ( nos oreilles) suffit bien souvent pour prvenir dune panne matrielle (ventilateur / disques durs )

IMPORTANT

CE QUIL FAUT RETENIR

EXEMPLE

Le but du dossier nest pas de prvenir dune panne matrielle.

La supervision sert aussi prvenir de dfaillance et donc de prparer les oprations de maintenance prventive.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment mesurer le cot dune maintenance prventive ?


4.3.2

Maintenance prventive = maintenance SANS PANNE

Il est difficile de dmontrer quune opration de maintenance prventive soit utile ! Puisque la panne na pas eu lieu - tout au moins : pas encore !

Cest pourquoi :

1 2

Lopration doit tre organise pour ne pas perturber les usagers Il faut que le cot soit prvu et justifiable par rapport aux pannes actuelles.

Recette de cuisine : Pour justifier lopration, il suffit de dmontrer le cot du nettoyage / remplacement / reboot / archivage face au cot de la panne.

IMPORTANT

Si la maintenance prventive doit tre jusitifie par moins de panne, il faut bien quantifier les pannes AVANT.

CE QUIL FAUT RETENIR

La maintenance prventive est trs importante / mais trop de maintenance prventive sera considre comme du gaspillage !

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Juger de lopportunit de la Maintenance prventive


4.3.3

peu de panne

Pas assez de maintenance prventive

Trop de maintenance prventive

trop de panne

Gaspillage

Trop de panne

!
EXEMPLE

Lopportunit = chaque signe annonciateur il y a une dure davant panne - durant laquelle il faut intervenir.

archiver les Logs tous les jours = perte de temps = inutile = cote cher

IMPORTANT

Prvoir une maintenance prventive mme loigne permet de crdibiliser notre mtier - mme si la panne arrive dans lentre temps.

CE QUIL FAUT RETENIR

La maintenance prventive doit tre prvue sur le calendrier pour juger ce moment-l si lopration est prvoir.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment se servirdes pannes supervision ? de la Prvenir

4.3.4

!
EXEMPLE

Avant tout : il faut se demander quelles oprations sont vrifier.

df | grep /dev/hda3 | awk '{print "insert into SURVEILLANCE (ORGANE, VALEUR) values (\"AZERTY/hda3\",\"" $5 "\");"}' > /tmp/addSurveillance mysql -e "\. /tmp/addSurveillance" STATISTIQUES_AZERTY

df
[root@AZERTY /]# df SysFichier /dev/hda1 /dev/hda2 none /dev/hda6 /dev/hda3 /dev/hdb1 1K-blocs 4127076 4127108 499308 27118336 2063536 29547036

grep /dev/hda3
Utilis Dispo. Util% 2427436 1489996 62% 138460 3779000 4% 0 499308 0% 119336 25621428 1% 1630084 328628 84% 10012272 18033856 36% Mont sur / /DATABASES /dev/shm /serveur /var /mnt/30go

Base de Donnes

awk '{print "insert into SURVEILLANCE (ORGANE, VALEUR) values (\"AZERTY/hda3\",\"" $5 "\");"}'

IMPORTANT

La supervision logiciel ne permet QUE de surveiller les logiciels. La surveillance matrielle est faite par lquipe exploitation.

CE QUIL FAUT RETENIR

La supervision doit tre bien faite pour servir la maintenance. Prvoir de remonter une information synthtique pour quelle puisse tre utile.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Dans un monde de supervision et de continuit de service


4.3.5

!
EXEMPLE Usagers
0 1

Une nouvelle notion : la continuit de service = service continu pour les usagers Je dois me renseigner sur les services qui doivent continuer ex: est-ce que CRON doit avoir une continuit de services? pour les usagers Il faut donc identifier les services quil ne faut pas interrompre (ODBC, Telnet, Oracle, ...) Il suffit de placer les plannings de prsence des usagers avec celui de la maintenance => continuit de service

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Maintenance

IMPORTANT

Il faut que tout ce qui peut tre fait, le soit durant les priodes de maintenance.

CE QUIL FAUT RETENIR

La supervision me permet de prparer mes oprations de maintenance sur les plages dabsence des usagers.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Equilibrer continuit de service et maintenance


4.3.6

?
Recette de cuisine

Comment faire pour que la maintenance soit en quilibre avec la continuit de service ?

La supervision me permet de voir une dfaillance qui peut arriver.. Je vais donc crire ce quil se passe pour me faire un retour dexprience et donc : de prvoir lopration de maintenance avant mme un symptme = maintenance prventive. Pour trouver lquilibre, il suffit de planifier les oprations de maintenance prventive hors horaire des usagers. Aucun usager nest prsent environs 15 heures par jours ! et ceci sur 5 jours.
Lundi 15 h de libre Mardi 15 h de libre Mercredi 15 h de libre Jeudi 15 h de libre Vendredi Samedi Dimanche 15 h de libre 24 h de libre 24 h de libre

IMPORTANT

Prvoir damnager les horaires de travail afin de tester les procdures de maintenance prventives (r-indexer les bases de donnes, vrifier les logs, sauvegarde systme ...)

CE QUIL FAUT RETENIR

Lquilibre ne se trouve pas en 5 minutes. Des annes dexprience / des annes de supervision permettent de trouver lquilibre dans votre Entreprise.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

A quoi sert le protocole SNMP ?

TOME IV chapitre 4

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Un moyen standard de supervision


4.4.1

Existe-t-il un moyen standard de superviser presque tous les organes dun rseau ? Et sil existait une norme pour connatre les informations internes dun routeur, dune imprimante, de certains HUB, de serveurs

Trame dinterrogation

Infos techniques

Trame dinterrogation

Infos techniques

Effectivement, il existe plein de moyens pour superviser automatiquement les organes dun rseau. Lun des moyens actuels standard = SNMP (ne pas confondre avec SMTP
= messagerie)

IMPORTANT

SNMP me permet de surveiller des organes rseaux (imprimantes, routeurs, hub, serveurs, station )

CE QUIL FAUT RETENIR

Les appareils superviser nont pas forcment loption SNMP / dans ce cas il faut choisir autre chose. On utilise loutil fourni avec lappareil.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Un protocole de supervision
4.4.2

Pourquoi un Protocole de supervision ?

La raison est simple : elle est conomique. Llment na pas besoin dtre complexe pour avoir un agent SNMP. La complexit est renvoye la console de surveillance. Quest-ce que je peux faire avec ? : Connatre ltat dun appareil => en lui envoyant une question Avec une vue sur les donnes locales => nb paquets passs Configurer => en donnant un ordre, llment peut changer sa conf Alerter => dans le protocole, un port est rserv aux alertes

Trame dinterrogation UDP 162 Infos techniques ou alertes

UDP 161

IMPORTANT

SNMP est un protocole en 2 morceaux : la dfinition de la structure (MIB) et les trames elles-mmes.

CE QUIL FAUT RETENIR

Chaque lment possde sa propre liste dordres et de rsultats une trame SNMP.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

La M.I.B.
4.4.3

Management Information Base (MIB), en clair ?

sysServices OBJECT-TYPE

Il sagit dun pseudo langage qui permet de dfinir les donnes envoyer llment pour obtenir le rsultat voulu. Ce langage possde mme une aide que le constructeur nous donne pour mieux comprendre le rsultat binaire de lappareil. En SNMP, les requtes partent sous forme de code auquel lappareil rpond.

SYNTAX STATUS

INTEGER (0..127) current

MAX-ACCESS read-only DESCRIPTION "A value indicating the set of services that this entity potentially offers. The value is a sum. This sum initially takes the value zero. Then, for each layer, L, in the range 1 through 7, that this node performs transactions for, 2 raised to (L - 1) is added to the sum. For example, a node which performs only routing functions would have a value of 4 (2^(3-1)). In contrast, a node which is a host offering application service would have a value of 72 (2^(4-1) + 2^(7-1)). Note that in the context of the Internet suite of protocols, values should be calculated accordingly: layer 1 2 3 4 7 functionality physical (e.g., repeaters) datalink/subnetwork (e.g., bridges) internet (e.g., supports the IP) end-to-end (e.g., supports the TCP) applications (e.g., supports the SMTP)

For systems including OSI protocols, layers 5 and 6 can also be counted." ::= { system 7 }

IMPORTANT

Un lment compatible SNMP nest exploitable quavec sa MIB. Attention lordre des bits !

CE QUIL FAUT RETENIR

Lagent SNMP de LINUX permet de crer une MIB sur mesure !

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Eplucher les informations


4.4.4

Quest-ce qui est rellement utile ?

La MIB contient des informations techniques que le constructeur a jug importantes - pas forcment intressantes - pas forcment pertinentes dans le cadre de la supervision. Par ailleurs, dautres informations qui ne se trouvent pas dans le SNMP sont capitales pour la supervision (ex. tat dune base de donnes).

Dun autre cot, des informations qui semblent tre sans importance refltent des critres de supervision / par exemple : le nombre de pages qui volue vite peut reflter une surcharge du serveur dimpression. Des trames importantes sortantes du Serveur Proxy (internet) peuvent nous diriger vers une recherche de virus (spyware) dans le rseau.

IMPORTANT

Toutes les informations ne sont pas utiles - il faut non seulement les trier mais aussi les agrmenter dautres donnes.

CE QUIL FAUT RETENIR

Il faut chercher les donnes utiles l o elles sont / SNMP ou autre.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

SNMP et les autres protocoles


4.4.5

Il existe beaucoup doutil daide la gestion dactifs informatiques (Gestion de parc) quelques uns ont t slectionns.

Soft

Avantages STANDARD Fonctionne avec presque tous les appareils rseaux Fonctionne sur ltat des ressources + vnements systmes Paramtrable directement sur le systme client (UNIX, NT, ...). Gamme de logiciels qui part de la gestion des ressources jusqu linventaire de parc. Bases de donnes centralises. Donne une vue sur ltat des services Micro$oft. Fonctionne sur toutes les plateformes et ouvert aux dveloppeurs qui veulent crer leur propre surveillance (ex. surveillance des ressources dune application propritaire). Sadapte au Bloc alarme ALRM2v5.

Inconvnients Ne fonctionne pas avec les applications (logiciels) Ne sadapte pas aux applications internes (ex. bases de donnes)

SNMP NSM

TIVOLI MOM CGS

Ne sadapte pas aux applications internes (ex. bases de donnes) Compatible quavec Micro$oft

Ne sera commercialis quen 2ime trimestre 2005

NSM : marque dpose par Computer Associates www.ca.com TIVOLI : marque dpose par IBM www.tivoli.fr MOM : marque dpose par Microsoft www.microsoft.fr CGS : marque dpose par AZERTY MicroSystem gp.azerty.fr

IMPORTANT

Chaque Logiciel a son protocole prfr. Pour les appareils : SNMP. Pour les Stations : Agents locaux propritaires.

CE QUIL FAUT RETENIR

A chaque lment contrler (de VOTRE rseau), il faut choisir le Logiciel adapt pour superviser.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Vers quel type de protocole va-t-on ?


4.4.6
Attention, notre but est de parler supervision.

Surpervision

Surveillance

Agents

lments

Mais que veut-on rellement ? Bien plus que de la surveillance, en ralit, cest, en cas de problme, dautomatiser la solution (autant que possible).

Problme connu ? Solution automatique apporter

IMPORTANT

Les constructeurs et les diteurs vont vers des protocoles bi-directionnels.

CE QUIL FAUT RETENIR

Le choix du logiciel de surveillance prend donc toute son importance (base de connaissance des pannes ...).

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Vers un protocole universel ?


4.4.7
Les constructeurs vont l o il y a de la rentabilit. Donc, ils vont tous dans des directions diffrentes. En effet, pour parler des imprimantes, les constructeurs vendent de plus en plus leurs manageurs et leurs outils dinventaires (CANON, HP, LexMark ...). Aujourdhui, uniformiser est trs difficile.

Le leader aujourdhui est SNMP. Dautant plus que les ordres de configurations font partie de son vocabulaire maintenant. On le trouve sur les imprimantes rseaux, les Hubs, les routeurs, les serveurs (NT, UNIX, LINUX, As400, Switch ...)

IMPORTANT

Les constructeurs poussent vers des protocoles persos tout en maintenant une compatibilit SNMP.

CE QUIL FAUT RETENIR

Les constructeurs font leurs normes. Personne ne les vrifie ! Et eux, ils ne sont pas OpenSources - do le danger pour demain.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment choisir mes appareils ?


4.4.8
Soyons francs ! Les appareils que nous ne souhaitons pas surveiller nont pas besoin dagent interne (SNMP ou autre). Ex : un HUB vers les connexions internet Ex : un agent SNMP sur les PC de bureautique

Par contre, ds lors o lon veut surveiller, il nous faut un protocole qui soit compatible avec le reste de notre infrastructure.

SNMP

Alerte ! Trop dinfos inutiles !

SNMP SNMP SNMP SNMP SNMP SNMP

IMPORTANT

Je choisis des lments administrables condition de les administrer !?!

CE QUIL FAUT RETENIR

Les appareils avec un agent (SNMP) cote plus cher / il faut donc mesurer la pertinence de nos choix.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quels outils de supervision NSM / TIVOLI / CGS ?

TOME IV chapitre 5

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Outil de supervision
4.5.1

Quest-ce quun outil de supervision ? Quelles sont ces fonctions ?

Surpervision

Surveillance

Agents

lments

Gestion des agents de surveillance


Un agent de surveillance plant ne veut pas dire quil y a un problme sur lappareil surveill !

Remonte dalertes

Remonte des stats

Administration des lments

IMPORTANT

Il ne faut pas multiplier les outils de supervision / car ladministration devient trop lourde.

CE QUIL FAUT RETENIR

Il faut choisir mon outil par rapport ce que jattends de lui.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Le rle de ladministateur Rseau


4.5.2

Quest-ce quun outil de supervision ? Quelles sont ces fonctions ?

Surpervision

Surveillance

Agents

lments

Alertes

Alertes Collisions

Remonte des alertes antivirales

Surveillance des bacs vides + tonners

Le rle de ladministrateur est de dfinir les organes surveiller / ce quil faut surveiller et trouver ce quil faut faire chaque alerte.

IMPORTANT

Aprs la remise en service, il faut trouver le motif de la panne pour quelle ne se reproduise pas (si possible) pour certains routeurs le reboot rgulier est ncessaire (le sachant, nous prvoyons alors de la maintenance prventive rgulire.
CE QUIL FAUT RETENIR

La dfinition de notre primtre nous montre ce quil faut surveiller / il faut lister chaque lement.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

NSM : atouts et faiblesses


4.5.3
Computer Associates a travaill pour proposer une console de surveillance avec ses agents multi plate-forme. En effet, la vraie problmatique, cest quil peut y avoir des centaines de choses vrifier, et chacune avec des frquences diffrentes (toutes les minutes, les heures ...).

Il y a moyen de paramtrer directement sous UNIX les agents UNIX avec les outils et les commandes locales !

NSM
A chaque vnement nous pouvons attribuer un batch de commandes ou des commandes vers lagent local.

Agent Windows (toutes les versions) Vue sur les Ressources / CPU/ mmoire / Disques / processus SNMP Nb de pages / nb paquets / Collisions / connexions

IMPORTANT

Avantage : NSM possde plein dautres fonctions (ordonnancement) Inconvnient : Son prix / documentation incomprhensible

CE QUIL FAUT RETENIR

NSM est un produit qui tient la route / il sappelait TNG.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

TIVOLI : atouts et faiblesses


4.5.4
IBM a voulu rpondre plusieurs problmatiques en mme temps : - dcouverte automatique dun rseau UNIX / Windows / SNMP / As400... - Mise en base de donnes des informations dinventaire pour la gestion de parc.
Agents UNIX trs simplistes Agent As400 trs puissant Agent Windows (tous les versions) Vue sur les Ressources / CPU/ mmoire / Disques / processus + Inventaire matriel et Logiciel SNMP Nb de pages / nb paquets / Collisions / connexions

TIVOLI
Une assistance est donne sur les alarmes mais il ny a pas vraiment de script bidirectionnel. Lancement de Batch

IMPORTANT

Avantage : Les donnes sont traites et places dans une base de rfrence (Gestion de parc) Inconvnient : Ne rsout pas la problmatique de rponse automatique une alerte.
CE QUIL FAUT RETENIR

TIVOLI nest pas vraiment un concurrent de NSM car ses fonctions dinventaire le cloisonne des clients de Gestion de Parc.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

CGS : atouts et faiblesses


4.5.5
AZERTY MicroSystem a voulu rpondre une problmatique douverture au monde en faisant de l opensource. Agents Unix pure Agents Windows Agents dveloppables sur mesure SNMP

CGS

Une hirarchie de serveurs et de consoles permet chaque administrateur dempiter sur le terrain des autres - sans y interagir.
Admin Serveurs Agent Serveur Routeur en SNMP Agent SNMP Imprimante Responsable Imprimante Agent serveur dimpressions

La mme alerte / info peut remonter vers plusieurs responsables

IMPORTANT

Avantage : Les donnes sont traites et places dans une base de rfrence (Gestion de parc) + rponse automatique aux vnements. Inconvnient : Ne sera commercialis quen juin 2005.
CE QUIL FAUT RETENIR

CGS (SoftsCheckers) ouvre ses informations internes de fonctionnement afin que les administrateurs puissent crer eux-mme un agent compatible avec tous les autres.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Les autres outils du march


4.5.6
MOM de Micro$oft : le nombrilisme grande chelle ! MOM vous permet de savoir si les applications microsoft qui tournent sur des serveurs microsoft, fonctionnent correctement ou pas. Les agents de surveillance ne traitent que les informations dlivres par le service donc, nous ne pouvons pas savoir rellement si les services fonctionnent correctement pour les usagers !
Agent MOM Utilisateurs Inventaire LandPark et son interface objets Trame SNMP SQL Serveur

MOM et son interface objets

CERUS Informatique a dvelopp LandPark. Il sagit dun logiciel de gestion de parc qui migre doucement doucement vers la supervision... (quavec SNMP et son agent dinventaire).

Nous sommes prvenus sil manque des feuilles dans limprimante cool ! Mais il faut que nous regardions la fiche de limprimante dans le logiciel pour le savoir .... pas cool .........

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Crer son propre outil de surveillance


4.5.7
Il faut se crer notre agent local (CRON par exemple).

Doit tre trs peu gourmand en ressources

Agent local en ShellScript par exemple / avec un cron il teste llment surveiller

Le rsultat est mis dans un fichier... pour que le prog de surveillance vienne le vrifier...

Lagent de surveillance va traiter le fichier brut afin de lpurer des donnes inutiles et les ajoute aux vnements prcdents / idalement vers une base de donnes.

mv /var/log/maillog /var/log/maillog_dummy cat /var/log/maillog_dummy | grep sendmail | awk '{print "insert into MAILSLOG (CLEF, QUI, QUOI, DTE) values (\"" $6 "\",\"" $7 "\",\"" $0 "\",\"" $1 " " $2 " " $3 "\");"}' > /tmp/mailadd echo 'update MAILSLOG set SENS = "F" where ((QUI like "from=%") AND (isnull(SENS)));' >> /tmp/mailadd mysql -e "\. /tmp/mailadd STATISTIQUES_INTERNET rm -f /tmp/mailadd cat /var/log/maillog_dummy >> /var/log/maillog_HISTORY rm -f /var/log/maillog_dummy /etc/init.d/syslog restart > /dev/null

Loutil de supervision ouvre la base de donnes afin dy voir les informations linaires et sous forme de requte afin davoir une visibilit claire. Loutil de supervision peut tre fait en PHP par exemple.

IMPORTANT

Attention, lagent local doit tre rapide et sans blocage car il pourrait engendrer des soucis involontaires.

CE QUIL FAUT RETENIR

Crer notre propre outil a lavantage de rpondre exactement nos besoins.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ce quun Help-Desk & un WorkFlow ?


TOME IV chapitre 6

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ce quun Help-Desk ?


4.6.1
Jusque l, nous avons vu comment reprer des pannes afin dy remdier Mais savoir quil y a un problme : cest bien le rfrencer : cest Mieux !

Imaginons que les incidents ne soient pas nots / comment trouver alors une rcurrence aux pannes ?

Un Help-Desk permet de noter les incidents et dy indiquer la rsolution. Au dbut, cest un bloc note de ce quil se passe Cest, vrai dire, assez peu rjouissant et fastidieux ... Rapidement, il devient un allier car, lorsquune panne ou un soucis apparat, ces informations (du pass) nous aide rsoudre le problme du moment ! Toutes les informations sappellent : une base de connaissance ou un Help-Desk. Bien sr, la mthode de rangement des informations est capitale ! Il faut ranger les donnes par thme et sous forme darbre logique.

IMPORTANT

Un Help-Desk est obligatoire / noublions pas quil est notre allier - dautant plus lorsquon est plusieurs informaticiens.
CE QUIL FAUT RETENIR

Avoir une base de connaissance permet aussi de mesurer le taux dincidents afin dtre transparent.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ce quun WorkFlow ?


4.6.2
Avoir une base de connaissance (Help-Desk), cest capital !

Mais si un incident ne nous concerne pas ?

Ne serait-il pas intressant de pouvoir transmettre (un peu comme un Email) les donnes techniques + infos du problme la personne responsable ? Et bien, un tel logiciel sappelle un WorkFlow !

Un Appel dun utilisateur pour un problme dimpression ?

Nous regardons les serveurs, les droits Et il se trouve que a incombe au responsable des imprimantes (Pb matriel par ex).
+ prcisions techniques

Le responsable imprimante se voit confier la mission avec la prcision que ce nest pas un problme rseau

prcisions sur la rparation

Le WorkFlow est un logiciel assez facile mettre en place (ou en lachetant) / il permet de mler les comptences et le flux dinformation entre services. Un peu comme un Mail, mais visible des autres intervenants.

IMPORTANT

Un WorkFlow permet chaque intervenant de faire correctement son travail en le documentant.

CE QUIL FAUT RETENIR

Lutilisateur est notre client (baromtre), veillons ce quil ait le maximum dinformations.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Faire jouer les acteurs ensemble


4.6.3
Bien sr, il se pose la question de comment faire travailler les acteurs ensemble ? Chaque intervenant peut tre missionn par un autre - en lui donnant des informations techniques et personnelles sur la situation son niveau. Pour que les acteurs travaillent ensemble, il faut dmontrer aux autres informaticiens que le WorkFlow rpond la communication, la perte de temps et la transparence pour lutilisateur.

Un Appel dun utilisateur pour ouvrir des droits un nouveau.

Nous crons le compte avec les droits ncessaires


+ prcisions techniques

Le service qualit peut vrifier que tout est OK pour rpondre lutilisateur.

FAIT

Le responsable applications ou DBA cre son tour le compte avec les droits.

IMPORTANT

Avec un tel schma, nous ne perdons plus de temps / et les utilisateurs sont contents aussi !

CE QUIL FAUT RETENIR

Bien plus que tout a, le travail en WorkFlow permet de garder en historique les interventions ou les missions.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Organisation & Srieux


4.6.4

A chaque demande du genre changer les droits / crer un compte, il nous faut noter QUI, QUAND, QUOI et POURQUOI nous le faisons. Bref, il nous faut ces donnes (dune manire ou dune autre). Le Help-Desk, aussi simpliste soit-il, rpond notre soucis de se souvenir pourquoi on a cr un compte le 10 janvier 2092 pour cocolapin ?!? Certaines socits exigent des traces papiers.

quand

qui

quoi
nd e qua jusqu + nd e qua jusqu +

pourquoi

fait le

IMPORTANT

A chaque mission dadministration / pensez documenter le pourquoi, qui, quand, quoi et jusque quand

CE QUIL FAUT RETENIR

On oublie souvent le jusque quand - cette information est capitale pour un accs de scurit.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Alertes bien gres


4.6.5
Avec le Help-Desk, nous pourrons voir les cyclicits des problmes (la rcurrence). Donc, entre le Help-Desk et le WorkFlow, nous pourrons facilement faire un planning des oprations de maintenance prventive pour anticiper les pannes. Nous ne pouvons pas penser tout. Donc il faut noter tout a dans le HelpDesk. Grce cette base de connaissance, nous pourrons faire des requtes pour trouver les pannes rcurrentes et les anticiper.

Panne A

Panne A

Panne A

} }
IMPORTANT CE QUIL FAUT RETENIR

Cest avec le temps que nous amliorerons notre qualit dadministrateur.

Il sagit dun travail long et peu pationnant, mais il est notre force de demain.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

2 mois

2 mois

1 mois1/2

AZERTY MicroSystem

Vrifier si la panne ne risque pas darriver

Comment dvelopper un WorkFlow


4.6.6
Il sagit dun logiciel qui permet de se passer les fiches entre responsables. Le logiciel est conu avec une partie haute : les donnes communes Il sagit l que de donnes dune base de donnes. et la partie basse : les boutons de circulation de la fiche / envoyer vers ce qui peut changer ltat de la fiche (?!)
WorkFlow FONCTIONS
code 1 2 3 Libell D.I. Resp. Impr. Adm.Rseau Pos EtatCourant EtatSuivant EtatCourant 1 2 3 4 5 6 1 2 3 2 3 1 1 3 2 Entre infos Chez lAdm Rseau Chez le Resp. Impr. Clture Clture Avorte InfoBouton de celui qui ma mis
ds cet tat

Connexion > Fonction

Envoyer AdmRseau Envoyer Resp.Impr. Envoyer AdmRseau Clture par AdmRseau Clture par D.I.

Interventions
IT 40 41 42 43 45 46 Date Pos .. .. .. .. .. .. 1 5 2 3 2 4

Lors du Login de Cocolapin => groupe Adm.Rseau Il se positionne sur la fiche en cours pour Lui : une liaison entre Interventions.Pos == WorkFlow.Pos Et ne liste que ceux pour EtatCourant == 3 (Adm.Rseau) La liste des fiches pour Cocolapin : 42, 45 et 46 Ds que la fiche saffiche / les boutons sont rafrachis en bas : exemple la fiche 42 : Pos = 2 , EtatSuivant de Pos 2 = 3 donc nous listons tous les boutons qui ont un EtatCourant == 3 en mettant InfoBouton dans le bouton de WorkFlow / ds que lon clique, la Pos du Bouton met jour la Fichier Interventions. Bien sr, il est conseill davoir un historique des actions en y mettant une zone commentaire pour le suivant.

Interventions
IT 40 41 42 43 45 46 Date Pos .. .. .. .. .. .. 1 5 2 3 2 4

WorkFlow
Pos EtatCourant EtatSuivant EtatCourant 1 2 3 4 5 6 1 1 3 2 3 1 1 3 2 Entre infos Chez lAdm Rseau Chez le Resp. Impr. Clture Clture Avorte InfoBouton de celui qui ma mis
ds cet tat

Envoyer AdmRseau Envoyer Resp.Impr. Envoyer AdmRseau Clture par AdmRseau Clture par D.I. Bloque la rception
Boutons pour cette fice

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment dvelopper un Help-Desk


4.6.7
Il sagit dun logiciel qui de noter des infos classes sur thme avec les rsolutions (base de connaissance).

THEMES
code 1 2 3 4 5 Libell HUB Routeurs Serveurs Linux NetGear Thme parent

Les thmes sont rangs comme un arbre de pointeurs. Dune manire linaire, nous reconstruisons trs simplement larbre.

3 2

FICHES
N 1 2 3 4 5 Thme Motif 1 5 4 5 5 fil dbranch SNMP tomb Crer un compte Ajouter une trame faire un test Solutions apports rebrancher rebooter le routeur adduser interface HTTP://... connexion WIFI

autres infos

Le Help-Desk doit avoir une interface la plus simple possible, sinon, nous ny rentrerons pas grand chose. Exemple dcran sur LANDPARK

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment grer les escalades ?

TOME IV chapitre 7

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ce quune Escalade ?


4.7.1
Toujours dans lesprit du service lutilisateur, il faut pouvoir mesurer le dlais dintervention et la monte dans les alertes. Cest ce quon appelle une escalade. Si lintervenant met trop de temps rsoudre le problme, le principe de lescalade veut que la personne au dessus soit prvenue. (pas forcment hirarchiquement)

Ce concept ne permet non pas de fliquer les dlais (quoique), mais de ne pas mettre trop de temps rgler les problmes. En gnral, on sen sert pour refaire une relance par Mail la mme personne qui le dossier a t pass.

IMPORTANT

Lescalade est utile, voir ncessaire, lorsquil y a plusieurs intervenants - a vite les dossiers bloqus.

CE QUIL FAUT RETENIR

Ca demande une bonne entente dans le groupe de travail afin que lescalade ne soit pas mal vcue.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment grer les escalades ?


4.7.2
A chaque type de demande, il suffit de dterminer le dlais aprs lequel la demande passe au suivant de lescalade.

Dossiers date date darrive chez lacteur actuel numro de lacteur actuel

Escalades Numro acteur actuel Dlais pour passer au suivant Numro acteur suivant

Si date darriver chez lacteur actuel + dlais pour passer au suivant Where numro de lacteur actuel = Numro acteur actuel Alors Numro de lacteur actuel = Numro acteur suivant date darrive chez lacteur actuel = now()

IMPORTANT

Il ne sagit que de requtes SQL / beaucoup de logiciels de Help-Desk grent les escalades.

CE QUIL FAUT RETENIR

La gestion des escalades napporte gnralement pas de solution / elle ne fait que transmettre lautre les interventions effectuer.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Pas descalades Maximales !


4.7.3
Une bonne gestion du suivi des demandes dintervention permet dviter de faire traner des demandes. Afin dviter que les demandes narrivent en haut de lescalade, il faut se mettre des gardes-fous.

Mail dalerte

Demande dintervention

Mail dalerte

Mail Garde-Fou

Gnralement, lalerte maximale part vers notre suprieur ou vers lutilisateur

IMPORTANT

Il faut toujours prvoir quelque chose avant que les dlais ne sortent du raisonnable.

CE QUIL FAUT RETENIR

Pensez dterminer des dlais raisonnables pour chaque action / cest la frontire entre la transparence et le professionnalisme.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

} }

1ier dlais

2ime dlais

3ime dlais

4ime dlais

AZERTY MicroSystem

Alerte maximale

Le rle de lAdminstrateur
4.7.4
LAdministration systme est au centre du rseau de lEntreprise. Et cest pour cela que nous en parlons aujourdhui. Car effectivement, dans toutes les Grandes Entreprises, il y a une Hot-Line (interne) qui route les appels au travers dun WorkFlow (ou dun organigramme). Quelque soit lEntreprise (voire mme la ntre), nous sommes au centre des escalades. A nous donc dtre exigeant car le moindre appel peut cacher une faille importante de la scurit.

Accs RAS Petite agence


Paramtrage Routeur impeccable

Accs scuris

IMPORTANT

Mme un administrateur ne peut pas connatre tous les accs extrieurs ! Un simple portable avec un Modem Maintenant du WIFI Mais grce aux appels (quil ne faut pas laisser monter en escalade) nous construisons le VRAI rseau.

CE QUIL FAUT RETENIR

Lcoute et la rponse aux utilisateurs est notre seule chance lorsquon entre dans une Entreprise (PME).

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Le rle de la scurit dans lescalade


4.7.5
A chaque type de demande, il suffit de dterminer le dlais aprs lequel la demande passe au suivant de lescalade.
Demande dintervention
Mail dalerte
Ralisation

}} }}
Dure durant laquelle, si votre collaborateur ne fait pas vite son travail, il peut y avoir des consquences sur la scurit !

}
IMPORTANT

1ier dlais

2ime dlais

Mail dalerte

Arrter un Compte suite licenciement faute grave

En tant quagent de scurit, nous devons tre attentifs toutes les demandes des utilisateurs / mme si a ne nous concerne pas ( priori).

CE QUIL FAUT RETENIR

Malheureusement, les Entreprises nont pas encore compris que lagent de scurit est le passage oblig pour toutes les demandes non pas pour y rpondre !

1ier dlais

2ime dlais

Dlais durant lequel le rseau est vulnrable / dautant plus avec un accs RAS !!!

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Ralisation

Mes escalades sont-elles correctes ?


4.7.6

Comment sassurer que notre fonction nest pas en pril cause des escalades ? Lexemple prcdent est un peu la preuve quune escalade mal implmente peut provoquer des soucis srieux de scurit ! Avec lusage, les ajustements raliser nous sauterons la figure / condition dy tre attentif. Grce aux outils tels que le Help-Desk, WorkFlow et Supervision, nous limitons srieusement les imprvus et les on ne pouvait pas lviter (Bouyues Telecom Nov.2004)

IMPORTANT

Rien ne peut, priori, nous dire que la dfinition des escalades est correcte / cest pourquoi regarder les dlais de ralisation permet bien souvent de limiter la casse en relanant humainement lacteur en retard ou laxiste.

CE QUIL FAUT RETENIR

Le meilleur administrateur passera pour quelquun dinutile puisque tout va bien... Le mme administrateur qui utilise le Help-Desk et le WorkFlow passera pour un expert car il rsolve tous les soucis ! A nous de choisir !

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Mise jour de lOrganisation


4.7.7

Autant ces mthodes pseudo-techniques sont indispensables, autant, ne rien changer dans lOrganisation malgr les anomalies, nous lasse ! Comme indiqu juste avant, ces outils nous permettent non seulement de valoriser notre travail mais aussi de pouvoir amliorer nos recherches de pannes au niveau de la supervision. ex: IIS (de Micro$oft) tombe souvent en rade il y a de nombreux appels pour cela. Il nous suffit de crer un agent de surveillance du type HEAD / HTTP/1.1 sur le port 80 sur serveur. Le dlais de rponse nous donne sa sant instantane. Notre supervision nous permet alors de prvenir une dfaillance avant mme les appels et raliser nos oprations de maintenance prventive afin que le soucis ne paraisse plus quand les usagers sont l (Reboot du service pour IIS / Micro$oft oblige).

IMPORTANT

Ne pas croire que les appels puissent cacher un autre problme est souvent le reflet dun manque dorganisation.

CE QUIL FAUT RETENIR

Toujours tre attentif lutilisateur / il est le thermomtre des applications informatiques !

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Une supervision centralise ou dcentralise ? Que choisir ?


TOME IV chapitre 8

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ce que la Centralisation


4.8.1

Centralisation = Mettre au centre / tout mettre ensemble

Merci monsieur De Lapalisse !

Surveillance + supervision ensemble


Surpervision Surveillance Agents

lments

Bien souvent loutil de supervision contient les agents de surveillance. Inutile de dire que le CPU de la console doit tenir la route !

IMPORTANT

Ce type darchitecture rpond bien une supervision de taille humaine (PME)

CE QUIL FAUT RETENIR

Tout est sur la mme machine / les sauvegardes sont uniques / en cas de crash : plus rien nest surveill.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Quest-ce que la Dcentralisation


4.8.2

Dcentralisation = ne rien mettre au centre

Merci monsieur De Lapalisse !

lments Surveillances Surpervision Agents

Bien souvent, la supervision sappelle une console. Les agents de surveillance sont sur dautres machines, si possible le plus parpills possible afin de rpartir la charge CPU du traitement des informations (purations).

IMPORTANT

Ce type darchitecture rpond bien une supervision de Grande dimension (plusieurs centaines dagents).

CE QUIL FAUT RETENIR

Seules les informations traites sont stockes en base de donnes. Les infos donnes aux agents de surveillance ne sont pas stockes.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Avantages des 2 approches


4.8.3

Centraliser ou Dcentraliser ? les Avantages des 2 solutions ?


lments

Surveillance + supervision ensemble


Surpervision Surveillance Agents

Avantages de la centralisation : Le cot (1 seule machine) La gestion des agents, puisquils sont sur le serveur
lments Surveillances Surpervision Agents

Avantages de la dcentralisation : Le CPU est pargn sur la console Chaque Agent est autonome Les agents ne consomment presque rien sur les stations clientes

IMPORTANT

Chaque architecture a ses avantages ! Le choix viendra trs certainement de la taille de votre Rseau.

CE QUIL FAUT RETENIR

Attention : tous les logiciels ne permettent pas le choix darchitecture Cest pourquoi il faut choisir le logiciel de surveillance en rapport avec la taille du Rseau.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Trouver un quilibre
4.8.4

Centraliser ou Dcentraliser ? Les Inconvnients des solutions...


lments

Surveillance + supervision ensemble


Surpervision Surveillance Agents

Inconvnient de la centralisation : Le CPU de la console ne sert plus qu a. Lors dune panne / nous sommes aveugles Les bases de donnes sont immenses car elle enregistrent, bien souvent, tous les vnements
lments Surveillances Surpervision Agents

Inconvnient de la dcentralisation : Lorsque quune station o se trouve un agent, plante / nous devenons aveugles sur ce quelle surveillait. Nous ne pouvons pas voir le dtail des trames de surveillance.

IMPORTANT

Toutes les solutions ont leurs inconvnients / il faut les connatre pour sy prparer.

CE QUIL FAUT RETENIR

Attention : tous les logiciels ne permettent pas le choix darchitecture Cest pourquoi il faut choisir le logiciel de surveillance en rapport avec la taille du Rseau.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Gestion semi centralise


4.8.5
En ne laissant pas un serveur seul faire toutes les surveillances mais en talant les agents de surveillance sur le parc, notre gestion semble plus rationnelle. Pourtant, il faut trouver comment avoir tous les avantages en mme temps.

lments Surveillances Surpervision Agents

Historique Local consultable distance


Surveillances

Historique Local consultable distance

IMPORTANT

Attention, cette solution demande bien souvent des agents propres la plate forme !

CE QUIL FAUT RETENIR

Il ny a pas de solution magique. Mesurez dabord limpact de vos choix sur votre planning car il est bien souvent prfrable de dmarrer par une solution centralise pour partir peu peu vers une solution dcentralise en sarrtant lorsque lquilibre CPU est atteint.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Que dit la Presse ?


4.8.6
Je pense que lon appelle la presse parce que les gens qui y travaillent sont des presss ! Presss dcrire, on crit nimporte quoi ! Suivant lhumeur du jour, on vous dit que la gestion centralise est la meilleur ... Demain, elle na que des failles Chaque diteur propose sa solution suivant lhumeur du moment, la presse loue les qualits de telle architecture, ou telle autre
Soft Solutions Centralise ses agents de surveillance Dcentralise ses agents bi directionnels

NSM

TIVOLI MOM CGS CERUS

Centralise tous ses agents (mme ceux en multi plate-forme !)

Dcentralise compltement / la console nest quune supervision.

Semi centralis et permet les rebonds de trames (routages encapsuls)

Centralise tous ses agents

IMPORTANT

Ne pas se jeter sur ce que dit la presse - mme celle de Linux / ils mlangent souvent Bidouille & professionnalisme.

CE QUIL FAUT RETENIR

Lisons la presse car elle dnote les tendances pour se remettre en question avec les nouveaux outils.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment faire son choix ?


4.8.7

Si nous avons dj un Logiciel : nous navons plus le choix ! Il faut se soumettre la politique de lditeur Si je reste libre (outils perso) je minspire des rflexions de la presse et des diteurs pour que ma supervision rponde ce que jattends delle !

IMPORTANT

Dans tous les cas : Attention aux dfauts cachs ! - Les mails dalerte ne partent QUE si notre serveur de messagerie fonctionne (et internet) ! - Les SMS dalerte ne partent QUE si Internet fonctionne - Les alertes crans ne sont utiles que si vous tes devant lcran (pas de RTT).

CE QUIL FAUT RETENIR

Je prvois toujours de prvenir quelquun dautre en cas dabsence / une console sur une seconde station.

Ca vous semble bte aujourdhui ? Ca le sera moins demain ! Pensez tous ceux qui ont plac leur scurit sur le tlphone portable quand BOUYGUES est tomb !!! Depuis, AZERTY MicroSystem commercialise un botier electro-informatique de surveillance / alarme...
Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Comment garantir que ma supervision est correcte et complte ?


TOME IV chapitre 9

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Primtre daction / mthode


4.9.1

Avant tout, il faut dfinir notre primtre daction Pour y parvenir facilement, voici une mthode : 1. dfinir les agences 2. dfinir les relations entre elles (routeurs, pont, WIFI ...) 3. trouver les relations de backup (+ accs externes RAS) 4. dfinir les rseaux et sous- rseaux 5. dfinir les plate formes de communication pour circulation des flux de supervision

Agence A

Agence B

4 2 3 3
Accs vers portables / accs clients

IMPORTANT

Nous navons pas le droit la bidouille ! Lapproche doit tre mthodique afin de ne rien oublier (autant que possible).

CE QUIL FAUT RETENIR

Aprs avoir fait le schma, il faut le faire valider, car les anciens en savent toujours plus que nous (en arrivant).

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Mettre en place les moyens techniques


4.9.2
Avant tout, il faut lister les lments surveiller + sur quel OS ils tournent
1
Agence A

Agence B

lments

Agents Locaux SNMP

Petit rappel (qui ne fait pas de mal) : Un routeur possde plusieurs adresses IP. Donc, pour connatre le motif de la panne, voici un petit tableau simple.
ip WAN ip SNMP LAN Routeur externe ip ip WAN LAN Routeur Interne Motif

ok ok

ok

ok

ok ok ok

ok ok ok ok

tout va bien Routeur externe a un problme Liaison FT en rade routeur en rade ? Ma station na pas la bonne passerelle FT en rade je ne vois pas le bon rseau

ok

ok

ok

IMPORTANT

La mthode de DEBUG fonctionne condition de laisser lICMP sur les routeurs (ping).

CE QUIL FAUT RETENIR

A chaque lment, vrifions bien que nous avons lAgent de surveillance adapt (SNMP, ICMP, UDP ...)
Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Prparer les escalades


4.9.3

Il est facile de dire quil faut escalader - mais comment fait-on rellement ? (sans logiciel qui le fait) En face de chose qui ncessite une escalade, il faut dterminer les responsables prvenir (Email par exemple). Prenons un exemple : tester une ligne LS entre 2 routeurs. La mthode du ping est la plus simple et la plus rapide ( condition de ne pas avoir inhib les trames ICMP sur les routeurs). Si 3 fois ping sans rponse avec un intercalaire d 1 minute => mail admin Si 10 fois ping sans rponse avec un intercalaire d 1 minute => mail SMS
OK=`ping -c 1 www.tf1.fr | grep "1 packets received" | awk '{print $2}'`

En ralit, il sagit de 2 oprations diffrentes : Lun vrifie le Ping Lautre compte et envoie le mail

case "_$OK" in _packets*) # Connexion OK # effacer laugmentation de nombre dalertes ;; *) # Connexion tombee # il faut incrmenter puis, si 3 => envoyer un mail ;; esac

cat /etc/HOSTNAME > /tmp/mailOK date >> /tmp/mailOK mail -s `cat /etc/HOSTNAME` jfcasquet@yahoo.fr < /tmp/mailOK

IMPORTANT

EN prparant mes escalades - je prpare aussi lorganisation qui doit y faire face (ici mes collgues).

CE QUIL FAUT RETENIR

Grce au Help-Desk, mme si je suis en vacances, mes collgues pourront consulter la base de connaissance afin de faire ce quils doivent (tests faire, appeler FT ...)

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Rpartir les rayons daction


4.9.4

Maintenant que jy suis, certaines alertes peuvent tre transmises dautres personnes. Bien souvent, ladministrateur est considr comme un hermite la supervision va permettre aussi de provoquer des changes constructifs de collaboration avec des BDA, programmeur, quipe dploiement applicatifs

Exemple : Nous sommes administrateur LAN en multisite. SI la liaison WAN tombe, ce nest pas de notre responsabilit mais, sans cette liaison, notre supervision tombe et les utilisateurs sont gns. Donc, dans nos tests, a ne nous cote pas grand chose de vrifier la liaison WAN (si son responsable ne le fait pas), afin de se rassurer sur nos installations et de prvenir le vrai responsable.

IMPORTANT

Nous sommes au coeur du Systme dinformation. Si une partie de lentreprise ne va pas bien, nous sommes les premiers impliqus / pensons donc, avec nos outils et nos ides, ce qui peut faire que le monde tourne mieux.

CE QUIL FAUT RETENIR

Les outils persos peuvent tre Netstat, ping, ssh, cat / grep, awk

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Une organisation Normale


conditions normales

4.9.5

Grce encore une fois, au Help-Desk, nous mesurons quand a va Bien souvent, on entend (de la part des services informatiques) on courre toujours... En ralit, grce au Help-Desk, nous pouvons mesurer le nombre dappel par jour + le temps de rsolution moyen - diviss par le temps de travail (hors congs) - a nous donne le nombre de personnes ncessaires au minimum dans lquipe informatique. Lorsque lquipe est de taille normale, et que les alertes (appels) sont en nombre normal, la surveillance est optimale puisquon prend le temps de voir si tout va bien. Une supervision tient la route quand on gre les incidents !

IMPORTANT

Si lquipe est trop petite, nous sommes les pompiers / ce moment l, prenons du temps lorsque les utilisateurs ne sont pas l pour mesurer les motifs des appels afin de rorganiser le travail ou daugmenter lquipe.

CE QUIL FAUT RETENIR

La supervision me permet danticiper seulement si cest humainement possible / Dans tous les cas, il faut prciser les soucis trouvs, pour les inscrire dans le Help-Desk.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Une organisation en Crise


conditions de crise

4.9.6

Un tat de CRISE peut venir de plusieurs origines : Une panne blocante Trop dappels Une priorit qui met tous les appels en attente Des appels nombreux pour le mme motif Afin dviter les escalades automatiques qui viendraient sajouter la crise, prvoyons un tat de crise qui bloquera toutes les alertes. A ce jour, seul SoftsChecker (CGS) lenvisage ! Si nous faisons nos propres agents de surveillance, pensons intgrer cette option. Exemple Sous UNIX : Le chemin : /BACKUP/Agents/ contient tous les shells appels avec CRON pour la gestion des escalades et alertes. Le chemin : /BACKUP/AgentsEnCrise/ contient tous les shells vides. Ds que la crise arrive, les 2 chemins sont alors inverss

IMPORTANT

Najoutons pas un autre stress celui dune priode de crise - pensons nous prparer. Par exemple, prparons des messages (WALL) pour les usagers + mails explicatifs...

CE QUIL FAUT RETENIR

Un jour ou lautre, nous vivrons une crise - prparonsnous le mieux possible pour laffronter avec professionnalisme / par ailleurs, prvenir nous donne encore du temps car les usagers seront patients.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Se prparer au reporting
4.9.7
Nous abordons maintenant la partie appele Qualit de la supervision. Que a aille bien ou pas - il nous faut prparer des reportings afin de mettre en exergue les choses que lon ne voit pas. Reporting = Requtes visuelles En prparant des requtes dans tous les sens, certaines vont paratre intressantes...

Interventions du mois par Systme :


Routeurs Linux UNIX

par intranet :
IIS

Accs Proxy internet

Linux

ce graph montre que les routeurs ont lair davoir un soucis

0h ce graph montre que lintranet sur IIS fonctionne avec de gros besoin de maintenance humaine.

12h Ici, nous voyons clairement que les usagers se servent dinternet pour jouer le midi : RISQUE VIRAL et SPYWARE trs important !

24h

IMPORTANT

Les reportings ne sont QUE des requtes SQL sur les informations stockes dans le Help-Desk et WorkFlow.

CE QUIL FAUT RETENIR

Faire du reporting (mme inutile) montre aussi notre transparence + crdibilit + professionnalisme. Des fois, ils servent aussi noyer le poisson ;-)

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Tableaux de Bord
4.9.8
Les reportings ne sont QUE des requtes avec des schmas (excel / OpenOffice / ou directement en PHP) - sans commentaire. Nous pouvons tre amens faire une tude sur le remplacement des routeurs BayNetworks pour migrer vers NetGear . Les reportings vont nous montrer des interventions nombreuses sur les routeurs. Ce type dinformation demande non plus de faire nimporte quelle requte mais de sinterroger sur les rsultats rcurrents. Cest lune des missions principales des RI.

Interventions par mois par Systme : janvier


Routeurs Linux UNIX Linux

fvrier
Routeurs

mars
Routeurs Linux UNIX

IMPORTANT

}
moyenne
Routeurs Linux UNIX

Un tableau de bord nest pas technique - il rpond un besoin lors dun runion de travail avec un comit directoire pluri-comptence.
CE QUIL FAUT RETENIR

Des tableaux de bord me permettent une srnit. Car les lments tranges des reportings sont tudis & comments afin de savoir si cest un Bug rpar ou un dfaut matriel.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Conclusion

TOME IV chapitre 10

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Ma responsabilit
4.10.1

Elle dpend du rle que je joue dans lEntreprise / mais dans tous les cas la supervision sera, pour moi, loutil de ma srnit et la dmonstration de mon professionnalisme.

Retour dinformation par la base de connaissance

toutes mes interventions + type de rsolution sont nots dans mon Help-Desk.

Rapport mensuel

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Les enjeux professionnels


4.10.2
Mon professionnalisme reconnu me permet dtre reconnu. Jadis, les informaticiens taient : soit trs pros / balaise soit trs nuls, mais crivant beaucoup (rapports) Encore aujourdhui, celui qui crit est le mieux reconnu ! A lEPITAn, le professionnalisme est reconnu / mais sattarder sur le papier, sur le renseignement des bases de donnes va faire la vraie diffrence sur le terrain. Vous partez en stage - notez que le reporting commence le premier jour ! (Ce que vous faites au jour le jour + temps dexcution ) Bien des stagiaires gardent le travail pour la fin cest une erreur, car vous passez cot de lhistorique et de ce vous a apport personnellement le stage (bien plus que technique)... Dune part, vous ferez la diffrence, dautre part, lorsque vous montrerez le temps pass lors de votre soutien et aussi chez lEntreprise, vous aurez quelque chose de concret dfinir :

Programmation

Dpannage ustilisateurs

cration de Shell Autre

administration serveur UNIX

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

Se reposer sur une mthode


4.10.3
Aujourdhui, vous avez eu une mthode ! A vous de fabriquer la vtre. Un conseil tout de mme : nempruntez pas une mthode inadapte (ex: MERISE pour ladministration rseau) :-( La mthodologie, ce nest pas crire pour crire / cest crire ce que lon fait en triant ses crits dune manire logique. A force, vous construirez votre plan qui sera valable dans telle entreprise et pas dans telle autre

Vous souhaitez en savoir plus, ou prendre contact : Jean-Franois Casquet jfcasquet@yahoo.fr AZERTY MicroSystem http://gp.azerty.fr jfcasquet@azerty.fr

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

SOMMAIRE

4.0.0 4.0.1. 4.1.

Prsentation Jean-Franois Casquet : Formation / cursus / exprience Pourquoi superviser un rseau ? 4.1.1. Qu'est-ce qu'un rseau (les origines) ? 4.1.2. Que veut dire "Superviser" ? 4.1.3. Diffrence entre superviser et surveiller ? 4.1.4. Pourquoi superviser ? 4.1.5. Pourquoi ne pas attendre la panne ? 4.1.6. Oui mais : comment faire ? Quels sont les impacts rels d'une dfaillance ? 4.2.1. Qu'est-ce qu'une dfaillance ? 4.2.2. Suis-je responsable d'une dfaillance ? 4.2.3. O se trouve ma responsabilit ? 4.2.4. Comment mesurer les impacts rels d'une dfaillance ? 4.2.5. Comment rpartir ma responsabilit sur les vrais acteurs ? 4.2.6. Que dit la loi sur ma responsabilit ? Comment faire la frontire entre la supervision et la maintenance prventive ? 4.3.1. Qu'est-ce qu'une maintenance prventive ? 4.3.2. Comment mesurer le cot d'une maintenance prventive ? 4.3.3. Juger de lopportunits de la maintenance prventive ? 4.3.4. Comment se servir de la supervision (prvenir les pannes) ? 4.3.5. Dans un monde de supervision et de continuit de service ... 4.3.6. Equilibrer continuit de service et maintenance A quoi sert le protocole SNMP ? 4.4.1. Un moyen standard de supervision ? 4.4.2. Un protocole de supervision ? 4.4.3. La M.I.B. 4.4.4. Eplucher les informations 4.4.5. SNMP et les autres protocoles 4.4.6. Vers quel type de protocole va-t-on ? 4.4.7. Vers un protocole universel ? 4.4.8. Comment choisir mes appareils ? Quels outils de supervision : NSM / TIVOLI / CGS 4.5.1. Outil de supervision ? 4.5.2. Le rle pour un Administrateur Rseau 4.5.3. NSM : atouts et faiblesses 4.5.4. TIVOLI : atouts et faiblesses 4.5.5. CGS : atouts et faiblesses 4.5.6.Les 'autres outils du march 4.5.7. Crer son propre outil de surveillance Qu'est-ce qu'un Help-Desk & WorkFlow ? 4.6.1. Qu'est-ce qu'un Help-Desk ? 4.6.2. Qu'est-ce qu'un WorkFlow ? 4.6.3. Faire jouer les acteurs ensemble 4.6.4. Organisation & Srieux 4.6.5. Les alertes bien gres 4.6.6. Comment dvelopper un WorkFlow ? 4.6.7. Comment dvelopper un Help-Desk ? Comment grer les escalades ? 4.7.1. Qu'est-ce qu'une escalade ? 4.7.2. Comment grer les escalades ? 4.7.3. Pas descalades maximales! 4.7.4. Le rle d'un Administrateur 4.7.5. Le rle d'un Agent de Scurit dans lescalade 4.7.6. Mes escalades sont-elles correctes ? 4.7.7. La mise jour de l'Organisation

4.2.

4.3.

4.4.

4.5.

4.6.

4.7.

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem

SOMMAIRE

4.8.

Une supervision centralise ou dcentralise : que choisir ? 4.8.1. Qu'est-ce que la centralisation 4.8.2. Qu'est-ce que la Dcentralisation 4.8.3. Avantages des 2 approches 4.8.4. Trouver l'quilibre ? 4.8.5. Gestion semi-centralise 4.8.6. Que dit la Presse ? 4.8.7. Comment faire son choix ? Comment garantir que ma supervision est correcte et complte ? 4.9.1. Primtre daction / mthode 4.9.2. Mettre en place les moyens techniques 4.9.3. Prparer les escalades 4.9.4. Rpartir les rayons d'action 4.9.5. Une organisation normale 4.9.6. Une organisation en crise 4.9.7. Se prparer au "reporting" 4.9.8. Tableaux de bord Conclusion 4.10.1. Ma responsabilit 4.10.2. Les enjeux professionnels 4.10.3. Se reposer sur une Mthode

4.9.

4.10

Quels sont les outils daujourdhui de supervision rseau LAN/WAN

AZERTY MicroSystem