Billets d'expert

Icon Article Supervision

Supervision

Publication : 2 décembre, 2011

Finalité des techniques de supervision

La supervision est nécessaire pour garantir la haute disponibilité d'une infrastructure, comme le système d'information d'une entreprise. En effet, son indisponibilité, même brève, peut causer de lourdes pertes financières. Il est donc nécessaire de mettre en place des solutions en cas de panne, comme des mécanismes de redondance, mais aussi des techniques de supervision afin de prévoir d'éventuels problèmes (une surcharge serveur, par exemple) et détecter des anomalies.

Les solutions de supervision existantes permettent également de générer des alertes en cas de problème. Ces alertes peuvent être transmises par SMS ou email aux personnes concernées pour garantir une intervention dans les plus brefs délais. Elles peuvent aussi donner lieu à des actions programmées comme le redémarrage automatique d'un service.

Selon la qualité de la supervision, la disponibilité d'une infrastructure est plus ou moins grande. Le taux de disponibilité (uptime) permet d'évaluer le niveau de disponibilité d'une infrastructure :

uptimeindisponibilité de l'infrastructure pendant une année
99%87 heures et 36 minutes
99.9%8 heures et 45 minutes
99.99%52 minutes
99.999%5 minutes
99.9999%32 secondes

Plusieurs niveaux de supervision

Il existe plusieurs niveaux de supervision, chacune s'intéressant à une couche particulière de l'infrastructure :

  • la supervision quantitative,
  • la supervision qualitative,
  • la supervision applicative.



La supervision quantitative

La supervision quantitative permet de récupérer des informations sur l'état physique d'une machine ou d'un ensemble de machines sur un réseau. Une application légère (appelée agent) est placée sur la machine et récupère certaines informations comme le taux de charge du processeur, le taux d'utilisation de la mémoire vive, l'espace de stockage utilisé et les températures des principaux composants. La plateforme de supervision interroge périodiquement cet agent via un protocole tel que SNMP (Simple Network Management Protocol) pour récupérer ces données qui peuvent alors être affichées sous forme de graphe afin de visualiser efficacement l'évolution de l'état physique d'une machine en fonction du temps.

La supervision qualitative

La supervision qualitative concerne les performances du réseau et le fonctionnement des différents éléments du réseau. Un logiciel de supervision réseau effectue des mesures de débit, de temps de latence, de taux de pertes de paquets de données, ainsi qu'un contrôle des flux, c'est-à-dire tout ce qui concerne la qualité de service (QoS). Les données récupérées peuvent être affichées sous forme de graphes permettant de visualiser rapidement l'état de fonctionnement du réseau.

En ce qui concerne le fonctionnement individuel des entités du réseau, un logiciel de supervision pourra par exemple envoyer périodiquement un email de test au serveur de messagerie pour vérifier la disponibilité du service, en s'assurant que celui-ci est bien envoyé par le protocole SMTP et reçu par le protocole POP ou IMAP. De même, il pourra faire une requête HTTP vers un serveur web pour voir si celui-ci lui renvoie bien la page demandée.

La supervision applicative

La supervision applicative teste les applications hébergées sur les serveurs pour s'assurer de leur bon fonctionnement. En effet, un serveur peut très bien être accessible sur le réseau et présenter des taux de charge acceptables, mais cela ne garantit pas que les applications qu'il héberge fonctionnent correctement.

Un agent SNMP est placé sur la machine à surveiller et fait subir à chaque application qu'elle héberge une batterie de tests significatifs couvrant différents cas d'utilisation. Les tests sont également choisis pour ne pas générer une charge trop importante ni modifier les données de l'application. L'agent stocke ensuite les données reçues dans une MIB (Management Information Base) via le protocole SNMP. Un utilisateur peut alors accéder à ces informations via une plateforme de supervision, en effectuant une requête SNMP vers la machine surveillée pour demander à l'agent SNMP d'aller rechercher les informations demandées dans la MIB et de les lui renvoyer.

La supervision chez Iguane Solutions

Chez Iguane Solutions, la supervision des machines est effectuée sur cinq niveaux :

  • réseau : la supervision du réseau permet de vérifier la disponibilité des machines sur le réseau et de s'assurer que les requêtes sont bien acceptées;
  • matériel : la supervision du matériel s'attache aux problèmes d'ordre physique du matériel, c'est-à-dire de vérifier si des composants sont défectueux et détecter les pannes;
  • système : la supervision système récupère des informations sur l'état des principaux composants d'une machine, comme le taux de charge et la température;
  • service : ce niveau de supervision concerne la vérification de la disponibilité et du bon fonctionnement des services;
  • applicatif : le niveau applicatif concerne les cas concrets d'utilisation des services et permet de s'assurer, via des batteries de tests, que les services répondent bien aux attentes des utilisateurs.

Ces cinq niveaux de supervision permettent d'assurer un taux de disponibilité allant jusqu'à 99,999% pour l'offre d'infogérance de niveau 3.