Sismology : Système de surveillance d’Iguane Solutions
Timeseries, stockage à long terme, multi-tenant et haute disponibilité
Cet article est une rétrospective de plusieurs mois d’amélioration continue depuis la création de notre système de monitoring actuel : quels défis avons-nous rencontrés, comment nous les avons surmontés et comment nous sommes finalement passés à Victoria Metrics.
Comment cela a commencé
Chez Iguane Solutions, nous avons créé un système multi-tenant basé sur Prometheus pour nos besoins en matière d’alertes et de métrologie : Sismology. Tout a commencé par un projet visant à remplacer nos systèmes monolithiques Naemon et Graphite (avec collectd) par un système unique fusionnant la métrologie et les alertes, basé sur le standard actuel : Prometheus.
Bien que Prometheus nous ait donné un bon noyau de métrologie et d’alerte, nous avons été confrontés à trois défis :
Multi-tenant : comme nous prévoyions de permettre à nos clients d’accéder à leurs propres données, il fallait surmonter le problème de la location unique de prometheus. | |
Stockage à long terme : plusieurs années, il n’est pas rare que nos clients (ou nous-mêmes) comparent une période spécifique de l’année avec l’année N-1 ou N-2. | |
Haute disponibilité : objectif de zéro downtime tout en ayant la possibilité de mettre certains nœuds hors ligne à des fins de maintenance |
Retrouvez l’article complet en anglais
Dans cet article écrit par Edouard Hur, VP Engineering chez Iguana Solutions, vous trouverez tous les détails sur :
- La mise au point des technologies utilisées;
- Le développement personnalisé concernant : l’utilisation du disque et le proxy de lecture à distance ; l’utilisation de la RAM, la cardinalité et pourquoi il a donné naissance à notre propre agent;
- Victoria Metrics et pourquoi il a remplacé InfluxDB.