Rétrospective : Sismology, système de monitoring d’Iguane Solutions

Rétrospective : Sismology, système de monitoring d’Iguane Solutions

Sismology : Système de surveillance d’Iguane Solutions

Timeseries, stockage à long terme, multi-tenant et haute disponibilité

Cet article est une rétrospective de plusieurs mois d’amélioration continue depuis la création de notre système de monitoring actuel : quels défis avons-nous rencontrés, comment nous les avons surmontés et comment nous sommes finalement passés à Victoria Metrics

Comment cela a commencé

Chez Iguane Solutions, nous avons créé un système multi-tenant basé sur Prometheus pour nos besoins en matière d’alertes et de métrologie : Sismology. Tout a commencé par un projet visant à remplacer nos systèmes monolithiques Naemon et Graphite (avec collectd) par un système unique fusionnant la métrologie et les alertes, basé sur le standard actuel : Prometheus.

Bien que Prometheus nous ait donné un bon noyau de métrologie et d’alerte, nous avons été confrontés à trois défis :

Multi-tenant : comme nous prévoyions de permettre à nos clients d’accéder à leurs propres données, il fallait surmonter le problème de la location unique de prometheus.

Stockage à long terme : plusieurs années, il n’est pas rare que nos clients (ou nous-mêmes) comparent une période spécifique de l’année avec l’année N-1 ou N-2.

Haute disponibilité : objectif de zéro downtime tout en ayant la possibilité de mettre certains nœuds hors ligne à des fins de maintenance

 

Retrouvez l’article complet en anglais

 

Dans cet article écrit par Edouard Hur, VP Engineering chez Iguana Solutions, vous trouverez tous les détails sur :

  • La mise au point des technologies utilisées;
  • Le développement personnalisé concernant : l’utilisation du disque et le proxy de lecture à distance ; l’utilisation de la RAM, la cardinalité et pourquoi il a donné naissance à notre propre agent;
  • Victoria Metrics et pourquoi il a remplacé InfluxDB.

Migration vers le Cloud, accompagnement 24/7, Kubernetes, FinOps