Modifications entre les versions 9 et 11 (s'étendant sur 2 versions)

Prometheus

Prometheus est un outil de monitoring (gestion des alertes par exemple) et une base de donnée de stockage de séries de temps.

Il a été déployé sur prometheus.adm.crans.org et n'est accessible que vis Adm. On peut accéder à son interface Web en passant par un proxy Sock par exemple.

Pour plus d'information, je ne peux que vous conseillez la documentation officielle.

Fonctionnement

Prometheus représente la base de données de monitoring, mais ne récupère pas de données par lui-même. Il faut donc ajouter des services sur les autres serveurs qui vont lui envoyer les données à monitorer. De plus pour visualiser ces données, il est souhaitable de mettre en place une interface bien plus « humaine » comme Grafana, bien que l'interface de base permette déjà de voir les données.

Un de ses gros points forts est que l'on peut exporter à peu près tout ce que l'on souhaite vers Prometheus, par exemple les données collectées par le contrôleur Unifi.

Pour monitorer les informations de base d'un serveur, il suffit d'installer prometheus-node-exporter qui va exporter les informations réseaux, CPU, RAM… sans configuration nécessaire. Vous l'avez compris ça fait le café.

Mais dis donc Jamy comment ça marche ?

Prometheus est en réalité un simple collecteur de données. Il va régulièrement (toutes les 15s) charger une page web (par exemple vulcain.adm.crans.org:9100) et récupérer le contenu. C'est donc lui qui interroge les serveurs et pas l'inverse.

Du côté des serveurs à monitorer on va alors installer des services comme prometheus-node-exporter qui vont simplement répondre à cette requête HTTP en renvoyant les données à l'instant t.

Cela veut dire que Prometheus est très simple à déboguer lorsque un node est inaccessible ! Il suffit d'essayer d'y aller avec son navigateur web.

Cela veut également dire que vous pouvez très simplement créer votre service qui va répondre sur un autre port en envoyant d'autres données et que Prometheus les acceptera.

Maintenance

Supprimer les données d'une node

Parfois après la suppression d'un serveur on veut drop les anciennes données. Pour cela sur le serveur Prometheus :

curl -X DELETE -g 'http://localhost:9090/api/v1/series?match[]={instance="ANCINNE_NODE:9100"}'

Choses à tester dans le futur

python3-django-prometheus ;
Intégrer avec les stats de GitLab (de base dans GitLab) ;
Activer le NTP dans prometheus-node-exporter ;
Exporter NGINX (pour monitorer les reverseproxy) ;
Exporter les données du contrôleur Unifi avec prometheus-snmp-exporter.

-  ⇤ ← Version 9 à la date du 2019-04-22 19:29:19 → 
  Taille: 2182
  Éditeur: WikiErdnaxe
  Commentaire:
+   ← Version 11 à la date du 2019-04-25 16:57:05 → ⇥
  Taille: 3015
  Éditeur: WikiErdnaxe
  Commentaire: Update
-Texte supprimé.
+Texte ajouté.
 Ligne 20:
+=== Mais dis donc Jamy comment ça marche ? ===

Prometheus est en réalité un simple collecteur de données. Il va régulièrement (toutes les 15s) charger une page web (par exemple vulcain.adm.crans.org:9100) et récupérer le contenu.
C'est donc lui qui interroge les serveurs et pas l'inverse.

Du côté des serveurs à monitorer on va alors installer des services comme {{{prometheus-node-exporter}}} qui vont simplement répondre à cette requête HTTP en renvoyant les données à l'instant t.

Cela veut dire que Prometheus est très simple à déboguer lorsque un node est inaccessible ! Il suffit d'essayer d'y aller avec son navigateur web.

Cela veut également dire que vous pouvez très simplement créer votre service qui va répondre sur un autre port en envoyant d'autres données et que Prometheus les acceptera.
-Ligne 31:
+Ligne 42:
- * [[https://github.com/pvdh/munin_exporter|Exporter Munin]] (normalement pas utile) ;
-Ligne 33:
+Ligne 43:
- * Intégrer avec les stats de GitLab ;
 * Dashboard NTP ;
+ * Intégrer avec les stats de GitLab (de base dans GitLab) ;
 * Activer le NTP dans {{{prometheus-node-exporter}}} ;
-Ligne 36:
+Ligne 46:
- * [[https://github.com/mdlayher/unifi_exporter|Exporter Unifi]].
+ * Exporter les données du contrôleur Unifi avec {{{prometheus-snmp-exporter}}}.