Container-Monitoring: Prometheus 2.0 überwacht effizienter
Ursprünglich von Soundcloud stammt die verteilte Monitoring-Lösung Prometheus, die mittlerweile vor allem für Container genutzt wird. Die aktuelle Version 2.0 reduziert den Fußabdruck der Software, erlaubt Snapshot-Backups der Datenbank und durchforstet riesige Mengen an Zeitreihen effizienter.

Die vor allem beim Cloud- und Containereinsatz verwendete Monitoring-Lösung Prometheus steht in Version 2.0 bereit. Prometheus sammelt Daten als Zeitreihen. Die in Version 2.0 enthaltene neue, leistungsfähigere Zeitreihen-Datenbank startete Anfang 2017 als Experiment, die in praktischen Benchmarks gewonnenen Ergebnisse können sich aber sehen lassen: Die Latenzzeiten für Abfragen sind konsistenter und skalieren besser, zugleich geht der Ressourcenverbrauch in realen Produktionsszenarien deutlich zurück.
- Container-Monitoring: Prometheus 2.0 überwacht effizienter
- Schnappschüsse per API machen
Zahlen dazu liefert unter anderem das Projekt selbst in einem Blogpost von Entwickler Fabian Reinartz, der sie bereit auf dem Open Source Summit in Prag vorstellte. Demnach reduziert sich die CPU-Auslastung gegenüber Version 1.8 um 20 bis 40 Prozent. Prometheus 2.0 braucht 33 bis 50 Prozent weniger Plattenplatz als die Vorgängerversion, und Disk-I/O liegt ohne große Last normalerweise bei weniger als einem Prozent.
Auch das auf Containereinsatz spezialisierte Unternehmen CoreOS beteiligt sich an der Entwicklung von Prometheus und sieht die "dramatischste Verbesserung in Prometheus 2.0" in der geringeren Menge an Daten, die die Monitoring-Software pro Sekunde auf die Festplatte schreibt, es seien bis zu zwei Größenordnungen weniger Daten als bisher. Dies erhöhe die Lebensdauer von SSDs und senke die Kosten.
Abgestanden nach fünf Minuten
Nutzer dürfte auch freuen, dass die neue Version das seit Jahren bestehende und recht komplex zu behebende Problem mit der Fünf-Minuten-Staleness löst. Denn erhält Prometheus etwa beim Auswerten eines Instant Vectors fünf Minuten lang keine aktualisierten Datenpunkte, betrachtet es die dazugehörige Zeitreihe als "schal" oder "abgestanden" (englisch: stale). Der Admin weiß dann nicht genau, ob ein Wert tatsächlich konstant ist oder er auf einen veralteten Datenpunkt schaut.
Das führt unter anderem dazu, dass die Warnungen auch dann noch abgehen, wenn ein Problem bereits behoben ist. Prometheus 2.0 verfolgt daher nun auch verschwindende Ziele oder deren Zeitreihen, was nicht nur Abfrage-Artefakte verhindert, sondern auch die Reaktionsfähigkeit der Warnungen verbessert.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Schnappschüsse per API machen |
- 1
- 2
Ich hab mal auch Monitoring Lösungen evaluiert und für meine Zwecke war check_mk...