Überwachung

Azure CycleCloud unterstützt die Überwachung externer Dienste durch seine pluggable Architektur. Administratoren können die automatische Überwachung dieser Systeme aktivieren, die auf die Seite "Einstellungen " unter dem Benutzermenü in der oberen rechten Ecke der Weboberfläche wechseln, auf das Element " CycleCloud-Einstellungen " doppelklicken und das Kontrollkästchen "Überwachung für CycleCloud-Dienste aktivieren" aktivieren.

Wenn diese Option aktiviert ist, werden unterstützte Dienste in jedem Cluster automatisch mit CycleCloud registriert, wodurch die Überwachung für diesen Dienst konfiguriert wird.

Unterstützte Dienste

Ganglia

Jede Version von CycleCloud wird mit Ganglia-Überwachung unterstützt, um Leistungsmetriken wie cpu/arbeitsspeicher/Bandbreitennutzung zu sammeln. Wenn Ihr Cluster für die Verwendung von Ganglia (die Standardeinstellung in den meisten Fällen) konfiguriert ist, funktioniert die automatische Überwachung so lange, bis Port 8652 zwischen CycleCloud und dem Masterknoten des Clusters geöffnet ist (der eine, der den gmetad-Dienst ausführt).

Ganglia auf CentOS/RHEL

Ganglia auf CentOS und RHEL wird von EPEL bereitgestellt. Azure CycleCloud konfiguriert und installiert EPEL und die Ganglia-Abhängigkeiten standardmäßig.

Möglicherweise kann man die Verwendung von EPEL deaktivieren, indem sie in einer Clustervorlage festlegen cyclecloud.install_epel = false . Das Abmelden von EPEL überspringt die Einrichtung der Ganglia-Überwachung. Dies wirkt sich nicht auf die Berechnungsfunktionalität Ihres Computeclusters aus, sondern sucht daten, die für die Berichtsansicht Ihres Clusters gesammelt wurden.

Hier sind die "Client"-Abhängigkeiten, die auf Ausführungsclusterknoten installiert sind, und die Abhängigkeiten des "Servers", die auf Master-/Head-Clusterknoten installiert sind.

# Ganglia client dependencies from CentOS/RHEL base
yum -y install apr bash expat glibc pcre python python-libs systemd zlib

# Ganglia client dependencies provided by EPEL
yum -y install ganglia ganglia-gmond ganglia-gmond-python libconfuse

# Ganglia server dependencies from CentOS/RHEL base
yum -y install apr bash expat glibc libmemcached pcre rrdtool systemd zlib

# Ganglia server dependencies provided by EPEL
yum -y install ganglia ganglia-gmetad libconfuse

Rastermodul

Wenn Sie die Grid Scheduling Edition von CycleCloud ausführen, wird die Grid Engine-Überwachung automatisch konfiguriert, wenn ein Grid Engine-Cluster gestartet wird. Die einzige Anforderung besteht darin, dass CycleCloud auf den Knoten mit dem qmaster-Dienst mit dem für den Cluster konfigurierten Keypair zugreifen kann.

Azure Monitor

Ab CycleCloud 8.0 werden Metriken für einen Cluster anstelle von Ganglia aus Azure Monitor abgerufen. Dadurch wird die Notwendigkeit entfernt, port 8652 eingehende Knoten zu öffnen.

Hinweis

Selbst Cluster, die noch bei Version 7 sind und Ganglia vorinstalliert sind, erhalten ihre Metriken aus Azure Monitor in CycleCloud 8.

Die Metriken, die gesammelt werden, sind:

  • CPU in Prozent
  • Datenträgerlesevorgänge in Bytes
  • Datenträgerschreibvorgänge in Bytes
  • Netzwerk eingehend
  • Netzwerk ausgehend

Es ist auch möglich, Protokolldaten aus CycleCloud-Clustern in Log Analytics zu speichern und benutzerdefinierte Metrikdashboards zu erstellen. Weitere Informationen zum Erstellen benutzerdefinierter Metrik-Dashboards aus Log Analytics für Ihre Cluster finden Sie im Abschnitt "How-to" und "Lernprogramme" in der Azure Monitor-Dokumentation.