Auswirkungen von Ausfällen in Operations Manager 2007

Letzte Aktualisierung: Mai 2009

Betrifft: Operations Manager 2007 R2, Operations Manager 2007 SP1

Verschiedene Microsoft System Center Operations Manager 2007-Server und -Komponenten können ausfallen und auf diese Weise die Operations Manager-Funktionalität beeinträchtigen.

Wie stark der Daten- oder Funktionalitätsverlust während eines Ausfalls ist, hängt vom jeweiligen Ausfallszenario ab. Zu den Einflussfaktoren gehören die Rolle der fehlerhaften Komponente, die Operations Manager-Bereitstellung, der Zeitraum bis zur Wiederherstellung und die Verfügbarkeit von Sicherungskopien.

Auswirkungen eines Ausfalls

Die Auswirkungen eines Ausfalls sind minimal, wenn die Operations Manager-Bereitstellung Failoverserver bzw. Cluster umfasst. Sie sind stärker, wenn kein Clustering und keine Failoververwaltungsserver implementiert wurden. Dies liegt daran, dass es länger dauert, eine ausgefallene Komponente wiederherzustellen. Wenn es länger dauert, die von einer ausgefallenen Komponente bereitgestellten Funktionen wiederherzustellen, ist das Risiko eines Datenverlusts größer, und wenn ein Datenverlust auftritt, gehen mehr Daten verloren. Weitere Informationen zur Minimierung der Auswirkungen eines Ausfalls finden Sie unter "Reduzieren der Auswirkung von Ausfällen" weiter unten.

In einigen Ausfallszenarien ist Operations Manager vorübergehend weiter funktionsfähig, ohne dass Daten verloren gehen. Nach Reparatur der fehlerhaften Komponente wird dann – ohne weiteren Eingriff – automatisch die vollständige Funktionalität wiederhergestellt.

In der folgenden Tabelle werden die Auswirkungen von Ausfällen verschiedener Operations Manager 2007-Komponenten aufgeführt. In Rahmen dieser Tabelle wird davon ausgegangen, dass jeder aufgeführte Server nur die angegebene Einzelrolle wahrnimmt.

Ausgefallene Komponente Auswirkung: Günstigstes Szenario Auswirkung: Ungünstigstes Szenario

Verwaltungsserver

Die Arbeitslast auf zusätzlichen Verwaltungsservern in der Verwaltungsgruppe erhöht sich, bis der ausgefallene Verwaltungsserver wiederhergestellt ist.

  • Die Daten auf verwalteten Computern werden in Warteschlangen gestellt und nicht verarbeitet, da sie nicht von Agents an den Verwaltungsserver gesendet werden können.

  • Computers ohne Agents werden nicht verwaltet.

  • Gatewayserver können Daten nicht von Agents an den Verwaltungsserver übertragen.

Stammverwaltungsserver

Bei mindestens einem funktionierenden Server im Cluster gibt es keine Auswirkungen.

  • Betriebskonsolen und Webkonsolen können keine Verbindung herstellen und die Konfiguration der Verwaltungsgruppe nicht verwalten.

  • Die Konfigurationsverwaltung für die Verwaltungsgruppe ist nicht verfügbar.

  • Verbindungen zu anderen Verwaltungsgruppen sind nicht verfügbar.

  • Es können keine administrativen Operations Manager-Tasks wie das Anzeigen, Bearbeiten oder Verwalten von Objekten ausgeführt werden.

  • Die Betriebskonsole funktioniert nicht.

  • Verbindungen zu Drittanbieter-Verwaltungsprodukten mithilfe von Connectors sind nicht verfügbar.

Operations Manager-Berichtsserver (OperationsManager-Datenbank ist intakt)

  • Auf Berichte kann nicht zugegriffen werden.

  • Die Berichtsansicht in der Betriebskonsole funktioniert nicht.

Operations Manager-Datenbank

Wenn die OperationsManager-Datenbank in einem Failovercluster installiert wurde, gibt es keine Auswirkungen, solange einer der Clusterknoten funktioniert. Wenn der Protokollversand implementiert ist, steht möglicherweise nicht der volle Dienstumfang zur Verfügung, bis die Datenbank neu erstellt wurde.

  • Daten von verwalteten Computern werden nicht verarbeitet und nicht in der Datenbank gespeichert. Diese Daten können letztendlich verloren gehen.

  • Verwaltungsserver stellen Daten zunächst in die Warteschlange des Zwischenspeichers. Sobald der Zwischenspeicher voll ist, beginnen die Verwaltungsserver damit, Daten zu löschen; Leistungsdaten werden hierbei als erstes gelöscht.

  • Es können keine administrativen Operations Manager-Tasks wie das Anzeigen, Bearbeiten oder Verwalten von Objekten ausgeführt werden.

  • Berichte enthalten keine aktuellen Informationen.

  • Die Betriebskonsole funktioniert nicht.

  • Änderungen an Management Packs werden nicht an Agents weitergegeben.

Data Warehouse-Server (OperationsManagerDW-Datenbank ist intakt)

Bei mindestens einem funktionierenden Server im Cluster gibt es keine Auswirkungen. Bei einem Fehler der OperationsManagerDW-Datenbank reduziert sich die Fehlerauswirkung durch Clustering nicht. (Auswirkungen siehe nächste Spalte.)

  • Berichte können nicht angezeigt, bearbeitet oder verwaltet werden.

  • Überwachungssammeldienst-Berichte (ACS-Berichte) können nicht angezeigt, bearbeitet oder verwaltet werden, wenn die Überwachungssammeldienste auf demselben Computer installiert sind, auf dem SQL Server ausgeführt wird.

Gatewayserver

Bei Bereitstellung mehrerer Gatewayserver ist ein Agentfailover auf einen anderen Gatewayserver möglich; die Kommunikation mit den Verwaltungsservern wird in diesem Fall nicht unterbrochen.

  • Aktuelle Überwachungsdaten sind nicht verfügbar, da Agents und Verwaltungsserver nicht miteinander kommunizieren.

Überwachungssammlungsdatenbank

Wenn die Überwachungssammlungsdatenbank intakt ist und mindestens ein Server im Cluster funktioniert, gibt es keine Auswirkungen. Bei einem Fehler der Überwachungssammlungsdatenbank reduziert sich die Fehlerauswirkung durch Clustering nicht. (Auswirkungen siehe nächste Spalte.)

  • Sicherheitsereignisse werden auf verwalteten Computern in Warteschlangen gestellt und nicht verarbeitet. Diese Daten können letztendlich verloren gehen.

  • Die Leistung verwalteter Computer ist aufgrund der angehäuften Daten beeinträchtigt.

  • ACS-Berichte enthalten keine aktuellen Informationen.

Hostcomputer der Betriebskonsole

Nicht anwendbar.

  • Die Konsole steht auf dem ausgefallenen Computer nicht zur Verfügung.

ACS-Sammlungsserver

Nicht anwendbar.

  • Überwachungsereignisse von ACS-Weiterleitungen werden nicht verarbeitet.

Reduzieren der Auswirkung von Ausfällen

Die Auswirkungen einiger Serverausfälle lassen sich durch Hinzufügen einer Redundanzfunktionalität oder durch Implementieren einer Failoverlösung wie Clustering deutlich reduzieren. Hierdurch reduziert sich auch die Dringlichkeit von Wiederherstellungsmaßnahmen.

Die nachfolgende Liste enthält Konfigurationsoptionen für das Hinzufügen von Redundanz- und Clusteringfunktionen zur Operations Manager-Bereitstellung. Durch Implementierung dieser Optionen können Sie die Auswirkungen von Ausfällen reduzieren und die Verfügbarkeit von Operations Manager in Ihrem Unternehmen erhöhen:

  • Hinzufügen von Verwaltungsservern

  • Installieren des Stammverwaltungsservers in einem Clusterdienst-Failovercluster

  • Platzieren der Datenbanken in einem Clusterdienst-Failovercluster

  • Konfigurieren des Gatewayservers für das Failover

  • Konfigurieren des Protokollversands

  • Konfigurieren der Mehrfachvernetzung von Agents über mehrere Verwaltungsgruppen

Jede dieser Optionen wird nachfolgend ausführlicher beschrieben. Weitere Informationen zu den Bereitstellungsoptionen, die dazu beitragen, eine hohe Verfügbarkeit sicherzustellen und die Auswirkungen von Ausfällen zu reduzieren, finden Sie im Operations Manager 2007-Bereitstellungshandbuch (https://go.microsoft.com/fwlink/?LinkId=93785).

Hinzufügen von Verwaltungsservern

Stellen Sie in einer Verwaltungsgruppe mehr als einen Verwaltungsserver bereit. Dies ermöglicht den Agents ein Failover, falls ein Verwaltungsserver ausfällt.

Wenn ein Verwaltungsserver ausgefallen ist, leiten alle Agents, die mit diesem Verwaltungsserver kommunizieren, die Berichterstattung automatisch an einen anderen Verwaltungsserver derselben Verwaltungsgruppe ein. Sobald der ausgefallene ursprüngliche Verwaltungsserver wiederhergestellt wurde, können die Agents erneut mit diesem kommunizieren.

Fällt der Stammverwaltungsserver aus, können Sie einen vorhandenen Verwaltungsserver zum Stammverwaltungsserver höher stufen. Nach Wiederherstellung des Stammverwaltungsservers können Sie den temporären Stammverwaltungsserver tiefer stufen und den wiederhergestellten ursprünglichen Server erneut zum Stammverwaltungsserver höher stufen.

Installieren des Stammverwaltungsservers in einem Clusterdienst-Failovercluster

Installieren Sie den Stammverwaltungsserver in einem Clusterdienst-Failovercluster. Wenn ein Knoten im Stammverwaltungsserver-Cluster ausfällt, wird die Rolle des Stammverwaltungsservers an einen anderen Clusterknoten übertragen. Dadurch kann der Stammverwaltungsserver ordnungsgemäß weiter funktionieren.

Nach Wiederherstellung des ausgefallenen Clusterknotens können Sie den Stammverwaltungsserver wieder zurück an den ursprünglichen Knoten verschieben oder weiter an einem anderen Knoten des Failoverclusters betreiben.

Platzieren von Datenbanken in einem Clusterdienst-Failovercluster

Platzieren Sie die OperationsManager-, die OperationsManagerDW- und die OperationsManagerAC-Datenbank in einem Clusterdienst-Failovercluster. Wie beim Stammverwaltungsserver-Cluster würden bei einem Knotenausfall sämtliche Datenbanken an einen anderen Knoten im Cluster verschoben und somit weiterhin ordnungsgemäß funktionieren. Wenn eine Datenbank jedoch beschädigt wird, müssen Sie sie möglicherweise von Ihrer jüngsten Sicherung wiederherstellen.

Konfigurieren des Gatewayservers für das Failover

Stellen Sie mehrere Gatewayserver bereit, um Agents ein Failover zwischen Gatewayservern zu ermöglichen und die Arbeitsauslastung für Verwaltungsaktivitäten zu verteilen.

Gatewayserver können auch für ein Failover zwischen Sammlungsverwaltungsservern in einer Verwaltungsgruppe konfiguriert werden, wenn mehrere Sammlungsverwaltungsserver zur Verfügung stehen.

Konfigurieren des Protokollversands

Im Rahmen des Protokollversands wird eine Kopie einer Operations Manager-Datenbank auf einem separaten Microsoft SQL Server 2005- bzw. SQL Server 2008-Server gepflegt. Die Protokollverwaltung sorgt dafür, dass die Datenbankkopie jederzeit aktuell ist, indem sie die Transaktionsprotokolle von der Quelldatenbank in der aktiven Verwaltungsgruppe an die Zieldatenbank in der Reserveverwaltungsgruppe sendet.

Für den Fall, dass eine Datenbank beschädigt wird, können Sie Operations Manager so konfigurieren, dass vorübergehend die Reserverdatenbank verwendet wird. Nach Wiederherstellung der ursprünglichen Datenbank können Sie Operations Manager für die erneute Verwendung dieser Datenbank konfigurieren.