Durchführen einer Notfallwiederherstellungsübung

Abgeschlossen

In dieser Lerneinheit erfahren Sie mehr über Site Recovery-Notfallübungen: was Sie dabei beachten müssen und wie Sie einen Test ausführen, um zu überprüfen, ob die Konfiguration richtig ist.

Mit Notfallwiederherstellungsübungen wird getestet, wie sich eine Organisation von einem Ausfall erholt, ohne dabei Produktionsdienste zu beeinträchtigen.

In der vorherigen Übung haben Sie das Einrichten von Azure Site Recovery abgeschlossen und müssen nun Ihre Infrastrukturreplikation testen. Testen Sie Ihre Konfiguration, indem Sie einen DR-Drill ausführen. Mit Azure Site Recovery können Sie diese Übungen sicher ausführen, ohne dass sich dies auf Ihre Produktionsumgebung auswirkt. Außerdem führen Sie einige Qualitätssicherungstests für die Konfiguration durch, um sicherzustellen, dass die Notfallwiederherstellungslösung funktioniert.

Was ist eine Notfallwiederherstellungsübung?

Mit einer Notfallwiederherstellungsübung (DR-Drill) können Sie die korrekte Konfiguration Ihrer Lösung überprüfen. Durch die Übung wissen Sie und Ihr Unternehmen, dass Ihre Daten und Dienste im Notfall verfügbar sind. Üblicherweise legen Organisationen eine Wiederherstellungszeitvorgabe (RTO) fest, die angibt, wie lange das Wiederherstellen der Infrastruktur dauert. Ihr Unternehmen sollte auch eine Recovery Point Objective (RPO) definieren, die den Umfang des Datenverlusts bestimmt, der innerhalb einer bestimmten Zeitspanne akzeptabel ist. Wenn es bei der Recovery Point Objective des Unternehmens beispielsweise um einen Tag handelt, müssen Sie jeden Tag eine Sicherung all Ihrer Daten erstellen. Sie müssen auch sicherstellen, dass es weniger als einen Tag lang dauert, diese Sicherung wiederherzustellen.

A screenshot that shows the breakdown of failover tests that have been run.

Site Recovery stellt sicher, dass die Notfallwiederherstellung nur testweise durchgeführt wird, indem eine Aufforderung angezeigt wird, diese im Site Recovery-Dashboard durchzuführen.

Wozu dienen Notfallwiederherstellungsübungen?

Eine Notfallwiederherstellungsübung ist wichtig, da durch diese sichergestellt wird, dass die implementierte Lösung die Business Continuity & Disaster Recovery-Anforderungen (BCDR) erfüllt und die Replikation ordnungsgemäß funktioniert. Die Notfallwiederherstellungsübung muss mit dem RTO und RPO gründlich getestet werden, um sicherzustellen, dass Replikation, Failover und Wiederherstellung innerhalb des erforderlichen Zeitraums erfolgen.

Angenommen, Ihre Wiederherstellungszeitvorgabe beträgt eine Stunde und die Recovery Point Objective sechs Stunden. Wenn Ihre Systeme stündlich gesichert werden, ergibt dies eine Stunde verlorener Daten und eine zusätzliche Stunde für die Wiederherstellung der Systeme.

Nehmen Sie jetzt an, dass die tatsächliche Wiederherstellungsdauer fünf Stunden beträgt. Der Datenverlust unserer Systeme beträgt nun knapp über sechs Stunden. Das bedeutet, dass das RPO-Ziel für Business Continuity & Disaster Recovery nicht eingehalten wurde. Wenn Sie testen, wie lange die tatsächliche Wiederherstellung nach einem Fehler dauert, können Sie sicherstellen, dass die Systeme die BCDR-Pläne einhalten.

Testfailover für einzelne Computer

Mit einem Failovertest können Sie einen Notfall und seine Auswirkungen simulieren. Sie können einen Failovertest über das Site Recovery-Dashboard oder direkt über das Notfallwiederherstellungsmenü einer bestimmten VM starten. Wählen Sie zunächst einen Wiederherstellungspunkt aus. Sie können entweder den zuletzt verarbeiteten, den aktuellsten App-konsistenten oder einen benutzerdefinierten Wiederherstellungspunkt auswählen.

Erstellen eines Failovertests

Erstellen Sie ein isoliertes virtuelles Netzwerk, damit Ihre Produktionsinfrastruktur nicht beeinträchtigt wird. Gehen Sie dazu folgendermaßen vor:

  1. Öffnen Sie die Ziel-VM mit dem Namen patient-records. Eine einfache Möglichkeit, diese zu finden, besteht darin, alle Ressourcen so zu filtern, dass nur Type == Virtual machine (Typ ==Virtueller Computer) angezeigt wird. Wählen Sie patient-records aus der Ergebnisliste aus.

  2. Scrollen Sie im Ressourcenmenü zu Vorgänge, und wählen Sie dann Notfallwiederherstellung aus.

    Screenshot that shows the Operations' disaster recovery option for a selected VM.

  3. Ein neuer Bereich Replizierte Elemente wird angezeigt. Wählen Sie Aktualisieren aus, bis im Statusfeld Geschützt angezeigt wird. Wählen Sie dann in der oberen Menüleiste die Option Testfailover aus.

    Screenshot that shows the test failover button for a selected VM.

  4. Nachdem die Überprüfung erfolgreich abgeschlossen wurde, wählen Sie Ihr virtuelles Netzwerk in der Dropdownliste Virtuelles Azure-Netzwerk aus. Wählen Sie anschließend die Schaltfläche Failover testen aus. Diese Option führt ein Testfailover der VM aus und ermöglicht es Ihnen, den Fortschritt über die Seite „Site Recovery-Aufträge“ nachzuverfolgen, indem Sie das Symbol Benachrichtigungen und den Link Aufgabe zum Testen des Failovers des virtuellen Computers starten auswählen.

  5. Nach Abschluss des Vorgangs wird die VM, für die ein Failover ausgeführt wurde, im Portal unter Virtuelle Computer in der Wiederherstellungsregion angezeigt. Anschließend können Sie überprüfen, ob die VM ausgeführt wird, die richtige Größe und Verbindung aufweist und die Quell-VM in einer anderen Azure-Region spiegelt.

  6. Nachdem Sie überprüft haben, dass alles wie erwartet funktioniert hat, können Sie den replizierten virtuellen Computer löschen, indem Sie auf Testfailover bereinigen im Bereich Notfallwiederherstellung klicken. An diesem Punkt empfehlen wir, Notizen zum Testergebnis hinzuzufügen. Aktivieren Sie das Kontrollkästchen neben Test abgeschlossen, um den virtuellen Testfailovercomputer zu löschen, und wählen Sie dann OK aus.

Flexibles Failover mehrerer Computer

Mit Site Recovery können Sie flexibel Notfallwiederherstellungstests für alle VMs ausführen. Sie können Wiederherstellungspläne erstellen, die einen oder mehrere virtuelle Computer enthalten. Failover können so oft wie gewünscht ausgeführt werden und ermöglichen eine flexible Richtlinie, mit der verschiedene Kombinationen von Infrastrukturen getestet werden können.

Screenshot that shows a test failover dashboard used to track the failover job execution.

Für die Inhalte des Wiederherstellungsplans sind die gleichen Testbereinigungen wie beim Testen einzelner VMs verfügbar.

Screenshot that shows the option to clean up a test failover.

Unterschied zwischen Test- und Produktionsfailover

Die Ausführung eines Produktionsfailovers in Site Recovery ähnelt der Durchführung eines Testfailovers. Es gibt jedoch einige Ausnahmen, beispielsweise wird Failover anstelle von Testfailover ausgewählt. Sie können die Quell-VM vor dem Failover herunterfahren, sodass beim Wechsel keine Daten verloren gehen. Site Recovery bereinigt die Quellumgebung nach Beendigung des Failovers nicht.

Wenn das Failover abgeschlossen ist, überprüfen Sie, ob die VM erwartungsgemäß funktioniert. In dieser Phase ermöglicht Site Recovery das Ändern des Wiederherstellungspunkts. Wenn Sie zufrieden sind, dass das Failover funktioniert, committen Sie das Failover. Site Recovery löscht alle Wiederherstellungspunkte der Quell-VM und schließt das Failover ab. Aufgrund der replizierten Infrastruktur und der Daten in der sekundären Region müssen Sie bedenken, dass der neue virtuelle Computer in der sekundären Region ebenfalls geschützt werden muss.

Überprüfen Sie Ihr Wissen

1.

Wie unterstützt Site Recovery das Gruppieren von Computern und Workloads?