Fehler und Aktionen im Azure Chaos Studio

In Azure Chaos Studio wird jede Aktivität, die als Teil eines Experiments stattfindet, als Aktion bezeichnet. Der häufigste Aktionstyp ist ein Fehler. In diesem Abschnitt werden Aktionen und Fehler sowie die Eigenschaften der einzelnen Aktionen und Fehler beschrieben.

Experimentaktionen

Eine Aktion ist jede Aktivität, die als Teil eines Chaosexperiments orchestriert wird. Aktionen werden in Schritten und Verzweigungen organisiert, sodass Aktionen entweder sequenziell oder parallel ausgeführt werden können. Jede Aktion verfügt über die folgenden Eigenschaften:

  • Name: Die jeweilige Aktion, die stattfindet. Ein Name verwendet in der Regel die Form eines URN für die Aktion, urnz. B. . .
  • Typ: Die Art und Weise, wie die Aktion ausgeführt wird. Aktionen können entweder fortlaufend oder diskret sein. Eine fortlaufende Aktion läuft über einen Bestimmten Zeitraum hinweg. Ein Beispiel ist das Anwenden des CPU-Drucks für 10 Minuten. Eine diskrete Aktion tritt nur einmal auf. Ein Beispiel ist ein Neustart eines Azure-Caches für Redis-Instanz.

Arten von Aktionen

Es gibt zwei verschiedenartige Aktionen in Chaos Studio:

  • Fehler: Diese Aktion verursacht eine Unterbrechung in einer oder mehreren Ressourcen.
  • Zeitverzögerungen: Diese Aktion "wartet" ohne Auswirkungen auf Ressourcen. Es ist nützlich, zwischen Fehlern aufzuhalten, bis ein System vom vorherigen Fehler betroffen ist.

Fehler

Fehler sind die gängigste Aktion in Chaos Studio. Fehler verursachen eine Störung in einem System, sodass Sie überprüfen können, ob das System diese Unterbrechung effektiv verarbeitet, ohne die Verfügbarkeit zu beeinträchtigen.

Fehler können:

  • Seien Sie destruktiv. Beispielsweise kann ein Fehler einen Prozess töten.
  • Druck anwenden. Ein Fehler kann z. B. einen virtuellen Arbeitsspeicherdruck hinzufügen.
  • Fügen Sie Latenz hinzu.
  • Führen Sie eine Konfigurationsänderung aus.

Zusätzlich zu einem Namen und Typ können Fehler auch eine Dauer aufweisen, wenn fortlaufend und Parameter. Parameter beschreiben, wie der Fehler angewendet werden soll, und sind spezifisch für den Fehlernamen. Ein Parameter für den Azure Cosmos DB-Failoverfehler ist beispielsweise der Lesebereich, der bei einem Fehler des Schreibbereichs zum Schreibbereich hochgestuft wird. Einige Parameter sind erforderlich, während andere optional sind.

Fehler sind abhängig vom Zieltyp entweder agentenbasiert oder dienstspezifisch. Für agentenbasierte Fehler muss der Chaos-Studio-Agent auf einem virtuellen Computer oder einer virtuellen Computer-Skalierungsgruppe installiert sein. Der Agent ist sowohl für Windows als auch für Linux verfügbar, aber nicht alle Fehler sind auf beiden Betriebssystemen verfügbar. Informationen dazu, welche Fehler auf jedem Betriebssystem unterstützt werden, finden Sie in der Chaos Studio-Fehler- und Aktionsbibliothek. Dienst-direkte Fehler erfordern keinen Agenten. Sie werden direkt für eine Azure-Ressource ausgeführt.

Fehler enthalten auch den Namen der Auswahl, die die Ressourcen beschreibt, für die der Fehler ausgeführt wird. Weitere Informationen zu Selektoren finden Sie unter Chaos-Experimente. Ein Fehler kann sich nur auf eine Ressource auswirken, wenn die Ressource als Ziel integriert wurde und die entsprechende Fehlerfunktion für die Ressource aktiviert ist.

Nächste Schritte

Nachdem Sie nun Aktionen und Fehler verstanden haben, sind Sie bereit für: