共用方式為


Azure Chaos Studio 中的錯誤和動作

在 Azure Chaos Studio 中,實驗中發生的每個活動都稱為「動作」。 最常見的動作類型是「錯誤」。 本文描述動作和錯誤,以及每個動作和錯誤的屬性。

實驗動作

動作是協調為混沌實驗一部分的任何活動。 動作會組織成步驟和分支,讓動作可以循序或平行執行。 每個動作都有下列屬性:

  • 名稱:發生的特定動作。 名稱通常採用動作的 URN 形式,例如 urn
  • 類型:動作執行的方式。 動作可以是「連續」或「離散」的。 連續動作會在一段時間內不間斷地執行。 例如,施加 CPU 壓力 10 分鐘。 離散動作只會發生一次。 例如,重新啟動 Azure Cache for Redis 執行個體。

動作的類型

Chaos Studio 中有兩種動作:

  • 錯誤:此動作會導致一或多個資源中斷。
  • 時間延遲:此動作會「等候」,而不會影響任何資源。 在錯誤之間暫停等候系統受到上一個錯誤影響很有用。

錯誤

錯誤是 Chaos Studio 中最常見的動作。 錯誤會在系統中造成中斷,可讓您驗證系統是否有效地處理中斷,而不會影響可用性。

錯誤可以:

  • 具有破壞性。 例如,錯誤可能終止程序。
  • 施加壓力。 例如,錯誤可能增加虛擬記憶體壓力。
  • 增加延遲。
  • 造成組態變更。

除了名稱和類型之外,錯誤也可能會有「持續時間」(如果連續的話) 和「參數」。 參數描述應如何套用錯誤,而且其是錯誤名稱特有的。 例如,Azure Cosmos DB 容錯移轉錯誤的參數是讀取區域,其會在寫入區域失敗期間提升為寫入區域。 部分參數是必要的,而其他參數則為選用的。

錯誤是「代理程式型」或是「服務-直接」,取決於目標類型。 代理程式型錯誤需要 Chaos Studio 代理程式安裝在虛擬機器或虛擬機器擴展集上。 代理程式同時適用於 Windows 和 Linux,但並非所有錯誤都可在這兩個作業系統上取得。 如需每個作業系統支援哪些錯誤的資訊,請參閱 Chaos Studio 錯誤和動作程式庫。 服務導向錯誤不需要任何代理程式。 它們會直接對 Azure 資源執行。

錯誤也包含選取器的名稱,而此選取器描述錯誤會針對其執行的資源。 若要深入了解選取器,請參閱混沌實驗。 如果資源已上線為目標,且已在資源上啟用對應的錯誤功能,則錯誤只會影響資源。

下一步

既然您了解動作和錯誤,您就可以: