雲端管理中的工作負載作業

某些工作負載對於企業成功至關重要。 針對這些工作負載,管理基準並不足以達成雲端管理所需的商務承諾。 平台作業可能甚至不足以達成商務承諾。 這是工作負載相當重要的一部分,需要特別專注於工作負載的運作方式及其支援方式。

投資工作負載作業會進而導致提升效能、降低業務中斷風險,並在發生系統失敗時加速復原。 本文討論如何投資這些高優先順序工作負載的持續作業,以改進商務承諾。

何時投資工作負載作業

「柏拉圖法則」(也稱為「80/20 法則」) 指出 80% 的效應來自 20% 的原因。 若允許 IT 組合在內部成長一段時間,通常會在 IT 組合審查中說明這項法則。 根據需要投資的效應,原因可能會不同,但通用法則均適用:

  • 80% 的系統失敗通常是 20% 的常見錯誤或 Bug 結果。
  • 80% 的商業價值通常來自組合中 20% 的工作負載。
  • 80% 的雲端移轉工作來自 20% 要移動的工作負載。
  • 80% 的雲端管理工作會支援 20% 的服務事件或報修單。
  • 中斷所造成 80% 的業務衝擊會來自 20% 受中斷影響的系統。

只有在清楚了解每個雲端採用策略、業務成果和作業計量時,才應該套用工作負載作業。 這是從傳統 IT 觀點來看的典範轉移。 傳統上,IT 會假設所有工作負載都已經歷相同程度的支援,並需要類似的優先順序層級。

在投資深度工作負載作業之前,IT 和企業應該了解增加雲端管理投資的業務理由和期望。

從資料著手

工作負載作業從深入了解工作負載效能和支援需求開始。 在小組投資工作負載作業之前,必須具備有關工作負載相依性、應用程式效能、資料庫診斷、虛擬機器遙測和事件歷程記錄的豐富資料。

此資料會植入驅動工作負載作業決策的見解。

持續觀察

初始資料和持續遙測可協助制訂和測試有關工作負載效能的理論。 但持續工作負載作業來自對工作負載效能 (主要著重於應用程式和資料效能) 的持續擴展觀察。

測試自動化

在應用程式層級,工作負載作業的第一個需求是投資深度測試。 針對透過工作負載作業支援的任何應用程式,應該建立並定期執行測試計劃,以提供跨應用程式的功能和規模測試。

定期測試遙測可提供各種工作負載作業相關假設的立即驗證。 您可以執行和測試改良的作業和架構模式。 產生的差異可提供明確的影響分析,以引導持續投資。

了解發行

明確了解發行週期和發行管線是工作負載作業的一項重要元素。

了解週期可為潛在的中斷做好準備,並讓小組主動解決任何可能會對作業造成負面影響的發行。 這項了解也可讓雲端管理小組與採用小組合作,以持續改進產品品質,並解決任何可能影響穩定性的 Bug。

更重要的是,了解發行管線可大幅改進工作負載的復原點目標 (RPO)。 在許多案例中,發行管線是復原應用程式的最快速準確路徑。 如果應用程式層只會在發生新的發行時變更,最好將投資偏重於管線最佳化,而不是從傳統備份程序復原應用程式。

雖然部署管線可以是復原的最快速路徑,但也可以是補救的最快速路徑。 當應用程式具有快速、有效率且可靠的發行管線時,雲端管理小組可選擇以自動部署到新主機作為自動補救的形式。

您可能會有許多其他更快速、更有效率的補救和復原機制。 不過,當使用現有管線可以達成商務承諾並從現有 DevOps 投資中獲利時,現有管線可能是可行的替代方案。

清楚傳達工作負載的變更

變更任何工作負載是工作負載作業的最大風險之一。 針對雲端管理工作負載作業層級中的任何工作負載,雲端管理小組應密切配合雲端採用小組,以了解來自每個發行的變更。 對主動了解的這項投資將對作業穩定性有直接、正面的影響。

改進成果

工作負載中的資料和通訊投資,會為下列三個領域之一的持續作業改進提供建議:

  • 技術債務解決方案
  • 建議的補救方式
  • 改進的系統設計

技術債務解決方案

最佳工作負載作業方案仍需要補救。 當您的雲端管理小組試圖保持聯繫以了解採用工作和發行時,小組同樣應該定期分享補救需求,以確保技術債務和 Bug 是您開發小組的持續優先考量。

建議的補救方式

藉由套用柏拉圖法則,我們可以說,80% 的負面業務衝擊可能來自 20% 的服務事件。 當這些事件無法在正常開發週期中解決時,對補救自動化的投資可大幅減少業務中斷情況。

改進的系統設計

在技術債務解決方案和自動補救的情況下,系統缺陷是大部分系統中斷的常見原因。 您可以透過遵循一些設計原則,來對整體工作負載作業造成最大的影響:

  • 可擴縮性:系統處理負載增加的能力。
  • 可用性:系統運作正常的時間百分比。
  • 復原:系統從失敗中復原並繼續運作的能力。
  • 管理:讓系統在生產環境中執行的作業程序。
  • 安全性:保護應用程式和資料免受威脅。

為了協助改進整體作業,Microsoft Azure Well-Architected Framework 提供了一種方法來評估特定工作負載是否遵循了這些要素。 將這些要素套用至平台作業和工作負載作業。

後續步驟

充分了解雲端採用架構中的管理方法之後,您現在可以實作雲端管理原則。 了解如何讓此方法可用於您的作業環境中。