營運卓越取捨

營運卓越透過實作清楚的小組標準、瞭解責任和責任、注意客戶成果,以及小組合作,提供工作負載品質。 這些目標的實作是以 DevOps 為根,建議將進程差異降至最低、減少人為錯誤,最後增加工作負載的值傳回。 該值不只是根據工作負載元件所提供的功能需求來測量。 其也會以小組為了改善而努力提供的價值來測量。

在工作負載的設計階段及其生命週期中,當採取持續改進步驟時,請務必考慮根據 營運卓越設計原則操作卓越設計檢查清單 中的建議,決定如何影響其他要素的目標和優化。 某些決策可能會受益于某些要素,但構成其他要素的取捨。 本文說明在設計工作負載架構和作業時,工作負載小組可能會遇到的範例取捨。

具有可靠性的營運卓越取捨

取捨:複雜度增加。 可靠性會優先簡化,因為簡單的設計可將設定錯誤降到最低,並減少非預期的互動。

  • 安全部署策略通常需要一些應用程式邏輯與工作負載中的資料之間的向前和回溯相容性。 這會增加測試負擔,並可能導致工作負載資料的複雜度或完整性問題。

  • 高度分層、模組化或參數化基礎結構,因為程式碼元件之間互動的複雜性,可能會增加意外設定錯誤的機會。

  • 受益于作業的雲端設計模式有時需要引進其他元件,例如使用外部組態存放區,或在容器化應用程式平臺中協調側車部署。 其他元件會增加系統中的互動點,增加介面區以產生故障或設定錯誤。

  • 設計成獨立演進以支援敏捷式開發和裝載的工作負載元件會引進服務探索的相依性,或甚至是 DNS 作為間接層。 服務探索可能缺乏變更的回應能力,而且故障可能難以診斷。

取捨:增加潛在的不穩定活動。 可靠性要素鼓勵避免活動或設計選擇可能會造成系統不穩定,並導致中斷、中斷或故障。

  • 部署小型累加變更是降低風險的技術,但這些小型變更也會更頻繁地傳遞至生產環境。 部署可能會造成系統不穩定,因此隨著部署率增加,此風險會隨之增加。

  • 以每週部署等速度計量來測量本身的文化特性,並使用自動化來加速以更快速步調引進變更,也可能在較短的期間內執行更多部署。

  • 藉由減少控制和可觀察性表面的數目,增加密度以簡化作業,也可能會導致可用性風險增加,因為故障或設定錯誤會增加不穩定事件的影響半徑。

使用安全性的卓越營運取捨

取捨:增加介面區。 安全性要素會針對元件和作業的曝光量,建議降低工作負載介面區。 此縮減可最小化攻擊媒介,並產生較小的安全性控制和測試範圍。

  • 圍繞工作負載並支援其作業的元件,例如自動化或自訂控制平面,也必須在一般安全性強化和測試的範圍內。

  • 例行、臨機操作和緊急作業會增加與工作負載的連絡點。 零信任方法會要求這些進程被視為攻擊媒介,而且必須包含在工作負載的安全性控制項和驗證中。

  • 系統的可觀察性平臺會收集工作負載的相關記錄和計量,這可以是重要的資訊洩漏來源。 因此,工作負載的安全性必須擴充,以保護資料接收免于內部和外部威脅。

  • 建置代理程式、外部化組態和功能切換存放區,以及並存部署方法,都會增加需要安全性的應用程式介面區。

  • 由小型、累加變更或「取得目前、保持最新」工作所造成的部署頻率較高,會導致軟體發展生命週期中更多的安全性測試。

取捨:提高透明度的需求。 安全工作負載是以保護流經系統元件之資料的機密性設計為基礎。

可觀察性平臺擷取所有類型的資料,以深入瞭解工作負載的健康情況和行為。 當小組嘗試提高可觀察性資料精確度時,來源系統的資料分類控制,例如資料遮罩,不會延伸到可觀察性平臺的記錄和記錄接收的風險增加。

取捨:減少分割。 隔離存取和函式的重要安全性方法是設計強式分割策略。 此設計是透過資源隔離和身分識別控制項來實作。

  • 在共用計算、網路和資料資源中共置不同的應用程式元件,讓管理更容易反向分割,或讓角色型分割難以達成。 共置元件可能也需要共用工作負載身分識別,這可能會導致許可權過度指派或缺乏可追蹤性。

  • 從統一記錄接收中收集系統的所有記錄,可讓查詢和建置警示變得更容易。 不過,這麼做也可以讓資料列式安全性更困難或不可能,以便以必要的稽核控制項處理敏感性資料。

  • 藉由減少角色及其指派的細微性,簡化屬性型或角色型安全性的管理,可能會導致不適當的廣泛許可權。

成本優化的運作卓越取捨

營運卓越支柱永遠不會建議降低生產力或危害工作負載投資報酬率的活動。 似乎將焦點從傳遞活動轉移的建議納入工作負載和小組的長期最佳興趣。 如果您的工作負載接近其終止日期,則對觸發這些取捨的建議非常有意義。

取捨:增加資源支出。 工作負載的主要成本驅動程式是其資源的成本。 部署較少的資源、適當調整資源大小,以及降低耗用量通常有助於降低成本。

  • 即使變更相對較小,實作安全部署做法可能會導致同時部署的資源數目增加。 這些模式需要部署應用程式或基礎結構元件的多個並行實例,以便以受控制的方式轉移流量。 此增加在使用不可變基礎結構方法的工作負載中更明顯。

  • 小組可能需要引進其他工作負載元件,才能實作作業上對齊的雲端設計模式或工作負載自動化。 例如,為了支援部署靈活度,他們可能會新增閘道路由元件。 為了支援更好的組態管理,他們可能會新增外部組態存放區。 為了支援租使用者生命週期事件,他們可能會建置控制平面。 這些資源也會影響生產前環境的成本。

  • 增加生產前環境的數目,以透過隔離來改善開發和測試體驗,也會增加資源數目。 這些資源不會用來根據生產需求提供供應專案,因此會增加解決方案的成本。

  • 根據資源計數、SKU 和資料磁片區,增加生產環境與生產環境的同位,可改善品質保證程式。 成本隨著同位增加而增加。

  • 雖然遙測資料不是直接資源,但若要啟用可觀察性平臺的有效性,則必須保存此資料。 大部分的作業資料存放區都有以擷取速率和磁片區組合為基礎的定價。 一般而言,隨著低延遲、高多樣性遙測的數量增加,成本也會增加。 針對多區域部署,這些作業資料接收預期會針對每個區域部署,因此任何每個資源的成本都會成為因素。

取捨:減少著重于傳遞活動。 工作負載小組成員藉由有效率地執行符合其功能的工作,來提供更高的工作負載價值。

  • 花費時間建立和精簡狀況良好且負責任支援結構和事件回應的工作負載小組,為工作負載的使用者提供寶貴的服務。 例如,隨著支援工作增加 (,正式的通話輪替) ,通常是因為業務關鍵性的變更,這些活動的成本會增加。 此成本增加可能是增加員工的結果,或可能會間接地以從傳遞活動轉移至支援函式的注意形式產生。

  • 訓練是工作負載小組個人持續改進程式的重要部分。 此訓練在個人擴充期間可以是正式或自我導向。 隨著定型時間增加,可供直接開發工作負載的時間量會減少。 當定型不是以角色為基礎或與工作負載或其未來特別相關的時,訓練投資就會降低。

  • 用於保護工作負載可靠性、安全性和效能效率的標準化例行作業工作需要一段時間來定義、精簡和執行。 這次不會直接花費在傳遞上。 這些工作的一些範例包括完整的變更影響分析、變更控制程式、徹底測試,以及增加修補程式管理。 隨著這些工作的頻率、全面性或作業負擔增加,投資的時間也會增加。

取捨:增加工具需求和多樣性。 成本優化要素建議減少工具擴展、合併廠商,以及所有工具購買的正確大小方法。

工作負載小組會購買工具和硬體,以支援在整個軟體發展生命週期期間執行的活動, (SDLC) ,包括規劃和設計、開發和測試和監視。 此空間中工具的市集正在成長。 工具會以各種價格點提供,這些價格點通常對應至工具的特性和功能。 除了免費供應專案之外,這些工具會產生初始授權成本,可能是每個基座或全月臺。 它們通常需要進行中的維護合約。 可能需要建立新的廠商關聯性。 以下是一些與營運卓越原則相關聯的預期工具或硬體支出範例:

  • 需求和待辦專案管理
  • 架構設計工具
  • UI/UX 設計工具
  • 程式碼和資產裝載
  • 程式碼和低程式碼開發環境
  • 自動化工具
  • 開發和品質保證工作站
  • 開發和部署管線
  • 測試執行和追蹤
  • 可觀察性工具

效能效率的營運卓越取捨

取捨:增加資源使用率。 效能效率要素建議盡可能配置可用的計算和網路,以符合工作負載的需求。

  • 工作負載的可觀察性架構需要架構中的元件配置時間和資源,以建立、收集及串流記錄和計量。 這些資料點有助於確保能夠有效警示和監視可靠性、安全性和效能。 隨著檢測層級增加,系統資源的負擔也可能會增加。

  • 某些部署模型,例如工作負載可能用於安全部署的藍色/綠色部署,可能會在生產應用程式平臺上引進並存部署。 這些部署需要先占式調整,以提供足夠的供應專案以符合未來的需求,或讓大部分休眠的部署保留一段時間才能支援復原。

取捨:增加延遲。 為了建立高效能的工作負載,小組會尋找減少工作負載執行其工作所耗用的時間和資源的方式。

  • 許多部署模型都需要使用閘道路由存取模式,這可能會導致延遲。 此延遲會根據相關流程的效能目標預算來繪製。

  • 某些支援「隨著時間獨立變更」方法的雲端設計模式,以支援累加式改善的理想,可能會因為周遊其他元件而造成延遲。 閘道、傳訊代理程式或防損毀層可以導入此延遲。

探索其他要素的取捨: