成本優化取捨

當您設計工作負載以在財務限制下將投資報酬率最大化 (ROI) 時,您必須先清楚定義功能和非功能需求。 工作和工作優先順序策略是不可或缺的。 基礎是一個具有強烈財務責任感的小組。 小組應該對可用技術和計費模型有強烈瞭解。

瞭解工作負載的 ROI 之後,您就可以開始加以改善。 若要改善 ROI,請考慮根據 成本優化設計原則成本優化設計檢查清單中的 建議,如何影響其他 Azure Well-Architected Framework 要素的目標和優化。 針對成本優化,請務必避免專注於較便宜的解決方案。 只著重於將支出降至最低的選項,可能會增加降低工作負載業務目標和信譽的風險。 本文說明在考慮成本優化的目標設定、設計和作業時,工作負載小組可能會遇到的範例取捨。

成本優化與可靠性的取捨

服務中斷的成本必須根據防止或復原的成本來測量。 如果中斷成本超過可靠性設計的成本,您應該投資更多來避免或減輕中斷。 相反地,可靠性工作的成本可能超過中斷的成本,包括合規性需求和信譽等因素。 您應該只在此案例中考慮可靠性設計的策略性分量。

取捨:降低復原能力。 工作負載會納入復原措施,以嘗試避免並承受特定類型和故障數量。

  • 為了節省成本,工作負載小組可能會過度布建元件或過度限制其調整規模,讓元件在突然的需求暴增期間更容易失敗。

  • 將工作負載資源合併 (增加密度) 的成本優化,可讓個別元件在需求尖峰和更新等維護作業期間更可能失敗。

  • 拿掉支援復原設計模式的元件,例如訊息總線,以及建立直接相依性可減少自我保留功能。

  • 藉由減少備援來節省成本,可能會限制工作負載處理並行故障的能力。

  • 使用預算 SKU 可能會限制工作負載可以達到的最大服務等級目標 (SLO) 。

  • 設定硬性消費限制可防止工作負載調整以符合合法需求。

  • 如果沒有可靠性測試工具或測試,工作負載的可靠性是未知的,而且不太可能符合可靠性目標。

取捨:有限的復原策略。 可靠的工作負載具有災害案例的測試事件回應和復原計劃。

  • 降低工作負載災害復原計劃的測試或鑽研可能會影響復原作業的速度和效率。

  • 建立或保留較少的備份會減少可能的恢復點,並增加遺失數據的機會。

  • 成本較低的支援合約可能會因為技術協助的延遲而增加工作負載復原時間。

取捨:提高複雜度。 使用簡單方法的工作負載,並避免不必要的或過度複雜度,在可靠性方面通常更容易管理。

  • 使用成本優化雲端模式可以新增元件,例如內容傳遞網路 (CDN) ,或將職責轉移至工作負載必須提供可靠性目標的邊緣和用戶端裝置。

  • 事件型調整可能會比以資源為基礎的調整更複雜,以微調和驗證。

  • 透過數據生命週期動作減少數據量和分層數據,可能會與在生命週期事件之前實作匯總的數據點結合,引進在工作負載中考慮的可靠性因素。

  • 使用不同的區域來優化成本,可能會讓管理、網路和監視變得更困難。

安全性的成本優化取捨

對工作負載中機密性、完整性和可用性的危害成本,必須一律與防止該入侵的工作成本平衡。 安全性事件可能會對公司信譽造成各種財務和法律影響,並傷害公司信譽。 投資安全性是風險降低活動。 發生風險的成本必須與投資平衡。 根據規則,請勿危害安全性,以取得低於責任點並同意風險降低的成本優化。 藉由將解決方案正規化來優化安全性成本是一項重要的優化做法,但請注意,執行這項操作時,應該注意如下的取捨。

取捨:降低安全性控制。 安全性控制是跨多層建立的,有時會重複,以提供深度防禦。

其中一個成本優化策略是尋找移除累算單位或營運成本之元件或程式的方法。 請注意,為了節省成本而移除類似下列範例的安全性元件會影響安全性。 您必須仔細執行此影響的風險分析。

  • 減少或簡化驗證和授權技術會危害零信任架構 的明確 驗證原則。 這些簡化的範例包括使用基本身份驗證配置,例如預先共用密鑰,而不是投資時間來學習產業 OAuth 方法,或使用簡化的角色型訪問控制指派來減少管理額外負荷。

  • 拿掉傳輸中加密或待用加密,以減少憑證及其作業程式的成本,會將數據公開給潛在的完整性或機密性缺口。

  • 由於相關的成本和時間投資,移除或減少安全性掃描或檢查工具或安全性測試,可能會直接影響工具和測試旨在保護的機密性、完整性或可用性。

  • 減少安全性修補的頻率,因為投入在編錄和執行修補的作業時間,會影響工作負載解決不斷演進的威脅。

  • 拿掉防火牆之類的網路控制可能會導致無法封鎖惡意的輸入和輸出流量。

取捨:增加的工作負載介面區。 安全性要素會優先處理縮減且包含的介面區,以將攻擊向量與安全性控制的管理降到最低。

將成本優化的雲端設計模式有時需要引進其他元件。 這些額外的元件會增加工作負載的介面區。 元件和數據內的元件必須受到保護,可能以系統尚未使用的方式保護。 這些元件和數據通常受限於合規性。 可匯入元件的模式範例包括:

  • 使用靜態內容裝載模式將數據卸除至新的 CDN 元件。

  • 使用「下階金鑰」模式卸載處理和保護用戶端計算的資源存取。

  • 使用 Queue-Based 負載撫平模式,藉由引進訊息總線來降低成本。

取捨:已移除分割。 安全性要素會優先處理強式分割,以支援目標安全性控件的應用,以及控制彈射半徑。

共用資源,例如在多租用戶的情況下或在共用應用程式平臺上共置多個應用程式,是藉由增加密度並降低管理介面來降低成本的方法。 這種增加的密度可能會導致安全性考慮如下:

  • 共用資源的元件之間的橫向移動比較容易。 危害應用程式平臺主機或個別應用程式可用性的安全性事件,也有較大的快取半徑。

  • 共置資源可能會共用工作負載身分識別,並在存取記錄中具有較不有意義的稽核線索。

  • 網路安全性控制必須夠廣泛,才能涵蓋所有共置的資源。 此設定可能會違反某些資源最低許可權原則。

  • 在共用主機上共置不同的應用程式或數據,可能會導致將合規性需求和安全性控制延伸至其他範圍以外的應用程式或數據。 這擴大範圍需要對共置元件進行額外的安全性檢查和稽核工作。

營運卓越的成本優化取捨

取捨:SDLC) 容量 (遭入侵的軟體開發生命週期。 工作負載的 SDLC 程式提供更嚴格、一致性、特定性和優先順序,以變更工作負載中的管理。

  • 減少測試工作以節省時間,以及與測試人員、資源和工具相關聯的成本,可能會導致生產環境中發生更多錯誤。

  • 延遲支付技術債務,將人員投入的焦點放在新功能上,可能會導致開發週期變慢,以及整體降低的靈活度。

  • 將檔取消設定為將焦點放在軟體開發上,可能會導致新員工更久的上線時間、影響事件回應的有效性,以及危害合規性需求。

  • 缺乏訓練投資會導致技能過時,減少小組採用較新技術和做法的能力。

  • 移除自動化工具以節省成本,會導致人員花費更多時間處理不再自動化的工作。 它也會增加錯誤和不一致的風險。

  • 減少規劃工作,例如範圍和活動優先順序,以減少費用,可能會因為模糊規格和實作不佳而增加重新工作的可能性。

  • 避免或減少持續改善活動,例如回顧和事件後報告,讓工作負載小組專注於傳遞,可以建立遺漏的機會,以優化例行、非計劃性及緊急程式。

取捨:減少可檢視性。 需要可檢視性,才能協助確保工作負載具有有意義的警示和成功的事件回應。

  • 減少記錄和計量磁碟區以節省記憶體和傳輸成本,可降低系統可檢視性,並可能導致:

    • 建立與可靠性、安全性和效能相關的警示的數據點較少。
    • 事件回應活動的涵蓋範圍差距。
    • 與安全性或合規性相關的互動或界限的可檢視性有限。
  • 成本優化設計模式可以將元件新增至工作負載,增加其複雜性。 工作負載監視策略必須包含這些新元件。 例如,某些模式可能會導入跨越多個元件或將進程從伺服器移轉至用戶端的流程。 這些變更會增加相互關聯和追蹤資訊的複雜度。

  • 降低對可觀察性工具及有效儀錶板維護的投資,可減少從生產環境學習、驗證設計選擇,以及通知產品設計的能力。 這項減少也可以影響事件響應活動,並讓符合復原時間目標和 SLO 更困難。

取捨:延後維護。 工作負載小組預期會以及時且有順序的方式,讓程式代碼、工具、軟體套件和操作系統修補並保持最新狀態。

  • 讓工具廠商的維護合約過期可能會導致遺漏的優化功能、錯誤解決和安全性更新。

  • 增加系統修補程式之間的時間以節省時間,可能會導致遺漏的錯誤修正或缺乏保護,以防止不斷演進的安全性威脅。

效能效率的成本優化取捨

成本優化和效能效率要素會優先處理工作負載的價值。 效能效率強調符合效能目標,而不需要花費更多費用。 成本優化強調將工作負載資源所產生的價值最大化,而不會超過效能目標。 因此,成本優化通常會改善效能效率。 不過,有與成本優化相關聯的效能效率取捨。 這些取捨可能會使達到效能目標變得更困難,並阻礙進行中的效能優化。

取捨:過度布建或未調整的資源。 效能有效率的工作負載有足夠的資源可提供需求,但不會有過多未使用的額外負荷,即使使用量模式變動也一樣。

  • 藉由縮小資源大小來降低成本,可能會降低資源的應用程式。 應用程式可能無法處理顯著的使用模式波動。

  • 限制或延遲調整為上限或降低成本,可能會導致供應不足以符合需求。

  • 為了降低成本而積極相應減少的自動調整設定,可能會讓服務因需求突然暴增而未準備,或造成頻繁的調整波動 () 。

取捨:缺少一段時間的優化。 評估功能變更、使用模式變更、新技術和工作負載上不同方法的影響,是嘗試提升效率的一種方式。

  • 限制專注於開發效能優化的專業知識,以排定傳遞優先順序,可能會導致遺漏改善資源使用量效率的機會。

  • 拿掉存取效能測試或監視工具會增加未偵測到效能問題的風險。 它也會限制工作負載小組在測量/改善週期上執行的能力。

  • 忽略容易降低效能的區域,例如數據存放區,可能會逐漸降低查詢效能,並提升整體系統使用量。

探索其他要素的取捨: