溝通與共同作業

已完成

在整個事件回應生命週期中,及時且清楚地共用資訊對於有效回應事件而言至關重要。 每個階段的溝通都相當關鍵:

  • 偵測:在事件發生時適當人員溝通,告知事件性質以及其影響的程度。
  • 回應:在診斷流程中,傳遞事件的詳細資訊、需要哪些步驟來修正問題,以及各自負責的工作。
  • 補救措施:商討服務可還原至正常作業的時間,以及後續追蹤的必要動作。
  • 「分析」:交流從事件中學習到的經驗、可執行哪些動作來避免再次發生。
  • 整備程度:將針對事件所制定的變更 (或必要的變更) 導入事件回應規劃、程序和系統。

視清楚的溝通為當務之急

稍早在本課程模組中曾提到,最高/高執行效率的組織會採取主動而非回應式方法。 若要將狀態從被動轉變為有效針對事件採取回應,您需要優先考量並實現良好、清楚、正確的溝通。

設立清楚的溝通包含幾項要素:

  • 確保在過程每個步驟中共用所發生狀況的相關資訊。
  • 記錄資訊;將資訊寫下,使其較不會遭到誤解或遺忘。
  • 將資訊置於集中的位置,讓所有需要的人員都能存取。
  • 使用工具來增加溝通效率。

雖然沒有提到,但我們已經在上一個單元中示範了上述所有行為。

溝通工具:ChatOps

在談論溝通工具之前,您必須先了解何謂 ChatOps,ChatOps 並不是指特定的工具,而是藉由溝通驅動的合作模式。 在開發人員之間,此模式常用於將人員、工具、流程和自動化整合在一起。 ChatOps 提供更好的小組合作方式,利用群組聊天來共同作業,而無需依賴較舊的技術 (例如電子郵件)。

ChatOps 使用更先進的形式,透過自訂的機器人與人工智慧將工作自動化。 當身處於事件回應中,您可使用 ChatOps 將群組聊天工具應用於溝通之中。 透過這種工作方式,能夠大幅激勵工程師在群組聊天中合作,共同處理問題與事件,當然也包含一般的工程工作。

群組聊天有助以機構知識的層面來傳達系統狀況,人員無需再將資訊死記於腦中,而是透過聊天與其他人共用和使用。

這麼做能提高小組整體的可見度與作業意識,並協助其他人了解如何執行各自的工作。 當在聊天中施行命令及共用正在進行的作業時,您同時也在指導其他人要做什麼,以及如何執行。

學習是在工程中共用所發生情況的副產品。 當對同儕和同事具備更深入的了解,且領導者正在進行操作和思考 (包括其進行決策的方式) 時,您即可對正在發生的事件產生更多共鳴。 這一切在開始將工作移到聊天時會更自然地發生。

在 ChatOps 解決方案中使用 Microsoft Teams

您已了解在事件期間 Microsoft Teams 可作為溝通工具組中一個重要部份的原因。 您可建立對話橋樑,並為事件準備專用的頻道,甚至是使用 Logic Apps 來自動化將事件詳細資料張貼到頻道的過程。

因為 Microsoft Teams 是一種可供在其中具備許多與工程工作相關對話的集中位置,這是開始 ChatOps 解決方案,並提供狀態更新與其他內容的良好位置。

例如,您可使用 Teams 的 Webhook 來更新狀態頁面。 您可以將 Teams 設定為在聊天中接聽特定命令,並在接收到這些特定命令時,將要求傳送到另外一個應用程式。 這個簡單應用程式可以是 Azure 函式,其使用進展中事件相關資訊來更新儲存在 Azure Blob 儲存體中的靜態 HTML 頁面。 最後的結果是,這個聊天中簡單命令可為不在聊天中的其他利害關係人提供更新。 這一個簡單步驟可節省時間在更新那些並未涉及回應的人員。

到目前為止,我們花了大部分時間在查看補救前的各個階段上。 現在讓我們將焦點轉移到改善該階段的方法。

檢定您的知識

1.

何謂 ChatOps?