Azure 監視器記錄的事件分析和視覺化

Azure 監視器記錄會從裝載於雲端的應用程式和服務收集和分析遙測,並提供分析工具來協助您將其可用性和效能最大化。 本文將概述如何在 Azure 監視器記錄中執行查詢,以便深入了解叢集發生什麼狀況並進行疑難排解。 我們將討論下列常見的問題:

  • 如何針對健康情況事件進行疑難排解?
  • 如何知道節點發生故障?
  • 如何知道我的應用程式服務已經啟動或停止?

注意

本文最近有所更新,改為使用「Azure 監視器記錄」一詞,而非 Log Analytics。 記錄資料仍儲存在 Log Analytics 工作區中,並仍由相同的 Log Analytics 服務收集和分析。 我們會持續更新術語,以更精確地反映 Azure 監視器記錄的角色。 如需詳細資料,請參閱 Azure 監視器遙測變更

Log Analytics 工作區概觀

注意

雖然在叢集建立時預設會啟用診斷儲存體,但您仍必須設定 Log Analytics 工作區才能讀取診斷儲存體。

Azure 監視器記錄會從受控資源 (包括 Azure 儲存體資料表或代理程式) 收集資料,並在中央存放庫中維護資料。 此資料可接著用於分析、警示和視覺效果,或進一步匯出。 Azure 監視器記錄會支援事件、效能資料或任何其他自訂資料。 請查看如何設定分析延伸模組來彙總事件以及如何建立 Log Analytics 工作區來讀取儲存體中的事件,以確定資料會流入 Azure 監視器記錄。

Azure 監視器記錄收到資料之後,Azure 會針對數個案例自訂數個監視解決方案,這些預先封裝的解決方案或操作儀表板可監視傳入資料。 其中包括 Service Fabric 分析解決方案和容器解決方案,這是與使用 Service Fabric 叢集進行診斷和監視最相關的兩個解決方案。 本文說明如何使用 Service Fabric 分析解決方案,它是用工作區建立的。

存取 Service Fabric 分析解決方案

Azure 入口網站中,移至您建立 Service Fabric 分析解決方案所在的資源群組。

選取資源 ServiceFabric<nameOfOMSWorkspace>

Summary 中,您會看到每一個所啟用解決方案的圖格以圖形形式顯示,其中一個屬於 Service Fabric。 按一下 [Service Fabric] 圖形以繼續進行「Service Fabric 分析」解決方案。

Service Fabric solution

下圖顯示 Service Fabric 分析解決方案的首頁。 這個首頁提供叢集中目前情況的快照集檢視。

Screenshot that shows the home page of the Service Fabric Analytics solution.

如果您建立叢集的時候啟用了分析功能,就可以看到以下各項的事件

注意

除了現有的 Service Fabric 事件外,更新分析延伸模組的設定可以收集更詳細的系統事件。

檢視 Service Fabric 事件,包括節點上的動作

在 Service Fabric 分析頁面上,按一下 Service Fabric 事件的圖形。

Service Fabric Solution Operational Channel

按一下 [清單] 來檢視清單中的事件。 這裡您會看到所有收集的系統事件。 為了方便參考,這些記錄均來自 Azure 儲存體帳戶中的 WADServiceFabricSystemEventsTable,而且同樣地,您接下來看到的 Reliable Service 和 Actor 事件均分別來自那些表格。

Query Operational Channel

或者您可以按一下左邊的放大鏡,然後使用 Kusto 查詢語言來尋找您想要的資料。 例如,如果想尋找針對叢集節點所採取的動作,您可以使用下列查詢。 下面使用的事件識別碼,可以在操作通道事件參考中找到。

ServiceFabricOperationalEvent
| where EventId < 25627 and EventId > 25619 

您可以查詢很多欄位,例如特定的節點 (電腦)、系統服務 (TaskName) 等。

檢視 Service Fabric Reliable Service 和 Actor 事件

在 Service Fabric 分析頁面上,按一下 Reliable Services 的圖形。

Service Fabric Solution Reliable Services

按一下 [清單] 來檢視清單中的事件。 這裡您會看到來自 Reliable Services 的事件。 啟動及完成 runasync 服務時,您可以看到不同的事件,它們通常是在部署和升級發生的。

Query Reliable Services

以類似的方式,就可以檢視 Reliable Actor 事件。 若要為 Reliable Actor 設定更詳細的事件,您需要到分析延伸模組的設定中去變更 scheduledTransferKeywordFilter (如下所示)。 Reliable Actor 事件參考會有這些事件值的詳細資料。

"EtwEventSourceProviderConfiguration": [
                {
                    "provider": "Microsoft-ServiceFabric-Actors",
                    "scheduledTransferKeywordFilter": "1",
                    "scheduledTransferPeriod": "PT5M",
                    "DefaultEvents": {
                    "eventDestination": "ServiceFabricReliableActorEventTable"
                    }
                },

Kusto 查詢語言功能很強大。 您可以執行的另一個重要查詢是找出哪些節點會產生最多事件。 下列螢幕擷取畫面中的查詢會顯示如何使用特定服務和節點來彙總 Service Fabric 操作事件。

Query Events per Node

下一步