Azure 監視器中的代理程式健全狀況解決方案

Azure 中的代理程式健全狀況解決方案可協助您瞭解哪些監視代理程式沒有回應,以及提交運算元據。 這包括所有直接向 Log Analytics 工作區報告的代理程式 Azure 監視器或連接到 Azure 監視器的 System Center Operations Manager 管理群組。

您也可以使用代理程式健全狀況解決方案來:

  • 追蹤已部署的代理程式數目,以及在地理位置分散的位置。
  • 執行其他查詢,以維護部署在 Azure、其他雲端環境或內部部署中的代理程式分佈的認知。

必要條件

部署此解決方案之前,請確認您已支援向 Log Analytics 工作區報告的Windows 代理程式,或向與您工作區整合的Operations Manager 管理群組報告。

管理組件

如果您的 Operations Manager 管理群組已連線到 Log Analytics 工作區,則下列管理組件會安裝在 Operations Manager 中。 新增此解決方案之後,這些管理元件也會安裝在直接連線的 Windows 電腦上。

  • microsoft System Center Advisor HealthAssessment Direct Channel 情報套件 (microsoft.intelligencepacks.updateassessment HealthAssessmentDirect)
  • Microsoft System Center Advisor HealthAssessment Server Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentViaServer)。

這些管理元件不需要進行任何設定或管理。 如需有關方案管理組件如何更新的詳細資訊,請參閱 將 Operations Manager 連接到 Log Analytics

組態

使用 新增解決方案中所述的程式,將代理程式健全狀況解決方案新增至您的 Log Analytics 工作區。 不需要進一步設定。

支援的代理程式

下表說明此解決方案支援的連線來源。

連線的來源 支援 描述
Windows 代理程式 系統會從直接 Windows 代理程式收集活動訊號事件。
System Center Operations Manager 管理群組 Yes 系統會從向管理群組回報的代理程式收集每隔60秒的訊號事件,然後將其轉送至 Azure 監視器。 不需要從 Operations Manager 代理程式直接連接到 Azure 監視器。 從管理群組轉送至 Log Analytics 工作區的訊號事件資料。

使用解決方案

當您將解決方案新增至 Log Analytics 工作區時, 代理程式健全狀況 磚會新增至儀表板。 此圖格會顯示過去 24 小時內的代理程式總數和沒有回應的代理程式數目。

Screenshot that shows the Agent Health tile on the dashboard.

選取 [ 代理程式健全狀況 ] 圖格,以開啟 代理程式健全狀況 儀表板。 此儀表板包含下表中的資料行。 每個資料行依計數列出前10個事件,而這些事件符合該資料行的指定時間範圍條件。 您可以選取每個資料行底下的 [ 查看全部 ],或選取資料行標題,以執行記錄搜尋來提供完整清單。

Column 描述
不同時間的代理程式計數 Linux 和 Windows 代理程式在七天期間內代理程式計數的趨勢
沒有回應的代理程式計數 過去24小時內未傳送任何心跳的代理程式清單
依作業系統類型的發佈 您的環境中有多少 Windows 和 Linux 代理程式的磁碟分割
依代理程式版本散發 在您的環境中安裝的代理程式版本的分割區,以及每個版本的計數
依代理程式類別散發 傳送訊號事件的代理程式類別的分割區:直接代理程式、Operations Manager 代理程式或 Operations Manager 管理伺服器
依管理群組散發 您環境中 Operations Manager 管理群組的磁碟分割
代理程式的地理位置 您有代理程式的國家/地區的分割區,以及每個國家/地區已安裝的代理程式數目總計
已安裝的閘道計數 已安裝 Log Analytics 閘道的伺服器數目,以及這些伺服器的清單

Screenshot that shows an example of the Agent Health solution dashboard.

Azure 監視器記錄

解決方案會在 Log Analytics 工作區中建立一種類型的記錄:信號。 心跳記錄具有下表中的屬性。

屬性 描述
Type Heartbeat
Category Direct AgentSCOM AgentSCOM Management Server
Computer 電腦名稱
OSType Windows 或 Linux 作業系統
OSMajorVersion 作業系統主要版本
OSMinorVersion 作業系統次要版本
Version Log Analytics 代理程式或 Operations Manager 代理程式版本
SCAgentChannel Direct and/or SCManagementServer
IsGatewayInstalled true 如果已安裝 Log Analytics 閘道,否則 false
ComputerIP Azure 虛擬機器的公用 IP 位址(如果有的話):Azure SNAT 位址 (不是使用私人 IP 之虛擬機器的私人 IP 位址)
ComputerPrivateIPs 電腦的私人 Ip 清單
RemoteIPCountry 電腦部署所在的地理位置
ManagementGroupName Operations Manager 管理群組的名稱
SourceComputerId 電腦的唯一識別碼
RemoteIPLongitude 電腦地理位置的經度
RemoteIPLatitude 電腦地理位置的緯度

向 Operations Manager 管理伺服器報告的每個代理程式都會傳送兩個信號。 SCAgentChannelDirectSCManagementServer 根據您在訂用帳戶中啟用的資料來源和監視解決方案而定,屬性的值將會包含和。

如果您還記得,解決方案的資料會傳送:

  • 直接從 Operations Manager 管理伺服器到 Azure 監視器
  • 直接從代理程式到 Azure 監視器,因為代理程式上收集的資料量

針對具有值的心跳事件 SCManagementServer ,此 ComputerIP 值為管理伺服器的 IP 位址,因為它會實際上傳資料。 如果 SCAgentChannel 是設定為的信號 Direct ,則是代理程式的公用 IP 位址。

記錄搜尋範例

下表提供此解決方案所收集記錄的範例記錄檔搜尋。

查詢 描述
信號 |相異電腦 代理程式總數
信號 |摘要 LastCall = 電腦的最大 (TimeGenerated) |LastCall < 前 (24 小時) 過去 24 小時內沒有回應的代理程式計數
信號 |摘要 LastCall = 電腦的最大 (TimeGenerated) |LastCall < 前 (1,500 萬次) 過去 15 分鐘內沒有回應的代理程式計數
信號 |在 TimeGenerated > 前 (24 小時) 和電腦 ( (的心跳 | 其中 TimeGenerated > 之前 (24 小時) | 相異電腦) ) | 摘要 LastCall = 電腦最多 (TimeGenerated) 過去24小時內上線的電腦
信號 |在 TimeGenerated > 前 (24 小時) 和電腦! ( (的心跳 | 其中 TimeGenerated > 之前 (30m) | 相異電腦) ) | 摘要 LastCall = 電腦最多 (TimeGenerated) 過去24小時內過去30分鐘內離線的代理程式總數 ()
信號 |摘要 AggregatedValue = dcount (電腦) by OSType 一段時間內依作業系統類型的代理程式數目趨勢
信號 |摘要 AggregatedValue = dcount (電腦) by OSType 依作業系統類型的發佈
信號 |摘要 AggregatedValue = dcount (電腦) 依版本 依代理程式版本散發
信號 |摘要 AggregatedValue = 依類別 () 計數 依代理程式類別散發
信號 |摘要 AggregatedValue = dcount (電腦) by ManagementGroupName 依管理群組散發
信號 |摘要 AggregatedValue = dcount (電腦) by RemoteIPCountry 代理程式的地理位置
信號 |where 如果 (isnotnull (toint (IsGatewayInstalled) ) ,IsGatewayInstalled = = true,IsGatewayInstalled = = "true" ) = = true |相異電腦 已安裝的 Log Analytics 閘道數目

下一步