你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

通过 Azure Monitor 日志进行事件分析和可视化

Azure Monitor 日志收集并分析云中托管的应用程序和服务的遥测,并提供分析工具以帮助最大限度地提高其可用性和性能。 本文概述如何在 Azure Monitor 日志中运行查询,以获取见解并排查群集中发生的问题。 本文解决以下常见问题:

  • 如何排查运行状况事件问题?
  • 如何知道节点已关闭?
  • 如何知道我的应用程序服务已启动或停止?

注意

本文最近已更新,从使用术语“Log Analytics”改为使用术语“Azure Monitor 日志”。 日志数据仍然存储在 Log Analytics 工作区中,并仍然由同一 Log Analytics 服务收集并分析。 我们正在更新术语,以便更好地反映 Azure Monitor 中的日志的角色。 有关详细信息,请参阅 Azure Monitor 术语更改

Log Analytics 工作区概述

注意

虽然默认情况下诊断存储已在群集创建时启用,但你仍必须设置 Log Analytics 工作区以从诊断存储中读取。

Azure Monitor 日志从托管资源(包括 Azure 存储表或代理)收集数据,并在中央存储库中维护这些数据。 之后这些数据可用于分析、报警、可视化或进一步导出。 Azure Monitor 日志支持事件、性能数据或任何其他的自定义数据。 查看配置诊断扩展以聚合事件的步骤创建 Log Analytics 工作区以从存储中的事件读取数据的步骤,确保数据流入 Azure Monitor 日志。

Azure Monitor 日志收到数据后,Azure 会提供多个预打包的监视解决方案或操作仪表板,来监视传入数据并根据几个场景进行自定义。 包括 Service Fabric 分析解决方案和容器解决方案。使用 Service Fabric 群集时,这两种解决方案与诊断和监视最为相关。 本文介绍如何使用在工作区中创建的 Service Fabric 分析解决方案。

访问 Service Fabric 分析解决方案

Azure 门户中,转到在其中创建了 Service Fabric 分析解决方案的资源组。

选择资源 ServiceFabric<nameOfOMSWorkspace>

Summary 中,将看到每个已启用的解决方案的图形形式的磁贴,包括 Service Fabric 的磁贴。 单击 Service Fabric 图形以转到 Service Fabric 分析解决方案。

Service Fabric 解决方案

下图是 Service Fabric 分析解决方案的主页。 此主页提供了群集中正在发生的事件的快照视图。

屏幕截图显示了 Service Fabric 分析解决方案的主页。

如果创建群集时启用了诊断,则可以看到以下对象的事件:

备注

除了现成的 Service Fabric 事件之外,可以通过更新诊断扩展的配置来收集更详细的系统事件。

查看 Service Fabric 事件,包括对节点执行的操作

在“Service Fabric 分析”页上,单击“Service Fabric 事件”对应的图形

Service Fabric 解决方案操作通道

单击“列表”,在列表中查看事件。 打开该列表后,将会看到已收集的所有系统事件。 以下内容摘自 Azure 存储帐户中的“WADServiceFabricSystemEventsTable”以供参考,类似地,接下来看到的 Reliable Services 和 Reliable Actors 事件也都摘自相应的表。

查询操作通道

或者,可以单击左侧的放大镜并使用 Kusto 查询语言找到所需的内容。 例如,若要查找针对群集中的节点执行的所有操作,可以使用以下查询。 在操作通道事件参考中可以找到下面使用的事件 ID。

ServiceFabricOperationalEvent
| where EventId < 25627 and EventId > 25619 

可以基于其他许多字段执行查询,例如,特定的节点(计算机)、系统服务 (TaskName)。

查看 Service Fabric Reliable Services 和 Reliable Actors 事件

在“Service Fabric 分析”页上,单击“Reliable Services”对应的图形

Service Fabric 解决方案 Reliable Services

单击“列表”,在列表中查看事件。 在此处可以查看来自 Reliable Services 的事件。 可以看到服务 runasync 在启动和完成(通常发生在部署和升级时)时的不同事件。

查询 Reliable Services

可以类似的方式查看 Reliable Actors 事件。 若要为 Reliable Actors 配置更详细的事件,需要在诊断扩展的配置中更改 scheduledTransferKeywordFilter(如下所示)。 Reliable Actors 事件参考中提供了这些参数值的详细信息。

"EtwEventSourceProviderConfiguration": [
                {
                    "provider": "Microsoft-ServiceFabric-Actors",
                    "scheduledTransferKeywordFilter": "1",
                    "scheduledTransferPeriod": "PT5M",
                    "DefaultEvents": {
                    "eventDestination": "ServiceFabricReliableActorEventTable"
                    }
                },

Kusto 查询语言非常强大。 可以运行另一个有用查询来找出哪些节点正在生成大多数事件。 以下屏幕截图中的查询显示了与特定服务和节点聚合的 Reliable Services 操作事件。

每个节点的查询事件

后续步骤