什么是监视?

监视实时显示生产数据

监视提供来自生产的反馈。 监视提供有关应用程序的性能和使用模式的信息。

监视的一个目标是通过最小化按时间度量的关键指标来实现高可用性:

  • 出现性能或其他问题时,有关问题的丰富诊断数据会通过自动监视反馈给开发团队。 是时候检测 TTD ( 了) 。
  • DevOps 团队根据信息尽快解决问题,使用户不再受到影响。 现在, 可以缓解 (TTM) 。
  • 测量解决时间,团队会随着时间的推移努力改进。 缓解后,团队会努力解决根本原因问题,使问题不再发生。 该是 修正 TTR () 。

监视的第二个目标是通过跟踪使用情况 启用经过验证的学习。 验证学习的核心概念是,每个部署都是跟踪支持或减少导致部署假设的实验结果的机会。 通过跟踪版本之间的使用情况和差异,团队可以衡量更改的影响并驱动业务决策。 如果假设降低,团队可能会快速 失败或__透视。 如果假设受支持,则团队可以双倍减少或 坚持。 这些数据明智的决策会导致对积压工作的新假设和优先级。

遥测 是一种从监视中收集数据的机制。 遥测可以使用部署环境中安装的代理、依赖于插入到源代码中的标记的 SDK、服务器日志记录或这些标记的组合。 通常,遥测会区分针对实时警报和仪表板优化的数据管道,以及故障排除或使用情况分析所需的更高容量的数据。

综合监视 使用一组一致的事务来评估性能和可用性。 综合事务是可预测的测试,其优势在于允许以高度可预测的方式将不同版本进行比较。 另一方面,真正的用户监视 (RUM) 这意味着用户浏览器、移动设备或桌面的经验测量,以及 上一英里 的情况(例如手机网络、internet 路由和缓存)的帐户。 与 synthetics 不同,RUM 通常不提供一段时间内的可重复测量。

监视通常用于 在生产环境中进行测试。 监视良好的部署会流式传输有关其运行状况和性能的数据,以便团队能够立即发现生产事件。 与 连续部署版本管道结合使用时,监视将检测新的异常,并允许进行提示缓解。 这允许在预生产环境中无法预见的应用程序行为中发现 未知未知 问题。

有效的监视至关重要,可让 DevOps 团队快速交付、从生产中获取反馈,并提高客户满意度、购置和保留期。

详细了解 Azure Monitor的监视功能。

了解如何设置和使用 Application Insights 进行监视