Агрегирование и сбор событий с помощью системы диагностики Azure для Linux

Статья
06/01/2023

Во время работы кластера Azure Service Fabric рекомендуется централизованно собирать журналы со всех узлов. Централизованное хранение журналов упрощает анализ и устранение неполадок в кластере, а также в приложениях и службах, работающих в этом кластере.

Один из способов отправки и сбора журналов заключается в использовании расширения системы диагностики Azure для Linux (LAD), которое отправляет журналы в службу хранилища Azure, а также может отправлять журналы в Azure Application Insights или Центры событий. Вы также можете использовать внешний процесс, чтобы считывать события из хранилища и передавать их в платформу обработки, например в журналы Azure Monitor или другое решение для анализа журналов.

Источники журналов и событий

События платформы Service Fabric

Service Fabric создает несколько готовых журналов посредством LTTng, включая журналы операционных событий и событий среды выполнения. Эти журналы хранятся в расположении, указанном в шаблоне Resource Manager кластера. Чтобы получить или задать сведения об учетной записи хранения, выполните поиск по тегу AzureTableWinFabETWQueryable и найдите StoreConnectionString.

События приложения

События, которые создаются кодом ваших приложений и служб согласно вашим указаниям во время инструментирования программного обеспечения. Вы можете использовать любое решение для ведения журналов, которое создает текстовые файлы журнала, например LTTng. Дополнительные сведения см. в описании трассировки вашего приложения в документации по LTTng.

Мониторинг и диагностика состояния служб в локальной среде разработки

Развертывание расширения системы диагностики

Первым шагом при сборе журналов является развертывание расширения системы диагностики на каждой виртуальной машине в кластере Service Fabric. Расширение системы диагностики собирает журналы на каждой виртуальной машине и отправляет их в указанную учетную запись хранения.

Чтобы развернуть расширение системы диагностики на виртуальных машинах в кластере в ходе его создания, переключите параметр Диагностика в состояние Вкл. После создания кластера этот параметр нельзя изменить с помощью портала. Соответствующие изменения необходимо будет внести в шаблоне Resource Manager.

Это необходимо для того, чтобы настроить агент LAD для наблюдения за указанными файлами журнала. Каждый раз при добавлении новой стройки в файл он создает запись системного журнала, которая отправляется в указанное вами хранилище (таблицу).

Дальнейшие действия

Дополнительные сведения о том, какие события нужно анализировать при устранении неполадок, см. в документации по LTTng и статье Использование диагностического расширения Linux для мониторинга данных о состоянии и производительности виртуальных машин под управлением Linux.
Настройте агент Log Analytics для сбора метрик, мониторинга развернутых в кластере контейнеров и визуализации журналов.