Agregação e coleção de eventos com o Linux Diagnóstico do Azure

Quando está a executar um cluster do Azure Service Fabric, é aconselhável recolher os registos de todos os nós numa localização central. Ter os registos numa localização central ajuda-o a analisar e resolver problemas no cluster ou problemas nas aplicações e serviços em execução nesse cluster.

Uma forma de carregar e recolher registos é utilizar a extensão Diagnóstico do Azure (LAD) do Linux, que carrega registos para o Armazenamento do Azure, e também tem a opção de enviar registos para Aplicação Azure Insights ou Hubs de Eventos. Também pode utilizar um processo externo para ler os eventos a partir do armazenamento e colocá-los num produto de plataforma de análise, como registos do Azure Monitor ou outra solução de análise de registos.

Origens de eventos e registos

Eventos da plataforma do Service Fabric

O Service Fabric emite alguns registos fora da caixa através do LTTng, incluindo eventos operacionais ou eventos de runtime. Estes registos são armazenados na localização especificada pelo modelo de Resource Manager do cluster. Para obter ou definir os detalhes da conta de armazenamento, procure a etiqueta AzureTableWinFabETWQueryable e procure StoreConnectionString.

Eventos da aplicação

Eventos emitidos a partir do código das aplicações e dos serviços, conforme especificado por si ao instrumentar o software. Pode utilizar qualquer solução de registo que escreva ficheiros de registo baseados em texto, por exemplo, LTTng. Para obter mais informações, veja a documentação LTTng sobre o rastreio da sua aplicação.

Monitorizar e diagnosticar serviços numa configuração de desenvolvimento de máquinas locais.

Implementar a extensão diagnóstico

O primeiro passo na recolha de registos é implementar a extensão diagnóstico em cada uma das VMs no cluster do Service Fabric. A extensão Diagnóstico recolhe registos em cada VM e carrega-os para a conta de armazenamento que especificar.

Para implementar a extensão diagnóstico nas VMs no cluster como parte da criação do cluster, defina Diagnóstico comoAtivado. Depois de criar o cluster, não pode alterar esta definição com o portal, pelo que terá de fazer as alterações adequadas no modelo de Resource Manager.

Isto configura o agente LAD para monitorizar os ficheiros de registo especificados. Sempre que uma nova linha é anexada ao ficheiro, cria uma entrada syslog que é enviada para o armazenamento (tabela) que especificou.

Passos seguintes

  1. Para compreender mais detalhadamente que eventos deve examinar durante a resolução de problemas, veja Documentação ltTng e Utilizar LAD.
  2. Configure o agente do Log Analytics para ajudar a recolher métricas, monitorizar contentores implementados no cluster e visualizar os registos