Guida al monitoraggio del cloud: raccogliere i dati correttiCloud monitoring guide: Collect the right data

Questo articolo descrive alcune considerazioni per la raccolta dei dati di monitoraggio in un'applicazione cloud.This article describes some considerations for collecting monitoring data in a cloud application.

Per osservare l'integrità e la disponibilità della soluzione cloud, è necessario configurare gli strumenti di monitoraggio per raccogliere un livello di segnali basati su stati di errore prevedibili.To observe the health and availability of your cloud solution, you must configure the monitoring tools to collect a level of signals that are based on predictable failure states. Questi segnali sono i sintomi dell'errore e non la loro origine.These signals are the symptoms of the failure, not the cause. Gli strumenti di monitoraggio usano le metriche e, per la diagnostica avanzata e l'analisi delle cause principali, log.The monitoring tools use metrics and, for advanced diagnostics and root cause analysis, logs.

Pianificare con attenzione il monitoraggio e la migrazione.Plan for monitoring and migration carefully. Per iniziare, includere il proprietario del servizio di monitoraggio, il responsabile delle operazioni e altri membri del personale correlato durante la fase di pianificazione e continuare a coinvolgerli durante il ciclo di sviluppo e rilascio.Start by including the monitoring service owner, the manager of operations, and other related personnel during the Plan phase, and continue engaging them throughout the development and release cycle. Lo scopo è quello di sviluppare una configurazione di monitoraggio basata sui criteri seguenti:Their focus will be to develop a monitoring configuration that's based on the following criteria:

  • Qual è la composizione del servizio?What is the composition of the service? Sono attualmente monitorate le dipendenze?Are those dependencies monitored today? In caso affermativo, sono presenti più strumenti necessari?If so, are there multiple tools involved? Esiste un'opportunità per consolidare, senza introdurre rischi?Is there an opportunity to consolidate, without introducing risks?
  • Qual è il contratto di servizio del servizio e come viene misurato e segnalato?What is the SLA of the service, and how will I measure and report it?
  • Come dovrebbe apparire il dashboard del servizio quando viene generato un evento imprevisto?What should the service dashboard look like when an incident is raised? Come dovrebbe apparire il dashboard per il proprietario del servizio e per il team che supporta il servizio?What should the dashboard look like for the service owner, and for the team that supports the service?
  • Quali metriche produce la risorsa che è necessario monitorare?What metrics does the resource produce that I need to monitor?
  • In che modo il proprietario del servizio, i team di supporto e gli altri addetti alla ricerca nei log?How will the service owner, support teams, and other personnel be searching the logs?

La modalità di risposta a tali domande e i criteri per l'invio di avvisi determinano la modalità di utilizzo della piattaforma di monitoraggio.How you answer those questions, and the criteria for alerting, determines how you'll use the monitoring platform. Se si esegue la migrazione da una piattaforma di monitoraggio esistente o da un set di strumenti di monitoraggio, usare la migrazione come opportunità per rivalutare i segnali raccolti.If you're migrating from an existing monitoring platform or set of monitoring tools, use the migration as an opportunity to reevaluate the signals you collect. Ciò vale soprattutto per il caso in cui è necessario considerare diversi fattori di costo quando si esegue la migrazione o l'integrazione con una piattaforma di monitoraggio basata sul cloud, ad esempio monitoraggio di Azure.This is especially true now that there are several cost factors to consider when you migrate or integrate with a cloud-based monitoring platform like Azure Monitor. Tenere presente che il monitoraggio dei dati deve essere praticabile.Remember, monitoring data needs to be actionable. È necessario aver raccolto i dati ottimizzati per offrire una visualizzazione a 10.000 piedi dell'integrità complessiva del servizio.You need to have optimized data collected to give you "a 10,000 foot view" of the overall health of the service. La strumentazione definita per identificare gli eventi imprevisti reali dovrebbe essere il più semplice, prevedibile e affidabile possibile.The instrumentation that's defined to identify real incidents should be as simple, predictable, and reliable as possible.

Sviluppare una configurazione di monitoraggioDevelop a monitoring configuration

Il proprietario e il team del servizio di monitoraggio seguono in genere un set comune di attività per sviluppare una configurazione di monitoraggio.The monitoring service owner and team typically follow a common set of activities to develop a monitoring configuration. Queste attività iniziano nelle fasi di pianificazione iniziali, continuano a eseguire il test e la convalida in un ambiente non di produzione e si estendono alla distribuzione nell'ambiente di produzione.These activities start at the initial planning stages, continue through testing and validating in a nonproduction environment, and extend to deploying into production. Le configurazioni di monitoraggio derivano da modalità di errore note, risultati dei test di errori simulati e l'esperienza di diverse persone nell'organizzazione (il Service Desk, le operazioni, i tecnici e gli sviluppatori).Monitoring configurations are derived from known failure modes, test results of simulated failures, and the experience of several people in the organization (the service desk, operations, engineers, and developers). Tali configurazioni presuppongono che il servizio esista già, viene migrato nel cloud e non è stato riprogettato.Such configurations assume that the service already exists, it's being migrated to the cloud, and it hasn't been rearchitected.

Per ottenere risultati qualitativi a livello di servizio, monitorare l'integrità e la disponibilità di questi servizi nelle fasi iniziali del processo di sviluppo.For service-level quality results, monitor the health and availability of these services early in the development process. Se si monitora la progettazione del servizio o dell'applicazione come un ripensamento, i risultati non saranno riusciti.If you monitor the design of that service or application as an afterthought, your results won't be as successful.

Per una risoluzione più rapida dell'evento imprevisto, tenere presenti le raccomandazioni seguenti:To drive quicker resolution of the incident, consider the following recommendations:

  • Definire un dashboard per ogni componente del servizio.Define a dashboard for each service component.
  • Usare le metriche per facilitare la diagnosi e identificare una risoluzione o una soluzione alternativa del problema se non è possibile individuare una causa principale.Use metrics to help guide further diagnosis and to identify a resolution or workaround of the issue if a root cause can't be uncovered.
  • Usare le funzionalità di drill-down del dashboard o supportare la personalizzazione della visualizzazione per rifinirla.Use dashboard drill-down capabilities, or support customizing the view to refine it.
  • Se sono necessari log dettagliati, le metriche dovrebbero avere consentito di individuare i criteri di ricerca.If you need verbose logs, metrics should have helped target the search criteria. Se le metriche non sono state utili, migliorarle per l'evento imprevisto successivo.If the metrics didn't help, improve them for the next incident.

L'adozione di questo set di principi guida consente di ottenere informazioni in tempo quasi reale, oltre a una migliore gestione del servizio.Embracing this guiding set of principles can help give you near-real-time insights, as well as better management of your service.

Passaggi successiviNext steps