Demo per la formazione autonoma sulla soluzione Service Map in Operations Management Suite (OMS)

Questa demo per la formazione autonoma illustra l'uso della soluzione Service Map in Operations Management Suite (OMS) per identificare e diagnosticare un problema simulato in un'applicazione Web. L'elenco dei servizi individua automaticamente i componenti delle applicazioni nei sistemi Windows e Linux ed esegue la mappatura della comunicazione fra i servizi. Consente di consolidare i dati raccolti da altri servizi OMS per agevolare l'analisi delle prestazioni e l'identificazione dei problemi. Verranno anche usate le ricerche nei log in Log Analytics per eseguire il drill-down sui dati raccolti e identificare il problema radice.

Descrizione dello scenario

È stata appena ricevuta una notifica relativa a problemi di prestazioni dell'applicazione del portale clienti ACME. Le uniche informazioni disponibili sono che i problemi sono iniziati all'incirca alle 4.00 PST di oggi. A parte un set di server Web, non si è completamente sicuri di tutti i componenti da cui dipende il portale.

Componenti e le funzionalità usati

Procedura dettagliata

1. Connettersi a OMS Experience Center

Questa procedura dettagliata fa uso di Operations Management Suite Experience Center, che offre un ambiente completo di OMS con dati di esempio. Per iniziare, seguire questo collegamento, specificare le informazioni e quindi selezionare lo scenario Insight & Analytics.

2. Avviare Service Map

Per avviare la soluzione, fare clic sul riquadro Service Map.

Riquadro Service Map

Verrà visualizzata la console di Service Map. Il riquadro a sinistra contiene un elenco di computer nell'ambiente in cui è installato l'agente per Service Map. Il computer da visualizzare verrà selezionato da questo elenco.

Elenco di computer

3. Visualizzare un computer

I server Web sono denominati AcmeWFE001 e AcmeWFE002. Fare clic su AcmeWFE001. Verrà visualizzata la mappa per AcmeWFE001 e tutte le relative dipendenze. La mappa mostra i processi in esecuzione nel computer selezionato e i servizi esterni con cui comunicano.

Server Web

Per visualizzare le prestazioni dell'applicazione Web problematica, fare clic sul processo AcmeAppPool (IIS App Pool). Verranno visualizzati i dettagli di questo processo ed evidenziate le relative dipendenze.

Pool di app

4. Cambiare l'intervallo di tempo

Il problema è iniziato alle 4.00, occorre quindi verificare quale fosse la situazione in quel momento. Fare clic su Intervallo di tempo e impostare l'ora sulle 4.00 PST con una durata di 20 minuti, mantenendo la data corrente e facendo le dovute modifiche in base al fuso orario locale.

Selezione ora

5. Visualizzare un avviso

A questo punto si può vedere che la dipendenza acmetomcat mostra un avviso. Potrebbe trattarsi del problema che si sta cercando. Fare clic sull'icona dell'avviso in acmetomcat per visualizzare i relativi dettagli. L'utilizzo della CPU è indicato come critico ed è possibile espandere l'avviso per visualizzare altri dettagli. Si tratta probabilmente della causa del rallentamento delle prestazioni.

Avviso

6. Visualizzare le prestazioni

Esaminare acmetomcat più da vicino. Fare clic nell'angolo superiore destro di acmetomcat e selezionare Carica mappa del server per visualizzare i dettagli e le dipendenze per questo computer. È possibile esaminare più a fondo i contatori delle prestazioni per verificare la situazione. Selezionare la scheda Prestazioni per visualizzare i contatori delle prestazioni raccolti da Log Analytics nell'intervallo di tempo. Si possono notare picchi periodici nelle prestazioni del processore e della memoria.

Prestazioni

7. Visualizzare il rilevamento modifiche

Provare ora a scoprire la possibile causa di questo utilizzo elevato. Fare clic sulla scheda Riepilogo, che contiene le informazioni che OMS ha raccolto dal computer, come le connessioni non riuscite, gli avvisi critici e le modifiche al software. Le sezioni con informazioni recenti interessanti dovrebbero già essere espanse. È possibile espandere altre sezioni per esaminare le informazioni in esse contenute.

Espandere Rilevamento modifiche, se non è già aperto. Qui vengono mostrate le informazioni raccolte dalla soluzione Rilevamento modifiche. Sembra che in questo intervallo di tempo sia stata apportata una modifica al software. Fare clic su Software per visualizzare i dettagli. Un processo di backup è stato aggiunto al computer poco dopo le 4.00. Sembra quindi che sia questa la causa del consumo eccessivo di risorse.

Rilevamento modifiche

Per fare un'ulteriore verifica, è possibile esaminare le informazioni dettagliate sulle prestazioni raccolte nel repository di Log Analytics. Fare nuovamente clic sulla scheda Avvisi e quindi su uno degli avvisi di utilizzo elevato della CPU. Fare clic su Mostra in Ricerca log. Verrà visualizzata la finestra Ricerca log, in cui è possibile eseguire ricerche nei log su tutti i dati archiviati nel repository. Service Map ha già compilato una query per recuperare l'avviso che si sta cercando.

Ricerca log

Provare ora a ottenere maggiori dettagli sulla raccolta di prestazioni che ha generato l'avviso, per verificare il sospetto che i problemi siano causati da tale processo di backup. Modificare l'intervallo di tempo in 6 ore. Quindi fare clic su Preferiti e scorrere fino alle ricerche salvate per Service Map. Si tratta delle query create in modo specifico per l'analisi. Fare clic su Top 5 Processes by CPU for acmetomcat (Primi 5 processi per CPU per acmetomcat).

Ricerca salvata

Questa query restituisce un elenco dei primi cinque processi per utilizzo del processore in acmetomcat. È possibile esaminare la query per iniziare a conoscere il linguaggio di query usato per le ricerche nei log. Se si è interessati ai processi in altri computer, è possibile modificare la query per recuperare tali informazioni.

In questo caso si può notare che il processo di backup utilizza in modo costante circa il 60% della CPU del server applicazioni. È evidente che questo processo è la causa del problema di prestazioni. Per risolvere il problema, naturalmente, il nuovo software di backup verrà rimosso dal server applicazioni. È possibile usare Configurazione dello stato desiderato (DSC), gestito da Automazione di Azure, per definire criteri che garantiscano che tale processo non venga mai eseguito in questi sistemi critici.

Riepilogo

  • Service Map permette di visualizzare l'intera applicazione, anche se non se ne conoscono tutti i server e le dipendenze.
  • Service Map presenta i dati raccolti da altre soluzioni OMS per identificare i problemi dell'applicazione e dell'infrastruttura sottostante.
  • Ricerche log consente di eseguire il drill down su dati specifici raccolti nel repository di Log Analytics.

Passaggi successivi