Come risolvere i problemi e monitorare SAP HANA (istanze di grandi dimensioni) in Azure

Monitoraggio in SAP HANA in Azure (istanze di grandi dimensioni)

SAP HANA in Azure (istanze di grandi dimensioni) non è diverso da qualsiasi altra distribuzione IaaS: è necessario monitorare le attività del sistema operativo e dell'applicazione e il modo in cui questi usano le risorse seguenti:

  • CPU
  • Memoria
  • Larghezza di banda della rete
  • Spazio su disco

Come con le macchine virtuali di Azure, è necessario stabilire se le classi di risorse indicate sopra sono sufficienti o meno. Ecco ulteriori dettagli su ciascuna delle diverse classi:

Utilizzo delle risorse della CPU: il rapporto definito da SAP per un determinato carico di lavoro su HANA viene applicato per garantire che ci siano sufficienti risorse di CPU disponibili per i dati archiviati in memoria. Tuttavia potrebbero esserci casi in cui HANA usa molte query eseguire in CPU a causa di indici mancanti o problemi simili. Ciò significa che è necessario monitorare il consumo delle risorse di CPU dell'unità dell'istanza HANA di grandi dimensioni nonché le risorse di CPU utilizzate dai servizi HANA specifici.

Utilizzo della memoria: è importante eseguire il monitoraggio dall'interno di HANA nonché dall'esterno di HANA sull'unità. All'interno di HANA monitorare il modo in cui i dati usano la memoria allocata di HANA per rispettare le linee guida sulle dimensioni di SAP. È utile inoltre monitorare il consumo di memoria a livello dell'istanza di grandi dimensioni per assicurarsi che il software aggiuntivo non HANA installato non usi troppa memoria e pertanto non entri in competizione con HANA per la memoria.

Larghezza di banda di rete: il gateway di rete virtuale di Azure è limitato nella larghezza di banda dei dati che si spostano nella rete virtuale di Azure, pertanto è utile monitorare i dati ricevuti da tutte le VM di Azure all'interno di una rete virtuale per scoprire quanto si è vicini ai limiti dello SKU del gateway di Azure selezionato. Nell'unità dell'istanza HANA di grandi dimensioni ha senso monitorare anche il traffico di rete in ingresso e in uscita nonché monitorare e tenere traccia dei volumi che vengono gestiti nel tempo.

Spazio su disco: l'utilizzo dello spazio su disco in genere aumenta nel tempo. Ciò è dovuto a diversi motivi, in particolare l'aumento di volume dei dati, l'esecuzione di backup del log delle transazioni, l'archiviazione dei file di traccia e l'esecuzione di snapshot di archiviazione. Pertanto è importante monitorare l'utilizzo dello spazio su disco e gestire lo spazio su disco associato all'unità dell'istanza HANA di grandi dimensioni.

Monitoraggio e risoluzione dei problemi dal lato HANA

Per analizzare efficacemente i problemi correlati a SAP HANA in Azure (istanze di grandi dimensioni), è utile circoscrivere la causa principale di un problema. SAP ha pubblicato molta documentazione di supporto.

Domande frequenti relative alle prestazioni di SAP HANA sono reperibili nelle note SAP seguenti:

Avvisi SAP HANA

Innanzitutto controllare i log di avviso correnti di SAP HANA. In SAP HANA Studio passare a Administration Console: Alerts: Show: all alerts (Console di amministrazione: Avvisi: Mostra: tutti gli avvisi). Questa scheda mostra tutti gli avvisi di SAP HANA per valori specifici (memoria fisica disponibile, utilizzo della CPU e così via) che si trovano all'esterno delle soglie minima e massima stabilite. Per impostazione predefinita i controlli vengono aggiornati automaticamente ogni 15 minuti.

In SAP HANA Studio passare ad Administration Console: Alerts: Show: all alerts (Console di amministrazione: Avvisi: Mostra: tutti gli avvisi)

CPU

Per un avviso generato a causa di un'impostazione non corretta della soglia, una possibile soluzione è reimpostare il valore predefinito o un valore di soglia accettabile.

Reimpostare il valore predefinito o un valore di soglia accettabile

Gli avvisi seguenti possono indicare problemi di risorse della CPU:

  • Utilizzo della CPU dell'host (avviso 5)
  • Funzionamento del punto di salvataggio più recente (avviso 28)
  • Durata del punto di salvataggio (avviso 54)

È possibile notare un elevato utilizzo della CPU sul database SAP HANA da uno dei seguenti elementi:

  • L'avviso 5 (utilizzo della CPU dell'host) viene generato per l'utilizzo della CPU corrente o precedente
  • L'utilizzo della CPU visualizzato nella schermata della panoramica

Utilizzo della CPU visualizzato nella schermata della panoramica

Il grafico di carico potrebbe mostrare un elevato utilizzo della CPU o un elevato utilizzo precedente:

Il grafico di carico potrebbe mostrare un elevato utilizzo della CPU o un elevato utilizzo precedente

Un avviso generato a causa dell'elevato utilizzo della CPU potrebbe essere causato da vari motivi fra cui, ma non solo: esecuzione di determinate transazioni, caricamento di dati, processi in sospeso, istruzioni SQL a esecuzione prolungata e cattive prestazioni delle query (ad esempio con BW in cubi HANA).

Per i passaggi dettagliati di risoluzione dei problemi, vedere il sito SAP HANA Troubleshooting: CPU Related Causes and Solutions (Risoluzione dei problemi di SAP HANA: suggerimenti e soluzioni per la CPU).

Sistema operativo

Uno dei controlli più importanti per SAP HANA in Linux consiste nel verificare che siano disattivate le transparent huge page: vedere la nota SAP #2131662 dedicata alle transparent huge page (THP) sui server SAP HANA.

  • È possibile controllare se le transparent huge page sono attivate tramite il seguente comando di Linux: cat /sys/kernel/mm/transparent_hugepage/enabled
  • Se always è racchiuso tra parentesi quadre come mostrato di seguito, significa che le transparent huge page sono attivate: [always] madvise never; se never è racchiuso tra parentesi quadre come mostrato di seguito, significa che le transparent huge page sono disattivate: always madvise [never]

Il seguente comando di Linux non deve restituire alcun valore: rpm -qa | grep ulimit. Nel caso sembrasse che ulimit è installato, disinstallarlo immediatamente.

Memoria

È possibile osservare che la quantità di memoria allocata per il database SAP HANA è maggiore del previsto. Gli avvisi seguenti indicano problemi con un utilizzo elevato della memoria:

  • Utilizzo di memoria fisica dell'host (avviso 1)
  • Utilizzo di memoria del server dei nomi (avviso 12)
  • Utilizzo di memoria totale delle tabelle columnstore (avviso 40)
  • Utilizzo di memoria dei servizi (avviso 43)
  • Utilizzo di memoria totale della risorsa di archiviazione principale delle tabelle columnstore (avviso 45)
  • File di dump di runtime (avviso 46)

Per i passaggi dettagliati di risoluzione dei problemi, vedere il sito SAP HANA Troubleshooting: Memory Problems (Risoluzione dei problemi di SAP HANA: problemi relativi alla memoria).

Rete

Vedere la nota SAP #2081065 dedicata alla risoluzione dei problemi di rete di SAP HANA e svolgere i passaggi di risoluzione dei problemi riportati in questa nota SAP.

  1. Analisi del tempo di round trip tra client e server. R. Eseguire lo script SQL HANA_Network_Clients.

  2. Analizzare le comunicazioni internodo. R. Eseguire lo script SQL HANA_Network_Services.

  3. Eseguire il comando di Linux ifconfig (l'output mostra se si verificano perdite di pacchetti).

  4. Eseguire il comando di Linux tcpdump.

Usare inoltre lo strumento open source IPERF (o simile) per misurare le prestazioni reali della rete applicazioni.

Per i passaggi dettagliati di risoluzione dei problemi, vedere il sito SAP HANA Troubleshooting: Networking Performance and Connectivity Problems (Risoluzione dei problemi di SAP HANA: problemi relativi alle prestazioni di rete e alla connettività).

Archiviazione

Dal punto di vista dell'utente finale, un'applicazione (o il sistema nel suo complesso) si esegue lentamente, non risponde o può anche sembrare bloccata se si verificano problemi di prestazioni dell'I/O. Nella scheda Volumes (Volumi) di SAP HANA Studio è possibile visualizzare i volumi collegati e quali volumi sono utilizzati da ciascun servizio.

Nella scheda Volumes (Volumi) di SAP HANA Studio è possibile visualizzare i volumi collegati e quali volumi sono utilizzati da ciascun servizio

Nella parte inferiore della schermata sono visualizzati i dettagli dei volumi, ad esempio i file e le statistiche di I/O.

Nella parte inferiore della schermata sono visualizzati i dettagli dei volumi, ad esempio i file e le statistiche di I/O

Per i passaggi dettagliati di risoluzione dei problemi, vedere il sito SAP HANA Troubleshooting: I/O Related Root Causes and Solutions (Risoluzione dei problemi di SAP HANA: cause principali e soluzioni relative all'I/O) e SAP HANA Troubleshooting: Disk Related Root Causes and Solutions (Risoluzione dei problemi di SAP HANA: cause principali e soluzioni relative al disco).

Strumenti di diagnostica

Eseguire un controllo di integrità di SAP HANA tramite HANA_Configuration_Minichecks. Questo strumento restituisce problemi tecnici critici che dovrebbero essere già stati notificati mediante avvisi in SAP HANA Studio.

Vedere la nota SAP #1969700 dedicata alla raccolta di istruzioni SQL per SAP HANA e scaricare il file Statements.zip SQL associato alla nota. Salvare il file .zip sul disco rigido locale.

In SAP HANA Studio, sulla scheda System Information (Informazioni di sistema), fare clic con il pulsante destro del mouse nella colonna Name (Nome) e selezionare Import SQL Statements (Importa istruzioni SQL).

In SAP HANA Studio, sulla scheda System Information (Informazioni di sistema), fare clic con il pulsante destro del mouse nella colonna Nome (Nome) e selezionare Import SQL Statements (Importa istruzioni SQL)

Selezionare il file SQL Statements.zip salvato in locale per importare una cartella con le istruzioni SQL corrispondenti. A questo punto possono essere eseguiti i molti diversi controlli di diagnostica con queste istruzioni SQL.

Ad esempio, per verificare i requisiti di larghezza di banda per SAP HANA System Replication, fare doppio clic sull'istruzione Bandwidth sotto Replication: Bandwidth e selezionare Open (Apri) nella console di SQL.

Verrà visualizzata l'istruzione SQL completa e sarà possibile modificare i parametri di input (sezione di modifica) e poi eseguirla.

Verrà visualizzata l'istruzione SQL completa e sarà possibile modificare i parametri di input (sezione di modifica) e poi eseguirla

Un altro esempio è fare clic con il pulsante destro del mouse sulle istruzioni sotto Replication: Overview. Selezionare Run (Esegui) dal menu di scelta rapida:

Un altro esempio è fare clic con il pulsante destro del mouse sulle istruzioni sotto Replication: Overview. Selezionare Run (Esegui) dal menu di scelta rapida

Vengono visualizzate informazioni utili per la risoluzione dei problemi:

Vengono visualizzate informazioni utili per la risoluzione dei problemi

Eseguire la stessa operazione per HANA_Configuration_Minichecks e cercare eventuali X nella colonna C (livello critico).

Output di esempio:

HANA_Configuration_MiniChecks_Rev102.01+1 per controlli SAP HANA generali.

HANA_Configuration_MiniChecks_Rev102.01+1 per controlli SAP HANA generali

HANA_Services_Overview per una panoramica di quanto stanno eseguendo attualmente i servizi SAP HANA.

HANA_Services_Overview per una panoramica di quanto stanno eseguendo attualmente i servizi SAP HANA

HANA_Services_Statistics per informazioni sul servizio SAP HANA (CPU, memoria, ecc.).

HANA_Services_Statistics per informazioni sul servizio SAP HANA

HANA_Configuration_Overview_Rev110+ per informazioni generali sull'istanza di SAP HANA.

HANA_Configuration_Overview_Rev110+ per informazioni generali sull'istanza di SAP HANA

HANA_Configuration_Parameters_Rev70+ per controllare i parametri di SAP HANA.

HANA_Configuration_Parameters_Rev70+ per controllare i parametri di SAP HANA