Konfigurera Azure Portal för att övervaka Azure Stack HCI-kluster (förhandsversion)

Gäller för: Azure Stack HCI, version 21H2

Viktigt

Funktionerna som beskrivs i den här artikeln kräver den senaste Uppdateringen av Azure Stack HCI. Tidigare versioner av Azure Stack HCI visar en övervakningspanel i stället för en Insights panel och menyn Insights är inte tillgänglig. Installera den senaste uppdateringen för att få de nya funktionerna.

Den här artikeln beskriver hur du aktiverar Azure Insights-funktioner för att övervaka ett Azure Stack HCI-kluster med Azure Stack HCI-Insights.

Om du inte redan har gjort det måste du registrera klustret med Azure. När du har aktiverat loggar och övervakning kan du använda Azure Stack HCI-Insights för att övervaka klusterhälsa, prestanda och användning. Övervakning av ett Azure Stack HCI-kluster från Azure Portal kräver att alla servrar i klustret är Azure Arc-aktiverade. Om du registrerade klustret på eller efter den 15 juni 2021 sker detta som standard. Annars måste du aktivera Azure Arc-integrering.

Loggfunktion (förhandsversion)

När du har registrerat klustret och Arc-aktiverat servrarna visas följande i Azure Portal:

  • En Azure Stack HCI-resurs i den angivna resursgruppen.
  • Server – Azure Arc-resurser för varje server i klustret i <clustername>ArcInstanceResourceGroup.
  • Noder med en Server-Azure Arc-resurslänk på resurssidan för Azure Stack HCI under fliken Noder .

Nu när klusternoderna är Arc-aktiverade går du till sidan för azure Stack HCI-klusterresursen. På fliken Funktioner visas alternativet för att aktivera loggar, som ska vara Inte konfigurerat.

Logs capability under the Capabilities tab

Den här funktionen är ett Arc for Servers-tillägg som förenklar installationen av Microsoft Monitoring Agent. Eftersom du använder tillägget Arc for Servers för att aktivera det här arbetsflödet kommer Microsoft Monitoring Agent automatiskt att vara installerat om du lägger till ytterligare servrar i klustret.

Anteckning

Microsoft Monitoring Agent för Windows kommunicerar utgående till Azure Monitor-tjänsten via TCP-port 443. Om servrarna ansluter via en brandvägg eller proxyserver för att kommunicera via Internet granskar du dessa krav för att förstå vilken nätverkskonfiguration som krävs.

Konfigurera Log Analytics-agenttillägget

Så här konfigurerar du Log Analytics-agenttillägget:

  1. Under fliken Funktioner väljer du Loggar.

  2. Välj Använd befintlig för att använda den befintliga arbetsytan för din prenumeration.

  3. Välj Lägg till längst ned på sidan.

    Enable Log Analytics on Azure portal

  4. När konfigurationen är klar visas loggarna som Konfigurerade under fliken Funktioner .

  5. Välj Inställningar > tillägg i verktygsfältet till vänster. Du bör se att var och en av dina servrar har installerat Microsoft Monitoring Agent.

Nu har du installerat Log Analytics-tillägget.

Inaktivera Log Analytics

Om du vill inaktivera funktionen Loggar måste du ta bort Microsoft Monitoring Agent från inställningarna för tillägg . Observera att detta inte tar bort Log Analytics-arbetsytan i Azure eller någon av de data som finns i den, så du måste göra det manuellt.

Så här tar du bort Microsoft Monitoring Agent från alla servrar i klustret:

  1. Välj Inställningar > tillägg i verktygsfältet till vänster.
  2. Markera kryssrutan MicrosoftMonitoringAgent .
  3. Klicka på Ta bort och sedan på Ja.

Insights kapacitet (förhandsversion)

Insights kallades tidigare "övervakning" och används för att övervaka dina resurser och ge användbara insikter om kluster, servrar, virtuella datorer, lagring och mycket mer.

Cluster portal screen

Data som genereras från ditt lokala Azure Stack HCI-kluster samlas in på en Log Analytics-arbetsyta i Azure. På den arbetsytan kan du samla in data om klustrets hälsotillstånd. Som standard samlar övervakningen in följande loggar varje timme:

  • Hälsohantering (Microsoft-windows-health/operational)
  • SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Händelse-ID: 3000, 3001, 3002, 3003, 3004)

Information om hur ofta logginsamlingen ska ändras finns i Händelseloggkanal.

Aktivera Insights

Genom att aktivera Insights kan du övervaka alla Azure Stack HCI-kluster som för närvarande är associerade med Log Analytics-arbetsytan genom att tillhandahålla användbara hälsomått. Så här aktiverar du den här funktionen från Azure Portal:

  1. Under fliken Funktioner väljer du Insights. Välj sedan Aktivera.
  2. Insights bör nu visas som Konfigurerad på fliken Funktioner.

Portal screen to enable Insights

Händelsekanalen Microsoft-windows-sddc-management/operational och microsoft-windows-health/operational Windows läggs till på Log Analytics-arbetsytan under Windows händelseloggar.

Portal workspace for Windows event logs

Genom att samla in dessa loggar visar analys hälsostatusen för enskilda servrar, enheter, volymer och virtuella datorer. Som standard läggs 5 prestandaräknare till:

Windows performance counters

Prestandaräknare

I följande tabell beskrivs de prestandaräknare som övervakas:

Prestandaräknare Beskrivning
Memory(*)\Available Bytes Tillgängliga byte är mängden fysiskt minne, i byte, omedelbart tillgängligt för allokering till en process eller för systemanvändning.
Network Interface(*)\Bytes Total/s Den hastighet med vilken byte skickas och tas emot över varje nätverkskort, inklusive inramningstecken. Byte totalt/sek är en summa av mottagna byte/sek och skickade byte/sek.
Processor(_Total)% processortid Procentandelen förfluten tid som alla processtrådar använde processorn för att köra instruktioner.
RDMA-aktivitet(*)\RDMA inkommande byte/sek Frekvens för data som tas emot via RDMA av nätverkskortet per sekund.
RDMA-aktivitet(*)\RDMA utgående byte/sek Frekvens för data som skickas via RDMA av nätverkskortet per sekund.

När du har aktiverat Insights kan det ta upp till 15 minuter att samla in data. När processen är klar kan du se en omfattande visualisering av hälsotillståndet för klustret under fliken Insights (förhandsversion) i det vänstra navigeringsfönstret, som du ser i följande skärmbild:

Server visualizations

Insights visualiseringar

När Insights har aktiverats innehåller följande tabeller information om alla resurser.

Hälsa

Tillhandahåller hälsofel i ett kluster.

Metric Beskrivning Enhet Exempel
Fel En kort beskrivning av hälsofel. När du klickar på länken öppnas en sidopanel med mer information. Ingen enhet PoolCapacityThresholdExceeded
Felande resurstyp Den typ av resurs som påträffade ett fel. Ingen enhet StoragePool
Felande resurs-ID Unikt ID för resursen som påträffade ett hälsofel. Unikt ID {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
Allvarlighetsgrad Allvarlighetsgraden för felet kan vara varning eller kritisk. Ingen enhet Varning
Inledande feltid Tidsstämpel för när servern senast uppdaterades. Datetimestamp 2022-04-09, 12:15:42

Server

Metric Beskrivning Enhet Exempel
Servrar Namnen på servrarna i klustret. Ingen enhet VM-1
Senast uppdaterad Tidsstämpeln för när servern senast uppdaterades. Datetimestamp 2022-04-09, 12:15:42
Status Hälsotillståndet för serverresurser i klustret. Det kan vara hälsosamt, varning, kritiskt och annat Felfri
CPU-användning Den % av tiden som processen har använt processorn. Procent 56%
Minnesanvändning Minnesanvändningen för serverprocessen är lika med räknaren Process\Privata byte plus storleken på minnesmappade data. Procent 16 %
Logiska processorer Antalet logiska processorer. Antal 2
Processorer Antalet processorer. Antal 2
Drifttid Den tid då en dator, särskilt en dator, är i drift. Dagar/min/s 2.609 timmar.
Webbplats Nätverksadressen som servern tillhör. IP-adress Webbplats 2001:4888:31:13c::/64
Domännamn Den lokala domän som servern tillhör. Ingen enhet Contoso.local

Virtuella datorer

Anger tillståndet för alla virtuella datorer i klustret. En virtuell dator kan vara i något av följande tillstånd: Körs, stoppas, misslyckades eller annan (okänd, startar, ögonblicksbilder, sparar, stoppar, pausar, återupptar, pausar, pausas, pausas).

Metric Beskrivning Enhet Exempel
Servrar Namnet på servern. Ingen enhet Sample-VM-1
Senast uppdaterad Detta ger datetimestamp för när servern senast uppdaterades Datetimestamp 2022-04-09, 12:24:02
Totalt antal virtuella datorer Antalet virtuella datorer i en servernod. Antal 0 av 0 körs
Körs Antalet virtuella datorer som körs i en servernod. Antal 2
Stoppad Antalet virtuella datorer som stoppats i en servernod. Antal 3
Misslyckad Antalet virtuella datorer misslyckades i en servernod. Antal 2
Övrigt Om den virtuella datorn är i något av följande tillstånd (okänd, startar, ögonblicksbilder, sparar, stoppar, pausar, återupptar, pausas, pausas, pausas), betraktas den som "Annan". Antal 2

Följande tabell innehåller hälsotillståndet för volymer i klustret:

Metric Beskrivning Enhet Exempel
Volymer Namnet på volymen Ingen enhet ClusterPerformanceHistory
Senast uppdaterad Datum/tidsstämpel för när lagringen senast uppdaterades. Datetimestamp 2022-04-14, 14:58:55
Status Status för volymen. Felfri, varning, kritisk och annan. Felfri
Total kapacitet Enhetens totala kapacitet i byte under rapporteringsperioden. Byte 25B
Tillgänglig kapacitet Den tillgängliga kapaciteten i byte under rapporteringsperioden. Byte 20B
Iops Indata-/utdataåtgärder per sekund. Per sekund 45/s
Dataflöde Antal byte per sekund som Application Gateway har betjänat. BytesPerSecond 5B/s
Svarstid Den tid det tar för I/O-begäran att slutföras. Second 10-talet
Återhämtning Kapaciteten att återställa från fel. Maximerar datatillgängligheten. Ingen enhet Trevägsspegling
Deduplicering Processen för att minska den fysiska mängden byte med data som måste lagras på disken. Tillgänglig eller inte Ja/nej
Filsystem Typ av filsystem. Ingen enhet ReFS

Inaktivera Insights

Om du vill inaktivera insikter följer du dessa steg:

  1. Välj Insights under fliken Funktioner.

  2. Välj Inaktivera Insights.

    Portal screen for disabling Insights

När du inaktiverar funktionen Insights samlas Hälsotjänst- och SDDC-hanteringsloggarna inte längre in. Befintliga data tas dock inte bort. Om du vill ta bort dessa data går du till Log Analytics-arbetsytan och tar bort data manuellt.

Behöver uppdateras

Panelen Insights visar ett meddelande om behovsuppdatering i följande fall:

  • Hälsohändelsen från Windows händelseloggar tas bort.
  • Alla eller alla 5 prestandaräknare från Loganalytics-arbetsytan tas bort.

Aktivera Insights igen genom att

  • Välj panelen Insights under Funktioner.
  • Välj Uppdatera för att se visualiseringarna igen.

Portal shows update needed

Prissättning för Azure Monitor

Som tidigare beskrivits samlas loggar in från när du aktiverar övervakningsvisualisering:

  • Hälsohantering (Microsoft-windows-health/operational).
  • SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Händelse-ID: 3000, 3001, 3002, 3003, 3004).

Du debiteras baserat på mängden data som matas in och inställningarna för datakvarhållning för Log Analytics-arbetsytan.

Azure Monitor har priser för användningsbaserad betalning och de första 5 GB per faktureringskonto per månad är kostnadsfria. Eftersom prissättningen kan variera på grund av flera faktorer, till exempel den region i Azure som du använder, går du till priskalkylatorn för Azure Monitor för de senaste prisberäkningarna. Följande tabell kan hjälpa dig att beräkna kostnaden:

Kluster i fristående Log Analytics-arbetsyta GB inmatat per månad
Kluster med två noder ~1 MB per timme
Kluster med fyra noder ~1 MB per timme
Kluster med åtta noder ~1 MB per timme

I följande tabell visas prisstrukturen för Azure Stack HCI-kluster av olika storlekar:

Kluster på samma Log Analytics-arbetsyta GB inmatat per månad
Liten distribution (3 kluster med två noder) ~3 GB
Mellanstor distribution (10 kluster med fyra noder) ~10 GB
Stor distribution (25 kluster med fyra noder) ~25 GB

Felsökning

Om funktionen Loggar och övervakning är aktiverade utan fel, men övervakningsdata inte visas efter en timme eller så, kan du använda Felsökningsverktyget för Log Analytics.

Så här använder du felsökningsverktyget för Log Analytics

  1. Öppna en PowerShell-fråga som administratör på Azure Stack HCI-värden där Log Analytics-agenten är installerad.

  2. Navigera till katalogen där verktyget finns.

    cd C:\Program Files\Microsoft Monitoring Agent\Agent\Troubleshooter
    
  3. Kör huvudskriptet med det här kommandot:

    .\GetAgentInfo.ps1
    
  4. När du uppmanas att välja ett felsökningsscenario väljer du alternativ 1: Agenten rapporterar inte data eller pulsslagsdata saknas.

  5. Du uppmanas att välja den åtgärd som du vill utföra. Välj alternativ 1: Diagnostisera.

    Troubleshooting tool command line options

  6. Om du stöter på felet som är markerat i följande skärmbild men fortfarande kan ansluta till alla Log Analytics-slutpunkter och dina brandväggs- och gatewayinställningar är korrekta, har du förmodligen stött på ett tidszonsproblem.

    Command prompt showing tool errors

    Orsaken är att den lokala tiden skiljer sig från Azure-tid och att arbetsytenyckeln inte kunde verifieras på grund av matchningsfelet.

    Move to next error

  7. Så här löser du problemet:

    1. Gå till din Azure Stack HCI-resurssida i Azure Portal och välj [klusternamn] > Tillägg. Markera sedan kryssrutan för MicrosoftMonitoringAgent och ta bort Tillägget för Microsoft Monitoring Agent.
    2. Kontrollera att din Azure Stack HCI-värdtidszon är korrekt och att den lokala tiden på värden är samma som Azure-tiden för din tidszon.
      1. I Azure Stack HCI-värdkonsolen väljer du alternativ 9: Datumtid &konfigurationsmenyn och väljer sedan ändra tidszon och ser till att lokal tid är korrekt.
      2. Granska tidszonen för Active Directory PDC (primär domänkontrollant) och kontrollera att datum och tid är korrekta.
      3. Om Active Directory PDC är korrekt och den lokala Azure Stack HCI-tiden fortfarande är felaktig identifieras inte Active Directory-domänhierarkin. Om så är fallet slutför du steg iv - vi nedan. Annars fortsätter du till steg c.
      4. Från Azure Stack HCI-värden väljer du alternativ 15 för att avsluta konfigurationsmenyn. Kör sedan följande kommando i PowerShell som administratör: w32tm.exe /config /syncfromflags:domhier /update – detta bör returnera en bekräftelse på att kommandot har slutförts och att tidsinställningen nu ska vara korrekt.
      5. Om du vill diagnostisera ytterligare kör w32tm /monitor du på Azure Stack HCI-värdkonsolen. Den aktiva domänkontrollanten bör anges som stratum 1-server och alla andra domänkontrollanter som stratum 2.
      6. Kontrollera slutligen att Windows tidstjänst- och tidsprovidrar inte är konfigurerade i ett grupprincip-objekt, eftersom detta stör Active Directory-domänhierarkin.
    3. Lägg till Log Analytics-tillägget igen genom att gå till din Azure Stack HCI-resurssida i Azure Portal, välja [klusternamn] > Översikt och sedan Funktioner och konfigurera Log Analytics och övervakning.
  8. Kör felsökningsverktyget för Log Analytics igen och du bör inte längre se felet. Nu bör du se Windows agentnummer ökas i Log Analytics-arbetsytan under Agenthantering för att matcha dina klusternoder, och övervakningshändelser börjar flöda.

Nästa steg