Konfigurera Azure Portal för att övervaka Azure Stack HCI-kluster (förhandsversion)
Gäller för: Azure Stack HCI, version 21H2
Viktigt
Funktionerna som beskrivs i den här artikeln kräver den senaste Uppdateringen av Azure Stack HCI. Tidigare versioner av Azure Stack HCI visar en övervakningspanel i stället för en Insights panel och menyn Insights är inte tillgänglig. Installera den senaste uppdateringen för att få de nya funktionerna.
Den här artikeln beskriver hur du aktiverar Azure Insights-funktioner för att övervaka ett Azure Stack HCI-kluster med Azure Stack HCI-Insights.
Om du inte redan har gjort det måste du registrera klustret med Azure. När du har aktiverat loggar och övervakning kan du använda Azure Stack HCI-Insights för att övervaka klusterhälsa, prestanda och användning. Övervakning av ett Azure Stack HCI-kluster från Azure Portal kräver att alla servrar i klustret är Azure Arc-aktiverade. Om du registrerade klustret på eller efter den 15 juni 2021 sker detta som standard. Annars måste du aktivera Azure Arc-integrering.
Loggfunktion (förhandsversion)
När du har registrerat klustret och Arc-aktiverat servrarna visas följande i Azure Portal:
- En Azure Stack HCI-resurs i den angivna resursgruppen.
- Server – Azure Arc-resurser för varje server i klustret i
<clustername>ArcInstanceResourceGroup
. - Noder med en Server-Azure Arc-resurslänk på resurssidan för Azure Stack HCI under fliken Noder .
Nu när klusternoderna är Arc-aktiverade går du till sidan för azure Stack HCI-klusterresursen. På fliken Funktioner visas alternativet för att aktivera loggar, som ska vara Inte konfigurerat.
Den här funktionen är ett Arc for Servers-tillägg som förenklar installationen av Microsoft Monitoring Agent. Eftersom du använder tillägget Arc for Servers för att aktivera det här arbetsflödet kommer Microsoft Monitoring Agent automatiskt att vara installerat om du lägger till ytterligare servrar i klustret.
Anteckning
Microsoft Monitoring Agent för Windows kommunicerar utgående till Azure Monitor-tjänsten via TCP-port 443. Om servrarna ansluter via en brandvägg eller proxyserver för att kommunicera via Internet granskar du dessa krav för att förstå vilken nätverkskonfiguration som krävs.
Konfigurera Log Analytics-agenttillägget
Så här konfigurerar du Log Analytics-agenttillägget:
Under fliken Funktioner väljer du Loggar.
Välj Använd befintlig för att använda den befintliga arbetsytan för din prenumeration.
Välj Lägg till längst ned på sidan.
När konfigurationen är klar visas loggarna som Konfigurerade under fliken Funktioner .
Välj Inställningar > tillägg i verktygsfältet till vänster. Du bör se att var och en av dina servrar har installerat Microsoft Monitoring Agent.
Nu har du installerat Log Analytics-tillägget.
Inaktivera Log Analytics
Om du vill inaktivera funktionen Loggar måste du ta bort Microsoft Monitoring Agent från inställningarna för tillägg . Observera att detta inte tar bort Log Analytics-arbetsytan i Azure eller någon av de data som finns i den, så du måste göra det manuellt.
Så här tar du bort Microsoft Monitoring Agent från alla servrar i klustret:
- Välj Inställningar > tillägg i verktygsfältet till vänster.
- Markera kryssrutan MicrosoftMonitoringAgent .
- Klicka på Ta bort och sedan på Ja.
Insights kapacitet (förhandsversion)
Insights kallades tidigare "övervakning" och används för att övervaka dina resurser och ge användbara insikter om kluster, servrar, virtuella datorer, lagring och mycket mer.
Data som genereras från ditt lokala Azure Stack HCI-kluster samlas in på en Log Analytics-arbetsyta i Azure. På den arbetsytan kan du samla in data om klustrets hälsotillstånd. Som standard samlar övervakningen in följande loggar varje timme:
- Hälsohantering (Microsoft-windows-health/operational)
- SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Händelse-ID: 3000, 3001, 3002, 3003, 3004)
Information om hur ofta logginsamlingen ska ändras finns i Händelseloggkanal.
Aktivera Insights
Genom att aktivera Insights kan du övervaka alla Azure Stack HCI-kluster som för närvarande är associerade med Log Analytics-arbetsytan genom att tillhandahålla användbara hälsomått. Så här aktiverar du den här funktionen från Azure Portal:
- Under fliken Funktioner väljer du Insights. Välj sedan Aktivera.
- Insights bör nu visas som Konfigurerad på fliken Funktioner.
Händelsekanalen Microsoft-windows-sddc-management/operational och microsoft-windows-health/operational Windows läggs till på Log Analytics-arbetsytan under Windows händelseloggar.
Genom att samla in dessa loggar visar analys hälsostatusen för enskilda servrar, enheter, volymer och virtuella datorer. Som standard läggs 5 prestandaräknare till:
Prestandaräknare
I följande tabell beskrivs de prestandaräknare som övervakas:
Prestandaräknare | Beskrivning |
---|---|
Memory(*)\Available Bytes | Tillgängliga byte är mängden fysiskt minne, i byte, omedelbart tillgängligt för allokering till en process eller för systemanvändning. |
Network Interface(*)\Bytes Total/s | Den hastighet med vilken byte skickas och tas emot över varje nätverkskort, inklusive inramningstecken. Byte totalt/sek är en summa av mottagna byte/sek och skickade byte/sek. |
Processor(_Total)% processortid | Procentandelen förfluten tid som alla processtrådar använde processorn för att köra instruktioner. |
RDMA-aktivitet(*)\RDMA inkommande byte/sek | Frekvens för data som tas emot via RDMA av nätverkskortet per sekund. |
RDMA-aktivitet(*)\RDMA utgående byte/sek | Frekvens för data som skickas via RDMA av nätverkskortet per sekund. |
När du har aktiverat Insights kan det ta upp till 15 minuter att samla in data. När processen är klar kan du se en omfattande visualisering av hälsotillståndet för klustret under fliken Insights (förhandsversion) i det vänstra navigeringsfönstret, som du ser i följande skärmbild:
Insights visualiseringar
När Insights har aktiverats innehåller följande tabeller information om alla resurser.
Hälsa
Tillhandahåller hälsofel i ett kluster.
Metric | Beskrivning | Enhet | Exempel |
---|---|---|---|
Fel | En kort beskrivning av hälsofel. När du klickar på länken öppnas en sidopanel med mer information. | Ingen enhet | PoolCapacityThresholdExceeded |
Felande resurstyp | Den typ av resurs som påträffade ett fel. | Ingen enhet | StoragePool |
Felande resurs-ID | Unikt ID för resursen som påträffade ett hälsofel. | Unikt ID | {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830} |
Allvarlighetsgrad | Allvarlighetsgraden för felet kan vara varning eller kritisk. | Ingen enhet | Varning |
Inledande feltid | Tidsstämpel för när servern senast uppdaterades. | Datetimestamp | 2022-04-09, 12:15:42 |
Server
Metric | Beskrivning | Enhet | Exempel |
---|---|---|---|
Servrar | Namnen på servrarna i klustret. | Ingen enhet | VM-1 |
Senast uppdaterad | Tidsstämpeln för när servern senast uppdaterades. | Datetimestamp | 2022-04-09, 12:15:42 |
Status | Hälsotillståndet för serverresurser i klustret. | Det kan vara hälsosamt, varning, kritiskt och annat | Felfri |
CPU-användning | Den % av tiden som processen har använt processorn. | Procent | 56% |
Minnesanvändning | Minnesanvändningen för serverprocessen är lika med räknaren Process\Privata byte plus storleken på minnesmappade data. | Procent | 16 % |
Logiska processorer | Antalet logiska processorer. | Antal | 2 |
Processorer | Antalet processorer. | Antal | 2 |
Drifttid | Den tid då en dator, särskilt en dator, är i drift. | Dagar/min/s | 2.609 timmar. |
Webbplats | Nätverksadressen som servern tillhör. | IP-adress | Webbplats 2001:4888:31:13c::/64 |
Domännamn | Den lokala domän som servern tillhör. | Ingen enhet | Contoso.local |
Virtuella datorer
Anger tillståndet för alla virtuella datorer i klustret. En virtuell dator kan vara i något av följande tillstånd: Körs, stoppas, misslyckades eller annan (okänd, startar, ögonblicksbilder, sparar, stoppar, pausar, återupptar, pausar, pausas, pausas).
Metric | Beskrivning | Enhet | Exempel |
---|---|---|---|
Servrar | Namnet på servern. | Ingen enhet | Sample-VM-1 |
Senast uppdaterad | Detta ger datetimestamp för när servern senast uppdaterades | Datetimestamp | 2022-04-09, 12:24:02 |
Totalt antal virtuella datorer | Antalet virtuella datorer i en servernod. | Antal | 0 av 0 körs |
Körs | Antalet virtuella datorer som körs i en servernod. | Antal | 2 |
Stoppad | Antalet virtuella datorer som stoppats i en servernod. | Antal | 3 |
Misslyckad | Antalet virtuella datorer misslyckades i en servernod. | Antal | 2 |
Övrigt | Om den virtuella datorn är i något av följande tillstånd (okänd, startar, ögonblicksbilder, sparar, stoppar, pausar, återupptar, pausas, pausas, pausas), betraktas den som "Annan". | Antal | 2 |
Följande tabell innehåller hälsotillståndet för volymer i klustret:
Metric | Beskrivning | Enhet | Exempel |
---|---|---|---|
Volymer | Namnet på volymen | Ingen enhet | ClusterPerformanceHistory |
Senast uppdaterad | Datum/tidsstämpel för när lagringen senast uppdaterades. | Datetimestamp | 2022-04-14, 14:58:55 |
Status | Status för volymen. | Felfri, varning, kritisk och annan. | Felfri |
Total kapacitet | Enhetens totala kapacitet i byte under rapporteringsperioden. | Byte | 25B |
Tillgänglig kapacitet | Den tillgängliga kapaciteten i byte under rapporteringsperioden. | Byte | 20B |
Iops | Indata-/utdataåtgärder per sekund. | Per sekund | 45/s |
Dataflöde | Antal byte per sekund som Application Gateway har betjänat. | BytesPerSecond | 5B/s |
Svarstid | Den tid det tar för I/O-begäran att slutföras. | Second | 10-talet |
Återhämtning | Kapaciteten att återställa från fel. Maximerar datatillgängligheten. | Ingen enhet | Trevägsspegling |
Deduplicering | Processen för att minska den fysiska mängden byte med data som måste lagras på disken. | Tillgänglig eller inte | Ja/nej |
Filsystem | Typ av filsystem. | Ingen enhet | ReFS |
Inaktivera Insights
Om du vill inaktivera insikter följer du dessa steg:
När du inaktiverar funktionen Insights samlas Hälsotjänst- och SDDC-hanteringsloggarna inte längre in. Befintliga data tas dock inte bort. Om du vill ta bort dessa data går du till Log Analytics-arbetsytan och tar bort data manuellt.
Behöver uppdateras
Panelen Insights visar ett meddelande om behovsuppdatering i följande fall:
- Hälsohändelsen från Windows händelseloggar tas bort.
- Alla eller alla 5 prestandaräknare från Loganalytics-arbetsytan tas bort.
Aktivera Insights igen genom att
- Välj panelen Insights under Funktioner.
- Välj Uppdatera för att se visualiseringarna igen.
Prissättning för Azure Monitor
Som tidigare beskrivits samlas loggar in från när du aktiverar övervakningsvisualisering:
- Hälsohantering (Microsoft-windows-health/operational).
- SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Händelse-ID: 3000, 3001, 3002, 3003, 3004).
Du debiteras baserat på mängden data som matas in och inställningarna för datakvarhållning för Log Analytics-arbetsytan.
Azure Monitor har priser för användningsbaserad betalning och de första 5 GB per faktureringskonto per månad är kostnadsfria. Eftersom prissättningen kan variera på grund av flera faktorer, till exempel den region i Azure som du använder, går du till priskalkylatorn för Azure Monitor för de senaste prisberäkningarna. Följande tabell kan hjälpa dig att beräkna kostnaden:
Kluster i fristående Log Analytics-arbetsyta | GB inmatat per månad |
---|---|
Kluster med två noder | ~1 MB per timme |
Kluster med fyra noder | ~1 MB per timme |
Kluster med åtta noder | ~1 MB per timme |
I följande tabell visas prisstrukturen för Azure Stack HCI-kluster av olika storlekar:
Kluster på samma Log Analytics-arbetsyta | GB inmatat per månad |
---|---|
Liten distribution (3 kluster med två noder) | ~3 GB |
Mellanstor distribution (10 kluster med fyra noder) | ~10 GB |
Stor distribution (25 kluster med fyra noder) | ~25 GB |
Felsökning
Om funktionen Loggar och övervakning är aktiverade utan fel, men övervakningsdata inte visas efter en timme eller så, kan du använda Felsökningsverktyget för Log Analytics.
Så här använder du felsökningsverktyget för Log Analytics
Öppna en PowerShell-fråga som administratör på Azure Stack HCI-värden där Log Analytics-agenten är installerad.
Navigera till katalogen där verktyget finns.
cd C:\Program Files\Microsoft Monitoring Agent\Agent\Troubleshooter
Kör huvudskriptet med det här kommandot:
.\GetAgentInfo.ps1
När du uppmanas att välja ett felsökningsscenario väljer du alternativ 1: Agenten rapporterar inte data eller pulsslagsdata saknas.
Du uppmanas att välja den åtgärd som du vill utföra. Välj alternativ 1: Diagnostisera.
Om du stöter på felet som är markerat i följande skärmbild men fortfarande kan ansluta till alla Log Analytics-slutpunkter och dina brandväggs- och gatewayinställningar är korrekta, har du förmodligen stött på ett tidszonsproblem.
Orsaken är att den lokala tiden skiljer sig från Azure-tid och att arbetsytenyckeln inte kunde verifieras på grund av matchningsfelet.
Så här löser du problemet:
- Gå till din Azure Stack HCI-resurssida i Azure Portal och välj [klusternamn] > Tillägg. Markera sedan kryssrutan för MicrosoftMonitoringAgent och ta bort Tillägget för Microsoft Monitoring Agent.
- Kontrollera att din Azure Stack HCI-värdtidszon är korrekt och att den lokala tiden på värden är samma som Azure-tiden för din tidszon.
- I Azure Stack HCI-värdkonsolen väljer du alternativ 9: Datumtid & på konfigurationsmenyn och väljer sedan ändra tidszon och ser till att lokal tid är korrekt.
- Granska tidszonen för Active Directory PDC (primär domänkontrollant) och kontrollera att datum och tid är korrekta.
- Om Active Directory PDC är korrekt och den lokala Azure Stack HCI-tiden fortfarande är felaktig identifieras inte Active Directory-domänhierarkin. Om så är fallet slutför du steg iv - vi nedan. Annars fortsätter du till steg c.
- Från Azure Stack HCI-värden väljer du alternativ 15 för att avsluta konfigurationsmenyn. Kör sedan följande kommando i PowerShell som administratör:
w32tm.exe /config /syncfromflags:domhier /update
– detta bör returnera en bekräftelse på att kommandot har slutförts och att tidsinställningen nu ska vara korrekt. - Om du vill diagnostisera ytterligare kör
w32tm /monitor
du på Azure Stack HCI-värdkonsolen. Den aktiva domänkontrollanten bör anges som stratum 1-server och alla andra domänkontrollanter som stratum 2. - Kontrollera slutligen att Windows tidstjänst- och tidsprovidrar inte är konfigurerade i ett grupprincip-objekt, eftersom detta stör Active Directory-domänhierarkin.
- Lägg till Log Analytics-tillägget igen genom att gå till din Azure Stack HCI-resurssida i Azure Portal, välja [klusternamn] > Översikt och sedan Funktioner och konfigurera Log Analytics och övervakning.
Kör felsökningsverktyget för Log Analytics igen och du bör inte längre se felet. Nu bör du se Windows agentnummer ökas i Log Analytics-arbetsytan under Agenthantering för att matcha dina klusternoder, och övervakningshändelser börjar flöda.