Monitorowanie kondycji i alertów w usłudze Azure Stack Hub

Usługa Azure Stack Hub obejmuje funkcje monitorowania infrastruktury, które ułatwiają wyświetlanie kondycji i alertów dla regionu usługi Azure Stack Hub. Kafelek Zarządzanie regionami zawiera listę wszystkich wdrożonych regionów usługi Azure Stack Hub. Jest on domyślnie przypięty w portalu administratora dla subskrypcji domyślnego dostawcy. Kafelek zawiera liczbę aktywnych alertów krytycznych i ostrzegawczych dla każdego regionu. Kafelek to punkt wejścia do funkcji kondycji i alertów usługi Azure Stack Hub.

Kafelek Zarządzanie regionami w portalu administratora usługi Azure Stack Hub

Informacje o kondycji w usłudze Azure Stack Hub

Dostawca zasobów kondycji zarządza kondycją i alertami. Składniki infrastruktury usługi Azure Stack Hub rejestrują się u dostawcy zasobów kondycji podczas wdrażania i konfiguracji usługi Azure Stack Hub. Ta rejestracja umożliwia wyświetlanie kondycji i alertów dla każdego składnika. Kondycja w usłudze Azure Stack Hub to prosta koncepcja. Jeśli istnieją alerty dotyczące zarejestrowanego wystąpienia składnika, stan kondycji tego składnika odzwierciedla najgorszą aktywną ważność alertu: ostrzeżenie lub krytyczne.

Definicja ważności alertu

Usługa Azure Stack Hub zgłasza alerty z tylko dwiema ważnościami: ostrzeżeniem i krytycznym.

  • Ostrzeżenie
    Operator może rozwiązać alert ostrzegawczy w zaplanowany sposób. Alert zwykle nie wpływa na obciążenia użytkowników.

  • Krytyczne
    Operator powinien zająć się alertem krytycznym w trybie pilnym. Te alerty wskazują problemy, które mają obecnie wpływ lub wkrótce wpłyną na użytkowników usługi Azure Stack Hub.

Wyświetlanie stanu kondycji składnika i zarządzanie nim

Stan kondycji składników można wyświetlić w portalu administratora oraz za pośrednictwem interfejsu API REST i programu PowerShell.

Aby wyświetlić stan kondycji w portalu, kliknij region, który chcesz wyświetlić na kafelku Zarządzanie regionami . Stan kondycji ról infrastruktury i dostawców zasobów można wyświetlić.

Lista ról infrastruktury

Aby wyświetlić bardziej szczegółowe informacje, możesz kliknąć dostawcę zasobów lub rolę infrastruktury.

Ostrzeżenie

Jeśli klikniesz rolę infrastruktury, a następnie klikniesz wystąpienie roli, dostępne są opcje uruchamiania, ponownego uruchamiania lub zamykania. Nie używaj tych akcji podczas stosowania aktualizacji do zintegrowanego systemu. Nie należy również używać tych opcji w środowisku zestawu Azure Stack Development Kit (ASDK). Te opcje są przeznaczone tylko dla zintegrowanego środowiska systemów, w którym istnieje więcej niż jedno wystąpienie roli na rolę infrastruktury. Ponowne uruchomienie wystąpienia roli (zwłaszcza AzS-Xrp01) w zestawie ASDK powoduje niestabilność systemu. Aby uzyskać pomoc dotyczącą rozwiązywania problemów, opublikuj problem na forum usługi Azure Stack Hub.

Wyświetlanie alertów

Lista aktywnych alertów dla każdego regionu usługi Azure Stack Hub jest dostępna bezpośrednio w bloku Zarządzanie regionami . Pierwszy kafelek w konfiguracji domyślnej to kafelek Alerty , który wyświetla podsumowanie alertów krytycznych i ostrzegawczych dla regionu. Możesz przypiąć kafelek Alerty, podobnie jak każdy inny kafelek w tym bloku, do pulpitu nawigacyjnego, aby uzyskać szybki dostęp.

Kafelek Alerty z ostrzeżeniem w portalu administratora usługi Azure Stack Hub

Aby wyświetlić listę wszystkich aktywnych alertów dla regionu, wybierz górną część kafelka Alerty . Aby wyświetlić filtrowaną listę alertów (krytyczne lub ostrzeżenie), wybierz element wiersza Krytyczne lub Ostrzeżenie w kafelku.

Blok Alerty obsługuje możliwość filtrowania zarówno stanu (Aktywny lub Zamknięty) jak i ważności (Krytyczne lub Ostrzeżenie). Widok domyślny wyświetla wszystkie aktywne alerty. Wszystkie zamknięte alerty są usuwane z systemu po siedmiu dniach.

Uwaga

Jeśli alert pozostaje aktywny, ale nie został zaktualizowany w ciągu dnia, możesz uruchomić polecenie Test-AzureStack i zamknąć alert, jeśli nie zgłoszono żadnych problemów.

Okienko filtrowania w celu filtrowania według stanu krytycznego lub ostrzeżenia w portalu administratora usługi Azure Stack Hub

Akcja Wyświetl interfejs API wyświetla interfejs API REST, który został użyty do wygenerowania widoku listy. Ta akcja umożliwia szybkie zapoznanie się ze składnią interfejsu API REST, której można użyć do wykonywania zapytań dotyczących alertów. Tego interfejsu API można używać w automatyzacji lub do integracji z istniejącymi rozwiązaniami do monitorowania, raportowania i obsługi biletów w centrum danych.

Możesz kliknąć określony alert, aby wyświetlić szczegóły alertu. Szczegóły alertu zawierają wszystkie pola skojarzone z alertem i umożliwiają szybką nawigację do składnika, którego dotyczy problem, oraz źródło alertu. Na przykład następujący alert występuje, jeśli jedno z wystąpień roli infrastruktury przejdzie w tryb offline lub nie jest dostępne.

Blok Szczegóły alertu w portalu administratora usługi Azure Stack Hub

Korygowanie alertów

Automatyczne korygowanie

Niektóre alerty obsługują opcję Napraw , jak pokazano na poprzedniej ilustracji. Po wybraniu akcji Napraw wykonuje kroki specyficzne dla alertu, aby spróbować rozwiązać problem. Po wybraniu opcji stan akcji Napraw jest dostępny jako powiadomienie portalu.

Akcja Napraw alert w toku

Akcja naprawy zgłosi pomyślne ukończenie lub niepowodzenie wykonania akcji w tym samym bloku powiadomień portalu. Jeśli akcja naprawy zakończy się niepowodzeniem dla alertu, możesz ponownie uruchomić akcję Napraw ze szczegółu alertu. Jeśli akcja naprawy zakończy się pomyślnie, nie uruchamiaj ponownie akcji Napraw . Po powrocie wystąpienia roli infrastruktury do trybu online ten alert zostanie automatycznie zamknięty.

Akcja naprawy zostanie ukończona pomyślnie

Korygowanie ręczne

Jeśli opcja Napraw nie jest obsługiwana, postępuj zgodnie z pełnym zestawem instrukcji korygowania podanych w alercie. Na przykład kroki korygowania wygasania certyfikatu wewnętrznego przeprowadzą Cię przez proces rotacji wpisów tajnych:

Korygowanie wygasania certyfikatu

Zamknięcie alertu

Wiele, ale nie każdy alert, zostanie automatycznie zamknięty po rozwiązaniu problemu źródłowego. Alerty, które udostępniają przycisk Napraw, zostaną automatycznie zamknięte, jeśli usługa Azure Stack Hub rozwiąże problem. W przypadku wszystkich innych alertów wybierz pozycję Zamknij alert po wykonaniu kroków korygowania. Jeśli problem będzie się powtarzać, usługa Azure Stack Hub wygeneruje nowy alert. Jeśli rozwiążesz ten problem, alert pozostanie zamknięty i nie będzie wymagał więcej kroków.

Następne kroki

Zarządzanie aktualizacjami w usłudze Azure Stack Hub

Zarządzanie regionami w usłudze Azure Stack Hub