Monitorowanie kondycji i alertów w usłudze Azure Stack HubMonitor health and alerts in Azure Stack Hub

Centrum Azure Stack obejmuje funkcje monitorowania infrastruktury, które ułatwiają wyświetlanie kondycji i alertów dla regionu centrum Azure Stack.Azure Stack Hub includes infrastructure monitoring capabilities that help you view health and alerts for an Azure Stack Hub region. Kafelek zarządzanie regionami zawiera wszystkie wdrożone regiony centrum Azure Stack.The Region management tile lists all the deployed regions of Azure Stack Hub. Jest on domyślnie przypięty w portalu administratora dla domyślnej subskrypcji dostawcy.It's pinned by default in the administrator portal for the Default Provider Subscription. Kafelek pokazuje liczbę aktywnych alertów krytycznych i ostrzeżeń dla każdego regionu.The tile shows the number of active critical and warning alerts for each region. Kafelek jest punktem wejścia w funkcje kondycji i alertu centrum Azure Stack.The tile is your entry point into the health and alert functionality of Azure Stack Hub.

Kafelek zarządzanie regionami w portalu administratora Azure Stack Hub

Informacje o kondycji w centrum Azure StackUnderstand health in Azure Stack Hub

Dostawca zasobów kondycji zarządza kondycją i alertami.The health resource provider manages health and alerts. Azure Stack składniki infrastruktury centrum rejestrują się przy użyciu dostawcy zasobów kondycji podczas wdrażania i konfigurowania centrum Azure Stack.Azure Stack Hub infrastructure components register with the health resource provider during Azure Stack Hub deployment and configuration. Ta rejestracja umożliwia wyświetlanie kondycji i alertów dla każdego składnika.This registration enables the display of health and alerts for each component. Kondycja w centrum Azure Stack jest prostą koncepcją.Health in Azure Stack Hub is a simple concept. Jeśli istnieje alert dotyczący zarejestrowanego wystąpienia składnika, stan kondycji tego składnika odzwierciedla najgorszy aktywny alert ważność: ostrzeżenie lub krytyczny.If alerts for a registered instance of a component exist, the health state of that component reflects the worst active alert severity: warning or critical.

Definicja ważności alertuAlert severity definition

Azure Stack Hub zgłasza alerty tylko z dwoma serwerami: Ostrzeżenie i krytyczny.Azure Stack Hub raises alerts with only two severities: warning and critical.

  • OstrzeżenieWarning
    Operator może posłużyć do zaplanowania alertu ostrzegawczego.An operator can address the warning alert in a scheduled manner. Alert zazwyczaj nie ma wpływu na obciążenia użytkowników.The alert typically doesn't impact user workloads.

  • KrytyczneCritical
    Operator powinien rozwiązywać alert o krytycznym znaczeniu.An operator should address the critical alert with urgency. Te alerty wskazują na problemy, które aktualnie wpływają lub wkrótce wpłyną Azure Stack użytkowników centrum.These alerts indicate issues that currently impact or will soon impact Azure Stack Hub users.

Wyświetl stan kondycji składników i Zarządzaj nimView and manage component health state

Stan kondycji składników można wyświetlić w portalu administratora oraz za pomocą interfejsu API REST i programu PowerShell.You can view the health state of components in the administrator portal and through REST API and PowerShell.

Aby wyświetlić stan kondycji w portalu, kliknij region, który chcesz wyświetlić na kafelku zarządzanie regionami .To view the health state in the portal, click the region that you want to view in the Region management tile. Można wyświetlić stan kondycji ról infrastruktury i dostawców zasobów.You can view the health state of infrastructure roles and of resource providers.

Lista ról infrastruktury

Możesz kliknąć dostawcę zasobów lub rolę infrastruktury, aby wyświetlić bardziej szczegółowe informacje.You can click a resource provider or infrastructure role to view more detailed information.

Ostrzeżenie

Jeśli klikniesz rolę infrastruktury, a następnie klikniesz wystąpienie roli, dostępne są opcje uruchamiania, ponownego uruchamiania lub zamykania.If you click an infrastructure role, and then click the role instance, there are options to Start, Restart, or Shutdown. Nie należy używać tych akcji w przypadku stosowania aktualizacji do zintegrowanego systemu.Don't use these actions when you apply updates to an integrated system. Nie należy również używać tych opcji w środowisku Azure Stack Development Kit (ASDK).Also, do not use these options in an Azure Stack Development Kit (ASDK) environment. Te opcje są przeznaczone tylko dla środowiska zintegrowanego systemu, w którym istnieje więcej niż jedno wystąpienie roli dla każdej roli infrastruktury.These options are only designed for an integrated systems environment, where there's more than one role instance per infrastructure role. Ponowne uruchomienie wystąpienia roli (szczególnie AzS-Xrp01) w ASDK powoduje niestabilność systemu.Restarting a role instance (especially AzS-Xrp01) in the ASDK causes system instability. Aby uzyskać pomoc w rozwiązywaniu problemów, Opublikuj swój problem na forum centrum Azure Stack.For troubleshooting assistance, post your issue to the Azure Stack Hub forum.

Wyświetlanie alertówView alerts

Lista aktywnych alertów dla każdego regionu centrum Azure Stack jest dostępna bezpośrednio w bloku zarządzanie regionami .The list of active alerts for each Azure Stack Hub region is available directly from the Region management blade. Pierwszy kafelek w konfiguracji domyślnej to kafelek alerty , który wyświetla podsumowanie alertów krytycznych i ostrzeżeń dla regionu.The first tile in the default configuration is the Alerts tile, which displays a summary of the critical and warning alerts for the region. Możesz przypiąć kafelek alerty, podobnie jak każdy inny kafelek w tym bloku, do pulpitu nawigacyjnego, aby uzyskać szybki dostęp.You can pin the Alerts tile, like any other tile on this blade, to the dashboard for quick access.

Kafelek alerty pokazujący ostrzeżenie w portalu administratora centrum Azure Stack

Aby wyświetlić listę wszystkich aktywnych alertów dla regionu, wybierz górną część kafelka alertów .To view a list of all active alerts for the region, select the top part of the Alerts tile. Aby wyświetlić listę filtrowanych alertów (krytyczne lub ostrzeżenie), wybierz element wiersz krytyczny lub ostrzegawczy w kafelku.To view a filtered list of alerts (Critical or Warning), select either the Critical or Warning line item within the tile.

Blok alerty obsługuje możliwość filtrowania zarówno stanu (aktywny, jak i zamknięty), jak i ważności (krytyczne lub ostrzeżenie).The Alerts blade supports the ability to filter both on status (Active or Closed) and severity (Critical or Warning). W widoku domyślnym są wyświetlane wszystkie aktywne alerty.The default view displays all active alerts. Wszystkie zamknięte alerty są usuwane z systemu po upływie siedmiu dni.All closed alerts are removed from the system after seven days.

Uwaga

Jeśli alert pozostaje aktywny, ale nie został zaktualizowany w ciągu dnia, możesz uruchomić polecenie test-AzureStack i zamknąć alert, jeśli nie zostaną zgłoszone żadne problemy.If an alert remains active but hasn't been updated in over a day, you can run Test-AzureStack and close the alert if no problems are reported.

Okienko filtru do filtrowania według stanu krytycznego lub ostrzeżenia w portalu administratora Azure Stack Hub

Akcja Wyświetl interfejs API wyświetla interfejs API REST, który został użyty do wygenerowania widoku listy.The View API action displays the REST API that was used to generate the list view. Ta akcja umożliwia szybkie zapoznanie się ze składnią interfejsu API REST, za pomocą której można wysyłać zapytania dotyczące alertów.This action provides a quick way to become familiar with the REST API syntax that you can use to query alerts. Możesz użyć tego interfejsu API w usłudze Automation lub do integracji z istniejącymi rozwiązaniami do monitorowania, raportowania i biletów centrów danych.You can use this API in automation or for integration with your existing datacenter monitoring, reporting, and ticketing solutions.

Możesz kliknąć konkretny alert, aby wyświetlić szczegóły alertu.You can click a specific alert to view the alert details. Szczegóły alertu zawierają wszystkie pola, które są skojarzone z alertem, i umożliwiają szybką nawigację w składniku, którego to dotyczy, i źródła alertu.The alert details show all fields that are associated with the alert and enable quick navigation to the affected component and source of the alert. Na przykład poniższy alert występuje, gdy jedno z wystąpień roli infrastruktury przejdzie w tryb offline lub jest niedostępne.For example, the following alert occurs if one of the infrastructure role instances goes offline or isn't accessible.

Blok szczegóły alertu w portalu administratora Azure Stack Hub

Korygowanie alertówAlert remediation

Automatyczne korygowanieAutomated remediation

Niektóre alerty obsługują opcję naprawy , jak pokazano na poprzedniej ilustracji.Some alerts support a Repair option, as shown in the previous image. Po wybraniu Akcja naprawy wykonuje kroki specyficzne dla alertu, aby podjąć próbę rozwiązania problemu.When selected, the Repair action performs steps specific to the alert to attempt to resolve the issue. Po wybraniu tego stanu Akcja naprawy jest dostępna jako powiadomienie w portalu.Once selected, the status of the Repair action is available as a portal notification.

Akcja naprawy alertu w toku

Akcja naprawy zgłosi pomyślne zakończenie lub niepowodzenie wykonania akcji w tym samym bloku powiadomień portalu.The Repair action will report successful completion or failure to complete the action in the same portal notification blade. Jeśli akcja naprawy zakończy się niepowodzeniem dla alertu, można ponownie uruchomić akcję naprawy z szczegółów alertu.If a Repair action fails for an alert, you may rerun the Repair action from the alert detail. Jeśli akcja naprawy została zakończona pomyślnie, nie uruchamiaj ponownie akcji naprawy .If the Repair action successfully completes, do not rerun the Repair action. Po powrocie wystąpienia roli infrastruktury do trybu online ten alert zostanie automatycznie zamknięty.After the infrastructure role instance is back online, this alert automatically closes.

Akcja naprawy została pomyślnie zakończona

Korygowanie ręczneManual remediation

Jeśli opcja Naprawa nie jest obsługiwana, należy postępować zgodnie z kompletnym zestawem instrukcji korygowania przedstawionych w alercie.If the Repair option is not supported, be sure to follow the complete set of remediation instructions provided in the alert. Na przykład procedura korygowania wygaśnięcia certyfikatu wewnętrznego przeprowadzi Cię przez proces rotacji wpisów tajnych:As an example, the internal certificate expiration remediation steps will guide you through the process of secret rotation:

Korygowanie wygaśnięcia certyfikatu

Zamknięcie alertuAlert closure

Wiele, ale nie każdy alert, zostanie automatycznie zamknięty po rozwiązaniu podstawowego problemu.Many, but not every alert, will automatically close when the underlying issue is resolved. Alerty z przyciskiem akcja naprawy zostaną zamknięte automatycznie, jeśli Azure Stack Hub rozwiąże problem.Alerts that provide a Repair action button will close automatically if Azure Stack Hub resolves the issue. W przypadku wszystkich innych alertów wybierz pozycję Zamknij alert po wykonaniu czynności zaradczych.For all other alerts, select Close Alert after you do the remediation steps. Jeśli problem będzie się powtarzać, usługa Azure Stack Hub wygeneruje nowy Alert.If the issue persists, Azure Stack Hub generates a new alert. Jeśli rozwiążesz ten problem, alert pozostanie zamknięty i nie będzie konieczne wykonanie dalszych kroków.If you resolve the issue, the alert remains closed and requires no more steps.

Następne krokiNext steps

Zarządzanie aktualizacjami w usłudze Azure Stack HubManage updates in Azure Stack Hub

Zarządzanie regionami w centrum Azure StackRegion management in Azure Stack Hub