Postup zavření výstrahy vygenerované monitorováním

Důležité

Tato verze Operations Manageru dosáhla konce podpory. Doporučujeme upgradovat na Operations Manager 2022.

Monitorování určují stav objektů. Objekt může být v jednom ze tří stavů: zeleném (úspěšný nebo v pořádku), žlutém (varování), nebo červeném (kritický nebo není v pořádku). Monitorování kapacity disku například může být označeno zeleně, je-li zaplněno méně než 85 procent kapacity, žlutě při zaplnění vyšším než 85 procent a červeně při zaplnění vyšším než 90 procent. Monitorování může být nakonfigurováno, aby vytvářelo výstrahu při změně stavu.

Když obdržíte výstrahu, v podrobnostech výstrahy uvidíte, jestli ji vygenerovalo pravidlo nebo monitorování. Pokud výstrahu vygenerovalo monitorování, doporučujeme, abyste monitorování umožnili ji automaticky vyřešit při návratu monitorování do stavu „v pořádku“. Pokud výstrahu zavřete, když je objekt ve stavu upozornění nebo není v pořádku, problém zůstane nevyřešený, ale nebudou generovány žádné další výstrahy.

Pokud monitorování vygeneruje výstrahu, když se jeho stav změní na červený, a vy ji vyřešíte, musíte resetovat také stav monitorování. Pokud se monitorování resetuje, může znovu dojít ke stejnému stavu, který vygeneroval výstrahu, ale žádná výstraha se nevygeneruje, protože se stav nezměnil.

Pokud v Operations Manageru před 2019 zavřete výstrahu, když je objekt ve stavu upozornění nebo není v pořádku, problém zůstane nevyřešený, ale negenerují se žádné další výstrahy. Toto chování, které často vedlo ke scénáři, kdy v systému není aktivní výstraha, zatímco existuje základní problém, je opravené v Operations Manageru 2019.

V Operations Manageru 2019 nejde zavřít výstrahu vygenerovanou monitorováním, pokud není stav odpovídajícího monitorování v pořádku. Pokud se pokusíte zavřít výstrahu vygenerovanou monitorováním, které není v pořádku, zobrazí se chybová zpráva a výstraha se nezavře.

Toto nové chování můžete zkontrolovat z konzoly Operations Console i webové konzoly.

Konzole Operations Console

Postupujte takto:

  1. Otevřete konzolu nástroje Operations Manager a vyberte Monitorování.

    Přehled monitorování zobrazuje souhrn stavů monitorování a aktuálních výstrah.

  2. V navigačním podokně vyberte Aktivní výstrahy .

  3. Klikněte pravým tlačítkem na výstrahu, kterou vygeneruje monitorování ve špatném stavu.

  4. Nastavte stav řešení na Uzavřeno.

    Zobrazí se následující zpráva s důvodem neuzavírání výstrahy:

    Výstrahy v aktuálním výběru nelze zavřít, protože monitory, které tyto výstrahy vygenerovaly, stále nejsou v pořádku. Další podrobnosti o výstraze, kterou nebylo možné zavřít, najdete na řídicím panelu Chyba uzavření výstrahy ve webové konzole nástroje Operations Manager.

    Snímek obrazovky s konzolou operací se zavřenou zprávou upozornění

    Poznámka

    Pokud chcete tuto výstrahu zavřít, musí se stav odpovídajícího monitorování ručně resetovat do stavu V pořádku. Pokud je automatické spuštění pro toto monitorování nastaveno na hodnotu true, výstraha se po resetování stavu automaticky zavře. V opačném případě se výstraha musí po resetování stavu zavřít ručně.

Webová konzole

  1. Otevřete webovou konzolu a vyberte Monitorování. Přehled monitorování zobrazuje souhrn stavů monitorování a aktuálních výstrah.

  2. V navigačním podokně vyberte Aktivní výstrahy .

  3. Otevřete výstrahu, kterou vygenerovalo monitorování ve špatném stavu.

  4. Nastavte stav řešení na Uzavřeno a Uložit změny.

    Zobrazí se následující zpráva s důvodem neuzavírání výstrahy:

    Aktuální výstrahu nelze zavřít, protože monitorování, které tuto výstrahu vygenerovalo, stále není v pořádku.

    Snímek obrazovky s webovou konzolou zprávy s uzavřenou výstrahou

    Poznámka

    Chcete-li tuto výstrahu zavřít, musíte ručně resetovat stav odpovídajících monitorování, která tuto výstrahu vygenerovala.

Ruční resetování stavu monitorování pro odpovídající výstrahu

Postupujte takto:

  1. V navigačním podokně vyberte Řídicí panel Selhání uzavření výstrah . Na řídicím panelu jsou uvedené výstrahy, které Operations Manager nemohl zavřít, protože monitorování, které výstrahu vygenerovalo, není v pořádku.

  2. Stav monitorování odpovídající výstrahy můžete resetovat následujícími dvěma způsoby:

    • Na řídicím panelu vyberte upozornění a pak vyberte akci řídicího panelu Resetovat stav pro výstrahu. Nebo
    • Výběrem výstrahy na tomto řídicím panelu přejděte na stránku pro přechod k podrobnostem výstrah (kde můžete vizualizovat všechny relevantní informace pro výstrahu) a v podokně úloh vyberte úlohu Resetovat stav .

    Snímek obrazovky znázorňující resetování stavu monitoru pro upozornění

Rozhraní API pro aktualizaci upozornění

Pokud se uzavření výstrahy aktivuje z externích systémů, jako je správa incidentů, a výstraha se neuzavřela, protože odpovídající monitorování není v pořádku, pak se s podrobnostmi o upozornění předá výjimka, kterou můžou využívat externí systémy.

K externalizaci dat aktualizací upozornění je možné použít následující existující rozhraní API pro aktualizaci upozornění. Tato dvě rozhraní API byla vylepšena tak, aby umožňovala externalizaci tohoto nového chování:

  • Rozhraní API pro aktualizaci upozornění 1

  • Rozhraní API pro aktualizaci upozornění 2

Následující ukázka ukazuje podrobnosti o použití výjimky AlertMonitorUnhealthyException.

namespace MonitorAlertClosureFailureExample
{
    class Program
    {
        static void Main(string[] args)
        {
            ManagementGroup mg = new ManagementGroup("localhost");

            // Get database availability alerts.
            MonitoringAlertCriteria alertCriteria = new MonitoringAlertCriteria(
                "Name LIKE '%DBStatusMonitor' AND Category = 'AvailabilityHealth'");
            IList<MonitoringAlert> alerts =
                mg.OperationalData.GetMonitoringAlerts(alertCriteria, default(DateTime));

            // Find the "Closed" resolution state that is defined
            // for this Management Group.
            IList<MonitoringAlertResolutionState> alertStates = mg.OperationalData.GetMonitoringAlertResolutionStates();
            MonitoringAlertResolutionState closedState = null;
            foreach (MonitoringAlertResolutionState thisState in alertStates)
            {
                if (thisState.Name == "Closed")
                {
                    closedState = thisState;
                }
            }

            // Close all alerts not already in the "Closed" resolution state.
            foreach (MonitoringAlert a in alerts)
            {
                a.ResolutionState = closedState.ResolutionState;
                string comment = "Closing the Alert";
                try
                {
                    a.Update(comment);
                }
                catch (AlertMonitorUnhealthyException e)
                {
                    // It mean the alert being closed is a monitor alert and the monitor which generated this alert is still unhealthy
                    // take an appropriate action. Here an error message is being displayed at console
                    Console.WriteLine("The alert with Alert Name" + a.Name + "cannot be closed as the monitor which genrated the alert is still unhealthy.")
                }
                catch (Exception e)
                {
                    // generic exception during the update of the alert
                    Console.WriteLine("Closing the alert with alert name" + a.Name + "is failing because" + e.Message)
                }

            }

    }
}


namespace MonitorAlertClosureFailureExample
{
    class Program
    {
        static void Main(string[] args)
        {
            ManagementGroup mg = new ManagementGroup("localhost");

            // Get database availability alerts.
            MonitoringAlertCriteria alertCriteria = new MonitoringAlertCriteria(
                "Name LIKE '%DBStatusMonitor' AND Category = 'AvailabilityHealth'");
            IList<MonitoringAlert> alerts =
                mg.OperationalData.GetMonitoringAlerts(alertCriteria, default(DateTime));

            // Find the "Closed" resolution state that is defined
            // for this Management Group.
            IList<MonitoringAlertResolutionState> alertStates = mg.OperationalData.GetMonitoringAlertResolutionStates();
            MonitoringAlertResolutionState closedState = null;
            foreach (MonitoringAlertResolutionState thisState in alertStates)
            {
                if (thisState.Name == "Closed")
                {
                    closedState = thisState;
                }
            }

            // Close all alerts not already in the "Closed" resolution state.
            string comment = "Closing the alert";
            foreach(MonitoringAlert a in alerts)
            {
                a.ResolutionState = closedState.ResolutionState;
            }

            IList<MonitoringAlertUpdateFailure> updateFailures = mg.OperationalData.UpdateMonitoringAlerts(alerts, comment);

            if (updateFailures != null && updateFailures.Count > 0)
            {
                foreach (MonitoringAlertUpdateFailure failure in updateFailures)
                {
                    if(failure.Exception is AlertMonitorUnhealthyException)
                    {
                        // It means the alert being closed is a monitor alert and the monitor which generated this alert is still unhealthy
                        // take an appropriate action. Here an error message is being displayed at console
                        Console.WriteLine("The alert with Alert Name" + a.Name + "cannot be closed as the monitor which genrated the alert is still unhealthy.")
                    }
            }           
        }

    }
}

Jak určit, jestli se výstraha automaticky vyřešila

Postupujte takto:

  1. Vyberte výstrahu a pak v podrobnostech výstrahy vyberte název monitorování výstrahy. Otevře se dialogové okno Vlastností pro monitorování.

  2. Ve vlastnostech monitorování vyberte kartu Výstrahy a podívejte se, jestli je vybraná možnost Automaticky vyřešit výstrahu, když se monitorování vrátí do dobrého stavu .

Zavření výstrahy vygenerované monitorováním

Postupujte takto:

  1. Přečtěte si výstrahu a zkontrolujte její vlastnosti. Zkontrolujte podrobnosti výstrahy a zjistěte, jestli ji vygenerovalo monitorování nebo pravidlo. K určení příčiny výstrahy použijte znalostní bázi produktů.

  2. Vyřešte příčiny výstrahy a podnikněte kroky potřebné k odstranění problému.

  3. Jakmile se problém vyřeší, v podrobnostech výstrahy vyberte Zdroj . Tím otevřete zobrazení Stav objektu souvisejícího s výstrahou.

  4. Klikněte pravým tlačítkem na objekt, přejděte na Otevřít a jako název objektu vyberte Průzkumník stavů.

  5. Vyberte monitorování, které výstrahu vygenerovalo, a na panelu nástrojů vyberte Resetovat stav . Zavřete Průzkumníka stavů a zobrazení Stav.

  6. Aktualizujte zobrazení výstrah. Pokud je výstraha stále uvedená, vyberte ji a v podokně Akce vyberte Zavřít výstrahu .

Poznámka

Následující aktualizace (uzavření osamocených upozornění) platí pro Operations Manager 2019 UR3 a novější.

Uzavření osamocených upozornění

V Operations Manageru 2019 RTM, UR1 a UR2 se aktivní výstrahy nezavírají po trvalém stavu v určitých scénářích, jak je podrobně popsáno níže:

  1. Zabezpečení před selháním:

    • Převzetí služeb při selhání, které se může aktivovat, když server pro správu přejde do offline režimu.
    • Z důvodu přidání nových serverů pro správu do fondu zdrojů, což vede k vyrovnávání zatížení.
    • Pokud počítač bez agenta převezme služby při selhání a má být monitorován jiným serverem pro správu, zobrazí se nový stav.
  2. Agent se po nějaké době odpojil a znovu připojil, kdy změna stavu nezná předchozí stav.

  3. Server pro správu se odpojil a znovu připojil.

  4. Mezipaměť služby Health Service se vymazá.

Obecně platí, že služba Health Service neudržuje poslední stav monitorování. při resetování monitorování do stavu v pořádku se neuzavřou výstrahy.

V Operations Manageru 2019 UR3 se všechna osamocené výstrahy nakonec zavřou v závislosti na typu monitorování, jak je podrobně popsáno níže:

  • Monitorování služby: Okamžitě zavřete.
  • Všechny monitory s modulem okamžitě na vyžádání: Okamžitě zavřete.
  • Všechna monitorování bez modulů na vyžádání: Zavření při druhém spuštění v závislosti na frekvenci.
  • Monitorování na základě událostí: Zavře se událostí, která je v pořádku, ke které dojde po inicializaci.

Přechod stavu při inicializaci monitorování ukazuje menší změnu; ukázka níže:

Snímek obrazovky znázorňující přechod stavu

Jak je znázorněno na obrázku výše, během inicializace se monitor nejprve změní na dobrý stav. Pak se znovu vypočítá a vrátí se do stavu. Uvidíte dva přechody změn stavu z prázdného stavu do stavu v pořádku.

Změny v prostředí pro zavření upozornění

V nástroji Operations Manager 2022 může správce zvolit uzavření výstrahy monitorování stavu, které je ve stavu Není v pořádku.

Ve verzi 2019 nešlo výstrahu vygenerovanou monitorováním zavřít, pokud není stav odpovídajícího monitoru v pořádku. Pokud se pokusíte zavřít výstrahu vygenerovanou monitorováním, které není v pořádku, zobrazí se chybová zpráva a upozornění se nezavře.

V nástroji Operations Manager 2022 může správce toto chování změnit tak, že přejde naNastavenísprávy> a vybere některou z následujících možností:

  • Zavření výstrah vygenerovaných monitorováním pouze při vyřešení základního stavu monitorování nebo ruční resetování
  • Zavření výstrah vygenerovaných monitorováním resetováním základního stavu monitorování: Tato možnost umožňuje zavřít výstrahy monitorování, která nejsou v pořádku, programově a v uživatelském rozhraní. Tím se resetuje základní stav monitorování, čímž se implicitně zavře odpovídající výstraha. Tato možnost také umožňuje hromadně zavřít výstrahy generované monitorováním.

Můžete také sledovat, jak se výstraha zavřela, zobrazenímHistorievlastností> upozornění.

Snímek obrazovky znázorňující globální nastavení skupiny pro správu

Snímek obrazovky s historií upozornění

Další kroky

  • Když se vygeneruje výstraha, můžete zobrazit aktivní výstrahy a podrobnosti v konzole Operations Console a identifikovat možné problémy a pomoct identifikovat další kroky k jejich řešení.

  • Po prošetření a vyřešení problému zjištěného jedním nebo více monitory si přečtěte téma Jak resetovat stav a ručně resetovat stav, pokud monitorování není nakonfigurované tak, aby automaticky vyřešilo, nebo nechcete čekat, až monitorování zjistí stav.