Podsumowanie

Ukończone

U wszystkich występują zdarzenia. Jeśli uruchomisz dowolny system o podstawowym rozmiarze, w pewnym momencie zakończy się to niepowodzeniem i wystąpi awaria. To fakt. Dlatego reagowanie na zdarzenia jest drugim poziomem w hierarchii niezawodności Dickersona bezpośrednio po monitorowaniu.

Następnie staje się pytanie: Jak reagujesz w tych momentach? Czy reagujesz w trybie pilnym przy użyciu określonego planu lub procesu, czy masz reakcję ad hoc? Wiemy z dobrych badań w tej dziedzinie, że czas odzyskiwania jest jednym ze wskaźników wysokiej wydajności organizacji. Dobry proces reagowania na zdarzenia jest kluczowy dla skrócenia okresu odzyskiwania.

W tym module przyjrzeliśmy się etapom zdarzenia i poznaliśmy niektóre kluczowe składniki planu reagowania na zdarzenia dla każdego z tych etapów. Omówiliśmy znaczenie śledzenia zdarzeń dobrze i sposobów automatyzowania tego procesu przy użyciu narzędzi dostępnych na platformie Azure. Przyjrzeliśmy się również kluczowym aspektom komunikacji podczas zdarzenia. Na koniec zapoznaliśmy się z niektórymi narzędziami, które zapewnia platforma Azure, które mogą pomóc Twojej organizacji w bardziej wydajnym korygowaniu zdarzenia.