Helyreállítás tervezése

Befejeződött
A számítási feladatnak képesnek kell lennie a legtöbb hiba előrejelzésére és helyreállítására, minden nagyságrendben, a felhasználói élmény és az üzleti célok minimális zavarával.

Még a rendkívül rugalmas rendszereknek is szükség van vészrekészségi megközelítésekre az architektúra tervezésekor és a számítási feladatok műveleteiben. Az adatrétegen olyan stratégiákkal kell rendelkeznie, amelyek sérülés esetén javíthatják a számítási feladatok állapotát.

Példaforgatókönyv

A Contoso jelenleg nagy mennyiségű adatot tárol egy helyszíni SQL Server-adatbázisban, és nemrég modernizálta az adatok elemzési megoldását az Azure-szolgáltatásokkal.

Az új elemzési megoldás az Azure Analysis Servicest, az Azure Data Factoryt, az Azure Synapse Analyticset, a Power BI-t és az Azure-beli virtuális gépeket használja. A megoldás minden felhasználója belső. A megoldás rendelkezésre állási követelményeinek mérlegelése után a csapat úgy dönt, hogy egyetlen régióban valósítja meg a megoldást.

Az adatok az Azure Data Factory használatával kerülnek betöltésre és feldolgozásra, mielőtt az Analysis Services-tárolóba mentenék őket. A folyamat egy része egy örökölt windowsos folyamatot igényel, amelyet egy felhőbeli virtuális gépen helyeznek üzembe.

Készüljön fel a katasztrófákra

Strukturált, tesztelt és dokumentált helyreállítási tervekkel rendelkezik, amelyek igazodnak a kialkudott helyreállítási célokhoz. A terveknek a rendszer egésze mellett az összes összetevőre is ki kell terjedniük.

Egy jól definiált folyamat gyors helyreállításhoz vezet, amely megakadályozhatja, hogy negatív hatással legyen vállalkozása pénzügyeire és hírnevére. A rendszeres helyreállítási próbák során a rendszerösszetevők, az adatok, valamint a feladatátvételi és feladat-visszavételi lépések helyreállításának folyamatát teszteljük, hogy elkerüljük a félreértéseket, amikor az idő és az adatok integritása a siker fő mértéke.

A Contoso kihívása

  • A megoldást csak belsőleg használják, és nem tekintik kritikus fontosságúnak. A számítási feladatokért felelős csapat és az üzleti érdekelt felek egyetértenek abban, hogy a megoldás másodlagos régióban való újraépítése elegendő helyreállítási modell abban a valószínűtlen esetben, ha az üzembe helyezett Azure-régió elveszik, vagy a teljes megoldás valamilyen más okból elérhetetlenné válik.
  • A számítási feladatokért felelős csapat leírja, hogyan hozhatja létre a megoldást egy másik régióban a DR-tervben, de még nem volt lehetősége teljes dr. részletezés elvégzésére.

A megközelítés és az eredmények alkalmazása

  • A regionális leállás után a DR válaszcsapata követni tudja a DR-terv utasításait, hogy újra üzembe helyezze az elemzési megoldást egy másik régióban.
  • A csapat feltárja a megoldás üzembe helyezéséhez szükséges műveletek némelyike esetében a DR-tervek hiányosságait, és a terv frissül, hogy a helyreállítás hatékonyabbá tegye a jövőben.
  • A számítási feladatokért felelős csapat és az érdekelt felek megállapodnak abban, hogy felgyorsítják a tervezett dr. tesztelést, hogy a frissített terv hatékonyabb helyreállítást biztosítson.

Állapotalapú adatok kezelése

Győződjön meg arról, hogy a helyreállítási célokon belül minden állapotalapú összetevő adatait kijavíthatja.

A biztonsági mentések elengedhetetlenek ahhoz, hogy a rendszer működőképes állapotba kerüljön egy megbízható helyreállítási ponttal, például az utolsó ismert jó állapottal.

A nem módosítható és tranzakciósan konzisztens biztonsági másolatok biztosítják, hogy az adatok ne módosíthatók legyenek, és hogy a visszaállított adatok ne sérüljenek.

A Contoso kihívása

  • A számítási feladatokért felelős csapat úgy dönt, hogy áthelyezi az SQL-adatbázisokat az Azure-ba, hogy csökkentse az elemzések feldolgozási idejét. Az egyik adatbázist nagy mértékben használják a virtuális gépek az elemzési folyamat során, ezért a csapatnak biztosítania kell, hogy az adatbázis állapota a lehető legalacsonyabb RPO-val helyreállítható legyen.

A megközelítés és az eredmények alkalmazása

  • Mivel az adatbázisok egyenként 4 TB-nál nagyobb méretűek, az Azure SQL Database-be való migrálás rövid távon nem érhető el. A csapat tehát az SQL Server 2022-t futtató Azure-beli virtuális gépekre migrál.
  • A csapat úgy dönt, hogy az Automatikus biztonsági mentés függvényt használja az összes adatbázishoz, beleértve a kritikus adatbázisokat is, például a virtuális gépek által használtakat.
  • A kritikus adatbázisok esetében a csapat azt tervezi, hogy az Automatikus biztonsági mentés függvénnyel és a Felügyelt példány hivatkozás függvénnyel aktívan replikálja az adatbázisokat egy felügyelt Azure SQL-példányba.

Automatizált öngyógyító képességek implementálása a tervezésben

Az öngyógyító képességek olyan mechanizmusok, amelyek lehetővé teszik, hogy a számítási feladat összetevői automatikusan megoldják a problémákat az érintett összetevők helyreállításával és szükség esetén a redundáns infrastruktúrára való feladatátvételsel. Tervezési minták használatával önjavító mechanizmusokkal rugalmasságot adhat a számítási feladatokhoz.

Az öngyógyító automatizálás segít csökkenteni a külső tényezők, például az emberi beavatkozás kockázatait, és lerövidíti a törésjavítási ciklust.

A Contoso kihívása

  • Az Adatok betöltésekor az Azure Data Factoryből meghívott Windows-folyamat kezdetben több virtuális gépen lett üzembe helyezve a nagyobb rendelkezésre állás érdekében.
  • Volt néhány olyan eset, amikor az örökölt Windows-folyamat összeomlott, és a virtuális gép újraindítására volt szükség. Bár a teljes feldolgozási időt minimálisan érintette (a redundancia szintje miatt), a csapat olyan megoldást szeretne implementálni, amely automatizálja a hiba észlelését és a helyreállítást.

A megközelítés és az eredmények alkalmazása

  • A csapat úgy dönt, hogy implementál egy Azure-beli virtuálisgép-méretezési csoport megoldást, amely úgy van konfigurálva, hogy az Alkalmazásállapot-bővítményt telepítse a virtuálisgép-folyamat állapotának folyamatos figyeléséhez.
  • Ha engedélyezve van az automatikus példányjavítás, a méretezési csoport most már képes javítani az összetevőt a virtuális gép újraindításával vagy egy új példány ugyanazon lemezkép alapján történő létrehozásával.

Tesztelje tudását

1.

Az alábbiak közül melyik példa olyan metrikákra, amelyek segítenek a vészhelyreállítási tervek végrehajtásában?

2.

Az alábbi forgatókönyvek közül melyik példa az állapotalapú adatok helyreállítási célokra történő kezelésére?

3.

A Contoso egy kritikus fontosságú üzletági alkalmazással rendelkezik az Azure-ban. Mi az egyik módja annak, hogy önjavítást valósítsanak meg az alkalmazás megbízhatóságának javítása érdekében?