Tervezzen műveletekhez

Befejeződött
A műveletekben balra tolva előrejelezi a meghibásodási feltételeket.

Tesztelje a hibákat korai és gyakran a fejlesztési életciklus során, és határozza meg a teljesítmény megbízhatóságra gyakorolt hatását. A kiváltó okok elemzése és a postmortems érdekében megosztott láthatóságot kell biztosítani a csapatok között a függőségi állapotról és a folyamatban lévő hibákról. Elemzések, a diagnosztika és a megfigyelhető rendszerek riasztásai alapvető fontosságúak a hatékony incidenskezelés és a folyamatos fejlesztés szempontjából.

A Contoso Egyetem mikroszolgáltatásokra épülő webalkalmazást futtat, amely oktatási szolgáltatásokat, például online órákat biztosít a Contoso oktatói és hallgatói számára. A számítási feladat Azure-alkalmazás Szolgáltatásra, Azure SQL Database-re, Microsoft Entra ID-ra, Azure Key Vaultra, Azure Service Busra, Azure Monitorra és Azure DevOpsra épül.

Robusztus monitorozás implementálása

Megfigyelhető rendszerek létrehozása, amelyek korrelálhatják a telemetriát.

A monitorozás és a diagnosztika kulcsfontosságú műveletek. Ha valami meghibásodik, tudnia kell, hogy sikertelen volt, mikor és miért nem sikerült. Az összetevők szintjén a megfigyelhetőség alapvető, de az összetevők és a korrelált folyamatok összesített megfigyelhetősége holisztikus képet nyújt az állapotról. Ezekre az adatokra azért van szükség, hogy a helymegismelő mérnökök rangsorolhassák a szervizelésre irányuló erőfeszítéseiket.

A Contoso kihívása

  • A számítási feladatalkalmazás öt, több funkcionális szinten leválasztott szolgáltatásból álló csomag részeként van üzembe helyezve.
  • A csapat szeretné elemezni a tranzakciókat és a felhasználók kéréseit, miközben a megoldás különböző szintjeire lépve azonosítják azokat a szűk keresztmetszeteket, amelyek instabilitáshoz vezethetnek, és hatékonyabb hibaelhárítást végezhetnek a problémák felmerülésekor.

A megközelítés és az eredmények alkalmazása

  • A számítási feladatokért felelős csapat a naplók és metrikák rögzítésére szolgáló összetevőket az Application Elemzések segítségével rögzíti, és minden platformszolgáltatáshoz konfigurálja a naplózást. A rendszer minden naplót továbbít a számítási feladat Azure Monitor-munkaterületére.
  • Az AzM-munkaterületen található adatok a megoldás egyes összetevőinek, valamint az összesített folyamatok és a megoldás állapotának elemzésére használhatók.
  • Az azonos kéréshez tartozó bejegyzések összetevők és szintek közötti korrelációja segít a csapatnak meghatározni a számítási feladatok állapotát, és megkönnyíteni a hibaelhárítási folyamatokat.

Lehetséges meghibásodások és rendellenes viselkedés előrejelzése

Az aktív megbízhatósági hibák láthatóvá tétele rangsoros és végrehajtható riasztások használatával. Olyan megbízható folyamatokba és infrastruktúrába fektethet be, amelyek gyorsabb osztályozáshoz vezetnek.

A webhely-megbízhatósági mérnökök azonnal értesítést kaphatnak, hogy enyhítsék a folyamatban lévő élő webhelyeseményeket, és proaktív módon mérsékeljék a prediktív riasztások által azonosított lehetséges hibákat, mielőtt élő incidensekká válnak.

A Contoso kihívása

  • A csapat az egyes tanórák elején jelentős forgalomnövekedésre számít, mivel a diákok regisztrálnak az osztályokra, hozzáférnek a szillabihoz, és tankönyveket vásárolnak.
  • A tanév kritikus időszakában a csapatnak biztosítania kell, hogy elegendő kapacitás legyen a várható terhelés növekedéséhez. A csapatnak képesnek kell lennie arra is, hogy gyorsan reagáljon más lehetséges rendelkezésre állási problémákra, amelyek felmerülhetnek.

A megközelítés és az eredmények alkalmazása

  • A csapat úgy konfigurálja a webes és adatbázisszinteket, hogy automatikusan felskálázhatók, hogy a terhelés növekedése előtt további kapacitással rendelkezzenek, és a terhelés növekedésével továbbra is lefoglalják a kapacitást.
  • A vészhelyzeti reagálási terv úgy van módosítva, hogy a stressz alatt álló folyamatokhoz kapcsolódó riasztásokat az incidenskezelési csapat rangsorolja.

Megbízhatósági kockázatok tesztelése

Hibák szimulálása és tesztek futtatása éles és éles környezetekben.

Előnyös, ha az éles környezetben hibák jelentkeznek, így reális elvárásokat állíthat be a helyreállításhoz. Ez lehetővé teszi, hogy olyan tervezési döntéseket hozzon, amelyek kecsesen reagálnak a hibákra. Emellett lehetővé teszi az üzleti metrikákhoz beállított küszöbértékek tesztelését is.

A Contoso kihívása

  • A webes szint és a tanulóregisztrációs REST szolgáltatás közötti kommunikáció ebben a számítási feladatban ügyféltanúsítványokra támaszkodik.
  • Mivel a tanulóregisztrációs funkció a kifejezés kezdete után nem sokat használ, ha a tanulóregisztrációs szolgáltatás által használt tanúsítvány lejár, a probléma egy ideig észrevétlenül jelentkezhet.
  • Emellett az utolsó regisztrációs időszak során több szolgáltatáskimaradás is történt, mivel a rendszer helytelenül kezelte az átmeneti csatlakozási hibákat. A csapat végrehajtott néhány kódfejlesztést az átmeneti hibák kezelésére, de nem biztos abban, hogy a funkció hogyan fog viselkedni a valós éles helyzetekben.

A megközelítés és az eredmények alkalmazása

  • A csapat olyan szintetikus tranzakciótesztelést fejleszt, amely havi ütemezés szerint éles környezetben fog futni, hogy több folyamatot szimuláljon, beleértve a regisztrációs folyamatot is.
  • A riasztás a szintetikus tranzakciós tesztekhez van konfigurálva, így a csapat értesítést kap a lejáró tanúsítványok kockázatával járó hibákról.
  • Emellett a csapat abba fektetett, hogy káosztesztelést építsen az SDLC-be, rutinszerű káosztesztelést végezzen, és rögzítse az eredményeket az önmegőrzési technikák ellenőrzéséhez és a korábban ismeretlen megbízhatósági problémák feltárásához.

Tesztelje tudását

1.

Igaz vagy hamis: a számítási feladatok megfigyelhetővé tételének egyik példája, ha az alkalmazás telemetriaadatokat bocsát ki.

2.

Mi a jól megtervezett riasztási stratégia attribútuma?

3.

Mi az egyik módja annak, hogy a Contoso bizonyítani tudja, hogy a számítási feladataik csökkentett állapotban működnek?