Kompromisy provozní efektivity

Efektivita provozu zajišťuje kvalitu úloh prostřednictvím implementace jasných standardů týmu, srozumitelné odpovědnosti a odpovědnosti, pozornosti k výsledkům zákazníků a soudržnosti týmů. Implementace těchto cílů vychází z DevOps, který doporučuje minimalizovat odchylky procesů, snížit lidské chyby a nakonec zvýšit hodnotu úlohy. Tato hodnota se neměří jenom na základě funkčních požadavků obsluhovaných komponentami úlohy. Měří se také hodnotou, kterou tým poskytuje ve snaze o zlepšení.

Během fáze návrhu úlohy a v průběhu jejího životního cyklu je důležité zvážit, jak můžou rozhodnutí na základě principů efektivity provozu a doporučení v kontrolním seznamu pro kontrolu návrhu pro efektivitu provozu ovlivnit cíle a optimalizace ostatních pilířů. Některá rozhodnutí mohou být přínosná pro některé pilíře, ale představují kompromisy pro jiné. Tento článek popisuje příklady kompromisů, se kterými se tým úloh může setkat při návrhu architektury a provozu úloh.

Kompromisy provozní efektivity se spolehlivostí

Kompromis: Zvýšená složitost. Spolehlivost upřednostňuje jednoduchost, protože jednoduchý návrh minimalizuje chybnou konfiguraci a omezuje neočekávané interakce.

  • Strategie bezpečného nasazení často vyžadují dopřednou a zpětnou kompatibilitu mezi aplikační logikou a daty v úloze. Tato další složitost zvyšuje zátěž při testování a může vést ke složitosti nebo problémům s integritou dat úloh.

  • Vysoce vrstvené, modulární nebo parametrizované infrastruktury jako kód mohou zvýšit riziko náhodné chyby konfigurace kvůli složitosti interakce mezi komponentami kódu.

  • Vzory návrhu cloudu, které využívají operace, někdy vyžadují zavedení dalších komponent, například použití externího úložiště konfigurace nebo koordinace nasazení sajdkár v kontejnerizované aplikační platformě. Další komponenty zvyšují body interakce v systému a zvětšující plochu pro poruchu nebo chybnou konfiguraci.

  • Komponenty úloh, které jsou navržené tak, aby se nezávisle vyvíjely tak, aby podporovaly agilní vývoj a hostování, zavádějí závislosti na zjišťování služby nebo dokonce DNS jako vrstvě nepřímého přístupu. Zjišťování služeb může postrádat rychlost odezvy na změny a selhání může být obtížné diagnostikovat.

Kompromis: Zvýšení potenciálních aktivit, které by mohly být vyrušeny. Pilíř spolehlivosti podněcuje k tomu, aby se vyhýbali činnostem nebo možnostem návrhu, které by mohly vést k přerušení, výpadkům nebo poruchám systému.

  • Nasazení malých přírůstkových změn je technika pro zmírnění rizika, ale očekává se, že se tyto malé změny budou do produkčního prostředí doručovat častěji. Nasazení mohou stabilizovat systém, takže když se rychlost nasazení zvyšuje, zvyšuje se i toto riziko.

  • Kultura, která se měří pomocí metrik rychlosti, jako jsou nasazení za týden, a používá automatizaci, která může usnadnit zavádění změn rychlejším tempem, také pravděpodobně provede více nasazení za kratší dobu.

  • Zvýšení hustoty pro zjednodušení operací snížením počtu řídicích a pozorovatelných ploch může také vést ke zvýšenému riziku dostupnosti, protože selhání nebo chybná konfigurace zvyšují poloměr dopadu aktivační události.

Kompromisy efektivity provozu se zabezpečením

Kompromis: Zvýšená plocha. Pilíř Zabezpečení doporučuje menší prostor pro pracovní vytížení z hlediska komponent a vystavení provozu. Toto omezení minimalizuje vektory útoku a vytváří menší rozsah pro kontrolu a testování zabezpečení.

  • Součásti, které obklopují úlohu a podporují její operace, jako je automatizace nebo vlastní řídicí rovina, musí být také v rozsahu pro pravidelné posílení zabezpečení a testování.

  • Rutinní, ad hoc a nouzové operace zvyšují kontaktní místa s úlohou. Přístup s nulovou důvěryhodností vyžaduje, aby tyto procesy byly považovány za vektory útoku a aby byly zahrnuty do kontrolních mechanismů zabezpečení a ověřování úloh.

  • Platforma pozorovatelnosti systému shromažďuje protokoly a metriky o úloze, které můžou být cenným zdrojem zpřístupnění informací. Proto je potřeba rozšířit zabezpečení úlohy, aby byly datové jímky chráněny před interními a externími hrozbami.

  • Sestavení agentů, externalizovaná konfigurace a úložiště přepínačů funkcí a přístupy k souběžným nasazením zvětšují plochu aplikace, která vyžaduje zabezpečení.

  • Vyšší frekvence nasazení způsobená malými přírůstkovými změnami nebo úsilím o získání aktuálního stavu má za následek větší testování zabezpečení v životním cyklu vývoje softwaru.

Kompromis: Zvýšená touha po transparentnosti. Zabezpečené úlohy jsou založené na návrzích, které chrání důvěrnost dat procházejících komponentami systému.

Platformy pozorovatelnosti ingestují data všech typů, aby získaly přehled o stavu a chování úloh. Vzhledem k tomu, že se týmy snaží dosáhnout vyšší přesnosti v datech pozorovatelnosti, existuje zvýšené riziko, že se ovládací prvky klasifikace dat, jako je maskování dat, ve zdrojových systémech nerozšíří na protokoly a jímky protokolů platformy pozorovatelnosti.

Kompromis: Omezená segmentace. Klíčovým přístupem k zabezpečení pro izolování přístupu a funkcí je navrhnout strategii silné segmentace. Tento návrh se implementuje prostřednictvím izolace prostředků a ovládacích prvků identity.

  • Společné umístění různorodých komponent aplikace ve sdílených výpočetních, síťových a datových prostředcích, aby se správa usnadnila, je obrácená segmentace nebo obtížnější dosáhnout segmentace na základě rolí. Společně umístěné komponenty můžou také potřebovat sdílet identitu úlohy, což může vést k nadměrnému přiřazení oprávnění nebo nedostatečné sledovatelnosti.

  • Shromažďování všech protokolů z celého systému v jednotné jímce protokolů může usnadnit dotazování a vytváření upozornění. Může to ale také ztížit nebo znemožnit poskytování zabezpečení na základě řádků, aby bylo možné nakládat s citlivými daty pomocí požadovaných kontrolních mechanismů.

  • Zjednodušení správy zabezpečení založeného na atributech nebo rolích snížením členitosti rolí a jejich přiřazení může vést k nevhodně širokým oprávněním.

Kompromisy provozní efektivity s optimalizací nákladů

Pilíř Efektivita provozu nikdy nedoporučuje aktivity, které snižují produktivitu nebo snižují návratnost investic do úloh. Doporučení, která se zdají přesunout pozornost od aktivit doručování, berou v úvahu dlouhodobé nejlepší zájmy pro úlohu a tým. Pokud se vaše úloha blíží datu ukončení platnosti, pravděpodobně nemá smysl investovat do doporučení, která tyto kompromisy aktivují.

Kompromis: Zvýšené výdaje na prostředky. Hlavním nákladovým faktorem úlohy jsou náklady na její prostředky. Nasazení menšího počtu prostředků, nastavení správné velikosti prostředků a snížení spotřeby obecně pomáhají udržet nízké náklady.

  • Implementace postupů bezpečného nasazení, i když jsou změny relativně malé, může vést ke zvýšení počtu souběžně nasazených prostředků. Tyto vzory vyžadují nasazení více souběžných instancí aplikace nebo komponenty infrastruktury, aby bylo možné provoz posouvat řízeným způsobem. Toto zvýšení je výraznější u úloh, které používají přístup k neměnné infrastruktuře.

  • Tým může potřebovat zavést další komponenty úloh, aby mohl implementovat provozně sladěné vzory návrhu cloudu nebo automatizaci úloh. Pokud například chtějí podporovat flexibilitu nasazení, můžou přidat komponentu směrování brány. Kvůli lepší správě konfigurací můžou přidat externí úložiště konfigurací. Aby bylo možné podporovat události životního cyklu tenanta, mohou vytvořit řídicí rovinu. Tyto prostředky také ovlivňují náklady na předprodukční prostředí.

  • Zvýšení počtu předprodukčních prostředí za účelem zlepšení prostředí pro vývoj a testování prostřednictvím izolace také zvyšuje počet prostředků. Tyto prostředky, které se nepoužívají k zajištění nabídky v rozporu s výrobní poptávkou, zvyšují náklady na řešení.

  • Zvýšení parity předprodukčních prostředí s produkčním prostředím z hlediska počtu prostředků, skladových položek a objemu dat zlepšuje proces zajištění kvality. Náklady se zvyšují se zvyšováním parity.

  • I když telemetrická data nejsou přímo prostředkem, pro zajištění efektivity pozorovatelných platforem je potřeba tato data zachovat. Většina provozních úložišť dat má ceny založené na kombinaci rychlosti příjmu dat a objemu. Obecně platí, že s tím, jak se zvyšuje množství telemetrie s nízkou latencí a vysokou rozmanitostí, zvyšují se také náklady. U nasazení ve více oblastech se očekává nasazení těchto provozních datových jímek pro jednotlivé oblasti, proto se náklady na prostředky stanou faktorem.

Kompromis: Menší zaměření na doručovací aktivity. Členové týmu úloh poskytují vyšší hodnotu úloh tím, že efektivně provádějí úkoly, které jsou v souladu s jejich možnostmi.

  • Týmy úloh, které tráví čas vytvářením a vylepšováním zdravé a zodpovědné struktury podpory a reakce na incidenty, poskytují uživatelům úlohy cennou službu. S tím, jak se úsilí podpory zvyšuje (například formální obměně na volání), obvykle kvůli změně obchodní důležitosti, se náklady na tyto aktivity zvyšují. Toto zvýšení nákladů může být důsledkem zvýšení počtu zaměstnanců nebo může vzniknout nepřímo ve formě pozornosti, která se přesune od doručovací činnosti k podpůrným funkcím.

  • Trénování je důležitou součástí procesu průběžného osobního zlepšování pracovního týmu. Toto školení může být formální nebo zaměřené na sebe během osobního obohacení. Se zvyšováním doby trénování se snižuje množství času dostupného pro přímý vývoj úlohy. Investice do trénování se sníží, pokud trénování není založené na rolích nebo se konkrétně týká úlohy nebo její budoucnosti.

  • Definování, upřesnění a provedení standardizovaných rutinních provozních úloh pro ochranu spolehlivosti, zabezpečení a efektivity výkonu úloh chvíli trvá. Tato doba není přímo strávena doručením. Mezi příklady těchto úloh patří komplexní analýza dopadu změn, procesy řízení změn, důkladné testování a zvýšená správa oprav. S rostoucí četností, komplexností nebo provozní zátěží těchto úkolů se zvyšuje i investovaná doba.

Kompromis: Vyšší nároky na nástroje a rozmanitost. Pilíř Optimalizace nákladů doporučuje snížení počtu nástrojů, konsolidaci dodavatelů a správný přístup ke všem nákupům nástrojů.

Tým úloh nakupuje nástroje a hardware pro podporu aktivit prováděných během celého životního cyklu vývoje softwaru (SDLC), včetně plánování a návrhu, vývoje, testování a monitorování. Marketplace pro nástroje v této oblasti se rozrůstá. Nástroje se nabízejí za různé ceny, které obvykle odpovídají jejich funkcím a možnostem. S výjimkou bezplatných nabídek se u těchto nástrojů účtují počáteční licenční náklady, které můžou být vázané na licenci nebo lokalitu. Často také vyžadují průběžné smlouvy o údržbě. Možná bude potřeba vytvořit nové vztahy dodavatelů. Tady je několik příkladů očekávaných výdajů na nástroje nebo hardware, které souvisejí s principy efektivity provozu:

  • Správa požadavků a backlogu
  • Nástroje návrhu architektury
  • Nástroje pro návrh uživatelského rozhraní a uživatelského prostředí
  • Hostování kódu a prostředků
  • Prostředí pro vývoj kódu a prostředí s minimem kódu
  • Nástroje pro automatizaci
  • Pracovní stanice pro vývoj a kontrolu kvality
  • Kanály pro vývoj a nasazení
  • Provádění testů a sledování
  • Nástroje pro pozorování

Kompromisy efektivity provozu s efektivitou výkonu

Kompromis: Zvýšené využití prostředků. Pilíř Efektivita výkonu doporučuje přidělit co nejvíce dostupných výpočetních a síťových prostředků požadavkům úlohy.

  • Architektura pozorovatelnosti úloh vyžaduje, aby komponenty v architektuře přidělily čas a prostředky k vytváření, shromažďování a streamování protokolů a metrik. Tyto datové body pomáhají zajistit, aby bylo možné efektivní upozorňování a monitorování z hlediska spolehlivosti, zabezpečení a výkonu. Se zvyšující se úrovní instrumentace se může zvyšovat i zatížení systémových prostředků.

  • Některé modely nasazení, například modré nebo zelené nasazení, které úloha může použít k bezpečnému nasazení, můžou na platformě produkčních aplikací zavést souběžná nasazení. Tato nasazení vyžadují preventivní škálování, aby se zajistila dostatečná nabídka pro budoucí poptávku, nebo na určitou dobu ponechá většinou neaktivní nasazení, aby se podpořilo vrácení zpět.

Kompromis: Zvýšená latence. Aby týmy vytvořily výkonné úlohy, hledají způsoby, jak zkrátit čas a prostředky, které úlohy spotřebovávají k provádění svých úkolů.

  • Řada modelů nasazení vyžaduje použití vzorů přístupu směrování brány, což může způsobovat latenci. Tato latence vychází z rozpočtu cíle výkonu pro související toky.

  • Některé vzory návrhu cloudu, které podporují přístupy "nezávislé změny v průběhu času", které podporují ideály přírůstkového zlepšování, můžou způsobovat latenci v důsledku procházení dalších komponent. Tuto latenci můžou představovat brány, zprostředkovatelé zasílání zpráv nebo vrstvy odolné proti poškození.

Prozkoumejte kompromisy pro ostatní pilíře: