Průvodce architekturou dat Azure

Tato příručka předkládá strukturovaný přístup k návrhu datově orientovaných řešení v Microsoft Azure. Vychází z osvědčených postupů odvozených díky spolupráci se zákazníky.

Úvod

Cloud mění způsob, jakým se navrhují aplikace, včetně způsobu zpracování a ukládání dat. Řešení polyglot persistence místo jedné obecné databáze, která zpracovává všechna data, využívají několik specializovaných úložišť dat, která jsou optimalizovaná pro poskytování konkrétních funkcí. Následkem toho se mění i pohled na data uvnitř jednotlivých řešení. Už není potřeba několik vrstev obchodní logiky, které čtou a zapisují v jediné datové vrstvě. Místo toho je řešení navržené s ohledem na datový kanál, který popisuje, jak data protékají řešením, kde se zpracovávají, kde se ukládají a jak je využívá další komponenta v kanálu.

Uspořádání příručky

Tato příručka pojednává o dvou všeobecných kategoriích datových řešení: úlohách tradičních systémů pro správu relačních databází a řešeních pro velké objemy dat.

Tradiční úlohy RDBMS: Mezi tyto úlohy patří online zpracování transakcí (OLTP) a technologie OLAP (Online Analytical Processing). Data v systémech OLTP jsou obvykle relační data s předdefinovaným schématem a sadou omezujících podmínek, které udržují referenční integritu. V organizaci se často dají data z víc zdrojů konsolidovat do datového skladu pomocí procesu extrakce, transformace a načítání (ETL), který zajistí přesun a transformaci zdrojových dat.

Úlohy tradičních systémů pro správu relačních databází

Řešení pro velké objemy dat: Architektura s velkými objemy dat je navržená tak, aby umožňovala příjem, zpracování a analýzu dat, která jsou pro tradiční databázové systémy příliš rozsáhlá nebo složitá. Data se dají zpracovávat dávkově, nebo v reálném čase. Řešení pro velké objemy dat většinou pracují s velkým objemem nerelačních dat, jako jsou data tvořená dvojicemi klíčů a hodnot, dokumenty JSON nebo data časových řad. Tradiční systémy pro správu relačních databázích často nejsou pro ukládání tohoto typu dat vhodné. Výraz NoSQL označuje rodinu databází navržených pro ukládání nerelačních dat. (Výraz není úplně přesný, protože řada úložišť nerelačních dat podporuje dotazy kompatibilní s SQL.)

Řešení pro velké objemy dat

Tyto dvě kategorie se vzájemně nevylučují a částečně se překrývají, my se ale domníváme, že se jedná o užitečný způsob, jak výklad zpřehlednit. Tato příručka v každé kategorii probírá běžné scénáře včetně souvisejících služeb Azure a příslušné architektury pro každý scénář. Kromě toho příručka porovnává zvolenou technologii datových řešení v Azure, včetně možností open source. V rámci každé kategorie popisujeme klíčová kritéria výběru a přehled možností, abychom vám pomohli zvolit správnou technologii pro váš scénář.

Cílem této příručky není naučit vás datové vědy nebo teorii databází. Těmto tématům se věnují celé knihy. Cílem místo toho je pomoct při výběru vhodné architektury dat nebo datového kanálu a potom vybrat technologie a služby Azure, které nejlépe vyhovují vašim požadavkům. Pokud už máte architekturu vybranou, můžete přejít přímo k volbě technologie.