Přehled cílové zóny správy dat v cloudovém měřítku

Cílová zóna správy dat je funkce správy a je centrální pro analýzy v cloudovém měřítku. Zodpovídá za zásady správného řízení vaší analytické platformy.

Diagram of data management landing zone overview.

Cílová zóna správy dat je samostatné předplatné se stejnými standardními službami cílové zóny Azure. Umožňuje zásady správného řízení dat prostřednictvím prohledávacích zařízení, které se připojují k datovým jezerům a polyglotní úložišti v cílových zónách dat. Partnerský vztah virtuální sítě propojuje cílovou zónu správy dat s cílovými zónami dat a předplatným připojení.

Tuto architekturu použijte jako výchozí bod. Stáhněte si soubor Visia a upravte ho tak, aby vyhovoval vašim konkrétním obchodním a technickým požadavkům při plánování implementace cílové zóny správy dat.

Poznámka

Polyglotní trvalost je termín úložiště, který popisuje výběr mezi různými technologiemi úložiště dat a úložišť dat, které podporují různé datové typy a jejich potřeby úložiště. Polyglotní trvalost je v podstatě koncept, který může aplikace používat více než jednu základní databázi nebo technologii úložiště.

Důležité

Cílová zóna správy dat se musí nasadit jako samostatné předplatné v rámci skupiny pro správu s příslušnými zásadami správného řízení. Pak můžete řídit zásady správného řízení v rámci vaší organizace. Akcelerátor cílové zóny Azure ukazuje, jak byste měli přistupovat k cílovým zónám Azure.

Katalog dat

Skupina prostředků: zásady správného řízení –rg

Katalog dat zaregistruje a udržuje informace o datech v centralizované oblasti a zpřístupňuje je pro organizaci. Zajišťuje, aby podniky zabránily duplicitním datovým produktům způsobeným redundantním příjmem dat různými projektovými týmy.

Doporučujeme zřídit službu katalogu dat, která definují metadata datových produktů uložených v cílových zónách dat.

Analýzy v cloudovém měřítku závisí na tom, že Microsoft Purview bude sloužit jako:

  • Systém registrace
  • Zjišťování zdrojů podnikových dat
  • Modul pro klasifikaci dat
  • Úložiště zásad
  • Rozhraní API pro registraci a čtení informací o datech
  • Centrum řídicího panelu dodržování předpisů

Protože je katalog dat součástí cílové zóny správy dat, může komunikovat s každou cílovou zónou dat prostřednictvím partnerského vztahu virtuální sítě a místního prostředí Integration Runtime. Zjišťování datových produktů v místních úložištích a dalších veřejných cloudech se dosahuje více nasazeními místního prostředí Integration Runtime.

Poznámka

I když se tato dokumentace zaměřuje především na používání microsoft Purview pro funkce katalogu dat a klasifikaci dat, podniky můžou investovat do jiných produktů, jako je Alation, Okera nebo Collibra. V takovém případě spolupracujte se svým dodavatelem, aby co nejblíže použili zásady popsané pro cílovou zónu správy dat. Mějte na paměti, že může být vyžadována nějaká vlastní integrace.

Další informace najdete v tématu Osvědčené postupy pro katalog dat a nasazení Microsoft Purview pro analýzy v cloudovém měřítku.

Správa kvality dat

Skupina prostředků: governance-rg2

Pokračujte v aktuálním řešení.

Kvalitu dat byste měli spravovat co nejblíže zdroji dat, abyste se vyhnuli problémům s kvalitou replikace v rámci analýz a aktiv umělé inteligence. Přesun metrik kvality a ověření do integrace dat zarovná proces kvality s týmy, které jsou k vašim datům nejblíže. Tyto týmy mají nejsrozumělejší znalosti o datovém assetu.

Rodokmen dat také poskytuje jistotu kvality dat a měli byste ji poskytnout pro všechny datové produkty a produkty.

Další informace o správě kvality dat najdete v tématu Kvalita dat.

Úložiště modelování dat

Skupina prostředků: governance-rg2

Modely vztahů entit byste měli zachytávat a ukládat do centrálního umístění v cílové zóně správy dat. To poskytuje uživatelům dat jediné místo pro vyhledání koncepčních diagramů.

Řada zákazníků používá ER Studio a iServer k modelování datových produktů před příjmem dat.

Správa hlavních dat

Skupina prostředků: governance-rg2

Řízení správy hlavních dat se nachází v cílové zóně správy dat. Správa hlavních dat v datové síti obsahuje specifické aspekty, které byste měli zvážit pro síť dat.

Řada řešení pro správu hlavních dat se plně integruje s Microsoft Entra ID. Tato integrace umožňuje zabezpečit data a poskytovat různá zobrazení pro různé skupiny uživatelů.

Další informace naleznete v tématu Hlavní systém správy dat.

Katalog rozhraní API

Skupina prostředků: governance-rg2

Vaše týmy datových aplikací budou pravděpodobně vytvářet různá rozhraní API pro jejich datová aplikace. Tato rozhraní API můžou být obtížná při zjišťování v celé organizaci. Tento problém může vyřešit umístění katalogu rozhraní API do cílové zóny správy dat.

Katalog rozhraní API vám může pomoct standardizovat dokumentaci a nabízí místo pro interní spolupráci na rozhraních API. Může také řídit spotřebu, publikování a řízení zásad správného řízení ve vaší organizaci.

Sdílení dat a kontrakty

Skupina prostředků: governance-rg2

Analýzy v cloudu používají správu nároků Microsoft Entra nebo zásady Microsoft Purview k řízení přístupu ke sdílení dat. I tak můžete i nadále vyžadovat úložiště pro sdílení a kontrakty. Toto úložiště je organizační funkce a měla by se nacházet v cílové zóně správy dat.

Vaše smlouvy by měly poskytovat informace o ověřování dat, modelech a zásadách zabezpečení.

Další informace najdete v tématu Kontrakty dat.

Azure Container Registry

Skupina prostředků: containers-rg

Cílová zóna správy dat hostuje službu Azure Container Registry. Azure Container Registry umožňuje operacím datové platformy nasazovat standardní kontejnery pro použití v projektech datových věd, které týmy datových aplikací využívají.

Skupina prostředků: synapse-link-rg

Azure Synapse Analytics Private Link Hubs jsou prostředky Azure, které propojují zabezpečenou síť a webové prostředí Azure Synapse Studio. Analýzy v cloudu bezpečně propojí vaši virtuální síť Azure s Azure Synapse Studio pomocí privátních propojení z těchto center.

Existují dva kroky pro připojení ke službě Azure Synapse Studio pomocí privátních propojení.

  1. Vytvořte prostředek centra Private Link.
  2. Vytvořte privátní koncový bod z vaší virtuální sítě Azure do centra Private Link.

Privátní koncové body pak můžete použít k zabezpečené komunikaci se službou Azure Synapse Studio. Integrujte tyto privátní koncové body s vaším řešením DNS, ať už s místním řešením, nebo s Azure Privátní DNS.

Další informace najdete v tématu Připojení do nástroje Azure Synapse Studio pomocí privátních odkazů.

Automatizační rozhraní (volitelné)

Vaše organizace se může rozhodnout vytvořit mnoho automatizačních služeb pro rozšíření možností analýzy v cloudovém měřítku. Tyto automatizační služby řídí řešení shody a onboardingu pro váš analytický stav.

Pokud se rozhodnete tyto automatizační služby sestavit, měli byste mít uživatelské rozhraní, které funguje jako datové marketplace i konzola operací. Toto rozhraní by se mělo spoléhat na základní úložiště metadat, jako jsme dříve probírali v standardech metadat.

Váš datový marketplace nebo konzola Operations Console volá střední vrstvu mikroslužeb, která usnadňuje onboarding, registraci metadat, zřizování zabezpečení, životní cyklus dat a pozorovatelnost.

Skupinu prostředků automationdb-rg můžete zřídit pro hostování úložiště metadat.

Důležité

Žádné z těchto automatizačních služeb nejsou produkty a nezobrazují žádnou položku plánu. Zobrazí se seznam, který vám pomůže zvážit, které položky byste mohli chtít automatizovat.

Služby

Service Obor služby
Zřizování cílových zón dat Tato služba vytvoří novou cílovou zónu dat. Není pravděpodobné, že by bylo možné používat vysoké využití, ale je součástí kompletního dokončení řešení onboardingu. Další informace najdete v tématu Zřizování analýz na úrovni cloudu.
Onboarding datového produktu Tato služba vytvoří a změní skupiny prostředků, které se týkají onboardovaného tenanta. Obsahuje také možnosti upgradu a snížení úrovně skladových položek a aktivaci a deaktivaci skupin prostředků pro všechny nasazené tenanty nebo služby. Vytvoří novou cílovou zónu dat DevOps. Další informace najdete v tématu Zřizování analýz na úrovni cloudu.
Zřizování přístupu Tato služba vytváří přístupové balíčky, zásady přístupu a proces schvalování přístupu k prostředkům (ruční nebo automatické) pomocí hlavního názvu uživatele (SPN/UPN). Může také zveřejnit rozhraní API, které poskytuje seznam žádostí o předplatné (prostředky), které uživatelé odeslali za posledních 90 dnů. Další informace najdete v tématu Správa přístupu k datům.
Příjem dat nezávislý na datech Tato mikroslužba vytváří nové zdroje dat pro příjem dat do cílových zón dat. To dělá tím, že komunikuje s metastorem služby Azure Data Factory SQL Database v každé cílové zóně dat. Další informace najdete v tématu Jak automatizované architektury příjmu dat podporují analýzy na úrovni cloudu v Azure.
Metadata Tato služba byla vystavena a vytváří metadata pro platformu. Další informace najdete v tématu Standardy metadat.
Životní cyklus dat Tato služba zodpovídá za udržování životního cyklu dat na základě metadat. Tato údržba může zahrnovat přesun dat do studeného úložiště a odstranění záznamů, které už není potřeba uchovávat. Další informace najdete v tématu Správa životního cyklu dat.
Onboarding datové domény VZTAHUJE SE POUZE NA DATOVOU SÍŤ. Tato služba zaznamenává metadata týkající se nových domén a podle potřeby nasadí nové domény. Může také vytvářet, aktualizovat, aktivovat a deaktivovat jakoukoli doménu nebo řádek služby, který můžete integrovat do mikroslužby. Další informace najdete v tématu Zřizování analýz na úrovni cloudu.

Standardizace dat

I když se nejedná o konkrétní funkci nebo produkt cílové zóny správy dat, měli byste volat standardizaci dat napříč všemi službami. Standardizace dat definuje formát, ve kterém se mají vaše data nacházet a ukládat.

Tip

Formát delta-lake používejte všude, kde je to možné jako standard defacto napříč všemi službami a úložištěm.

Další informace naleznete v tématu Standardizace dat.

Další kroky