Co jsou toky dat?

Tip

Vyzkoušejte tok dat Gen2 ve službě Data Factory v Microsoft Fabric, a to vše v jednom analytickém řešení pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Toky dat jsou samoobslužná cloudová technologie pro přípravu dat. Toky dat umožňují zákazníkům ingestovat, transformovat a načítat data do prostředí Microsoft Dataverse, pracovních prostorů Power BI nebo účtu Azure Data Lake Storage ve vaší organizaci. Toky dat jsou vytvořené pomocí Power Query, sjednoceného připojení k datům a přípravného prostředí, které už je součástí mnoha produktů Microsoftu, včetně Excelu a Power BI. Zákazníci můžou aktivovat toky dat tak, aby běžely buď na vyžádání, nebo automaticky podle plánu; data jsou vždy aktuální.

Toky dat je možné vytvářet v několika produktech Microsoftu.

Toky dat jsou doporučené v několika produktech Microsoftu a nevyžadují vytvoření nebo spuštění licence specifické pro tok dat. Toky dat jsou dostupné v Power Apps, Power BI a Dynamics 365 Customer Přehledy. Možnost vytvářet a spouštět toky dat je součástí licencí těchto produktů. Funkce toku dat jsou většinou společné pro všechny produkty, ve kterých jsou doporučené, ale některé funkce specifické pro jednotlivé produkty můžou existovat v tocích dat vytvořených v jednom produktu a jiné.

Jak funguje tok dat?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

Předchozí obrázek znázorňuje celkový přehled o tom, jak je definovaný tok dat. Tok dat získává data z různých zdrojů dat (již je podporováno více než 80 zdrojů dat). Potom na základě transformací nakonfigurovaných pomocí prostředí pro vytváření Power Query tok dat transformuje data pomocí modulu toku dat. Nakonec se data načtou do výstupního cíle, což může být prostředí Microsoft Power Platform, pracovní prostor Power BI nebo účet Azure Data Lake Storage organizace.

Toky dat běží v cloudu

Toky dat jsou cloudové. Když je tok dat vytvořený a uložený, jeho definice se uloží v cloudu. Tok dat také běží v cloudu. Pokud je ale zdroj dat místní, dá se k extrahování dat do cloudu použít místní brána dat. Když se aktivuje spuštění toku dat, dojde k transformaci a výpočtu dat v cloudu a cíl je vždy v cloudu.

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

Toky dat používají výkonný transformační modul.

Power Query je modul pro transformaci dat používaný v toku dat. Tento modul je schopný podporovat mnoho pokročilých transformací. Používá také jednoduché, ale výkonné a grafické uživatelské rozhraní označované jako Editor Power Query. Toky dat můžete v tomto editoru použít k rychlejšímu a snadnějšímu vývoji řešení pro integraci dat.

Screenshot showing an example of Power Query transformations.

Integrace toku dat s Microsoft Power Platform a Dynamics 365

Vzhledem k tomu, že tok dat ukládá výsledné tabulky v cloudovém úložišti, můžou ostatní služby pracovat s daty vytvořenými toky dat.

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

Například aplikace Power BI, Power Apps, Power Automate, Power Virtual Agents a Aplikace Dynamics 365 můžou získat data vytvořená tokem dat připojením k Dataverse, konektoru toku dat Power Platform nebo přímo přes jezero v závislosti na cíli nakonfigurovaného při vytváření toku dat.

Výhody toků dat

V následujícím seznamu jsou uvedeny některé výhody používání toků dat:

  • Tok dat odděluje vrstvu transformace dat od vrstvy modelování a vizualizace v řešení Power BI.

  • Kód transformace dat se může nacházet v centrálním umístění, toku dat, nikoli v rozprostření mezi více artefaktů.

  • Tvůrce toku dat potřebuje jenom dovednosti Power Query. V prostředí s více tvůrci může být tvůrce toku dat součástí týmu, který společně sestaví celé řešení BI nebo provozní aplikaci.

  • Tok dat je nezávislý na produktech. Nejedná se pouze o součást Power BI; data můžete získat v jiných nástrojích a službách.

  • Toky dat využívají Power Query, výkonné, grafické prostředí samoobslužné transformace dat.

  • Toky dat běží zcela v cloudu. Nevyžaduje se žádná další infrastruktura.

  • Máte několik možností, jak začít pracovat s toky dat, používat licence pro Power Apps, Power BI a zákaznickou Přehledy.

  • I když jsou toky dat schopné pokročilých transformací, jsou navržené pro samoobslužné scénáře a nevyžadují žádné IT ani vývojářské pozadí.

Scénáře použití pro toky dat

Toky dat můžete používat pro mnoho účelů. Následující scénáře obsahují několik příkladů běžných případů použití toků dat.

Migrace dat ze starších systémů

V tomto scénáři se rozhodlo, že organizace použije Power Apps pro nové uživatelské rozhraní místo staršího místního systému. Power Apps, Power Automate a AI Builder používají Dataverse jako primární systém úložiště dat. Aktuální data v existujícím místním systému je možné migrovat do služby Dataverse pomocí toku dat a tyto produkty pak mohou tato data používat.

Vytvoření datového skladu pomocí toků dat

Toky dat můžete použít jako náhradu za další nástroje pro extrakci, transformaci a načítání (ETL) k vytvoření datového skladu. V tomto scénáři se datoví inženýři společnosti rozhodnou použít toky dat k vytvoření hvězdicového schématu navrženého datového skladu, včetně tabulek faktů a dimenzí ve službě Data Lake Storage. Power BI se pak používá ke generování sestav a řídicích panelů získáním dat z toků dat.

Image of how to build a data warehouse using dataflows.

Vytvoření dimenzionálního modelu pomocí toků dat

Toky dat můžete použít jako náhradu za jiné nástroje ETL k vytvoření dimenzionálního modelu. Například datoví inženýři společnosti se rozhodnou použít toky dat k sestavení hvězdicového schématu navrženého dimenzionálního modelu, včetně tabulek faktů a dimenzí ve službě Azure Data Lake Storage Gen2. Power BI se pak používá ke generování sestav a řídicích panelů získáním dat z toků dat.

Image of how to build a dimensional model using dataflows.

Centralizovaná příprava dat a opětovné použití sémantických modelů napříč několika řešeními Power BI

Pokud více řešení Power BI používá stejnou transformovanou verzi tabulky, proces vytvoření tabulky se několikrát opakuje. Tím se zvyšuje zatížení zdrojového systému, spotřebovává více prostředků a vytváří duplicitní data s více body selhání. Místo toho je možné vytvořit jeden tok dat pro výpočet dat pro všechna řešení. Power BI pak může znovu použít výsledek transformace ve všech řešeních. Tok dat, pokud se používá takovým způsobem, může být součástí robustní architektury implementace Power BI, která zabraňuje duplikování kódu Power Query a snižuje náklady na údržbu vrstvy integrace dat.

Image of how tables can be reused across multiple solutions.

Další kroky

Následující články poskytují další studijní materiály pro toky dat.