Co je Data Factory v Microsoft Fabric?

Data Factory vám umožňuje používat moderní prostředí pro integraci dat k ingestování, přípravě a transformaci dat z bohaté sady zdrojů dat (například databází, datového skladu, Lakehouse, dat v reálném čase a dalších). Bez ohledu na to, jestli jste občan nebo profesionální vývojář, budete moct transformovat data pomocí inteligentních transformací a využívat bohatou sadu aktivit. S Data Factory v Microsoft Fabric přinášíme možnosti rychlého kopírování (přesunu dat) do toků dat i datových kanálů. Pomocí funkce Rychlé kopírování můžete přesouvat data mezi oblíbenými úložišti dat rychle. Nejdůležitější je, že funkce Fast Copy umožňuje přenést data do vašeho Lakehouse a Datového skladu v Microsoft Fabric pro účely analýzy.

Data Factory implementuje dvě primární základní funkce: toky dat a kanály.

  • Toky dat umožňují využít více než 300 transformací v návrháři toků dat, což vám umožní snadněji transformovat data a s větší flexibilitou než jakýkoli jiný nástroj , včetně inteligentních transformací dat založených na umělé inteligenci.
  • Datové kanály umožňují využívat předefinované funkce orchestrace dat k vytváření flexibilních pracovních postupů dat, které vyhovují potřebám vašeho podniku.

Datové toky

Toky dat poskytují rozhraní s nízkým kódem pro příjem dat ze stovek zdrojů dat a transformaci dat pomocí 300+ transformací dat. Výsledná data pak můžete načíst do několika cílů, jako jsou databáze Azure SQL a další. Toky dat je možné spouštět opakovaně pomocí ruční nebo plánované aktualizace nebo jako součást orchestrace datového kanálu.

Toky dat se vytvářejí pomocí známého prostředí Power Query, které je dnes dostupné napříč několika produkty a službami Microsoftu, jako jsou Excel, Power BI, Power Platform, Dynamics 365 Přehledy aplikací a další. Power Query umožňuje všem uživatelům, od občanů po profesionální integrátory dat, provádět příjem dat a transformace dat napříč jejich datovými aktivy. Umožňuje provádět spojení, agregace, čištění dat, vlastní transformace a mnoho dalšího od snadno použitelného, vysoce vizuálního a nízkokódového uživatelského rozhraní.

Screenshot of the Power BI user interface showing the dataflow experience.

Datové kanály

Datové kanály umožňují výkonné funkce pracovních postupů v cloudovém měřítku. S datovými kanály můžete vytvářet složité pracovní postupy, které můžou aktualizovat tok dat, přesouvat data velikosti PB a definovat sofistikované kanály toku řízení.

Pomocí datových kanálů můžete vytvářet složité pracovní postupy ETL a datové továrny, které můžou provádět mnoho různých úloh ve velkém měřítku. Možnosti toku řízení jsou integrované do datových kanálů, které umožňují vytvářet logiku pracovního postupu, která poskytuje smyčky a podmínky.

Přidejte aktivitu kopírování řízenou konfigurací společně s aktualizací toku dat s nízkým kódem v jednom kanálu pro kompletní datový kanál ETL. Můžete dokonce přidat aktivity založené na kódu pro poznámkové bloky Sparku, skripty SQL, uložené proc a další.

Screenshot of the user interface showing copy activity.

Pokud chcete začít s Microsoft Fabric, přejděte do rychlého startu: Vytvoření prvního toku dat Gen2 pro získání a transformaci dat.