Sdílet prostřednictvím


Ceny toku dat Gen2 pro Data Factory v Microsoft Fabric

Tok dat Gen2 umožňuje využívat rozhraní s nízkým kódem a transformace založené na umělé inteligenci a 300+ dat a umělé inteligence, díky kterým můžete transformovat data snadněji a s větší flexibilitou než jakýkoli jiný nástroj. Tok dat Gen2 je vytvořený pomocí známého prostředí Power Query, které je dnes dostupné napříč několika produkty a službami Microsoftu, jako jsou Excel, Power BI, Power Platform, Dynamics 365 Přehledy aplikace a další. Po publikování toku dat se vygeneruje definice toku dat – jedná se o program, který se spustí po aktualizaci toku dat a vytvoří tabulky v přípravném úložišti nebo výstupním cíli. Během aktualizace se definice toku dat používá modul toku dat k vygenerování plánu orchestrace, správě prostředků a orchestraci provádění dotazů mezi zdroji dat, bránami a výpočetními moduly a k vytváření tabulek v přípravném úložišti nebo cíli dat.

Diagram of the Dataflow Gen2 architecture.

Diagram, který je zde znázorněn, zachycuje různé komponenty architektury DataFlow DataFlow Gen2 služby Data Factory, včetně Lakehouse používaného k ingestování dat, a artefaktu skladu používaného jako výpočetní modul a znamená rychlejší zápis výsledků do přípravných nebo podporovaných cílů výstupu. Pokud není možné použít výpočetní prostředky skladu nebo když je pro dotaz zakázaný přípravný modul, modul Mashup extrahuje, transformuje nebo načte data do pracovních nebo cílových dat. Další informace o tom, jak tok dat Gen2 funguje, najdete v tomto blogovém příspěvku: Data Factory Spotlight: Dataflow Gen2.

Když aktualizujete nebo publikujete položku Toku dat Gen2, spotřebují se jednotky kapacity prostředků infrastruktury pro následující moduly.

  • Standardní výpočetní prostředky: Poplatky se vám účtují na základě doby vyhodnocení dotazu napříč všemi dotazy toku dat spuštěnými prostřednictvím modulu Mashup.
  • Výpočetní prostředky s vysokým škálováním toků dat: Účtuje se vám, když je povolená příprava na základě doby spotřeby modulu SQL pro Lakehouse (přípravné úložiště) a skladu (výpočetní prostředky úložiště).

Cenový model Toku dat Gen2

Následující tabulka uvádí, že k určení nákladů na spuštění Toku Dataflow Gen2 využívá každé spuštění dotazu modul mashupu pro standardní výpočty a že doba provádění výpočetních prostředků se přeloží na spotřebu 16 jednotek CU za hodinu. Za druhé platí, že pro scénáře výpočetních prostředků ve velkém měřítku, kdy je povolená příprava, by se měla počítat také doba provádění modulu SQL Lakehouse/Warehouse. Doba trvání provádění výpočetních prostředků se překládá na spotřebu 6 JEDNOTek za hodinu. Na konci každého spuštění Dataflow Gen2 se spotřeba jednotek kapacity (CU) pro každý typ motoru sečte a účtuje se podle přeložené ceny kapacity Fabric v oblasti, ve které je nasazená.

Typ modulu Dataflow Gen2 Měřiče spotřeby Míra spotřeby CU infrastruktury Členitost generování sestav spotřeby
Compute úrovně Standard Na základě každé doby provádění dotazů mashupového stroje v sekundách. 16 jednotek CU za hodinu Na položku Toku dat Gen2
Výpočty toků dat ve velkém měřítku Na základě doby provádění modulu SQL pro Lakehouse/Warehouse (s povolenou přípravou) v sekundách. 6 jednotek CU za hodinu Na pracovní prostor

Poznámka:

V současné době není možné zrušit spuštění Toku dat Gen2, ale tuto funkci přidáme do ledna 2024.

Změny míry spotřeby úloh Microsoft Fabric

Sazby spotřeby se můžou kdykoli změnit. Microsoft používá přiměřené úsilí k poskytování oznámení prostřednictvím e-mailu a oznámení v produktu. Změny jsou platné k datu uvedené v poznámkách k verzi a blogu Microsoft Fabric. Pokud se nějaká změna míry spotřeby úloh Microsoft Fabric výrazně zvýší kapacitní jednotky (CU) vyžadované k použití konkrétní úlohy, můžou zákazníci použít možnosti zrušení dostupné pro zvolený způsob platby.

Výpočet odhadovaných nákladů pomocí aplikace Metriky prostředků infrastruktury

Aplikace Microsoft Fabric Capacity Metrics poskytuje přehled o využití kapacity pro všechny pracovní prostory Infrastruktury svázané s kapacitou. Správci kapacity ji používají ke sledování výkonu úloh a jejich využití v porovnání s zakoupenou kapacitou. Použití aplikace Metrics představuje nejpřesnější způsob, jak odhadnout náklady na spuštění aktualizace Toku dat Gen2. Při zátěžovém testování scénáře vytvořte položku Tok dat Gen2 v novém pracovním prostoru, abyste snížili veškerý hlášený šum v aplikaci Metriky infrastruktury.

Následující tabulka se dá využít jako šablona k výpočtu odhadovaných nákladů pomocí aplikace Fabric Metrics pro aktualizaci Toku dat Gen2:

Metrika Compute úrovně Standard Vysokokapacitní výpočetní prostředky
Celkový počet jednotek CU s CU sekundy h CU sekundy
Fakturované efektivní hodiny CU s / (60*60) = S CU-hour h / (60*60) = H CU-hour

Celkové náklady na aktualizaci = (S + H CU hodina) * (kapacita fabric za jednotkovou cenu)