Sdílet prostřednictvím


Scénář cen s využitím Toku dat Gen2 k načtení 2 GB místních dat CSV do tabulky Lakehouse

V tomto scénáři se tok dat Gen2 použil k načtení 2 GB místních dat CSV do tabulky Lakehouse v Microsoft Fabric.

Ceny použité v následujícím příkladu jsou hypotetické a nemají v úmyslu znamenat přesné skutečné ceny. Jedná se jen o ukázku toho, jak můžete odhadnout, naplánovat a spravovat náklady na projekty služby Data Factory v Microsoft Fabric. Vzhledem k tomu, že kapacity Fabric jsou cenově jedinečné napříč oblastmi, používáme ceny průběžných plateb za kapacitu Fabric v oblasti USA – západ 2 (typická oblast Azure), a to v hodnotě 0,18 USD za CU za hodinu. Projděte si Microsoft Fabric – ceny a prozkoumejte další možnosti cen kapacity Fabric.

Konfigurace

K dosažení tohoto scénáře je potřeba vytvořit tok dat pomocí následujících kroků:

  1. Inicializace toku dat: Začněte tím, že do toku dat nahrajete 2 GB souborů CSV z místního prostředí.
  2. Konfigurace Power Query:
    1. Přejděte do Power Query.
    2. Zakažte možnost pro přípravu dotazu.
    3. Pokračujte kombinování souborů CSV.
  3. Transformace dat:
    1. Zvýšení úrovně záhlaví pro přehlednost
    2. Odeberte nepotřebné sloupce.
    3. Podle potřeby upravte datové typy sloupců.
  4. Definovat cíl výstupních dat:
    1. Nakonfigurujte Lakehouse jako cíl výstupu dat.
    2. V tomto příkladu se vytvořil a využil lakehouse v rámci fabric.

Odhad nákladů pomocí aplikace Metriky prostředků infrastruktury

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

Screenshot showing details of the Dataflow Gen2 Refresh cost

Screenshot showing details of a Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Screenshot showing details of a second Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Operace aktualizace Toku Gen2 spotřebovala 4749,42 CU sekundy a dva výpočetní operace s vysokým škálováním toků dat spotřebovaly 7,78 SEKUND CU + 7,85 SEKUNDy CU.

Poznámka:

I když se hlásí jako metrika, skutečná doba trvání spuštění není relevantní při výpočtu efektivních hodin CU s aplikací Metriky prostředků infrastruktury, protože metrika cu sekund, která také hlásí účty po dobu trvání.

Metrika Spotřeba výpočetních prostředků
Aktualizace CU toku dat Gen2 v sekundách 4749,42 CU sekund
Vysoké škálování výpočetních toků dat v sekundách (7,78 + 7,85) 15,63 CU sekund
Fakturované efektivní hodiny CU (4749,42 + 15,63) / (60*60) = 1,32 HODIN CU

Celkové náklady na spuštění za 0,18 USD za hodinu CU = (1,32 HODIN CU) * (0,18 USD/HODINA CU) ~= 0,24 USD