Prémiové funkce pro toky datPremium features of dataflows

Toky dat se podporují pro uživatele Power BI Pro a Power BI Premium.Dataflows are supported for Power BI Pro and Power BI Premium users. Některé funkce jsou dostupné jen u předplatného Power BI Premium.Some features are only available with a Power BI Premium subscription. Tento článek podrobně popisuje funkce, které jsou dostupné jen na úrovni Premium, a jejich použití.This article describes and details the Premium-only features and their uses.

Jen v Power BI Premium jsou k dispozici následující funkce:The following features are available only with Power BI Premium:

  • Vylepšený výpočetní modulEnhanced compute engine
  • Direct QueryDirect Query
  • Počítané entityComputed entities
  • Propojené entityLinked Entities
  • Přírůstková aktualizaceIncremental refresh

Popis těchto položek najdete v následujících oddílech.The following sections described each of these features in detail.

Vylepšený výpočetní modulThe enhanced compute engine

Vylepšený výpočetní modul v Power BI umožňuje předplatitelům Power BI Premium využívat jejich kapacitu k optimalizaci používání toků dat.The enhanced compute engine in Power BI enables Power BI Premium subscribers to use their capacity to optimize the use of dataflows. Používání vylepšeného výpočetního modulu přináší následující výhody:Using the enhanced compute engine provides the following advantages:

  • Výrazně zkracuje dobu aktualizace nutnou u dlouhotrvajících kroků ETL nad počítanými entitami, jako je například provádění operací spojení, hledání jedinečných hodnot, filtrování a seskupováníDrastically reduces the refresh time required for long-running ETL steps over computed entities, such as performing joins, distinct, filters, and group by
  • Umožňuje provádět u entit dotazy DirectQuery.Perform DirectQuery queries over entities

Následuje popis povolení vylepšeného výpočetního modulu i s odpověďmi na časté otázky.Enabling the enhanced compute engine is described next, along with answers to common questions.

Použití vylepšeného výpočetního moduluUsing the enhanced compute engine

Vylepšený výpočetní modul se povoluje na stránce Nastavení kapacity ve službě Power BI v části toky dat.The enhanced compute engine is enabled from the Capacity Settings page in the Power BI service, in the dataflows section. Ve výchozím nastavení je vylepšený výpočetní modul vypnutý.By default, the enhanced compute engine is Off. Pokud ho chcete povolit, nastavte přepínač na Zapnuto, jak je znázorněno na následujícím obrázku, a uložte nastavení.To enable the enhanced compute engine, switch the toggle to On as shown in the following image, and save your settings.

Zapnutí vylepšeného výpočetního modulu

Důležité

Vylepšený výpočetní modul funguje jenom pro kapacity Power BI A3 a vyšší.The enhanced compute engine works only for Power BI capacities of A3 and larger.

Po zapnutí vylepšeného výpočetního modulu se vraťte k tokům dat. Měli byste zaznamenat zlepšení výkonu v jakékoli počítané entitě, která provádí komplexní operace, například operace spojení nebo seskupení pro toky dat vytvořené z existujících propojených entit ve stejné kapacitě.Once the enhanced compute engine is on, return to dataflows and you should see a performance improvement in any computed entity that performs complex operations, such as joins or group by operations for dataflows created from existing linked entities on the same capacity.

Pokud chcete co nejlépe využít výpočetní modul, rozdělte fázi ETL do dvou samostatných toků dat následujícím způsobem:To make best use of the compute engine, split the ETL stage into two separate dataflows, in the following way:

  • Tok dat 1 – tento tok dat by měl pouze přijímat všechny požadované údaje ze zdroje dat a umístit je do toku dat 2.Dataflow 1 - this dataflow should only be ingesting all of the required from a data source, and placing it into dataflow 2.
  • Tok dat 2 – všechny operace ETL provádějte v tomto druhém toku dat, ale ujistěte se, že odkazujete na tok dat 1, který by měl být ve stejné kapacitě.Dataflow 2 - perform all ETL operations in this second dataflow, but ensure you're referencing Dataflow 1, which should be on the same capacity. Také se ujistěte, že jste před jakoukoli jinou operací nejdřív provedli operace, které se mohou sbalit (filtrování, seskupování, hledání jedinečných hodnot, spojení), aby se zajistilo využití výpočetního modulu.Also ensure you perform operations that can fold (filter, group by, distinct, join) first, before any other operation, to ensure the compute engine is utilized.

Časté otázky a odpovědiCommon questions and answers

Otázka: Povolil(a) jsem vylepšený výpočetní modul a aktualizace jsou nyní pomalejší.Question: I've enabled the enhanced compute engine, but my refreshes are slower. Proč?Why?

Odpověď: Pokud povolíte vylepšený výpočetní modul, existují dvě možná vysvětlení, proč dochází k pomalejším aktualizacím:Answer: If you enable the enhanced compute engine, there are two possible explanations that could lead to slower refresh times:

  • Když je povolený vylepšený výpočetní modul, je pro jeho správné fungování vyžadováno určité množství paměti.When the enhanced compute engine is enabled, it requires some memory to function properly. Paměť, která je k dispozici pro provedení aktualizace, je tedy snížena, a proto se zvyšuje pravděpodobnost, že aktualizace budou zařazeny do fronty, což zase snižuje toky dat, které se dají souběžně aktualizovat.As such, memory available to perform a refresh is reduced and therefore increases the likelihood of refreshes to be queued, which in turn reduces the number of dataflows that can refresh concurrently. Pokud chcete tento problém vyřešit, zvyšte velikost paměti přiřazené tokům dat, abyste zajistili, že paměť dostupná pro souběžné aktualizace toku dat zůstane stejná.To address this, when enabling enhanced compute, increase the memory assigned for dataflows to ensure the memory available for concurrent dataflow refreshes remains the same.

  • Dalším důvodem, proč se můžete setkat s pomalejšími aktualizacemi, je to, že výpočetní modul funguje jenom nad stávajícími entitami.Another reason you may encounter slower refreshes is that the compute engine only works on top of existing entities. Pokud váš tok dat odkazuje na zdroj dat, který není tokem dat, nezaznamenáte vylepšení.If your dataflow references a data source that's not a dataflow, you won't see an improvement. Nedojde k nárůstu výkonu, protože v některých scénářích s velkými objemy dat by počáteční čtení ze zdroje dat bylo pomalejší, protože data musí být předána vylepšenému výpočetnímu modulu.There will be no performance increase, since in some big data scenarios, the initial read from a data source would be slower because the data needs to be passed to the enhanced compute engine.

Otázka: Nevidím přepínač vylepšeného výpočetního modulu.Question: I cannot see the enhanced compute engine toggle. Proč?Why?

Odpověď: Vylepšený výpočetní modul se postupně uvolňuje do oblastí po celém světě.Answer: The enhanced compute engine is being released in stages to regions around the world. Předpokládáme, že všechny oblasti budou podporované na konci roku 2020.We anticipate all regions will supported by the end of 2020.

Otázka: Jaké jsou podporované datové typy pro výpočetní modul?Question: What are the supported data types for the compute engine?

Odpověď: Vylepšený výpočetní modul a toky dat aktuálně podporují následující datové typy.Answer: The enhanced compute engine and dataflows currently support the following data types. Pokud váš tok dat nepoužívá žádný z následujících datových typů, při aktualizaci dojde k chybě:If your dataflow doesn't use one of the following data types, an error occurs during refresh:

  • Datum/ČasDate/Time
  • Desetinné čísloDecimal Number
  • TextText
  • Celé čísloWhole number
  • Datum/čas/pásmoDate/Time/Zone
  • Pravda/nepravdaTrue/False
  • DatumDate
  • ČasTime

Použití DirectQuery s toky dat v Power BI (Preview)Use DirectQuery with dataflows in Power BI (preview)

Pomocí DirectQuery se můžete připojovat přímo k tokům dat. Můžete se tak připojit přímo k příslušnému toku dat, aniž byste museli importovat jeho data.You can use DirectQuery to connect directly to dataflows, and thereby connect directly to your dataflow without having to import its data.

Při používání DirectQuery s toky dat získáte následující vylepšení Power BI a procesů toků dat:Using DirectQuery with dataflows enables the following enhancements to your Power BI and dataflows processes:

  • Nemusíte používat samostatné plány aktualizací – DirectQuery se připojuje přímo k toku dat, takže není potřeba vytvářet importovanou datovou sadu.Avoid separate refresh schedules - DirectQuery connects directly to a dataflow, removing the need to create an imported dataset. Používání DirectQuery s toky dat proto znamená, že už nepotřebujete samostatné plány aktualizací pro tok dat a datovou sadu, abyste zajistili, že budou vaše data synchronizovaná.As such, using DirectQuery with your dataflows means you no longer need separate refresh schedules for the dataflow and the dataset to ensure your data is synchronized.

  • Filtrování dat – používání DirectQuery je užitečné pro práci s filtrovaným zobrazením dat v rámci toku dat.Filtering data - DirectQuery is useful for working on a filtered view of data inside a dataflow. Pokud chcete filtrovat data a pracovat tak s menší podmnožinou dat v toku dat, můžete pomocí DirectQuery (a výpočetního modulu) filtrovat tok dat a pracovat s vyfiltrovanou podmnožinou, kterou potřebujete.If you want to filter data, and thereby work with a smaller subset of the data in your dataflow, you can use DirectQuery (and the compute engine) to filter dataflow data and work with the filtered subset you need.

Používání DirectQuery u toků datUsing DirectQuery for dataflows

Používání DirectQuery s toky dat je funkce ve verzi Preview, která je dostupná od verze Power BI Desktopu z května 2020.Using DirectQuery with dataflows is a preview feature available beginning with the May 2020 version of Power BI Desktop.

Pro používání DirectQuery s toky dat platí také určité předpoklady:There are also prerequisites for using DirectQuery with dataflows:

  • Váš tok dat se musí nacházet v pracovním prostoru Power BI Premium.Your dataflow must reside within a Power BI Premium enabled workspace
  • Musí být zapnutý výpočetní modul.The compute engine must be turned on

Povolení DirectQuery u toků datEnable DirectQuery for dataflows

Abyste zajistili, že k vašemu toku dat bude mít DirectQuery přístup, musí se vylepšený výpočetní modul nacházet v optimalizovaném stavu.To ensure your dataflow is available for DirectQuery access, the enhanced compute engine must be in its optimized state. Když budete chtít povolit DirectQuery u toků dat, nastavte novou možnost Nastavení vylepšeného výpočetního modulu na Zapnuto.To enable DirectQuery for dataflows, set the new Enhanced compute engine settings option to On. Na následujícím obrázku je toto nastavení správně vybrané.The following image shows the setting properly selected.

Podrobná kontrola nad přímým dotazem

Jakmile toto nastavení použijete, aktualizujte tok dat, aby se tato optimalizace projevila.Once you've applied that setting, refresh the dataflow for the optimization to take effect.

Důležité aspekty a omezení u DirectQueryConsiderations and limitations for DirectQuery

Používání DirectQuery s toky dat má několik známých omezení:There are a few known limitations with DirectQuery and dataflows:

  • Během období verze Preview této funkce můžou někteří zákazníci při používání DirectQuery s toky dat zaznamenat vypršení časových limitů nebo problémy s výkonem.During the preview period of this feature, some customers may experience timeouts or performance issues when using DirectQuery with dataflows. Tyto problémy aktivně řešíme v tomto období Preview.Such issues are being actively addressed during this preview period.

  • Složené/smíšené modely, které mají zdroje dat Import a DirectQuery, se v současné době nepodporují.Composite/mixed models that have import and DirectQuery data sources are currently not supported.

  • U velkých toků dat může dojít při zobrazení vizualizací k problémům s časovým limitem.Large dataflows may have trouble with timeout issues when viewing visualizations. Velké toky dat, u kterých dojde k potížím s časovými limitem, by měly používat režim Import.Large dataflows that run into trouble with timeout issues should use Import mode.

  • Pokud používáte DirectQuery, zobrazí konektor toku dat v nastavení zdroje dat neplatné přihlašovací údaje.Under data source settings, the dataflow connector will show invalid credentials if you are using DirectQuery. Nemá to vliv na chování a datová sada bude fungovat správně.This does not affect the behavior, and the dataset will work properly.

Počítané entityComputed entities

Při použití toků dat v předplatném Power BI Premium můžete provádět výpočty v úložišti.You can perform in-storage computations when using dataflows with a Power BI Premium subscription. Můžete provádět výpočty s existujícími toky dat a vracet výsledky, které vám umožní zaměřit se na vytváření sestav a analýzy.This lets you perform calculations on your existing dataflows, and return results that enable you to focus on report creation and analytics.

Počítaná entita

Abyste mohli provádět výpočty v úložišti, je nutné napřed vytvořit tok dat a přenést data do daného úložiště toku dat Power BI.To perform in-storage computations, you first must create the dataflow and bring data into that Power BI dataflow storage. Když máte tok dat obsahující data, můžete vytvářet počítané entity, což jsou entity, které provádí výpočty v úložišti.Once you have a dataflow that contains data, you can create computed entities, which are entities that perform in-storage computations.

Důležité aspekty a omezení u počítaných entitConsiderations and limitations of computed entities

  • Při práci s toky dat vytvořenými v účtu Azure Data Lake Storage Gen2 organizace fungují propojené a počítané entity správně jenom v případě, že se nacházejí ve stejném účtu úložiště.When working with dataflows created in an organization's Azure Data Lake Storage Gen2 account, linked entities and computed entities only work properly when the entities reside in the same storage account.

Osvědčeným postupem při provádění výpočtů s propojenými místními a cloudovým daty je vytvoření nového toku dat pro každý zdroj (jednoho pro místní úložiště a druhého pro cloud) a následné vytvoření třetího toku pro sloučení a výpočet těchto dvou zdrojů.As a best practice, when doing computations on data joined by on-premises and cloud data, create a new dataflow for each source (one for on-premises and one for cloud) and then create a third dataflow to merge/compute over these two data sources.

Propojené entityLinked entities

S předplatným Power BI Premium máte možnost odkazovat na existující toky dat, což vám umožní provádět výpočty u těchto entit pomocí počítaných entit, nebo můžete vytvořit „jediný spolehlivý zdroj“, který můžete opakovaně používat ve více tocích dat.You can reference existing dataflows when using with a Power BI Premium subscription, which lets you either perform calculation on these entities using computed entities or allows you to create a "single source of the truth" table that you can reuse within multiple dataflows.

Přírůstková aktualizaceIncremental refresh

U datových toků je možné nastavit přírůstkové aktualizace, aby nebylo při každé aktualizaci nutné načítat všechna data.Dataflows can be set to refresh incrementally to avoid having to pull all the data on every refresh. Provedete to tak, že vyberete tok dat a potom ikonu Přírůstková aktualizace.To do so, select the dataflow then select the incremental refresh icon.

Přírůstková aktualizace

Při nastavení přírůstkové aktualizace se do toku dat přidají parametry určující rozsah kalendářních dat.Setting incremental refresh adds parameters to the dataflow to specify the date range. Podrobné informace o tom, jak nastavit přírůstkovou aktualizaci, najdete v článku o přírůstkové aktualizaci.For detailed information on how to set up incremental refresh, see the incremental refresh article.

Kdy přírůstkovou aktualizaci nenastavovatConsiderations for when not to set incremental refresh

Přírůstkovou aktualizaci u toku dat nenastavujte v následujících situacích:Do not set a dataflow to incremental refresh in the following situations:

  • Přírůstkovou aktualizaci by neměly používat propojené entity, když odkazují na tok dat.Linked entities should not use incremental refresh if they reference a dataflow. Toky dat nepodporují posouvání dotazů neboli „query folding“ (i když je u entity povolené DirectQuery).Dataflows does not support query folding (even if the entity is DirectQuery enabled).
  • Přírůstkovou aktualizaci by neměly používat datové sady, které odkazují na datové toky.Datasets referencing dataflows should not use incremental refresh. Aktualizace toků dat by měly obecně fungovat dobře.Refreshes to dataflows should generally perform well. Pokud aktualizace trvají déle, než se čekalo, zvažte použití výpočetního modulu a režimu DirectQuery.If the refreshes take longer than expected, consider using the compute engine and or DirectQuery mode.

Další krokyNext steps

Další informace o tocích dat a Power BI najdete v následujících článcích:The following articles provide more information about dataflows and Power BI: