データフローの Premium 機能Premium features of dataflows

データフローは、Power BI Pro および Power BI Premium のユーザーに対してサポートされています。Dataflows are supported for Power BI Pro and Power BI Premium users. 一部の機能は、Power BI Premium サブスクリプションでのみ使用できます。Some features are only available with a Power BI Premium subscription. この記事では、Premium のみの機能とその使用の詳細について説明します。This article describes and details the Premium-only features and their uses.

次の機能は、Power BI Premium でのみ使用できます。The following features are available only with Power BI Premium:

  • 拡張コンピューティング エンジンEnhanced compute engine
  • 直接クエリDirect Query
  • 計算対象エンティティComputed entities
  • リンクされたエンティティLinked Entities
  • 増分更新Incremental refresh

以下のセクションでは、これらの各機能について詳しく説明します。The following sections described each of these features in detail.

拡張コンピューティング エンジンThe enhanced compute engine

Power BI の拡張コンピューティング エンジンにより、Power BI Premium サブスクライバーは自身の容量を使用してデータフローの使用を最適化できます。The enhanced compute engine in Power BI enables Power BI Premium subscribers to use their capacity to optimize the use of dataflows. 拡張コンピューティング エンジンを使用すると、次のような利点があります。Using the enhanced compute engine provides the following advantages:

  • 計算対象エンティティに対する、実行時間の長い ETL ステップ (joinsdistinctfiltersgroup by の実行など) に必要な更新時間の大幅な短縮Drastically reduces the refresh time required for long-running ETL steps over computed entities, such as performing joins, distinct, filters, and group by
  • エンティティに対して DirectQuery クエリを実行するPerform DirectQuery queries over entities

次に、拡張コンピューティング エンジンを有効にする方法と、よく寄せられる質問への回答について説明します。Enabling the enhanced compute engine is described next, along with answers to common questions.

拡張コンピューティング エンジンの使用Using the enhanced compute engine

拡張コンピューティング エンジンは、Power BI サービスの [容量の設定] ページの [データフロー] セクションで有効にします。The enhanced compute engine is enabled from the Capacity Settings page in the Power BI service, in the dataflows section. 既定では、拡張コンピューティング エンジンは [オフ] になっています。By default, the enhanced compute engine is Off. 拡張コンピューティング エンジンを有効にするには、次の図に示すようにトグルを [オン] に切り替えて、設定を保存します。To enable the enhanced compute engine, switch the toggle to On as shown in the following image, and save your settings.

拡張コンピューティング エンジンをオンにする

重要

拡張コンピューティング エンジンは、A3 以上の Power BI 容量に対してのみ機能します。The enhanced compute engine works only for Power BI capacities of A3 and larger.

拡張コンピューティング エンジンをオンにしたら、データフローに戻ります。複雑な演算 (同じ容量の既存のリンクされたエンティティから作成されたデータフローに対する joinsgroup by 演算など) を実行する計算対象エンティティのパフォーマンスが向上しているはずです。Once the enhanced compute engine is on, return to dataflows and you should see a performance improvement in any computed entity that performs complex operations, such as joins or group by operations for dataflows created from existing linked entities on the same capacity.

コンピューティング エンジンを最大限に活用するには、次のように ETL ステージを 2 つの異なるデータフローに分割します。To make best use of the compute engine, split the ETL stage into two separate dataflows, in the following way:

  • データフロー 1: このデータフローでは、データ ソースから必要なすべてを取り込み、それをデータフロー 2 に配置するだけです。Dataflow 1 - this dataflow should only be ingesting all of the required from a data source, and placing it into dataflow 2.
  • データフロー 2: この 2 つ目のデータフローですべての ETL 操作が実行されますが、データフロー 1 が同じ容量にあり、それを参照していることを確認します。Dataflow 2 - perform all ETL operations in this second dataflow, but ensure you're referencing Dataflow 1, which should be on the same capacity. また、コンピューティング エンジンが確実に使用されるように、他の演算を実行する前に、フォールドできる演算 (filter、group by、distinct、join) を確実に実行します。Also ensure you perform operations that can fold (filter, group by, distinct, join) first, before any other operation, to ensure the compute engine is utilized.

一般的な質問と回答Common questions and answers

質問: 拡張コンピューティング エンジンを有効にしましたが、更新に時間がかかります。Question: I've enabled the enhanced compute engine, but my refreshes are slower. なぜでしょうか。Why?

回答: 拡張コンピューティング エンジンを有効にすると更新時間が遅くなる原因には、2 つの理由が考えられます。Answer: If you enable the enhanced compute engine, there are two possible explanations that could lead to slower refresh times:

  • 拡張コンピューティング エンジンを有効にすると、エンジンが適切に機能するためにある程度のメモリが必要になります。When the enhanced compute engine is enabled, it requires some memory to function properly. そのため、更新の実行に使用できるメモリが減り、更新がキューに格納される可能性が高くなります。これにより、同時に更新できるデータフローの数が減少します。As such, memory available to perform a refresh is reduced and therefore increases the likelihood of refreshes to be queued, which in turn reduces the number of dataflows that can refresh concurrently. これに対処するには、拡張コンピューティングを有効にするときに、データフローに割り当てられているメモリを増やして、同時実行のデータフロー更新に使用できるメモリが変わらないようにします。To address this, when enabling enhanced compute, increase the memory assigned for dataflows to ensure the memory available for concurrent dataflow refreshes remains the same.

  • 更新が遅くなる可能性があるもう 1 つの理由は、コンピューティング エンジンは既存のエンティティ上に対してのみ動作することです。Another reason you may encounter slower refreshes is that the compute engine only works on top of existing entities. データフローではないデータ ソースがデータフローで参照されている場合、改善は見られません。If your dataflow references a data source that's not a dataflow, you won't see an improvement. 一部のビッグ データ シナリオでは、データを拡張コンピューティング エンジンに渡す必要があるため、データ ソースからの最初の読み取りが遅くなり、パフォーマンスが向上しません。There will be no performance increase, since in some big data scenarios, the initial read from a data source would be slower because the data needs to be passed to the enhanced compute engine.

質問: 拡張コンピューティング エンジンのトグルが表示されません。Question: I cannot see the enhanced compute engine toggle. なぜでしょうか。Why?

回答: 拡張コンピューティング エンジンは、世界中のリージョンに段階的にリリースされています。Answer: The enhanced compute engine is being released in stages to regions around the world. 2020 年末までに、すべてのリージョンがサポートされる予定です。We anticipate all regions will supported by the end of 2020.

質問: コンピューティング エンジンでサポートされているデータ型は何ですか?Question: What are the supported data types for the compute engine?

回答: 拡張コンピューティング エンジンとデータフローでは、現在、次のデータ型がサポートされています。Answer: The enhanced compute engine and dataflows currently support the following data types. データフローで次のデータ型のいずれかが使用されていない場合は、更新時にエラーが発生します。If your dataflow doesn't use one of the following data types, an error occurs during refresh:

  • 日付/時刻Date/Time
  • 10 進数Decimal Number
  • テキストText
  • 整数Whole number
  • 日付/時刻/タイムゾーンDate/Time/Zone
  • True/FalseTrue/False
  • DateDate
  • 時刻Time

Power BI で DirectQuery とデータフローを使用する (プレビュー)Use DirectQuery with dataflows in Power BI (preview)

DirectQuery を使用してデータフローに直接接続し、それによってデータをインポートせずにデータフローに直接接続することができます。You can use DirectQuery to connect directly to dataflows, and thereby connect directly to your dataflow without having to import its data.

データフローに DirectQuery を使用すると、Power BI とデータフローのプロセスに対して次の改善が可能になります。Using DirectQuery with dataflows enables the following enhancements to your Power BI and dataflows processes:

  • 個別の更新スケジュールを回避する - DirectQuery では、データフローに直接接続するため、インポートされたデータセットを作成する必要がなくなります。Avoid separate refresh schedules - DirectQuery connects directly to a dataflow, removing the need to create an imported dataset. そのため、データフローに DirectQuery を使用すると、データフローとデータセット用の個別の更新スケジュールが不要になり、データの同期が保証されます。As such, using DirectQuery with your dataflows means you no longer need separate refresh schedules for the dataflow and the dataset to ensure your data is synchronized.

  • データのフィルター処理 - DirectQuery は、データフロー内のデータのフィルター処理されたビューを操作する場合に便利です。Filtering data - DirectQuery is useful for working on a filtered view of data inside a dataflow. データをフィルター処理することでデータフロー内のデータの小さなサブセットを処理したい場合は、DirectQuery (およびコンピューティング エンジン) を使用してデータフローのデータをフィルター処理し、目的のフィルター処理されたサブセットを操作できます。If you want to filter data, and thereby work with a smaller subset of the data in your dataflow, you can use DirectQuery (and the compute engine) to filter dataflow data and work with the filtered subset you need.

データフローに対して DirectQuery を使用するUsing DirectQuery for dataflows

データフローに対する DirectQuery の使用は、Power BI Desktop の 2020 年 5 月バージョンから使用できるようになったプレビュー機能です。Using DirectQuery with dataflows is a preview feature available beginning with the May 2020 version of Power BI Desktop.

データフローに DirectQuery を使用するための前提条件もあります。There are also prerequisites for using DirectQuery with dataflows:

  • データフローが Power BI Premium が有効なワークスペース内に存在する必要がありますYour dataflow must reside within a Power BI Premium enabled workspace
  • コンピューティング エンジンを有効にする必要がありますThe compute engine must be turned on

データフローに対して DirectQuery を有効にするEnable DirectQuery for dataflows

データフローを DirectQuery からアクセスできるようにするには、拡張コンピューティング エンジンが最適化された状態になっている必要があります。To ensure your dataflow is available for DirectQuery access, the enhanced compute engine must be in its optimized state. データフローに対して DirectQuery を有効にするには、新しい [コンピューティング エンジンの拡張設定] オプションを [オン] に設定します。To enable DirectQuery for dataflows, set the new Enhanced compute engine settings option to On. 次の画像は、適切に選択された設定を示しています。The following image shows the setting properly selected.

直接クエリのきめ細かい制御

この設定を適用したら、最適化を有効にするためにデータフローを更新してください。Once you've applied that setting, refresh the dataflow for the optimization to take effect.

DirectQuery に関する考慮事項と制限事項Considerations and limitations for DirectQuery

DirectQuery とデータフローには、いくつかの既知の制限事項があります。There are a few known limitations with DirectQuery and dataflows:

  • この機能のプレビュー期間中は、データフローに DirectQuery を使用すると一部のお客様にタイムアウトやパフォーマンス上の問題が発生する場合があります。During the preview period of this feature, some customers may experience timeouts or performance issues when using DirectQuery with dataflows. このような問題は、このプレビュー期間中にアクティブに対処されています。Such issues are being actively addressed during this preview period.

  • インポートおよび DirectQuery データ ソースがある複合または混合モデルは、現在、サポートされていません。Composite/mixed models that have import and DirectQuery data sources are currently not supported.

  • 大規模なデータフローでは、視覚エフェクトを表示するときに、タイムアウトの問題が発生する可能性があります。Large dataflows may have trouble with timeout issues when viewing visualizations. タイムアウトの問題が発生する大規模なデータフローの場合は、インポート モードを使用する必要があります。Large dataflows that run into trouble with timeout issues should use Import mode.

  • DirectQuery を使用している場合は、データ ソースの設定で、データフロー コネクタに無効な資格情報が表示されます。Under data source settings, the dataflow connector will show invalid credentials if you are using DirectQuery. これが動作に影響することはなく、データセットは正常に機能します。This does not affect the behavior, and the dataset will work properly.

計算対象エンティティComputed entities

Power BI Premium サブスクリプションでデータフローを使用するときに、ストレージ内計算を実行できます。You can perform in-storage computations when using dataflows with a Power BI Premium subscription. これにより、既存のデータフローで計算を実行して、レポートの作成と分析に集中できる結果を返すことができます。This lets you perform calculations on your existing dataflows, and return results that enable you to focus on report creation and analytics.

計算対象エンティティ

ストレージ内計算を実行するには、まず、データフローを作成して、その Power BI データフロー ストレージにデータを取り込む必要があります。To perform in-storage computations, you first must create the dataflow and bring data into that Power BI dataflow storage. データを含むデータフローを作成した後は、ストレージ内計算を実行するエンティティである計算されたエンティティを作成できます。Once you have a dataflow that contains data, you can create computed entities, which are entities that perform in-storage computations.

計算対象エンティティに関する考慮事項と制限事項Considerations and limitations of computed entities

  • 組織の Azure Data Lake Storage Gen2 アカウントで作成されたデータフローを使用しているとき、リンクされたエンティティと計算対象エンティティは、そのエンティティが同じストレージ アカウントに存在するときにのみ機能します。When working with dataflows created in an organization's Azure Data Lake Storage Gen2 account, linked entities and computed entities only work properly when the entities reside in the same storage account.

ベスト プラクティスとして、オンプレミスとクラウドのデータによって結合されたデータに対して計算を行う場合は、ソースごとに新しいデータフローを作成し (オンプレミス用に 1 つ、クラウド用に 1 つ)、3 番目のデータフローを作成して、これらの 2 つのデータソースのマージと計算を行います。As a best practice, when doing computations on data joined by on-premises and cloud data, create a new dataflow for each source (one for on-premises and one for cloud) and then create a third dataflow to merge/compute over these two data sources.

リンクされたエンティティLinked entities

Power BI Premium サブスクリプションで使用する場合は、既存のデータフローを参照できます。これにより、計算対象エンティティを使用してこれらのエンティティの計算を実行したり、複数のデータフロー内で再利用できる "単一の正しい情報源" テーブルを作成したりできます。You can reference existing dataflows when using with a Power BI Premium subscription, which lets you either perform calculation on these entities using computed entities or allows you to create a "single source of the truth" table that you can reuse within multiple dataflows.

増分更新Incremental refresh

更新のたびにすべてのデータを取得する必要がないよう、増分更新されるようにデータフローを設定できます。Dataflows can be set to refresh incrementally to avoid having to pull all the data on every refresh. そのためには、データフローを選択してから、増分更新アイコンを選択します。To do so, select the dataflow then select the incremental refresh icon.

増分更新

増分更新を設定すると、日付範囲を指定するパラメーターがデータフローに追加されます。Setting incremental refresh adds parameters to the dataflow to specify the date range. 増分更新の設定方法の詳細については、増分更新に関する記事を参照してください。For detailed information on how to set up incremental refresh, see the incremental refresh article.

増分更新を設定しない場合に関する考慮事項Considerations for when not to set incremental refresh

次の状況では、データフローの増分更新を設定しないでください。Do not set a dataflow to incremental refresh in the following situations:

  • リンクされたエンティティでデータフローが参照されている場合、それらでは増分更新を使用しないでください。Linked entities should not use incremental refresh if they reference a dataflow. データフローを使用すると、クエリの折りたたみはサポートされません (エンティティで DirectQuery が有効にされている場合でも)。Dataflows does not support query folding (even if the entity is DirectQuery enabled).
  • データフローを参照するデータセットにおいては、増分更新を使用しないでください。Datasets referencing dataflows should not use incremental refresh. 通常、データフローに対する更新は問題なく行われるはずです。Refreshes to dataflows should generally perform well. 更新に予想より長い時間がかかる場合は、コンピューティング エンジンと DirectQuery モードの使用を検討してください。If the refreshes take longer than expected, consider using the compute engine and or DirectQuery mode.

次のステップNext steps

データフローと Power BI の詳細については、以下の記事を参照してください。The following articles provide more information about dataflows and Power BI: