環境とワークスペース間でデータフローを再利用する場合のベスト プラクティス

この記事では、データフローを効果的かつ効率的に再利用するためのベスト プラクティスについて説明します。 再利用するデータフローを開発する場合に、設計上の落とし穴や潜在的なパフォーマンスの問題を回避するには、この記事を参照してください。

ステージングまたは抽出データフローからデータ変換データフローを分離する

データフローですべてのアクションを実行する場合、そのエンティティを他のデータフローや他の目的で再利用するのは困難です。 再利用するのに最適なデータフローは、少数のアクションのみを実行するデータフローです。 1 つの特定のタスクに特化したデータフローの作成は、それらを再利用するための最適な方法の 1 つです。 ステージング データフローとして使用する一連のデータフローがある場合、その唯一のアクションは、ソース システムからデータをそのまま抽出することです。 これらのデータフローは、他の複数のデータフローで再利用できます。

データ変換データフローがある場合は、一般的な変換を実行するデータフローに分割できます。 各データフローでは、少数のアクションだけを実行できます。 データフローごとに少数のアクションを実行することにより、そのデータフローの出力は他のデータフローで再利用可能になります。

少数のアクションのみを実行するデータフロー。

データ ソースからステージング データフローへのデータの抽出を示す画像。ここで、エンティティは Dataverse または Azure Data Lake Storage のいずれかに格納され、次に変換データフローに移動されます。そこでは、データは変換されデータ ウェアハウス構造へと変えられ、そして Power BI データセットに読み込まれます。

複数のワークスペースを使用する

各ワークスペース (または環境) は、そのワークスペースのメンバーのみ使用できます。 すべてのデータフローを 1 つのワークスペースに構築すると、データフローの再利用は最小限に抑えられます。 会社全体のエンティティを処理しているデータフローには何らかの汎用ワークスペースを使用できます。 複数の部門にわたってエンティティを処理するデータフロー用のワークスペースを用意することもできます。 また、特定の部門でのみ使用されるデータフロー用のワークスペースを使用することもできます。

個別のワークスペースを示す画像。

ワークスペースに適切なアクセス レベルを設定する

他のワークスペースのデータフローにアクセスしてワークスペース内のデータフローの出力を使用するには、ワークスペースの [表示] アクセス権を与える必要があります。 Power BI ワークスペース内の他のロールの詳細については、「新しいワークスペースのロール」を参照してください。

ワークスペースへのアクセス。

Power BI のデータフローの承認

テナント組織では多くのデータフローが作成される可能性があります。また、どのデータフローが最も信頼性が高いのかユーザーからわかりにくい場合もあります。 データフローの作成者、またはデータフローの編集アクセス権を持つユーザーは、3 つのレベル (承認なし、昇格、認定) でデータフローを承認できます。

これらのレベルの承認は、ユーザーが信頼性の高いデータフローをより簡単かつ迅速に見つけるのに役立ちます。 承認レベルの高いデータフローが最初に表示されます。 Power BI 管理者は、データフローを認定レベルに承認する機能を他のユーザーに委任できます。 詳細については、「承認 - Power BI コンテンツの昇格と認定」を参照してください。

データフローに対する承認。

エンティティを複数のデータフローに分割する

1 つのデータフローに複数のエンティティを含めることができます。 エンティティを複数のデータフローに分割する理由の 1 つは、データ インジェストとデータ変換のデータフローを分離する方法について、この記事で前に学習したことです。 エンティティを複数のデータフローに含めるもう 1 つの理由は、他のテーブルとは異なる更新スケジュールが必要な場合です。

次の図に示す例では、売上テーブルを 4 時間ごとに更新する必要があります。 現在の日付レコードを更新するには、日付テーブルを 1 日に 1 回だけ更新する必要があります。 また、製品マッピング テーブルは週に 1 回だけ更新する必要があります。 これらのテーブルがすべて 1 つのデータフローにある場合、すべてのテーブルに対して更新オプションは 1 つのみです。 しかし、これらのテーブルを複数のデータフローに分割する場合は、各データフローの更新を個別にスケジュールできます。

更新のスケジュールが異なるデータフロー。

データフロー エンティティに対する優れたテーブル候補

デスクトップ ツールの Power Query を使用してソリューションを開発する場合は、次の質問が必要になる場合があります。これらのテーブルの中で、データフローに移動する候補として最適なテーブルは何ですか? データフローに移動するのが最適なテーブルは、複数のソリューション、または複数の環境またはサービスで使用する必要があるテーブルです。 たとえば、次の図に示す Date テーブルは、2 つの個別の Power BI ファイルで使用する必要があります。 各ファイルでテーブルを複製する代わりに、データフロー内のテーブルをエンティティとしてビルドし、これらの Power BI ファイルで再利用できます。

データフローで使用される共有テーブル。