Microsoft Power Platform データフローと Azure Data Factory のラングリング データフローの相互関係

Microsoft Power Platform のデータフローと Azure Data Factory のデータフローは、ソース システムからデータを抽出し、データを変換し、変換されたデータを宛先に読み込むという点で、同じことを実行していると考えられることがよくあります。 ただし、この 2 種類のデータフローには違いがあり、これらのテクノロジを組み合わせて動作するソリューションを実装することができます。 この記事では、この関係について詳しく説明します。

Power Platform データフロー

Power Platform データフローは、Power Query エンジンによって強化されたデータ変換サービスであり、クラウドでホストされています。 これらのデータフローの場合、さまざまなデータ ソースからデータを取得し、変換を適用した後に、Dataverse または Azure Data Lake Storage に格納できます。

Power Platform データフロー図。

Data Factory ラングリング データフロー

Data Factory は、クラウドベースの抽出、変換、読み込み (ETL) サービスであり、さまざまなソースと宛先をサポートしています。 このテクノロジには、マッピング データフローとラングリング データフローという 2 種類のデータフローがあります。 ラングリング データフローは、データ変換のために Power Query エンジンによって強化されています。

ラングリング データフロー。

共通点

Power Platform データフローと Data Factory ラングリング データフローは、いずれも 1 つ以上のソースからデータを取得し、Power Query を使ってデータに変換を適用し、変換されたデータを宛先に読み込むのに役立ちます。 さらに:

  • どちらも Power Query のデータ変換を使って強化されています。
  • どちらもクラウドベースのテクノロジです。

違いは何でしょうか。

重要なのは、その違いを知ることです。そうすれば、どちらか一方を使いたいシナリオを考えることができるからです。

特徴 Power Platform データフロー Data Factory ラングリング データフロー
変換先 Dataverse または Azure Data Lake Storage 多数の変換先 (こちらの一覧を参照してください)
Power Query の変換 すべての Power Query 関数がサポートされています 一部の関数がサポートされています (こちらの一覧を参照してください)
変換元 多数のソースがサポートされています 一部のソースのみ (こちらの一覧を参照してください)
スケーラビリティ Premium 容量と強化されたコンピューティング エンジンの使用に依存 高拡張性

各データフローに適しているユーザー ペルソナ

小規模から中規模のデータを統合および変換する市民アプリケーション開発者や市民データ アナリストである場合は、Power Platform データフローの方が便利でしょう。 使用できる変換数が多いこと、開発者の知識がなくても使用できること、Power BI または Power Platform でデータフローの作成、監視、編集ができること — このようなことすべてが、Power Platform データフローがこの種の開発者に適したデータ統合ソリューションである理由です。

ビッグ データや大規模なデータセットを扱い、毎回大量の行を取り込むデータ開発者である場合は、Data Factory ラングリング データフローの方が仕事に適したツールでしょう。 ラングリング データ フローを使用すれば、Power Query Online Mashup Editor によって生成された M を、クラウド規模で実行するための Spark コードに変換できます。 Azure portal を使ってラングリング データフローを作成、監視、編集する作業は、Power Platform データフローの経験よりも高度な開発者の学習曲線が必要です。 ラングリング データフローは、この種の対象ユーザーに最適です。