データ変換データフローからデータ インジェストを分離することにより、パフォーマンスと再利用性を向上させる
データフロー実装のベスト プラクティスの 1 つは、データフローの役割を、データ インジェストとデータ変換という 2 つの層に分けることです。 このパターンは、1 つのデータフローで低速データ ソースの複数のクエリを処理する場合や、同じデータ ソースに対して複数のデータフロー クエリを実行する場合に特に役立ちます。 クエリごとに低速データ ソースからデータを何度も取得する代わりに、データ インジェスト プロセスを 1 回実行して、そのプロセス上で変換を行うことができます。 この記事では、そのプロセスについて説明します。
オンプレミスのデータ ソース
多くのシナリオでは、オンプレミスのデータ ソースは低速データ ソースです。 特に、データフローとデータ ソースの間の中間層としてゲートウェイが存在することが考慮されます。

データ インジェストに分析データフローを使用すると、ソースからのデータの取得プロセスが最小限に抑えられ、Azure Data Lake Storage へのデータの読み込みに注力されます。 ストレージでは、インジェスト データフローの出力を利用する他のデータフローを作成できます。 データフロー エンジンは、元のデータ ソースまたはゲートウェイに接続しなくても、データ レイクから直接データを読み取り、変換を行うことができます。

低速データ ソース
データ ソースが低速である場合も、同じプロセスが有効です。 サービスとしてのソフトウェア (SaaS) データ ソースの中には、API 呼び出しの制限により、パフォーマンスが低下するものがあります。
データ インジェストとデータ変換のデータフローの分離
データのインジェストと変換の 2 つの層を分離すると、データ ソースが低速なシナリオで役立ちます。—— データ ソースとのやり取りを最小限に抑えることができます。
この分離は、パフォーマンスを向上させるだけでなく、古いレガシ データ ソース システムが新しいシステムに移行されているシナリオにも役立ちます。 そのような場合、データ インジェスト データフローを変更するだけで済みます。 このような変更では、データ変換データフローはそのまま維持されます。

他のツールやサービスでの再利用
データ変換データフローからのデータ インジェスト データフローの分離は、多くのシナリオで役立ちます。 このパターンの別のユース ケース シナリオが、他のツールやサービスでこのデータを使用する場合です。 このため、分析データフローを使用して、独自の Data Lake Storage をストレージ エンジンとして使用することをお勧めします。 詳細情報: 分析データフロー
データ インジェスト データフローを最適化する
可能な限り、データ インジェスト データフローの最適化を検討してください。 例として、ソースのすべてのデータが必要ではなく、データ ソースでクエリ フォールディングがサポートされている場合は、データをフィルター処理し、必要なサブセットのみを取得することをお勧めします。 クエリ フォールディングの詳細については、「Power Query のクエリ フォールディング」を参照してください。
データ インジェスト データフローを分析データフローとして作成する
データ インジェスト データフローを分析データフローとして作成することを検討してください。 これは特に、他のサービスやアプリケーションがこのデータを使用するのに役立ちます。 これにより、データ変換データフローが分析インジェスト データフローからデータを簡単に取得できるようになります。 詳細については、「分析データフロー」を参照してください。