Fabric レイクハウスにデータ取り込むためのオプション

データ取得エクスペリエンスは、次のようなデータをレイクハウスに取り込むためのすべてのユーザー シナリオをカバーしています。

  • 既存の SQL Server に接続し、レイクハウス上のデルタ テーブルにデータをコピーする。
  • 自分のコンピューターからファイルをアップロードする。
  • 他のレイクハウスから複数のテーブルをコピーして新しいデルタ テーブルにマージする。
  • ストリーミング ソースに接続して、レイクハウスにデータを配置する。
  • 他の内部レイクハウスや外部ソースからデータをコピーせずに参照する。

レイクハウスにデータを読み込むさまざまな方法

Microsoft Fabric では、次のようにレイクハウスにデータを取り込む方法がいくつかあります。

  • ローカル コンピューターからファイルをアップロードする
  • パイプラインでコピー ツールを実行する
  • データフローを設定する
  • ノートブック コード内の Apache Spark ライブラリ

ローカル ファイルのアップロード

ローカル コンピューターに格納されているデータをアップロードすることもできます。 これはレイクハウス エクスプローラーで直接行うことができます。

Screenshot of file upload dialog in the Lakehouse explorer.

パイプラインのコピー ツール

コピー ツールは、さまざまなデータ ソースに接続し、元の形式でデータを読み込んだり、デルタ テーブルに変換したりできる、拡張性の高い Data Integration ソリューションです。 コピー ツールはパイプライン アクティビティの一部で、イベントに基づいたスケジュールやトリガーなど、複数の方法で変更できます。 詳細については、「コピー クティビティを使用してデータをコピーする方法」を参照してください。

データフロー

Power BI データフローに精通しているユーザーの場合は、レイクハウスにデータを読み込むのに同じツールを使用できます。 レイクハウス エクスプローラーの [データの取得] オプションからすばやくアクセスでき、200 を超えるコネクタからデータを読み込むことができます。 詳細については、「クイックスタート: 初めてのデータフローを作成してデータの取得と変換を行う」を参照してください。

ノートブック コード

使用可能な Spark ライブラリを使用してデータ ソースに直接接続し、データ フレームにデータを読み込み、レイクハウスに保存できます。 この方法は、ユーザー コードで完全に管理されているレイクハウスにデータを読み込む最もオープンな方法です。

Note

Spark コードで作成された外部 Delta テーブルは、SQL 分析エンドポイントに対して表示されません。 外部 Delta テーブルを SQL 分析エンドポイントに対して表示するには、テーブル領域のショートカットを使用します。

データを読み込む方法を選択する際の考慮事項

ユース ケース 推奨事項
ローカル コンピューターからの小さなファイルのアップロード ローカル ファイルのアップロードを使用する
小さいデータまたは特定のコネクタ データフローを使用する
大きなデータ ソース パイプラインのコピー ツールを使用する
複雑なデータ変換 ノートブック コードを使用する