Microsoft Fabric のレイクハウスとは?

Microsoft Fabric Lakehouseは、構造化データと非構造化データを 1 つの場所で保存、管理、分析するためのデータ アーキテクチャ プラットフォームです。 これは柔軟でスケーラブルなソリューションで、組織がさまざまなツールとフレームワークを使用して大量のデータを扱い、そのデータの処理と分析を行うことを可能とします。 これは他のデータ管理および分析ツールと統合され、データ エンジニアリングと分析の包括的なソリューションを提供します。

Gif of overall lakehouse experience.

レイクハウス SQL 分析エンドポイント

レイクハウスは、作成時に SQL 分析エンドポイントと既定のセマンティック モデルを自動生成することで、サービス レイヤーを作成します。 この新しい透視機能を使用すると、ユーザーはレイク内のデルタ テーブル上で直接作業を行い、データ インジェストからレポートに至るまでの、円滑でパフォーマンスに優れたエクスペリエンスを提供できます。

SQL 分析エンドポイントは読み取り専用のエクスペリエンスであり、トランザクション データ ウェアハウスの完全な T-SQL サーフェス領域をサポートしていない点に注意してください。

Note

SQL 分析エンドポイントでは Delta 形式のテーブルのみが使用できることに注意してください。 Parquet、CSV、およびその他の形式は、SQL 分析エンドポイントを使用してクエリを実行できません。 テーブルが表示されない場合は、Delta 形式に変換する必要があります。

自動テーブル検出および登録

自動テーブル検出および登録はレイクハウスの機能であり、データ エンジニアやデータ サイエンティスト向けにフル マネージドのファイルからテーブルへのエクスペリエンスを提供します。 ファイルをレイクハウスのマネージド領域にドロップすると、サポートされている構造化形式について自動的にシステムで検証が行われ、必要なメタデータ (列名、形式、圧縮など) と共にメタストアに登録されます。 (現時点では、サポートされている形式は Delta テーブルのみです)。その後、そのファイルをテーブルとして参照し、SparkSQL 構文を使用してデータを操作できます。

レイクハウス アイテムの操作

データ エンジニアは、レイクハウスとレイクハウス内のデータを次のいくつかの方法で操作できます。

  • レイクハウス エクスプローラー: エクスプローラーは主要なレイクハウスの操作ページです。 レイクハウスにデータを読み込み、オブジェクト エクスプローラーを使用してレイクハウス内のデータを探索し、MIP ラベル その他を設定できます。 エクスプローラーのエクスペリエンスの詳細については、「Fabric Lakehouse エクスプローラーを操作する」を参照してください。

  • ノートブック: データ エンジニアはノートブックを使用して、レイクハウスとの間で、テーブルかフォルダーまたはその両方として、直接読み取り、変換、書き込みを行うコードを記述できます。 レイクハウス用にノートブックを使用する方法の詳細は、「ノートブックを使用したレイクハウス内でのデータの探索」および「ノートブックを使用してレイクハウスにデータを読み込む方法」で確認できます。

  • パイプライン: データ エンジニアは、パイプライン コピー ツールなどのデータ統合ツールを使用して、他のソースからデータをプルし、レイクハウスに移動できます。 コピー アクティビティの使用方法の詳細については、「コピー アクティビティを使用してデータをコピーする方法」を参照してください。

  • Apache Spark ジョブ定義: データ エンジニアは、堅牢なアプリケーションを開発し、Java、Scala、Python でコンパイルされた Spark ジョブの実行を調整できます。 Spark ジョブの詳細について: Apache Spark ジョブ定義とは?

  • データフロー Gen 2: データ エンジニアは、データフロー Gen 2 を使用して、データの取り込みと準備を行うことができます。 データフローを使用したデータの読み込みの詳細については、「初めてのデータフローを作成してデータの取得および変換を行う」を参照してください。

レイクハウスにデータを読み込むさまざまな方法の詳細については、「Fabric レイクハウスにデータ取り込むためのオプション」を参照してください。

レイクハウスを使用したマルチタスク

マルチタスクエク スペリエンスは、複数の項目をシームレスに開いて切り替え、データ レイクハウスをこれまで以上に効率的に管理できるようにするブラウザー タブ デザインを提供します。 異なるウィンドウ間を行き来する必要や、タスクの流れを見失ったりすることはありません。 レイクハウスは、次の機能を使用して、データ管理の取り組みを可能な限り効率的かつユーザーフレンドリーにするために、マルチタスクエクスペリエンスを強化します。

  • 実行中の操作を保持する: 1 つのタブでアップロードやデータ読み込み操作実行を行い、他のタブで別のタスクを確認できます。強化されたマルチタスク機能では、タブ間を移動しても実行中の操作は取り消されません。 中断なしで作業に集中できます。

  • コンテキストを保持する: 選択したオブジェクト、データ テーブル、またはファイルは開いたままであり、タブを切り替えればすぐに使用できます。 データ レイクハウスのコンテキストをいつでもすぐに利用できます。

  • 非ブロッキングのリスト再読み込み: ファイルとテーブル一覧の非ブロッキング 再読み込みメカニズム。 リストがバックグラウンドで更新されている間も作業を続けることができます。 これにより、スムーズで中断のないエクスペリエンスを提供しながら、最新のデータが確実に得られます。

  • 明確に定義された通知: トースト通知では、受信元のレイクハウスが指定されるため、マルチタスク環境での変更や更新を簡単に追跡できます。

アクセシビリティの高いレイクハウス デザイン

アクセシビリティは常に最優先事項であり、レイクハウスが包括的で、すべてのユーザーにとってわかりやすいものになるようにしています。 アクセシビリティをサポートするためにこれまでに実装した主なイニシアチブを次に示します。

  • スクリーン リーダーとの互換性: 一般的なスクリーン リーダーとシームレスに連携できるため、視覚障碍のあるユーザーがプラットフォームを効果的に移動して操作できるようになります。

  • テキストリフロー: さまざまな画面サイズと向きに適応するレスポンシブ デザイン。 テキストとコンテンツのリフローが動的に行われ、ユーザーはさまざまなデバイスでアプリケーションを簡単に表示および操作できます。

  • キーボード ナビゲーション: ユーザーがマウスに頼らずにレイクハウス内を移動できるようにキーボード ナビゲーションが改善され、運動障碍のあるユーザーのエクスペリエンスが向上しました。

  • 画像の代替テキスト: すべての画像にわかりやすい代替テキストが含まれるようになり、スクリーン リーダーが意味のある情報を伝えることができるようになりました。

  • フォーム フィールドとラベル: すべてのフォーム フィールドにラベルが関連付けられているため、スクリーン リーダーを使用するユーザーを含め、すべてのユーザーのデータ入力が簡略化されます。

この概要では、レイクハウスの基本について説明しました。 次の記事に進み、独自のレイクハウスを作成して使用する方法について確認してください。