レイク データベースを使う

完了

レイク データベースを作成すると、テーブル スキーマに一致するデータ ファイルをデータ レイク内の適切なフォルダーに格納し、SQL を使ってクエリを実行できるようになります。

サーバーレス SQL プールの使用

サーバーレス SQL プールを使って、SQL スクリプトでレイク データベースのクエリを実行することができます。

たとえば、RetailDB というレイク データベース内に Customer テーブルがあるとします。 次のような標準の SELECT ステートメントを使ってクエリを実行することができます。

USE RetailDB;
GO

SELECT CustomerID, FirstName, LastName
FROM Customer
ORDER BY LastName;

OPENROWSET 関数を使ったり、基となるファイル ストレージからデータにアクセスするための追加のコードを含めたりする必要はありません。 ファイルへのマッピングは、サーバーレス SQL プールによって自動処理されます。

Apache Spark プールの使用

サーバーレス SQL プールを使うだけでなく、Apache Spark プールで Spark SQL を使うことでレイク データベースのテーブルを操作することができます。

たとえば、次のコードを使って Customer テーブルに新しい顧客レコードを挿入できます。

%%sql
INSERT INTO `RetailDB`.`Customer` VALUES (123, 'John', 'Yang')

次に、次のコードを使ってテーブルのクエリを実行できます。

%%sql
SELECT * FROM `RetailDB`.`Customer` WHERE CustomerID = 123