レイクデータベースを使う

レイクデータベースを作成すると、テーブルスキーマに一致するデータファイルをデータレイク内の適切なフォルダーに格納し、SQL を使ってクエリを実行できるようになります。

サーバーレス SQL プールの使用

サーバーレス SQL プールを使って、SQL スクリプトでレイクデータベースのクエリを実行することができます。

たとえば、RetailDB というレイクデータベース内に Customer テーブルがあるとします。次のような標準の SELECT ステートメントを使ってクエリを実行することができます。

USE RetailDB;
GO

SELECT CustomerID, FirstName, LastName
FROM Customer
ORDER BY LastName;

OPENROWSET 関数を使ったり、基となるファイルストレージからデータにアクセスするための追加のコードを含めたりする必要はありません。ファイルへのマッピングは、サーバーレス SQL プールによって自動処理されます。

サーバーレス SQL プールを使うだけでなく、Apache Spark プールで Spark SQL を使うことでレイクデータベースのテーブルを操作することができます。

たとえば、次のコードを使って Customer テーブルに新しい顧客レコードを挿入できます。

%%sql
INSERT INTO `RetailDB`.`Customer` VALUES (123, 'John', 'Yang')

次に、次のコードを使ってテーブルのクエリを実行できます。

%%sql
SELECT * FROM `RetailDB`.`Customer` WHERE CustomerID = 123