Azure Synapse サーバーレス SQL プールの機能とユースケースを理解する

5 分

Azure Synapse Analytics は、大規模なデータの処理と分析に一般的に使用される幅広いテクノロジを組み合わせる統合分析サービスです。データソリューションで最も普及しているテクノロジの 1 つは、データのクエリと操作のための業界標準言語である SQL です。

Azure Synapse Analytics のサーバーレス SQL プール

Azure Synapse SQL は、Azure Synapse Analytics の分散クエリシステムであり、次の 2 種類のランタイム環境を提供します。

サーバーレス SQL プール: オンデマンド SQL クエリ処理。主にデータレイク内のデータを操作するために使用されます。
専用 SQL プール: データがリレーショナルテーブルに格納されているデータウェアハウスをホストするために使用される、エンタープライズ規模のリレーショナルデータベースインスタンスです。

このモジュールでは、サーバーレス SQL プールに焦点を当てます。これにより、データレイク内のデータに対してクエリを実行するためのクエリごとの課金エンドポイントが提供されます。サーバーレス SQL プールを使用する利点は次のとおりです。

特別なストアにデータをコピーしたり読み込んだりする必要なく、決まった場所でデータのクエリを実行できる、使い慣れた T-SQL 構文。
最も人気のあるドライバーを含めたさまざまなビジネスインテリジェンス、およびアドホッククエリ実行ツールを提供する統合接続。
大規模なデータと計算関数用に構築された分散クエリ処理による、高速なクエリパフォーマンス。
組み込みのクエリ実行フォールトトレランスにより、大規模なデータセットを対象とする実行時間の長いクエリの場合でも、高い信頼性と成功率を実現。
セットアップするインフラストラクチャや保守するクラスターがない。すべての Azure Synapse ワークスペース内にこのサービスの組み込みのエンドポイントが提供されるため、ワークスペースを作成したらすぐにデータのクエリ実行を開始できます。
予約されているリソースには課金されず、実行するクエリによって処理されるデータに対してのみが課金の対象。

サーバーレス SQL プールを使うタイミング

サーバーレス SQL プールは、データレイク内に存在するデータへのクエリ実行用に調整されているため、管理上の負担がなくなるだけでなく、システムへのデータの取り込みについて心配する必要もなくなります。既にレイク内にあるデータを対象にしたクエリを実行するだけです。

Synapse SQL サーバーレスリソースモデルは、Azure Synapse Analytics ワークスペースの Always-on サーバーレス SQL エンドポイントを使用して処理できる計画外または "バースト的な" ワークロードに最適です。サーバープールを使用すると、コストを監視して属性付けするために、実行された各クエリの正確なコストを把握する必要がある場合に便利です。

Note

サーバーレス SQL プールは分析システムであり、アプリケーションでトランザクションデータの格納に使われるデータベースなどの OLTP ワークロードには推奨されません。ミリ秒の応答時間を必要とし、データセット内の 1 つの行を特定する必要があるワークロードは、サーバーレス SQL プールには適していません。

サーバーレス SQL プールの一般的なユースケースは次のとおりです。

データ探索: データ探索では、データレイクを参照してデータに関する初期の分析情報を得る必要がありますが、Azure Synapse Studio を使用すると簡単に実現できます。リンクされたデータレイクストレージ内のファイルを参照し、組み込みのサーバーレス SQL プールを使用して SQL スクリプトを自動的に生成し、SQL Server のテーブルの場合と同様に、ファイルまたはフォルダーから上位 100 行を選択できます。そこから、データが通常の SQL Server テーブル内にある場合と同様に、データに対してプロジェクション、フィルター処理、グループ化をはじめとするほとんどの操作を適用できます。
データ変換: Azure Synapse Analytics には Synapse Spark を使用した優れたデータ変換機能がありますが、一部のデータエンジニアにとっては、SQL を使用したデータ変換の方がより簡単かもしれません。サーバーレス SQL プールを使用すると、対話型または自動データパイプラインの一部として、SQL ベースのデータ変換を実行できます。
論理データウェアハウス: データレイク内のデータを最初に探索した後、サーバーレス SQL データベース内のテーブルやビューなどの外部オブジェクトを定義できます。データはデータレイクファイルに格納されたままですが、クライアントアプリケーションや分析ツールが使用できるリレーショナルスキーマによって抽象化され、SQL Server でホストされているリレーショナルデータベースと同様にデータにクエリを実行できます。

続行

Azure Synapse サーバーレス SQL プールの機能とユース ケースを理解する

Azure Synapse Analytics のサーバーレス SQL プール

サーバーレス SQL プールを使うタイミング

フィードバック