Azure Synapse Analytics での専用 SQL プール (旧称 SQL DW) のコンピューティングを管理する

[アーティクル]
06/01/2023

Azure Synapse Analytics で専用 SQL プール (旧称 SQL DW) におけるコンピューティングの管理について説明します。専用 SQL プールを一時停止してコストを削減したり、パフォーマンス需要に応じて専用 SQL プールをスケーリングしたりします。

コンピューティングの管理とは

専用 SQL プール (旧称 SQL DW) のアーキテクチャではストレージとコンピューティングを分離して、それぞれを個別にスケーリングできます。その結果、データストレージとは無関係に、パフォーマンス需要に応じてコンピューティングをスケーリングできます。コンピューティングリソースは、一時停止して再開することもできます。このアーキテクチャでは、当然、コンピューティングとストレージに対する課金は別々に行われます。専用 SQL プール (旧称 SQL DW) をしばらく使用する必要がない場合は、コンピューティングを一時停止して、コンピューティングコストを節約できます。

コンピューティングのスケーリング

コンピューティングをスケールアウトまたはスケールバックするには、専用 SQL プール (旧称 SQL DW) のデータウェアハウスユニット設定を調整します。データウェアハウスユニットを追加していくと、読み込みとクエリのパフォーマンスが直線的に増加していきます。

スケールアウトの手順については、Azure Portal、PowerShell、または T-SQL のクイックスタートに関する記事を参照してください。 REST API を使用して、スケールアウト操作を実行することもできます。

スケール操作を実行する場合、専用 SQL プール (旧称 SQL DW) は、最初にすべての受信クエリを中止し、次にトランザクションをロールバックして一貫性のある状態を確保します。スケーリングは、トランザクションのロールバックが完了して初めて実行されます。スケール操作では、コンピューティングノードからストレージレイヤーがデタッチされ、コンピューティングノードが追加され、ストレージレイヤーがコンピューティングレイヤーに再アタッチされます。各専用 SQL プール (旧称 SQL DW) は、60 のディストリビューションとして保存され、これがコンピューティングノードに均等に分配されます。コンピューティングノードを追加していくと、コンピューティング能力も向上していきます。コンピューティングノードの数が増加すると、それにつれてコンピューティングノードあたりのディストリビューションの数が減少し、クエリ用のコンピューティング能力がより多く得られます。同様に、データウェアハウスユニットを減らすと、コンピューティングノードの数が減少し、クエリ用のコンピューティングリソースが減ります。

次の表は、データウェアハウスユニットが変化すると、コンピューティングノードあたりのディストリビューションの数がどのように変化するかを示しています。 DW30000c は、60 のコンピューティングノードを提供し、DW100c よりはるかに高いクエリパフォーマンスを達成します。

データウェアハウスユニット	コンピューティングノードの数	ノードあたりのディストリビューションの数
DW100c	1	60
DW200c	1	60
DW300c	1	60
DW400c	1	60
DW500c	1	60
DW1000c	2	30
DW1500c	3	20
DW2000c	4	15
DW2500c	5	12
DW3000c	6	10
DW5000c	10	6
DW6000c	12	5
DW7500c	15	4
DW10000c	20	3
DW15000c	30	2
DW30000c	60	1

データウェアハウスユニットの適正サイズの確認

スケールアウトのパフォーマンス上のメリット (特に、大規模なデータウェアハウスユニットのスケールアウトのパフォーマンス上のメリット) を確認するには、少なくとも 1 TB のデータセットを使用する必要があります。専用 SQL プール (旧称 SQL DW) の最適なデータウェアハウスユニット数を確認するには、スケールアップとスケールダウンを試します。データを読み込んだ後、さまざまなデータウェアハウスユニット数でいくつかのクエリを実行します。スケーリングは簡単に行えるので、1 時間以内でさまざまなパフォーマンスレベルを試すことができます。

最適なデータウェアハウスユニット数を確認する際の推奨事項を以下に示します。

開発中の専用 SQL プール (旧称 SQL DW) の場合は、少ない数のデータウェアハウスユニットを選択することから始めます。手始めとしては、DW400c または DW200c が適しています。
アプリケーションのパフォーマンスを監視し、選択したデータウェアハウスユニットの数に対するパフォーマンスの変化を観察します。
線形スケールを想定し、データウェアハウスユニットをどれだけ増減する必要があるかを確認します。
ビジネス要件に応じた最適なパフォーマンスレベルに到達するまで調整を行います。

スケールアウトを実行するタイミング

データウェアハウスユニットをスケールアウトすると、次のパフォーマンスに影響があります。

スキャン、集計、CTAS ステートメントに関するシステムのパフォーマンスが直線的に向上します。
データ読み込み用のリーダーとライターの数が増えます。
コンカレントクエリとコンカレンシースロットの最大数。

データウェアハウスユニットをスケールアウトするタイミングについての推奨事項を以下に示します。

大量データの読み込みまたは変換操作を実行する前に、データが短時間で使用可能になるようにスケールアウトします。
営業時間のピーク時は、より多くの同時実行クエリに対応できるようにスケールアウトします。

スケールアウトしてもパフォーマンスが向上しない場合の対処

データウェアハウスユニットを追加すると、並列性が増加します。作業がコンピューティングノード間で均等に分割されている場合、並列性を追加すると、クエリのパフォーマンスが向上します。スケールアウトしてもパフォーマンスが変化しない場合は、その理由がいくつか存在します。ディストリビューション全体でデータが傾斜しているか、クエリによって大量のデータ移動が発生している可能性があります。クエリのパフォーマンスの問題を調査するには、パフォーマンスのトラブルシューティングに関する記事を参照してください。

コンピューティングの一時停止と再開

コンピューティングを一時停止すると、ストレージレイヤーがコンピューティングノードからデタッチされます。コンピューティングリソースがアカウントから解放されます。コンピューティングが一時停止中は、コンピューティングに対する課金はありません。コンピューティングを再開すると、ストレージがコンピューティングノードに再アタッチされ、コンピューティングの課金が再開されます。専用 SQL プール (旧称 SQL DW) を一時停止する場合:

コンピューティングリソースとメモリリソースは、データセンターで使用可能なリソースのプールに返されます。
一時停止の期間中、データウェアハウスユニットのコストは 0 になります。
データストレージは影響を受けず、データはそのまま残ります。
実行中またはキューに入れられたすべての操作が取り消されます。
DMV カウンターがリセットされます。

専用 SQL プール (旧称 SQL DW) を再開する場合:

専用 SQL プール (旧称 SQL DW) がデータウェアハウスユニット設定のコンピューティングとメモリのリソースを取得します。
データウェアハウスユニットのコンピューティングの課金が再開されます。
データが使用可能になります。
専用 SQL プール (旧称 SQL DW) がオンラインになった後、ワークロードクエリを再開する必要があります。

常に専用 SQL プール (旧称 SQL DW) にアクセスできるようにする場合は、一時停止ではなく、最小サイズへのスケールダウンを検討してください。

一時停止と再開の手順については、Azure Portal または PowerShell のクイックスタートに関する記事を参照してください。一時停止 REST API または再開 REST API を使用することもできます。

一時停止またはスケールの前にトランザクションを排出する

一時停止操作またはスケール操作を開始する前に、既存のトランザクションを完了することをお勧めします。

専用 SQL プール (旧称 SQL DW) を一時停止またはスケーリングすると、一時停止またはスケーリング要求を開始したときに、バックグラウンドでクエリが取り消されます。単純な SELECT クエリの取り消しは、短時間で終わる処理であるため、インスタンスを一時停止またはスケールするのにかかる時間にほとんど影響しません。ただし、データやデータ構造を変更するトランザクションクエリは、すぐに停止できない場合があります。 トランザクションクエリについては、当然、すべてが完了するか、変更をロールバックする必要があります。 トランザクションクエリが完了した作業をロールバックするには、クエリが元の変更の適用にかかった時間と同じか、それよりも長くかかる場合があります。たとえば、行の削除を既に 1 時間実行しているクエリを取り消した場合、削除された行を挿入し直すのに 1 時間かかる可能性があります。トランザクションの実行中に一時停止またはスケールを実行した場合、一時停止またはスケールするには、ロールバックが完了するのを待機する必要があるため、時間がかかることがあります。

トランザクションの概要とトランザクションの最適化に関するページも参照してください。

コンピューティングの管理の自動化

コンピューティングの管理操作を自動化するには、Azure の機能を使用したコンピューティングの管理に関する記事を参照してください。

スケールアウト、一時停止、再開の各操作は、完了するのに数分かかる場合があります。スケーリング、一時停止、または再開を自動化する場合は、別のアクションに進む前に特定の操作を確実に完了させるロジックを実装することをお勧めします。さまざまなエンドポイントを通じて専用 SQL プール (旧称 SQL DW) の状態を確認することで、このような操作の自動化を適切に実装できます。

専用 SQL プール (旧称 SQL DW) の状態を確認するには、PowerShell または T-SQL のクイックスタートに関する記事を参照してください。また、REST API で専用 SQL プール (旧称 SQL DW) の状態を確認することもできます。

アクセス許可

専用 SQL プール (旧称 SQL DW) をスケーリングするには、ALTER DATABASE に関するページで説明されているアクセス許可が必要です。一時停止と再開には、SQL DB Contributor のアクセス許可、具体的には Microsoft.Sql/servers/databases/action が必要です。

次のステップ

コンピューティングの管理については、ハウツーガイドを参照してください。コンピューティングリソースの管理の別の側面として、個々のクエリへの異なるコンピューティングリソースの割り当てがあります。詳細については、「ワークロード管理用のリソースクラス」を参照してください。