SQL Server ビッグデータクラスターのデータプールとは

[アーティクル]
03/21/2023

適用対象: SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 ビッグデータクラスターのアドオンは廃止されます。 SQL Server 2019 ビッグデータクラスターのサポートは、2025 年 2 月 28 日に終了します。ソフトウェアアシュアランス付きの SQL Server 2019 を使用する既存の全ユーザーはプラットフォームで完全にサポートされ、ソフトウェアはその時点まで SQL Server の累積更新プログラムによって引き続きメンテナンスされます。詳細については、お知らせのブログ記事と「Microsoft SQL Server プラットフォームのビッグデータオプション」を参照してください。

この記事では、SQL Server ビッグデータクラスターでの "SQL Server データプール" の役割について説明します。以下のセクションでは、データプールのアーキテクチャ、機能、使用シナリオについて説明します。

この 5 分間のビデオでは、データプールについて説明し、データプールからデータのクエリを実行する方法について説明します。

データプールのアーキテクチャ

データプールは、クラスターに永続的な SQL Server ストレージを提供する 1 つ以上の SQL Server データプールインスタンスで構成されます。これにより、外部データソースおよび作業のオフロードに対してキャッシュデータをクエリするパフォーマンスを向上させることができます。データは、T-SQL クエリまたは Spark ジョブのいずれかを使用してデータプールに取り込まれます。大きなデータセット全体のパフォーマンスを向上させるために、取り込まれたデータはシャードに分散され、プール内のすべての SQL Server インスタンスに格納されます。サポートされているディストリビューション方法はラウンドロビン方式であり、レプリケートされます。読み取りアクセスの最適化では、各データプールインスタンスの各テーブルにクラスター化列ストアインデックスが作成されます。データプールは、SQL Server ビッグデータクラスターのスケールアウトデータマートとして機能します。

スケールアウトデータマート

データプール内の SQL Server インスタンスへのアクセスは、SQL Server マスターインスタンスから管理されます。データプールに対する外部データソースが、データキャッシュを格納する PolyBase 外部テーブルと共に作成されます。バックグラウンドでは、コントローラーによって、外部テーブルに一致するテーブルを含むデータベースがデータプールに作成されます。 SQL Server マスターインスタンスからは、ワークフローは透過的になります。コントローラーにより、特定の外部テーブル要求が、コンピューティングプールを介してデータプール内の SQL Server インスタンスにリダイレクトされ、クエリを実行して結果セットが返されます。データプール内のデータは、取り込みまたはクエリのみが可能であり、変更することはできません。そのため、データを更新するには、テーブルを削除してから、テーブルを再作成し、その後データを再設定する必要があります。

データプールのシナリオ

レポートを作成する目的は、データプールの一般的なシナリオです。たとえば、複数の PolyBase データソースを結合する複雑なクエリは、週次レポートで使用され、データプールにオフロードできます。キャッシュデータにより、ローカルの高速コンピューティングが提供され、元のデータセットに戻る必要がなくなります。同様に、定期的に更新する必要があるダッシュボードデータも、最適化されたレポート作成のためにデータプールにキャッシュすることができます。また、Machine Learning の繰り返し探索も、データプール内のデータセットをキャッシュすることからメリットが得られます。

次のステップ

SQL Server ビッグデータクラスターの詳細については、次のリソースを参照してください。

SQL Server ビッグデータクラスターのデータプールとは

データプールのアーキテクチャ

データプールのシナリオ

次のステップ

フィードバック

フィードバック

その他のリソース

SQL Server ビッグ データ クラスターのデータ プールとは

データ プールのアーキテクチャ

データ プールのシナリオ

次のステップ

フィードバック

フィードバック

その他のリソース

SQL Server ビッグデータクラスターのデータプールとは

データプールのアーキテクチャ

データプールのシナリオ