[アーティクル]
06/15/2011

ページの読み取り

SQL Server データベースエンジンのインスタンスからの I/O には、論理読み取りと物理読み取りがあります。論理読み取りは、データベースエンジンがバッファキャッシュからページを要求するたびに行われます。要求したページがバッファキャッシュに存在しない場合、物理読み取りが行われ、まず、ディスクからキャッシュにページがコピーされます。

データベースエンジンのインスタンスによって生成された読み取り要求はリレーショナルエンジンによって制御され、ストレージエンジンによって最適化されます。リレーショナルエンジンは、最も効率的なアクセス方法 (テーブルスキャン、インデックススキャン、キーによる読み取りなど) を判別します。アクセス方法とストレージエンジンのバッファマネージャコンポーネントによって、実行される読み取りの一般的なパターンが決まり、そのアクセス方法の実装に必要な最適化がその読み取りに対して行われます。バッチを実行するスレッドが、読み取りのスケジュールを設定します。

先行読み取り

データベースエンジンでは、先行読み取りと呼ばれるパフォーマンス最適化メカニズムがサポートされています。先行読み取りでは、クエリ実行プランに必要なデータページとインデックスページを予想し、実際にクエリで使用される前に、予想したページをバッファキャッシュに配置します。これにより、計算と I/O を同時に行うことができ、CPU とディスクが最大限に活用されます。

データベースエンジンではこの先行読み取りメカニズムにより、1 つのファイルから連続するページを最大 64 ページ (512 KB) まで読み取ることができます。この読み取りは、バッファキャッシュ内の (多くの場合連続していない) バッファを適切な数まで読み取る、単一のスキャッタ/ギャザー読み取り処理として実行されます。この範囲のいずれかのページが既にバッファキャッシュに存在する場合、読み取りの完了時に、読み取られたページの中から対応するページが破棄されます。また、バッファキャッシュのページと対応するページが複数存在する場合、それらのページが先頭または末尾からまとめて "切り捨て" られることもあります。

先行読み取りの対象は、データページとインデックスページの 2 種類です。

データページの読み取り

データページの読み取りに使用されるテーブルスキャンは、データベースエンジンでは非常に効率的に行われます。SQL Server データベース内の IAM (Index Allocation Map) ページには、テーブルまたはインデックスで使用されているエクステントの一覧が格納されています。ストレージエンジンは IAM を読み取ることで、読み取る必要のあるディスクアドレスが並べ替えられたリストを構築できます。これによりストレージエンジンは、ディスク上の位置に基づき、順番に行われる大量の順次読み取りとして、I/O を最適化できます。IAM ページの詳細については、「オブジェクトに使用されている領域の管理」を参照してください。

インデックスページの読み取り

ストレージエンジンは、インデックスページをキー順で直列に読み取ります。次の図は、キーのセットを格納しているリーフページのセットと、リーフページをマップしている中間インデックスノードの例を示しています。インデックスのページ構造の詳細については、「クラスタ化インデックスの構造」を参照してください。

キーによるリーフページへの中間インデックスノードのマップ

ストレージエンジンは、リーフレベルの上にある中間インデックスページ内の情報を使用して、キーを格納しているページに対して、直列先行読み取りのスケジュールを設定します。ABC ～ DEF までのすべてのキーに対する要求が行われると、ストレージエンジンは、まずリーフページの上にあるインデックスページを読み取ります。ただし、504 ページから 556 ページ (指定された範囲内で最後のキーを持つページ) までを単に順番に読み取るのではありません。ストレージエンジンは、中間インデックスページをスキャンし、読み取りが必要なリーフページのリストを構築します。続けて、すべての読み取りをキー順にスケジュール設定します。ストレージエンジンは、ページ 504/505 と 527/528 が連続していることも認識し、単一のスキャッタ読み取りを実行して、隣接するページを 1 回の操作で取得します。直列操作で多くのページを取得する場合、ストレージエンジンは一度に行う読み取りブロックのスケジュールを設定します。この読み取りのサブセットが終了すると、ストレージエンジンは同じ数の新たな読み取りのスケジュールを設定します。これは必要とされるすべての読み取りのスケジュールが設定されるまで続きます。

ストレージエンジンは、プレフェッチを使用して非クラスタ化インデックスからのベーステーブルの参照を高速化します。非クラスタ化インデックスのリーフ行は、それぞれの特定のキー値を格納しているデータ行へのポインタを格納しています。ストレージエンジンは、非クラスタ化インデックスのリーフページを読み取りながら、ポインタが既に取得されているデータ行の非同期読み取りをスケジュールに組み込みます。これにより、ストレージエンジンは非クラスタ化インデックスのスキャンを完了する前に、基になるテーブルからデータ行を取得できます。テーブルがクラスタ化インデックスを保持しているかどうかに関係なく、プレフェッチが使用されます。SQL Server Enterprise は、SQL Server の他のエディションよりも多くプレフェッチを使用するため、より多くのページを先行して読み取ることができます。いずれのエディションでも、プレフェッチのレベルは構成できません。非クラスタ化インデックスの詳細については、「非クラスタ化インデックスの構造」を参照してください。

拡張スキャン

SQL Server Enterprise の拡張スキャン機能により、複数のタスクがフルテーブルスキャンを共有できるようになります。Transact-SQL ステートメントの実行プランがテーブルのデータページのスキャンを必要とし、そのテーブルが既に他の実行プラン用にスキャンされていることをデータベースエンジンが検出した場合、データベースエンジンは、2 番目のスキャンの現在位置で 2 番目のスキャンを 1 番目のスキャンに結合します。データベースエンジンは各ページを 1 回だけ読み取り、各ページの行を両方の実行プランに渡します。この処理は、テーブルの最後まで行われます。

この時点で、1 番目の実行プランはスキャンの完全な結果を所有していますが、2 番目の実行プランは進行中のスキャンに結合する前に読み取られたデータページを取得する必要があります。2 番目の実行プランのスキャンは、折り返してテーブルの最初のデータページに戻り、1 番目のスキャンに結合した位置に達するまでスキャンを実行します。このようにして、スキャンはいくつでも組み合わせることができます。データベースエンジンは、すべてのスキャンを完了するまでデータページをループし続けます。このメカニズムは、"メリーゴーラウンドスキャン" とも呼ばれます。また、このメカニズムは、ORDER BY 句が指定されていない SELECT ステートメントから返される結果の順序が保証されない理由を説明しています。

たとえば、500,000 ページを持つテーブルがあるとします。UserA が、このテーブルのスキャンを要求する Transact-SQL ステートメントを実行します。このスキャンが 100,000 ページを処理した時点で、UserB が同じテーブルをスキャンする別の Transact-SQL ステートメントを実行します。データベースエンジンは、100,001 ページ以降のページに対する 1 セットの読み取り要求をスケジュールに組み込み、各ページの行を両方のスキャンに渡します。スキャンが 200,000 ページ目に達した時点で、UserC が同じテーブルをスキャンする別の Transact-SQL ステートメントを実行します。データベースエンジンは、200,001 ページから読み取った各ページの行を 3 つのスキャンすべてに渡します。500,000 行目を読み取った時点で、UserA のスキャンは完了します。UserB と UserC のスキャンは、先頭に戻って 1 ページから読み取りを開始します。データベースエンジンが 100,000 ページに到達すると、UserB のスキャンが完了します。UserC のスキャンは 200,000 ページを読み取るまで処理を続けます。このページ時点ですべてのスキャンが完了したことになります。

拡張スキャンを使用しなければ、ユーザーが互いにバッファ領域の確保を求めて競合することになり、ディスクアームの競合が発生します。また、一度読み取られたページを複数のユーザーが共有するのではなく、同じページがユーザーごとにその都度読み取られるため、パフォーマンスが低下し、リソースに負荷がかかります。

ページの読み取り

先行読み取り

データページの読み取り

インデックスページの読み取り

拡張スキャン

関連項目

概念

その他のリソース

ページの読み取り

先行読み取り

データ ページの読み取り

インデックス ページの読み取り

拡張スキャン

関連項目

概念

その他のリソース

データページの読み取り

インデックスページの読み取り