データ圧縮

[アーティクル]
10/27/2023

適用対象:SQL Server Azure SQL Database Azure SQL Managed Instance

SQL Server、Azure SQL Database および Azure SQL Managed Instance では、行ストアテーブルおよびインデックスのための行およびページの圧縮がサポートされます。また、列ストアと、列ストアテーブルおよびインデックスのための列ストアの保存用圧縮もサポートされます。

行ストアテーブルおよびインデックスについては、データベースのサイズを小さくするためにデータ圧縮機能を使用してください。領域を削減するだけでなく、データ圧縮を使用すると、データを格納するページ数が少なくなり、クエリがディスクから読み取る必要のあるページが少なくなるため、大量の I/O が発生する作業のパフォーマンスを向上できます。ただし、アプリケーションとの間でデータが交換される間は、データの圧縮と圧縮解除のためデータベースサーバーで追加の CPU リソースが必要になります。次のデータベースオブジェクトで行とページの圧縮を構成することができます。

ヒープとして格納されているテーブル全体。
クラスター化インデックスとして格納されているテーブル全体。
非クラスター化インデックス全体。
インデックス付きビュー全体。
パーティション分割されているテーブルおよびインデックスの場合、パーティションごとに圧縮オプションを構成することができ、オブジェクトの各パーティションを同じ圧縮設定にする必要がありません。

列ストアテーブルおよびインデックスの場合、すべての列ストアテーブルおよびインデックスで列ストア圧縮が使用されます。これはユーザーが構成できません。データを格納および取得できる CPU リソースと時間に余裕がある場合にデータサイズをさらに小さくするには、列ストアの保存用圧縮を使用します。次のデータベースオブジェクトで列ストアの保存用圧縮を構成することができます。

列ストアテーブル全体またはクラスター化列ストアインデックス全体。列ストアテーブルはクラスター化列ストアインデックスとして格納されるため、どちらの方法を使っても同じ結果になります。
非クラスター化列ストアインデックス全体。
パーティション分割されている列ストアテーブルおよび列ストアインデックスの場合、パーティションごとに保存用圧縮オプションを構成することができ、オブジェクトの各パーティションを同じ保存用圧縮設定にする必要がありません。

Note

GZIP アルゴリズム形式を使用してデータを圧縮することもできます。これは追加の手順であり、古いデータを長期保管するためにアーカイブする際にデータの一部を圧縮する場合に最も適しています。 COMPRESS 関数を使用して圧縮されたデータにインデックスを付けることはできません。詳細については、「COMPRESS (Transact-SQL)」を参照してください。

行とページの圧縮の考慮事項

行とページの圧縮を使用する際は、次の点に注意してください。

データの圧縮に関する詳細情報は、Service Pack または今後のリリースで予告なしに変更されることがあります。
圧縮は Azure SQL Database で使用できます
SQL Server エージェントは、のすべてのエディションで利用できるわけではありません。詳細については、このセクションの最後にあるエディションとサポートされている機能のリストをご覧ください。
圧縮は、システムテーブルには使用できません。
圧縮を使用すると、ページに格納できる行数が増えますが、テーブルまたはインデックスの最大行サイズは変更されません。
最大行サイズと圧縮のオーバーヘッドの合計が、最大行サイズ 8,060 バイトを超える場合、テーブルで圧縮を有効にすることはできません。たとえば、c1 CHAR(8000) 列および c2 CHAR(53) 列を含むテーブルは、追加される圧縮のオーバーヘッドが原因で圧縮できません。 vardecimal ストレージ形式を使用する場合は、この形式が有効になると行サイズのチェックが実行されます。行とページの圧縮の場合は、オブジェクトが最初に圧縮されるときに行サイズのチェックが実行され、各行が挿入または変更されるときにもチェックされます。圧縮では、次の 2 つのルールが適用されます。
- 固定長の型に対する更新が常に成功する必要があります。
- データ圧縮の無効化が常に成功する必要があります。圧縮された行がページに収まる場合も (圧縮後サイズが 8,060 バイト未満の場合も)、SQL Server は未圧縮時に収まらない行の更新は行いません。
データ圧縮を有効にすると、行以外のデータは圧縮されません。たとえば、8060 バイトを超える XML レコードには、行外のページが使用され、これは圧縮されません。
一部のデータ型はデータ圧縮の影響を受けません。詳細については、「行の圧縮によるストレージへの影響」を参照してください。
パーティションの一覧を指定する場合は、個々のパーティションの圧縮の種類を ROW、PAGE、または NONE に設定できます。パーティションの一覧を指定しない場合は、すべてのパーティションがステートメントで指定されたデータ圧縮プロパティを使用して設定されます。特に指定しない限り、データ圧縮はテーブルまたはインデックスの作成時に NONE に設定されます。特に指定しない限り、既存の圧縮はテーブルの変更時にも保持されます。
範囲外の一連のパーティションまたは単独のパーティションを指定すると、エラーが生成されます。
テーブルの圧縮プロパティは非クラスター化インデックスに継承されません。インデックスを圧縮するには、インデックスの圧縮プロパティを明示的に設定する必要があります。既定では、インデックスの圧縮設定はインデックスの作成時に NONE に設定されます。
ヒープにクラスター化インデックスを作成する場合、圧縮状態を特に指定しない限り、ヒープの圧縮状態がクラスター化インデックスに継承されます。
ヒープがページレベルの圧縮用に構成されている場合、ページでは、次の方法によるページレベルの圧縮のみが受け入れられます。
- データは一括最適化を有効にして一括インポートされます。
- データは INSERT INTO ... WITH (TABLOCK) 構文を使用して挿入されますが、テーブルに非クラスター化インデックスがありません。
- テーブルを再構築するには、ALTER TABLE ... REBUILD 圧縮オプションを指定した PAGE ステートメントを実行します。
DML 操作の一部としてヒープに割り当てられた新しいページでは、ヒープが再構築されるまで PAGE 圧縮は使用されません。圧縮を解除してから再適用するか、クラスター化インデックスを作成してから削除することで、ヒープを再構築します。
ヒープの圧縮設定を変更するには、テーブルのすべての非クラスター化インデックスを再構築して、ヒープ内の新しい行位置へのポインターを持つようにする必要があります。
ROW または PAGE 圧縮は、オンラインまたはオフラインで有効または無効にすることができます。オンライン操作の場合、ヒープに対する圧縮の有効化はシングルスレッドです。
行またはページの圧縮を有効または無効にするために必要なディスク空き容量は、インデックスを作成または再構築するために必要なディスク空き容量と同じです。パーティションデータの場合は、一度に 1 つのパーティションの圧縮を有効または無効にすることによって必要な空き容量を削減できます。
パーティションテーブルのパーティションの圧縮状態を確認するには、sys.partitions カタログビューの data_compression 列に対してクエリを実行します。
インデックスを圧縮する際、行とページの両方の圧縮を使用してリーフレベルのページを圧縮できます。リーフレベル以外のページでは、ページの圧縮は受け入れられません。
大きな値のデータ型は、そのサイズが原因で、通常の行データとは別に特殊な目的のページに格納される場合があります。データ圧縮は、別個に格納されているデータには使用できません。
SQL Server 2005 (9.x) で vardecimal ストレージ形式を実装したテーブルは、アップグレード時にもその設定を保持します。 vardecimal ストレージ形式を使用するテーブルに行の圧縮を適用することができます。ただし、行の圧縮は vardecimal ストレージ形式のスーパーセットなので、vardecimal ストレージ形式を保持する必要はありません。 vardecimal ストレージ形式と行の圧縮を組み合わせても、10 進値の圧縮は追加されません。 vardecimal ストレージ形式を使用するテーブルにページの圧縮を適用することができます。ただし、vardecimal ストレージ形式の列では、さらなる圧縮が行われる可能性が低いです。

Note

サポートされるすべてのバージョンのが vardecimal ストレージ形式をサポートしていますが、データの圧縮で同じ目的が果たされるので、vardecimal ストレージ形式は非推奨とされます。この機能は、 SQL Serverの将来のバージョンで削除される予定です。新規の開発作業ではこの機能を使用しないようにし、現在この機能を使用しているアプリケーションは修正することを検討してください。

Windows 上の SQL Server の各エディションでサポートされる機能の一覧については、以下を参照してください。

列ストアおよび列ストアの保存用圧縮

列ストアテーブルおよび列ストアインデックスは常に列ストア圧縮を使用して格納されます。保存用圧縮と呼ばれる追加の圧縮機能を構成するによって、列ストアのデータサイズをさらに小さくすることができます。保存用圧縮を使用するには、SQL Server でデータに対して Microsoft Xpress 圧縮アルゴリズムを実行します。次の種類のデータ圧縮を使用して、保存用圧縮を追加または削除します。

保存用圧縮で列ストアデータを圧縮するには、COLUMNSTORE_ARCHIVE データ圧縮を使用します。
保存用圧縮を解凍するには、COLUMNSTORE データ圧縮を使用します。この結果として生成されるデータは、引き続き列データの圧縮を使用して圧縮できます。

アーカイブ圧縮を追加するには、ALTER TABLE (Transact-SQL) または ALTER INDEX (Transact-SQL) を REBUILD オプションと DATA COMPRESSION = COLUMNSTORE_ARCHIVE と共に使用します。

次に例を示します。

ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = 1 WITH (
    DATA_COMPRESSION = COLUMNSTORE_ARCHIVE
);

ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
    DATA_COMPRESSION = COLUMNSTORE_ARCHIVE
);

ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
    DATA_COMPRESSION = COLUMNSTORE_ARCHIVE ON PARTITIONS (2, 4)
);

保存用圧縮を削除して、データを列ストア圧縮に復元するには、REBUILD オプションと DATA COMPRESSION = COLUMNSTORE を指定して ALTER TABLE (Transact-SQL または ALTER INDEX (Transact-SQL)を使用します。

次に例を示します。

ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = 1 WITH (
     DATA_COMPRESSION = COLUMNSTORE
);

ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
    DATA_COMPRESSION = COLUMNSTORE
);

ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
    DATA_COMPRESSION = COLUMNSTORE ON PARTITIONS (2, 4)
);

次の例では、データ圧縮をあるパーティションの列ストアに設定し、列ストアの圧縮を別のパーティションに設定しています。

ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
    DATA_COMPRESSION = COLUMNSTORE
        ON PARTITIONS (4, 5),
    DATA COMPRESSION = COLUMNSTORE_ARCHIVE
        ON PARTITIONS (1, 2, 3)
);

パフォーマンス

保存用圧縮を使用して列ストアインデックスを圧縮すると、列ストアインデックスに保存用圧縮がない場合に比べて実行速度が遅くなります。保存用圧縮は、データを圧縮および取得する時間と CPU リソースに余裕がある場合にのみ使用します。

記憶域を削減するデータ圧縮の利点は、頻繁にアクセスしないデータに便利です。たとえば、各月のデータ用のパーティションがある場合、ほとんどアクティビティは最新の月のデータに対して実行されるため、古い月のデータをアーカイブして必要なストレージを削減できます。

Metadata

次のシステムビューには、クラスター化インデックスのデータ圧縮に関する情報が含まれています。

sys.indexes (Transact-SQL) - The type and type_desc columns include CLUSTERED COLUMNSTORE and NONCLUSTERED COLUMNSTORE.
sys.partitions (Transact-SQL) - The data_compression and data_compression_desc columns include COLUMNSTORE and COLUMNSTORE_ARCHIVE.

プロシージャ sp_estimate_data_compression_savings (Transact-SQL) も列ストアインデックスに適用されます。

パーティションテーブルとインデックスへの影響

パーティションテーブルとパーティションインデックスでデータ圧縮を使用する場合は、次の点に注意してください。

ALTER PARTITION ステートメントを使用してパーティションを分割すると、両方のパーティションに元のパーティションのデータ圧縮属性が継承されます。
2 つのパーティションをマージすると、結果として得られるパーティションにマージ先パーティションのデータ圧縮属性が継承されます。
パーティションを切り替えるには、パーティションのデータ圧縮プロパティがテーブルの圧縮プロパティと一致する必要があります。
パーティションテーブルまたはパーティションインデックスの圧縮の変更に使用できる構文には、次の 2 種類があります。
- 次の構文では、参照されているパーティションのみが再構築されます。
```
ALTER TABLE <table_name>
REBUILD PARTITION = 1 WITH (
    DATA_COMPRESSION = <option>
);
```
- 次の構文では、参照されていないパーティションの既存の圧縮設定を使用して、テーブル全体が再構築されます。
```
ALTER TABLE <table_name>
REBUILD PARTITION = ALL WITH (
    DATA_COMPRESSION = PAGE ON PARTITIONS(<range>),
    ...
);
```
パーティションインデックスの場合は、ALTER INDEX を使用して同じ原則に従います。
クラスター化インデックスを削除する場合、パーティション構成を変更しない限り、対応するヒープパーティションでデータ圧縮設定が維持されます。パーティション構成を変更すると、すべてのパーティションが圧縮されていない状態に再構築されます。クラスター化インデックスを削除し、パーティション構成を変更するには、次の手順を実行します。
1. クラスター化インデックスを削除します。
2. 圧縮オプションを指定する ALTER TABLE ... REBUILD オプションを使用して、テーブルを変更します。
クラスター化インデックスを削除するには、クラスター化インデックスの上位レベルだけが削除されるため、OFFLINE は高速な操作です。 ONLINE でクラスター化インデックスを削除すると、SQL Server によって、ヒープが手順 1 で 1 回、手順 2 で 1 回の計 2 回再構築される必要があります。

レプリケーションへの圧縮の影響

レプリケーションでデータ圧縮を使用する場合は、次の点に注意してください。

スナップショットエージェントで最初のスキーマスクリプトが生成されるときに、新しいスキーマでは、テーブルとインデックスの両方に同じ圧縮設定が使用されます。圧縮をテーブルのみで有効にし、インデックスで無効にすることはできません。
トランザクションレプリケーションの場合、アーティクルスキーマオプションによって、スクリプトを作成する必要がある依存オブジェクトおよびプロパティが特定されます。詳細については、「 sp_addarticle」を参照してください。

ディストリビューションエージェントでは、スクリプトの適用時に下位のサブスクライバーのチェックが行われません。圧縮のレプリケーションが選択されている場合、下位のサブスクライバーに対するテーブルの作成は失敗します。混合トポロジの場合は、圧縮のレプリケーションを有効にしないでください。
マージレプリケーションの場合、パブリケーションの互換性レベルがスキーマオプションをオーバーライドし、この互換性レベルによってスクリプトが作成されるスキーマオブジェクトが特定されます。

混合トポロジの場合、新しい圧縮オプションをサポートする必要がないときは、パブリケーションの互換性レベルを下位のサブスクライバーバージョンに設定してください。必要な場合は、テーブルをサブスクライバーに作成してから圧縮してください。

次の表に、レプリケーション時に圧縮を制御するレプリケーション設定を示します。

ユーザー意図	テーブルまたはインデックスのパーティション構成のレプリケート	圧縮設定のレプリケート	スクリプト作成の動作
パーティション構成をレプリケートしてパーティションのサブスクライバーで圧縮を有効にする。	True	True	パーティション構成と圧縮設定の両方のスクリプトを作成します。
パーティション構成をレプリケートするがサブスクライバーでデータ圧縮は実行しない。	True	False	パーティション構成のスクリプトは作成しますが、パーティションの圧縮設定のスクリプトは作成しません。
パーティション構成をレプリケートせず、サブスクライバーでデータ圧縮も実行しない。	False	False	パーティションと圧縮設定のスクリプトを作成しません。
パブリッシャーですべてのパーティションが圧縮される場合はサブスクライバーでテーブルを圧縮するが、パーティション構成はレプリケートしない。	False	True	すべてのパーティションで圧縮が有効になっているかどうかを確認します。テーブルレベルで圧縮のスクリプトを作成します。

その他の SQL Server コンポーネントへの影響

適用対象:SQL Server Azure SQL Database Azure SQL Managed Instance

圧縮はデータスペースエンジンで行われるので、SQL Server の他のほとんどのコンポーネントには、データは圧縮されていない状態で提供されます。このため、他のコンポーネントに対する圧縮の影響は、次の要因に限定されます。

一括インポート操作と一括エクスポート操作
- データをエクスポートする場合、データはネイティブ形式であっても圧縮されていない行形式で出力されます。この結果、エクスポートされたデータファイルのサイズがソースデータより大幅に大きくなる可能性があります。
- データをインポートする場合、インポート先のテーブルで圧縮が有効になっているときは、データはデータベースエンジンによって圧縮された行形式に変換されます。この結果、圧縮されていないテーブルにデータをインポートする場合と比較して、CPU 使用率が上昇する可能性があります。
- ページの圧縮を使用するヒープにデータを一括インポートする場合、一括インポート操作では、データの挿入時にページの圧縮を使用したデータ圧縮が試行されます。
圧縮はバックアップと復元には影響しません。
圧縮はログ配布には影響しません。
データ圧縮は、スパース列と互換性がありません。したがって、スパース列を含むテーブルを圧縮したり、スパース列を圧縮されたテーブルに追加したりすることはできません。
圧縮を有効にすると、クエリプランが変更される可能性があります。データの格納に使用されるページ数とページあたりの行数が異なるためです。

データ圧縮

行とページの圧縮の考慮事項

列ストアおよび列ストアの保存用圧縮

パフォーマンス

Metadata

パーティションテーブルとインデックスへの影響

レプリケーションへの圧縮の影響

その他の SQL Server コンポーネントへの影響

フィードバック

フィードバック

その他のリソース

データ圧縮

行とページの圧縮の考慮事項

列ストアおよび列ストアの保存用圧縮

パフォーマンス

Metadata

パーティション テーブルとインデックスへの影響

レプリケーションへの圧縮の影響

その他の SQL Server コンポーネントへの影響

関連するコンテンツ

フィードバック

フィードバック

その他のリソース

パーティションテーブルとインデックスへの影響