データ重複除去の概要

適用対象: Windows Server 2022、Windows Server 2019、Windows Server 2016

データ重複除去とは何ですか。

データ重複排除は、一言で言って "重複排除" と呼ばれることが多く、ストレージ コストに対する冗長データの影響を軽減するのに役立つ機能です。 有効にすると、データ重複除去により、ボリューム上の重複している部分が検索され、ボリューム上のデータが検査されて、ボリューム上の空き領域が最適化されます。 ボリューム上のデータセットの重複する部分は、1 回だけ保存され、さらに節減するために (必要に応じて) 圧縮されます。 データ重複除去では、データの忠実性や完全性を損なうことなく冗長性を最適化します。 データ重複除去のしくみの詳細については、「データ重複除去のしくみ」 セクション (「データ重複除去とは」ページ) を参照してください。

重要

KB4025334には、重要な信頼性の修正を含む、データ重複排除の修正プログラムのロールアップが含まれており、Windows Server 2016 および Windows Server 2019 でデータ重複排除を使用する場合は、それをインストールすることを強く推奨します。

データ重複除去はなぜ有用ですか。

記憶域管理者はデータ重複除去を使用して、重複データに関連するコストを削減できます。 大規模なデータセットには 大量の 重複が存在することが多く、データを格納するコストを増しています。 次に例を示します。

  • ユーザー ファイル共有は同じ、または類似するファイルのコピーを多く含むことがあります。
  • 仮想化ゲストは VM 間でほぼ同じであることがあります。
  • 毎日のバックアップ スナップショットの内容は、わずかな違いであることがあります。

データ重複除去から得られる領域の節約は、データセットや、ボリューム上のワークロードに依存します。 重複の多いデータセットでは、最大 95% の最適化率、つまり記憶域使用率が 20 分の 1 になることがあります。 以下の表は、各種コンテンツに対して重複除去を行った場合の標準的な削減効果を示しています。

シナリオ Content 標準的な削減効果
ユーザー ドキュメント Office ドキュメント、写真、ミュージック、ビデオなど 30 ~ 50%
展開共有 ソフトウェア バイナリ、cab ファイル、シンボルなど 70 ~ 80%
仮想化ライブラリ ISO、仮想ハード ディスク ファイルなど 80 ~ 95%
一般的なファイル共有 上記のすべて 50 ~ 60%

注意

ボリューム上の領域を解放するだけの場合は、クラウドを使った階層化を有効Azure File Sync使用を検討してください。 これにより、最も頻繁にアクセスされるファイルをローカルにキャッシュし、最もアクセス頻度の低いファイルをクラウドに階層化することで、パフォーマンスを維持しながらローカル記憶域を節約できます。 詳細については、「Azure File Sync のデプロイの計画」を参照してください。

データ重複除去はどのような場合に使用できますか。

Illustration of file servers 汎用ファイル サーバー
汎用ファイル サーバーは、次に示す任意の種類の共有を含む可能性のある一般的な用途のファイル サーバーです。 汎用ファイル サーバーでは、同じファイルの多くのコピーまたはバージョンを複数のユーザーが所有する傾向があるため、データ重複除去の有力候補です。 ソフトウェア開発用の共有は、多くのバイナリがビルドごとに基本的に変更されていないため、データ重複除去の恩恵を受けることになります。
Illustration of VDI servers 仮想デスクトップ インフラストラクチャ (VDI) のデプロイ
リモート デスクトップ サービスなどの VDI サーバーは、組織がユーザーにデスクトップをプロビジョニングするための軽量のオプションになります。 組織がこのようなテクノロジに頼る理由はさまざまです。
  • アプリケーションの展開: 企業全体にアプリケーションをすばやくデプロイできます。 これは、頻繁に更新されるアプリケーション、使用頻度の低いアプリケーション、または管理しにくいアプリケーションがあるときに特に便利です。
  • アプリケーションの統合: 一連の集中管理された仮想マシンからアプリケーションをインストールして実行すると、クライアント コンピューター上のアプリケーションを更新する必要がなされます。 このオプションで、アプリケーションにアクセスするために必要なネットワーク帯域幅の量も減少します。
  • リモート アクセス: ユーザーは、ホーム コンピューター、キオスク、低電力ハードウェア、オペレーティング システムなど、Windows 以外のデバイスからエンタープライズ アプリケーションにアクセスできます。
  • ブランチ オフィスへのアクセス: VDI 展開では、集中型データ ストアへのアクセスが必要なブランチ オフィスワーカーに対して、アプリケーションのパフォーマンスを向上させることができます。 データ負荷の高いアプリケーションは、低速な接続用に最適化されたクライアント/サーバー プロトコルに対応していないことがあります。
VDI 展開では、ユーザー用にリモート デスクトップを駆動する仮想ハード ディスクが実質的に同じであるためデータ重複除去の有力候補です。 さらに、データ重複除去は、いわゆる「VDI ブート ストーム」を軽減できます。VDI ブート ストームとは、多くのユーザーが 1 日の始まりに同時に自分のデスクトップにログオンして記憶域のパフォーマンスが低下する状況です。
Illustration of backup applications 仮想化されたバックアップ アプリケーションなどのバックアップ先
バックアップ スナップショット間には大幅な重複があるため、Microsoft Data Protection Manager (DPM) などのバックアップ アプリケーションはデータ重複除去の有力候補です。
Illustration of other workloads その他のワークロード
その他のワークロードもデータ重複除去の有力候補になります