記憶域の再同期を理解して管理するUnderstand and monitor storage resync

適用対象:Windows Server 2019Applies to: Windows Server 2019

記憶域の再同期アラートは、Windows Server 2019 の記憶域スペースダイレクトの新機能であり、記憶域が再同期されたときにヘルスサービスがエラーをスローできるようにします。Storage resync alerts are a new capability of Storage Spaces Direct in Windows Server 2019 that allows the Health Service to throw a fault when your storage is resyncing. このアラートは、再同期が発生したときに通知するのに役立ちます。これにより、誤ってサーバーを増やしたりすることはありません (複数の障害ドメインが影響を受け、クラスターが停止する可能性があります)。The alert is useful in notifying you when resync is happening, so that you don't accidentally take more servers down (which could cause multiple fault domains to be affected, resulting in your cluster going down).

このトピックでは、記憶域スペースダイレクトを使用した Windows Server フェールオーバークラスターでの記憶域の再同期について説明します。This topic provides background and steps to understand and see storage resync in a Windows Server failover cluster with Storage Spaces Direct.

再同期についてUnderstanding resync

まず、ストレージがどのように同期されるかを理解するための簡単な例を見てみましょう。共有されていない (ローカルドライブのみ) 分散ストレージソリューションでは、この動作が行われることに注意してください。Let's start with a simple example to understand how storage gets out of sync. Keep in mind that any shared-nothing (local drives only) distributed storage solution exhibits this behavior. 次に示すように、1つのサーバーノードがダウンした場合、そのドライブはオンラインに戻るまで更新されません。これは、すべてのハイパー収束アーキテクチャに当てはまります。As you will see below, if one server node goes down, then its drives won't be updated until it comes back online - this is true for any hyper-converged architecture.

文字列 "HELLO" を格納するとします。Suppose that we want to store the string "HELLO".

文字列 "hello" の ASCII

3方向ミラーの回復性を備えているため、この文字列のコピーは3つあります。Asssuming that we have three-way mirror resiliency, we have three copies of this string. ここで、サーバー #1 を一時的に停止した場合 (メンテナンスの場合)、copy #1 にアクセスできません。Now, if we take server #1 down temporarily (for maintanence), then we cannot access copy #1.

コピー #1 にアクセスできません

文字列を "HELLO" から "HELP!" に更新するとします。Suppose we update our string from "HELLO" to "HELP!" この時点で。at this time.

文字列 "help!" の ASCII

文字列を更新すると #2 がコピーされ、#3 が正常に更新されます。Once we update the string, copy #2 and #3 will be succesfully updated. ただし、サーバー #1 が一時的にダウンしている (メンテナンスの場合) ため、コピー #1 にまだアクセスできません。However, copy #1 still cannot be accessed because server #1 is down temporarily (for maintanence).

#2 と #2 をコピーするための書き込みの Gif

ここでは、同期されていないデータを含む #1 をコピーします。オペレーティングシステムでは、詳細なダーティ領域追跡を使用して、同期されていないビットを追跡します。このようにして、サーバー #1 がオンラインに戻ったときに、コピー #2 または #3 からデータを読み取り、コピー #1 でデータを上書きすることによって、変更を同期できます。Now, we have copy #1 which has data that is out of sync. The operating system uses granular dirty region tracking to keep track of the bits that are out of sync. This way when server #1 comes back online, we can sync the changes by reading the data from copy #2 or #3 and overwriting the data in copy #1. この方法の利点は、サーバー #2 またはサーバー #3 からのすべてのデータを再同期するのではなく、古いデータをコピーすることだけです。The advantages of this approach are that we only need to copy over the data that is stale, rather than resyncing all of the data from server #2 or server #3.

コピー #1 "に上書きする Gif

ここでは、データが同期されないようにする方法について説明します。しかし、このようなことは大まかに見てみましょう。So, this explains how data gets out of sync. But what does this look like at a high level? この例では、3台のサーバーハイパー集約クラスターを使用しているとします。Assume for this example that we have a three server hyper-converged cluster. サーバー #1 がメンテナンス中の場合は、停止していると表示されます。When server #1 is in maintenance, you will see it as being down. サーバー #1 バックアップを作成すると、詳細なダーティリージョンの追跡 (上で説明した) を使用して、すべてのストレージの再同期が開始されます。When you bring server #1 back up, it will start resyncing all of its storage using the granular dirty region tracking (explained above). データがすべて同期されると、すべてのサーバーが表示されます。Once the data is all back in sync, all servers will be shown as up.

再同期の管理ビューの Gif

Windows Server 2019 で記憶域の再同期を監視する方法How to monitor storage resync in Windows Server 2019

これで、記憶域の再同期のしくみを理解できたので、Windows Server 2019 でこれがどのように表示されるかを見てみましょう。Now that you understand how storage resync works, let's look at how this shows up in Windows Server 2019. ストレージが再同期したときに表示されるヘルスサービスに新しいエラーが追加されました。We have added a new fault to the Health Service that will show up when your storage is resyncing.

PowerShell でこのエラーを表示するには、次のように実行します。To view this fault in PowerShell, run:

Get-HealthFault

これは、Windows Server 2019 の新しいエラーであり、PowerShell、クラスター検証レポート、および正常性エラーに基づいて構築された他の任意の場所に表示されます。This is a new fault in Windows Server 2019, and will appear in PowerShell, in the cluster validation report, and anywhere else that builds on Health faults.

より深いビューを取得するには、次のように PowerShell でタイムシリーズデータベースに対してクエリを実行します。To get a deeper view, you can query the time series database in PowerShell as follows:

Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded

次に出力の例を示します。Here's some example output:

Object Description: ClusterNode Server1

Series                       Time                Value Unit
------                       ----                ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48     214 GB

特に、Windows 管理センターでは、正常性エラーを使用して、クラスターノードの状態と色を設定します。Notably, Windows Admin Center uses Health faults to set the status and color of cluster nodes. この新しいエラーが発生すると、クラスターノードが赤 (down) から黄色 (再同期) に、赤から緑に直接移動するのではなく、HCI ダッシュボードで緑 (上) に移行します。So, this new fault will cause cluster nodes to transition from red (down) to yellow (resyncing) to green (up), instead of going straight from red to green, on the HCI Dashboard.

再同期の2016対2019ビューの画像

全体的なストレージ再同期の進行状況を表示することにより、同期されていないデータの量と、システムが進行中であるかどうかを正確に把握できます。By showing the overall storage resync progress, you can accurately know how much data is out of sync and whether your system is making forward progress. Windows 管理センターを開き、ダッシュボードにアクセスすると、次のように新しいアラートが表示されます。When you open Windows Admin Center and go to the Dashboard, you will see the new alert as follows:

Windows 管理センターのアラートの画像

このアラートは、再同期が発生したときに通知するのに役立ちます。これにより、誤ってサーバーを増やしたりすることはありません (複数の障害ドメインが影響を受け、クラスターが停止する可能性があります)。The alert is useful in notifying you when resync is happening, so that you don't accidentally take more servers down (which could cause multiple fault domains to be affected, resulting in your cluster going down).

Windows 管理センターの [サーバー ] ページに移動し、[インベントリ] をクリックしてから特定のサーバーを選択すると、この記憶域の再同期がサーバーごとにどのように表示されるかを詳細に確認できます。If you navigate to the Servers page in Windows Admin Center, click on Inventory, and then choose a specific server, you can get a more detailed view of how this storage resync looks on a per-server basis. サーバーに移動してストレージグラフを確認すると、上記の完全な数字を含む紫色の線で修復が必要なデータの量が表示されます。If you navigate to your server and look at the Storage chart, you will see the amount of data that needs to be repaired in a purple line with exact number right above. この量は、サーバーがダウンしたときに増加します (より多くのデータを resynced する必要があります)。また、サーバーがオンラインに戻ったとき (データは同期されています)、徐々に減少します。This amount will increase when the server is down (more data needs to be resynced), and gradually decrease when the server comes back online (data is being synced). 修復する必要があるデータの量が0の場合、記憶域は再同期になります。必要に応じて、サーバーを解放しておくことができます。When the amount of data that needs to be repair is 0, your storage is done resyncing - you are now free to take a server down if you need to. Windows 管理センターでのこのエクスペリエンスのスクリーンショットを次に示します。A screenshot of this experience in Windows Admin Center is shown below:

Windows 管理センターのサーバービューの画像

Windows Server 2016 で記憶域の再同期を確認する方法How to see storage resync in Windows Server 2016

ご覧のように、このアラートは、ストレージ層で起こっていることを総合的に把握するうえで特に役立ちます。As you can see, this alert is particularly helpful in getting a holistic view of what is happening at the storage layer. これは、記憶域スペースでの修復操作など、長時間実行される記憶域モジュールジョブに関する情報を返す、Get StorageJob コマンドレットから取得できる情報を効果的に要約します。It effectively summarizes the information that you can get from the Get-StorageJob cmdlet, which returns information about long-running Storage module jobs, such as a repair operation on a storage space. 次に例を示します。An example is shown below:

Get-StorageJob

出力例を次に示します。Here's example output:

Name                  ElapsedTime           JobState              PercentComplete       IsBackgroundTask
----                  -----------           --------              ---------------       ----------------
Regeneration          00:01:19              Running               50                    True

一覧表示されている記憶域ジョブはボリュームごとに表示されるため、このビューの方がはるかに細分化されています。実行中のジョブの一覧を確認したり、個々の進行状況を追跡したりすることができます。This view is a lot more granular since the storage jobs listed are per volume, you can see the list of jobs that are running, and you can track their individual progress. このコマンドレットは、Windows Server 2016 と2019の両方で動作します。This cmdlet works on both Windows Server 2016 and 2019.

関連項目See also