Windows での記憶域クラス メモリ (NVDIMM-N) の正常性管理Storage-class Memory (NVDIMM-N) Health Management in Windows

適用先:Windows Server 2019、Windows Server 2016、Windows Server (半期チャネル)、Windows 10Applies To: Windows Server 2019, Windows Server 2016, Windows Server (Semi-Annual Channel), Windows 10

この記事では、Windows の記憶域クラス メモリ (NVDIMM-N) デバイスに固有のエラー処理と正常性管理に関する情報をシステム管理者および IT プロフェッショナルに提供して、記憶域クラス メモリと従来の記憶装置の違いを明らかにします。This article provides system administrators and IT Pros with information about error handling and health management specific to storage-class memory (NVDIMM-N) devices in Windows, highlighting the differences between storage-class memory and traditional storage devices.

Windows での記憶域クラス メモリ デバイスのサポートについてご存知ない場合は、以下のショート ビデオで概要が説明されています。If you aren't familiar with Windows' support for storage-class memory devices, these short videos provide an overview:

参照してください理解する記憶域スペース ダイレクトで永続的なメモリのデプロイとします。Also see Understand and deploy persistent memory in Storage Spaces Direct.

JEDEC 準拠 NVDIMM-N 記憶域クラス メモリ デバイスは、Windows Server 2016 および Windows 10 (バージョン 1607) 以降の Windows において、ネイティブ ドライバーでサポートされます。JEDEC-compliant NVDIMM-N storage-class memory devices are supported in Windows with native drivers, starting in Windows Server 2016 and Windows 10 (version 1607). これらのデバイスの動作は他のディスク (HDD や SSD) に似ていますが、いくつかの違いがあります。While these devices behave similar to other disks (HDDs and SSDs), there are some differences.

ここに記載されているすべての状態は、めったに発生しないと思われますが、ハードウェアが使用されている状態に依存します。All conditions listed here are expected to be very rare occurrences, but depend on the conditions in which the hardware is used.

以下のさまざまなケースで、記憶域スペース構成を参照することがあります。The various cases below may refer to Storage Spaces configurations. 特に注目するのは、記憶域スペースでミラー化されたライトバック キャッシュとして 2 つの NVDIMM-N デバイスを使用する構成です。The particular configuration of interest is one where two NVDIMM-N devices are utilized as a mirrored write-back cache in a storage space. そのような構成をセットアップするには、「NVDIMM-N ライトバック キャッシュを使った記憶域スペースの構成」を参照してください。To set up such a configuration, see Configuring Storage Spaces with a NVDIMM-N write-back cache.

Windows Server 2016 では、記憶域スペースの GUI に、NVDIMM-N バスの種類が "不明" として表示されます。In Windows Server 2016, the Storage Spaces GUI shows NVDIMM-N bus type as UNKNOWN. これは機能が失われたわけでも、プール、記憶域 VD が作成できないことを示すものでもはありません。It doesn't have any fuctionality loss or inability in creation of Pool, Storage VD. バスの種類は、次のコマンドを実行して確認できます。You can verify the bus type by running the following command:

PS C:\>Get-PhysicalDisk | fl

コマンドレットの出力の BusType パラメーターに、バスの種類が "SCM" と正しく表示されます。The parameter BusType in output of cmdlet will correctly show bus type as "SCM"

記憶域クラス メモリの正常性確認Checking the health of storage-class memory

記憶域クラス メモリの正常性を照会するには、Windows PowerShell セッションで、次のコマンドを使用します。To query the health of storage-class memory, use the following commands in a Windows PowerShell session.

PS C:\> Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

これにより、この出力例が得られます。Doing so yields this example output:

SerialNumberSerialNumber HealthStatusHealthStatus OperationalStatusOperationalStatus OperationalDetailsOperationalDetails
802c-01-1602-117cb5fc802c-01-1602-117cb5fc 正常Healthy OKOK
802c-01-1602-117cb64f802c-01-1602-117cb64f 警告Warning Predictive FailurePredictive Failure {Threshold Exceeded,NVDIMM_N Error}{Threshold Exceeded,NVDIMM_N Error}

注意

イベントで指定された NVDIMM-N デバイスの物理的な場所を検索するには、イベント ビューアーのイベントの [詳細] タブで、 [EventData] > [Location] に移動します。To find the Physical location of an NVDIMM-N device specified in an event, on the Details tab of the event in Event Viewer, go to EventData > Location. Windows Server 2016 では NVDIMM-N デバイスの場所が正しく表示されませんが、これは Windows Server バージョン 1709 で修正されています。Note that Windows Server 2016 lists the incorrect location NVDIMM-N devices, but this is fixed in Windows Server, version 1709.

さまざまな正常性の状態を理解するには、以下のセクションをご覧ください。For help understanding the various health conditions, see the following sections.

"Warning" (警告) の正常性状態"Warning" Health Status

これは、記憶域クラス メモリ デバイスの正常性を確認すると、以下の出力例が示すように正常性状態として警告が表示される状態です。This condition is when you check the health of a storage-class memory device and see that it's Health Status is listed as Warning, as shown in this example output:

SerialNumberSerialNumber HealthStatusHealthStatus OperationalStatusOperationalStatus OperationalDetailsOperationalDetails
802c-01-1602-117cb5fc802c-01-1602-117cb5fc 正常Healthy OKOK
802c-01-1602-117cb64f802c-01-1602-117cb64f 警告Warning Predictive FailurePredictive Failure {Threshold Exceeded,NVDIMM_N Error}{Threshold Exceeded,NVDIMM_N Error}

この状態について、以下の表で説明します。The following table lists some info about this condition.

説明Description
起こり得る状態Likely condition NVDIMM-N 警告しきい値違反NVDIMM-N Warning Threshold breached
根本原因Root Cause NVDIMM-N デバイスは、温度、NVM の有効期間、電源の有効期間など、さまざまなしきい値を追跡します。NVDIMM-N devices track various thresholds, such as temperature, NVM lifetime, and/or energy source lifetime. これらのしきい値のいずれかを超えると、オペレーティング システムに通知されます。When one of those thresholds is exceeded, the operating system is notified.
通常の動作General behavior デバイスは引き続き完全に動作します。Device remains fully operational. これは警告であり、エラーではありません。This is a warning, not an error.
記憶域スペースの動作Storage Spaces behavior デバイスは引き続き完全に動作します。Device remains fully operational. これは警告であり、エラーではありません。This is a warning, not an error.
詳細情報More info PhysicalDisk オブジェクトの OperationalStatus フィールド。OperationalStatus field of the PhysicalDisk object. EventLog – Microsoft-Windows-ScmDisk0101/OperationalEventLog – Microsoft-Windows-ScmDisk0101/Operational
操作What to do 警告しきい値の違反によっては、NVDIMM-N のすべてまたは特定部分の交換を検討することが賢明である場合があります。Depending on the warning threshold breached, it may be prudent to consider replacing the entire, or certain parts of the NVDIMM-N. たとえば、NVM の有効期間しきい値の違反が発生した場合に、NVDIMM-N を交換することが合理的である場合があります。For example, if the NVM lifetime threshold is breached, replacing the NVDIMM-N may make sense.

NVDIMM-N への書き込みが失敗するWrites to an NVDIMM-N fail

この状態では、記憶域クラス メモリ デバイスの正常性を確認すると、以下の出力例が示すように、正常性状態が Unhealthy (異常)、操作状態が IO Error(IO エラー) と表示されます。This condition is when you check the health of a storage-class memory device and see the Health Status listed as Unhealthy, and Operational Status mentions an IO Error, as shown in this example output:

SerialNumberSerialNumber HealthStatusHealthStatus OperationalStatusOperationalStatus OperationalDetailsOperationalDetails
802c-01-1602-117cb5fc802c-01-1602-117cb5fc 正常Healthy OKOK
802c-01-1602-117cb64f802c-01-1602-117cb64f UnhealthyUnhealthy {Stale Metadata, IO Error, Transient Error}{Stale Metadata, IO Error, Transient Error} {Lost Data Persistence, Lost Data, NV...}{Lost Data Persistence, Lost Data, NV...}

この状態について、以下の表で説明します。The following table lists some info about this condition.

説明Description
起こり得る状態Likely condition 永続性/バックアップ電力の喪失Loss of Persistence / Backup Power
根本原因Root Cause NVDIMM-N デバイスは、永続性のためにバックアップ電源 (通常ではバッテリやスーパー キャパシター) に依存しています。NVDIMM-N devices rely on a back-up power source for their persistence – usually a battery or super-cap. このバックアップ電源を利用できない場合、またはデバイスが何らかの理由 (コントローラー/Flash エラー) でバックアップを実行できない場合は、データが危険にさらされており、Windows は影響を受けているデバイスへのさらなる書き込みを阻止します。If this back-up power source is unavailable or the device cannot perform a backup for any reason (Controller/Flash Error), data is at risk and Windows will prevent any further writes to the affected devices. データを退避させるための読み取りは引き続き可能です。Reads are still possible to evacuate data.
通常の動作General behavior NTFS ボリュームのマウントが解除されます。The NTFS volume will be dismounted.
PhysicalDisk の正常性状態フィールドには、影響を受けているすべての NVDIMM-N デバイスについて "Unhealthy" (異常)が表示されます。The PhysicalDisk Health Status field will show "Unhealthy" for all affected NVDIMM-N devices.
記憶域スペースの動作Storage Spaces behavior 影響を受けている NVDIMM-N が 1 つだけである限り、記憶域スペースは操作可能であり続けます。Storage Space will remain operational as long as only one NVDIMM-N is affected. 複数のデバイスが影響を受けている場合、記憶域スペースへの書き込みは失敗します。If multiple devices are affected, writes to the Storage Space will fail.
PhysicalDisk の正常性状態フィールドには、影響を受けているすべての NVDIMM-N デバイスについて "Unhealthy" (異常)が表示されます。The PhysicalDisk Health Status field will show "Unhealthy" for all affected NVDIMM-N devices.
詳細情報More info PhysicalDisk オブジェクトの OperationalStatus フィールド。OperationalStatus field of the PhysicalDisk object.
EventLog – Microsoft-Windows-ScmDisk0101/OperationalEventLog – Microsoft-Windows-ScmDisk0101/Operational
操作What to do 影響を受けている NVDIMM-N のデータをバックアップすることをお勧めします。We recommended backing-up the affected NVDIMM-N's data. 読み取りアクセスを可能にするには、ディスクを手動でオンライン化します (ディスクは読み取り専用の NTFS ボリュームとして表されます)。To gain read access, you can manually bring the disk online (it will surface as a read-only NTFS volume).

この状態を完全に解消するには、根本原因を解決する必要があります (すなわち、問題に応じて、電源を修理するか、または NVDIMM-N を交換します)。NVDIMM-N 上のボリュームは、オフライン化してから再びオンライン化するか、またはシステムを再起動する必要があります。To fully clear this condition, the root cause must be resolved (i.e. service power supply or replace NVDIMM-N, depending on issue) and the volume on the NVDIMM-N must either be taken offline and brought online again, or the system must be restarted.

記憶域スペースで NVDIMM-N を再び使用するには、Reset-PhysicalDisk コマンドレットを使用します。これにより、デバイスが再統合されて、修復プロセスが開始されます。To make the NVDIMM-N usable in Storage Spaces again, use the Reset-PhysicalDisk cmdlet, which re-integrates the device and starts the repair process.

NVDIMM-N が、"0" バイトの容量として表示されるか、または "Generic Physical Disk" (汎用物理ディスク) と表示されるNVDIMM-N is shown with a capacity of '0' Bytes or as a "Generic Physical Disk"

これは、記憶域クラス メモリ デバイスが 0 バイトの容量として表示されて初期化できない状態であるか、または記憶域クラス メモリ デバイスが "汎用物理ディスク" オブジェクトとして公開されて、以下の出力例が示すように操作状態として通信の切断が表示される状態です。This condition is when a storage-class memory device is shown with a capacity of 0 bytes and cannot be initialized, or is exposed as a "Generic Physical Disk" object with an Operational Status of Lost Communication, as shown in this example output:

SerialNumberSerialNumber HealthStatusHealthStatus OperationalStatusOperationalStatus OperationalDetailsOperationalDetails
802c-01-1602-117cb5fc802c-01-1602-117cb5fc 正常Healthy OKOK
警告Warning 通信の切断Lost Communication

この状態について、以下の表で説明します。The following table lists some info about this condition.

説明Description
起こり得る状態Likely condition BIOS が NVDIMM-N を OS に公開しなかったBIOS Did Not Expose NVDIMM-N to OS
根本原因Root Cause NVDIMM-N デバイスは DRAM がベースとなっています。NVDIMM-N devices are DRAM based. 破損している DRAM アドレスが参照されている場合、ほとんどの CPU はマシン チェックを開始して、サーバーを再起動します。When a corrupt DRAM address is referenced, most CPUs will initiate a machine check and restart the server. 次に、一部のサーバー プラットフォームは、NVDIMM の割り当てを解除します。これにより、OS は NVDIMM にアクセスできなくなり、別のマシン チェックが実行される可能性があります。Some server platforms then un-map the NVDIMM, preventing the OS from accessing it and potentially causing another machine check. NVDIMM-N が故障したために交換する必要があることを BIOS が検出した場合にも、これが発生する可能性があります。This may also occur if the BIOS detects that the NVDIMM-N has failed and needs to be replaced.
通常の動作General behavior NVDIMM-N は 0 バイトの容量で未初期化として表示されて、読み取りまたは書き込みは不可能です。NVDIMM-N is shown as uninitialized, with a capacity of 0 bytes and cannot be read or written.
記憶域スペースの動作Storage Spaces behavior (影響を受けている NVDIMM-N が 1 つだけである場合) 記憶域スペースは操作可能であり続けます。Storage Space remains operational (provided only 1 NVDIMM-N is affected).
NVDIMM-N PhysicalDisk オブジェクトは、正常性状態が "警告" である "汎用物理ディスク" として表示されます。NVDIMM-N PhysicalDisk object is shown with a Health Status of Warning and as a "General Physical Disk"
詳細情報More info PhysicalDisk オブジェクトの OperationalStatus フィールド。OperationalStatus field of the PhysicalDisk object.
EventLog – Microsoft-Windows-ScmDisk0101/OperationalEventLog – Microsoft-Windows-ScmDisk0101/Operational
操作What to do サーバー プラットフォームが NVDIMM-N デバイスをホスト OS に再び公開するように、NVDIMM-N デバイスを交換またはサニタイズする必要があります。The NVDIMM-N device must be replaced or sanitized, such that the server platform exposes it to the host OS again. 他の修正不可能なエラーが発生する可能性もあることから、デバイスの交換をお推めします。Replacement of the device is recommended, as additional uncorrectable errors could occur. 代替デバイスを記憶域スペース構成に追加するには、Add-Physicaldisk コマンドレットを使用します。Adding a replacement device to a storage spaces configuration can be achieved with the Add-Physicaldisk cmdlet.

NVDIMM-N は、再起動後に RAW または空のディスクとして表示されます。NVDIMM-N is shown as a RAW or empty disk after a reboot

この状態では、記憶域クラス メモリ デバイスの正常性を確認すると、以下の出力例が示すように、正常性状態が Unhealthy (異常)、操作状態が Unrecognized Metadata (認識されないメタデータ) と表示されます。This condition is when you check the health of a storage-class memory device and see a Health Status of Unhealthy and Operational Status of Unrecognized Metadata, as shown in this example output:

SerialNumberSerialNumber HealthStatusHealthStatus OperationalStatusOperationalStatus OperationalDetailsOperationalDetails
802c-01-1602-117cb5fc802c-01-1602-117cb5fc 正常Healthy OKOK {Unknown}{Unknown}
802c-01-1602-117cb64f802c-01-1602-117cb64f UnhealthyUnhealthy {Unrecognized Metadata, Stale Metadata}{Unrecognized Metadata, Stale Metadata} {Unknown}{Unknown}

この状態について、以下の表で説明します。The following table lists some info about this condition.

説明Description
起こり得る状態Likely condition バックアップ/復元エラーBackup/Restore Failure
根本原因Root Cause バックアップまたは復元手順のエラーによって、NVDIMM-N のすべてのデータが失われる可能性があります。A failure in the backup or restore procedure will likely result in all data on the NVDIMM-N to be lost. オペレーティング システムが読み込まれると、パーティションやファイル システムがない新しい NVDIMM-N として表示されて、RAW として表されます。すなわち、これにはファイル システムがありません。When the operating system loads, it will appear as a brand new NVDIMM-N without a partition or file system and surface as RAW, meaning it doesn't have a file system.
通常の動作General behavior NVDIMM-N は、読み取り専用モードになります。NVDIMM-N will be in read-only mode. 再使用を開始するには、明示的なユーザー対処が必要です。Explicit user action is needed to begin using it again.
記憶域スペースの動作Storage Spaces behavior 影響を受けている NVDIMM が 1 つだけである場合は、記憶域スペースは操作可能であり続けます。Storage Spaces remains operational if only one NVDIMM is affected).
NVDIMM-N 物理ディスク オブジェクトは、正常性状態が "Unhealthy" (異常) と表示され、記憶域スペースで使用されることはありません。NVDIMM-N physical disk object will be shown with the Health Status "Unhealthy" and is not used by Storage Spaces.
詳細情報More info PhysicalDisk オブジェクトの OperationalStatus フィールド。OperationalStatus field of the PhysicalDisk object.
EventLog – Microsoft-Windows-ScmDisk0101/OperationalEventLog – Microsoft-Windows-ScmDisk0101/Operational
操作What to do ユーザーが、影響を受けたデバイスを交換したくない場合は、Reset-PhysicalDisk コマンドレットを使用して、影響を受けている NVDIMM-N の読み取り専用状態を解消することができます。If the user doesn't want to replace the affected device, they can use the Reset-PhysicalDisk cmdlet to clear the read-only condition on the affected NVDIMM-N. 記憶域スペースの環境では、これにより、記憶域スペースへの NVDIMM-N の再統合と修復プロセスの開始も試行されます。In Storage Spaces environments this will also attempt to re-integrate the NVDIMM-N into Storage Space and start the repair process.

インターリーブ セットInterleaved Sets

多くの場合、インターリーブ セットをプラットフォームの BIOS で作成し、複数の NVDIMM-N デバイスが ホスト オペレーティング システムで単一デバイスとして認識されるようにすることができます。Interleaved sets can often be created in a platform's BIOS to make multiple NVDIMM-N devices appear as a single device to the host operating system.

Windows Server 2016 および Windows 10 Anniversary Edition では、NVDIMM-N のインターリーブ セットはサポートされません。Windows Server 2016 and Windows 10 Anniversary Edition do not support interleaved sets of NVDIMM-Ns.

この記事を執筆している時点では、そのようなセットに含まれる個々の NVDIMM-N を正しく識別して、具体的にどのデバイスがエラーを引き起こした可能性があるのか、あるいは修理を必要としているのかをユーザーに明確に知らせるメカニズムはホスト オペレーティング システムにありません。At the time of this writing, there is no mechanism for the host operating system to correctly identify individual NVDIMM-Ns in such a set and clearly communicate to the user which particular device may have caused an error or needs to be serviced.