Trvalá správa stavu paměti

Platí pro: Azure Stack HCI, verze 21H2 a 20H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10

Tento článek obsahuje informace o zpracování chyb a správě stavu specifických pro zařízení s trvalou pamětí (PMem), často nazývaná paměť třídy úložiště (SCM), což je typ stálého média, které je možné použít jako úložiště nejvyšší úrovně.

Tato krátká videa poskytují přehled Windows trvalé paměti od společnosti Microsoft:

Další informace najdete v tématu Principy a nasazení trvalé paměti.

Trvalá paměťová zařízení jsou podporovaná u nativních ovladačů od Windows Server 2016 a Windows 10 (verze 1607). I když se trvalá paměťová zařízení chovají podobně jako jiné disky (pevné disky a disky SSD), existují určité rozdíly.

Běžným případem použití je použití dvou trvalých paměťových modulů jako zrcadlené mezipaměti se zpětným zápisem v prostoru úložiště. Zřízení této konfigurace je popsané v části Konfigurace prostorů úložiště s mezipamětí se zpětným zápisem NVDIMM-N.

V Windows Server 2016 uživatelské rozhraní Prostory úložiště typ sběrnice NVDIMM-N neznámý. Při vytváření fondu, virtuálního počítače ani virtuálního Storage ne. Typ sběrnice můžete ověřit spuštěním následující rutiny:

Get-PhysicalDisk | fl

Parametr BusType ve výstupu bude správně zobrazovat typ sběrnice jako SCM.

Zobrazení stavu trvalé paměti

Tato část popisuje, jak zobrazit stav modulů trvalé paměti. Pokud používáte trvalou paměť, existuje několik rozdílů v prostředí monitorování:

  • Trvalá paměť nevytváří čítače výkonu fyzického disku, takže se nezobrazí v grafech v Windows pro správu.
  • Trvalá paměť nevytváří data Storportu 505, takže nebudete mít aktivní detekci odlehlé hodnoty.

V opačném případě je prostředí monitorování stejné jako u jakéhokoli jiného fyzického disku.

Na stav trvalého paměťového disku se můžete dotazovat spuštěním následujících rutin:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Je vhodné poznamenat, že stejné informace můžete získat pomocí rutiny a zadáním Get-PhysicalDisk BusType jako SCM:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Poznámka

Fyzické umístění trvalého paměťového zařízení zadaného v události najdete tak, že na kartě Podrobnosti události v Prohlížeč událostí EventDataLocation. Mějte na Windows Server 2016, že seznam obsahuje nesprávné umístění trvalých paměťových zařízení, ale v Windows Serveru verze 1709 je tato chyba opravená.

HealthStatus ukazuje, jestli je trvalý paměťový disk v pořádku.

Hodnota UnsafeshutdownCount sleduje počet vypnutí, která mohou způsobit ztrátu dat na tomto logickém disku. Jedná se o součet nezabezpečeně vypínání všech základních trvalých paměťových zařízení tohoto disku. Další informace o stavu najdete pomocí rutiny , například Get-PmemPhysicalDeviceGet-PmemPhysicalDevice

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Tato rutina ukazuje, které trvalé paměťové zařízení není v pořádku. Zařízení, které není v pořádku (DeviceId 20) odpovídá případu v předchozím příkladu. Funkce PhysicalLocation v systému BIOS může pomoct zjistit, které trvalé paměťové zařízení je ve chybném stavu.

Podmínky různých stavů jsou vysvětlené v následujících odstavcích.

Stav upozornění

Tato podmínka se zobrazí, když zkontrolujete stav trvalého paměťového zařízení a uvidíte, že jeho Stav je uvedený jako Upozornění,jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
802c-01-1602-117cb64f Upozornění Prediktivní selhání {Threshold Exceeded,NVDIMM_N Error}

V následující tabulce jsou uvedeny některé informace o této podměně.

Čísla Popis
Pravděpodobná podmínka Překročení prahové hodnoty upozornění
Původní příčina Trvalá paměťová zařízení sledují různé prahové hodnoty, například teplotu, životnost NVM nebo životnost zdroje energie. Překročení některé z těchto prahových hodnot se oznámí systému.
Obecné chování Zařízení zůstává plně funkční. Jedná se o upozornění, ne o chybu.
Chování Prostorů úložiště Zařízení zůstává plně funkční. Jedná se o upozornění, ne o chybu.
Další informace Pole s provozním stavem objektu fyzického disku Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat V závislosti na překročení prahové hodnoty upozornění může být vhodné nahradit trvalé paměťové zařízení.

Zápisy do trvalého paměťového zařízení selžou.

Tento stav nastane, když zkontrolujete stav trvalého paměťového zařízení a zobrazí se stav Není v pořádku a Provozní stav zmiňuje V/V chybu ,jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
802c-01-1602-117cb64f Není v pořádku {Zastaralá metadata, Vstupně-výstupní chyba, Přechodná chyba} {Ztráta trvalosti dat, Ztráta dat, NV...}

V následující tabulce jsou uvedeny některé informace o této podměně.

Čísla Popis
Pravděpodobná podmínka Ztráta trvalého nebo záložního napájení
Původní příčina Trvalost trvalých paměťových zařízení závisí na záložním zdroji napájení – obvykle na baterie nebo super cap. Pokud tento záložní zdroj napájení není dostupný nebo zařízení nemůže z nějakého důvodu provést zálohu (chyba řadiče/flash disku), jsou data ohrožená a systém Windows zabrání dalším zápisům na ovlivněná zařízení. Kvůli vyklizení dat je pořád možné čtení.
Obecné chování Svazek NTFS bude odpojen.
U všech ovlivněných zařízení NVDIMM-N se v poli Stav fyzického disku zobrazí "Není v pořádku".
Chování Prostorů úložiště Storage prostor zůstane funkční, dokud je ovlivněný jenom jeden modul trvalé paměti. Pokud je ovlivněných více zařízení, zápisy do Prostorů úložiště selžou.
U všech ovlivněných trvalých paměťových zařízení se v poli Stav fyzického disku zobrazí "Není v pořádku".
Další informace Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Doporučujeme zálohovat data PMem ovlivněná. Přístup ke čtení získáte ručním uvedením disku do online režimu (zobrazí se jako svazek NTFS jen pro čtení).

Aby bylo možné tento stav plně vymazat, musí být hlavní příčina vyřešena (tj. v závislosti na problému) a svazek v modulu musí být buď přepnut do režimu offline, nebo musí být systém restartován.

pokud chcete modul trvalé paměti použít znovu v Prostory úložiště, použijte Reset-PhysicalDisk rutinu, která znovu integruje zařízení a spustí proces opravy.

Zařízení se zobrazuje s kapacitou "0" bajtů nebo jako "obecný fyzický disk".

Tato podmínka je k dispozici v případě, že se v trvalém paměťovém zařízení zobrazuje kapacita 0 bajtů a nelze ji inicializovat, nebo je vystavena jako objekt generického fyzického disku bez sériového čísla, které zobrazuje provozní stav ztráty komunikace, jak je znázorněno v následujícím příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
Upozornění Ztráta komunikace

V následující tabulce jsou uvedeny některé informace o této podmínce.

Adresář Popis
Pravděpodobná podmínka Systém BIOS nezveřejnil v operačním systému trvalý modul paměti.
Původní příčina Trvalá paměťová zařízení jsou založená na DRAM. Při odkazování na poškozenou adresu paměti DRAM spustí většina procesorů kontrolu počítače a restartuje server. Některé serverové platformy pak odregistrují modul trvalé paměti, takže operačnímu systému znemožní přístup k němu a potenciálně způsobují kontrolu počítače. K tomu může dojít také v případě, že systém BIOS zjistí, že se nezdařila chyba modulu trvalé paměti a musí být nahrazen.
Obecné chování Modul trvalé paměti je zobrazen jako Neinicializovaný, s kapacitou 0 bajtů a nelze ho číst ani zapsat.
Chování Prostorů úložiště Storage místo zůstane funkční (k dispozici je pouze jeden modul trvalé paměti).
PMem fyzický disk se zobrazí se stavem upozornění a jako "obecný fyzický disk".
Další informace Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Trvalé paměťové zařízení musí být nahrazeno nebo upraveno tak, aby je serverová platforma znovu vystavuje hostitelskému operačnímu systému. Doporučuje se vyměnit zařízení, protože by mohlo dojít k neopravitelné chybě. Přidání náhradního zařízení do konfigurace prostorů úložiště lze dosáhnout pomocí Add-PhysicalDisk rutiny.

Po restartování se zařízení zobrazí jako nezpracovaný nebo prázdný disk.

K tomuto stavu dochází, když zkontrolujete stav trvalého paměťového zařízení a zobrazí se stav není v pořádku a provozní stav nerozpoznaná metadata, jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK {Neznámé}
802c-01-1602-117cb64f Není v pořádku {Nerozpoznaná metadata, Zastaralá metadata} {Neznámé}

V následující tabulce jsou uvedeny některé informace o této podmínce.

Adresář Popis
Pravděpodobná podmínka Chyba při zálohování/obnovení
Původní příčina Selhání v postupu zálohování nebo obnovení pravděpodobně způsobí ztrátu všech dat v modulu trvalé paměti. Když se operační systém načte, zobrazí se jako značka nové trvalé paměťové zařízení bez oddílu nebo systému souborů a povrchu jako nezpracované, což znamená, že nemá systém souborů.
Obecné chování Trvalá paměť bude v režimu jen pro čtení. Jeho opětovné použití vyžaduje explicitní akci uživatele.
Chování Prostorů úložiště Prostory úložiště zůstává funkční, pokud je ovlivněn pouze jeden modul trvalé paměti).
objekt fyzického disku PMem se zobrazí se stavem "není v pořádku" a Prostory úložiště se nepoužívá.
Další informace Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Pokud uživatel nechce postižené zařízení nahradit, může použít Reset-PhysicalDisk rutinu k vymazání podmínky jen pro čtení v modulu ovlivněná trvalá paměť. v prostředí Prostory úložiště se tato akce také pokusí znovu integrovat modul trvalé paměti do Prostory úložiště a zahájit proces opravy.

Další kroky

Související informace najdete v tématu také: