Freigeben über


Integritätsverwaltung für PMEM

Gilt für: Azure Stack HCI, Versionen 22H2 und 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10

Dieser Artikel enthält Informationen zur Fehlerbehandlung und Integritätsverwaltung für PMEM-Geräte (persistenter Speicher), die häufig als Speicherklassenspeicher (Storage-Class Memory, SCM) bezeichnet werden. Hierbei handelt es sich um eine Art von nicht-flüchtigen Medien, die als Speicher der obersten Ebene verwendet werden können.

Diese kurzen Videos bieten eine Übersicht über die Windows-Unterstützung für PMEM:

Siehe auch Grundlagen und Bereitstellung des persistenten Speichers.

PMEM-Geräte werden ab Windows Server 2016 und Windows 10 (Version 1607) mit nativen Treibern unterstützt. PMEM-Geräte verhalten sich zwar ähnlich wie andere Datenträger (HDDs und SSDs), es gibt jedoch auch einige Unterschiede.

Häufig werden zwei PMEM-Module als gespiegeltes Zurückschreibcache in einem Speicherplatz verwendet. Informationen zum Einrichten einer solchen Konfiguration finden Sie unter Konfigurieren von Speicherplätzen mit NVDIMM-N-Zurückschreibcache.

In Windows Server 2016 zeigt die Speicherplatz-GUI den Bustyp NVDIMM-N als UNKNOWN an. Hier gibt es keinen Verlust von Funktionen oder der Möglichkeit zur Erstellung von Pools, Speicher-VD. Durch die Ausführung des folgenden Cmdlet können Sie den Bustyp überprüfen:

Get-PhysicalDisk | fl

Der Parameter BusType zeigt in der Ausgabe ordnungsgemäß SCM als Bustyp an.

Anzeigen des PMEM-Integritätsstatus

In diesem Abschnitt wird beschrieben, wie Sie sich den Integritätsstatus Ihrer PMEM-Module anzeigen lassen. Bei der Verwendung von persistentem Speicher gibt es einige Unterschiede in der Überwachung:

  • Persistenter Speicher erstellt keine Leistungsindikatoren für die physischen Datenträger, deshalb taucht er in den Diagrammen im Windows Admin Center nicht auf.
  • Persistenter Speicher erstellt keine Storport 505-Daten, sodass Ausreißer nicht proaktiv erkannt werden können.

Ansonsten ist die Überwachung jedoch mit der von anderen physischen Datenträgern identisch.

Sie können die Integrität eines PMEM-Disks abfragen, indem Sie die folgenden Cmdlets ausführen:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Beachten Sie dabei, dass Sie dieselben Informationen mithilfe des Get-PhysicalDisk-Cmdlets und durch die Angabe von SCM als Bustyp abrufen können:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Hinweis

Um den physischen Speicherort eines PMEM-Geräts zu ermitteln, das bei einem Ereignis angegeben ist, wechseln Sie auf der Registerkarte Details des Ereignisses in der Ereignisanzeige zu EventData>Location. Beachten Sie dabei, dass in Windows Server 2016 der falsche Speicherort der PMEM-Geräte aufgelistet wird. Dies ist jedoch in Windows Server, Version 1709, behoben.

HealthStatus zeigt an, ob der PMEM-Disk fehlerfrei ist.

Mit dem Wert UnsafeshutdownCount wird die Anzahl von Herunterfahrvorgängen nachverfolgt, die zu Datenverlusten auf diesem logischen Disk führen können. Es handelt sich dabei um die Summe der Anzahl sämtlicher unsicheren Herunterfahrvorgänge aller zugrunde liegenden PMEM-Geräte des Disks. Weitere Informationen zum Integritätsstatus können Sie mithilfe des Get-PmemPhysicalDevice-Cmdlets abrufen, z. B. Informationen wie OperationalStatus.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Dieses Cmdlet zeigt die fehlerhaften PMEM-Geräte an. Das fehlerhafte Gerät (DeviceId 20) entspricht dem Fall im vorherigen Beispiel. Über die PhysicalLocation im BIOS kann ermittelt werden, welches PMEM-Gerät in einem fehlerhaften Zustand ist.

In den folgenden Abschnitten finden Sie Informationen zu den verschiedenen Integritätszuständen.

Integritätsstatus „Warning“

Diese Bedingung liegt vor, wenn beim Überprüfen der Integrität eines PMEM-Geräts der Integritätsstatus Warning zurückgegeben wird (wie in der folgenden Beispielausgabe gezeigt):

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Warnung Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

In der folgenden Tabelle werden einige Informationen über die Bedingung aufgelistet:

Überschrift Beschreibung
Wahrscheinliche Bedingung Schwellenwert für Warnung überschritten
Grundursache PMEM-Geräte überwachen eine Reihe von Schwellenwerten, z. B. für Temperatur, NVM-Lebensdauer und/oder Lebensdauer der Energiequelle. Wenn einer dieser Schwellenwerte überschritten wird, wird das Betriebssystem benachrichtigt.
Allgemeines Verhalten Das Gerät bleibt voll funktionsfähig. Dies ist eine Warnung, kein Fehler.
Speicherplatzverhalten Das Gerät bleibt voll funktionsfähig. Dies ist eine Warnung, kein Fehler.
Weitere Informationen OperationalStatus-Feld des PhysicalDisk-Objekts. EventLog – Microsoft-Windows-ScmDisk0101/Operational
Aktion Je nach dem überschrittenen Schwellenwert kann es ratsam sein, das PMEM-Gerät zu ersetzen.

Fehler bei Schreibvorgängen auf ein PMEM-Gerät

Diese Bedingung liegt vor, wenn beim Überprüfen der Integrität eines PMEM-Geräts der Integritätsstatus Unhealthy zurückgegeben wird und der Betriebsstatus einen IO Error anzeigt (wie in der folgenden Beispielausgabe dargestellt):

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Fehlerhaft {Stale Metadata, IO Error, Transient Error} {Lost Data Persistence, Lost Data, NV...}

In der folgenden Tabelle werden einige Informationen über die Bedingung aufgelistet:

Überschrift Beschreibung
Wahrscheinliche Bedingung Unterbrechung der Energiequelle für Persistenz/Sicherungen
Grundursache Um Persistenz sicherzustellen, sind PMEM-Geräte von einer Energiequelle für Sicherungen abhängig – üblicherweise ein Akku oder Superkondensator. Wenn diese Energiequelle nicht verfügbar ist oder das Gerät aus einem anderen Grund keine Sicherung durchführen kann (Controller-/Flash-Fehler), besteht das Risiko von Datenverlust. Windows verhindert daher, dass weitere Schreibvorgänge auf den betroffenen Geräten durchgeführt werden. Lesevorgänge sind weiterhin möglich, um Daten zu verschieben.
Allgemeines Verhalten Die Bereitstellung des NTFS-Volumes wird aufgehoben.
Im Integritätsstatusfeld PhysicalDisk wird der Status „Unhealthy“ für alle betroffenen NVDIMM-N-Geräte angezeigt.
Speicherplatzverhalten Sofern nur ein PMEM-Modul betroffen ist, ist der Speicherplatz weiterhin verfügbar. Wenn mehrere Geräte betroffen sind, werden Schreibvorgänge auf dem Speicherplatz mit einem Fehler beendet.
Im Integritätsstatusfeld PhysicalDisk wird der Status „Unhealthy“ für alle betroffenen PMEM-Geräte angezeigt.
Weitere Informationen OperationalStatus-Feld des PhysicalDisk-Objekts.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Aktion Die Daten des betroffenen PMEM sollten gesichert werden. Um Lesezugriff zu erhalten, können Sie den Datenträger manuell verfügbar machen (er wird als schreibgeschütztes NTFS-Volume angezeigt).

Um dieses Problem vollständig zu lösen, muss die Ursache behandelt werden (abhängig vom Problem muss die Stromversorgung wiederhergestellt oder das PMEM-Modul ersetzt werden). Außerdem muss das Volume auf dem Modul offline und dann erneut online geschaltet bzw. das System neu gestartet werden.

Um das PMEM-Modul erneut im Speicherplatzfeature nutzen zu können, verwenden Sie das Reset-PhysicalDisk-Cmdlet, mit dem das Gerät erneut integriert und der Reparaturvorgang gestartet wird.

Das Gerät wird mit einer Kapazität von 0 Bytes oder als „Generic Physical Disk“ angezeigt

Diese Bedingung liegt vor, wenn ein PMEM-Gerät mit einer Kapazität von 0 Bytes angezeigt wird und nicht initialisiert werden kann oder wenn es als Generic Physical Disk-Objekt ohne Seriennummer verfügbar gemacht wird, das den Betriebsstatus Lost Communication anzeigt, wie in dieser Beispielausgabe dargestellt:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
Warnung Lost Communication

In der folgenden Tabelle werden einige Informationen über die Bedingung aufgelistet:

Überschrift Beschreibung
Wahrscheinliche Bedingung BIOS hat kein PMEM-Modul für das Betriebssystem verfügbar gemacht
Grundursache PMEM-Geräte sind DRAM-basiert. Wenn auf eine beschädigte DRAM-Adresse verwiesen wird, initiieren die meisten CPUs eine Computerprüfung und starten den Server neu. Einige Serverplattformen heben dann die Zuordnung des PMEM-Moduls auf und verhindern damit, dass das Betriebssystem darauf zugreifen kann. Außerdem wird durch diesen Vorgang möglicherweise erneut eine Computerprüfung ausgelöst. Dieser Fehler kann auch auftreten, wenn das BIOS erkennt, dass das PMEM-Modul fehlerhaft ist und ersetzt werden muss.
Allgemeines Verhalten Das PMEM-Modul wird als nicht initialisiert und mit einer Kapazität von 0 Bytes angezeigt. Es können keine Schreib- oder Lesevorgänge für dieses Gerät ausgeführt werden.
Speicherplatzverhalten Das Speicherplatzfeature bleibt funktionsfähig (sofern nur ein PMEM-Modul betroffen ist).
Das PMEM-PhysicalDisk-Objekt wird mit dem Integritätsstatus „Warning“ und als „General Physical Disk“ angezeigt
Weitere Informationen OperationalStatus-Feld des PhysicalDisk-Objekts.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Aktion Das PMEM-Gerät muss ersetzt oder bereinigt werden, damit es erneut von der Serverplattform für das Hostbetriebssystem zur Verfügung gestellt werden kann. Da weitere nicht behebbare Fehler auftreten können, sollte das Gerät ersetzt werden. Das Hinzufügen eines Ersatzgeräts zu einer Speicherplatzkonfiguration ist über das Add-PhysicalDisk-Cmdlet möglich.

Das Gerät wird nach einem Neustart als Rohdatenträger oder leerer Datenträger angezeigt

Diese Bedingung liegt vor, wenn beim Überprüfen der Integrität eines PMEM-Geräts der Integritätsstatus Unhealthy und als Betriebsstatus Unrecognized Metadata zurückgegeben wird (wie in der folgenden Beispielausgabe gezeigt):

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK {Unknown}
802c-01-1602-117cb64f Fehlerhaft {Unrecognized Metadata, Stale Metadata} {Unknown}

In der folgenden Tabelle werden einige Informationen über die Bedingung aufgelistet:

Überschrift Beschreibung
Wahrscheinliche Bedingung Sicherungs-/Wiederherstellungsfehler
Grundursache Ein Fehler beim Sicherungs- oder Wiederherstellungsvorgang führt höchstwahrscheinlich dazu, dass alle Daten im PMEM-Modul verloren gehen. Nachdem das Betriebssystem geladen wurde, wird es als ganz neues PMEM-Gerät ohne Partition oder Dateisystem und mit RAW-Oberfläche (d. h. ohne Dateisystem) angezeigt.
Allgemeines Verhalten PMEM befindet sich nur im Lesemodus. Um das Gerät erneut zu verwenden, muss der Benutzer eine explizite Aktion ausführen.
Speicherplatzverhalten Das Speicherplatzfeature bleibt funktionsfähig (sofern nur ein PMEM-Modul betroffen ist).
Für das physische PMEM-Datenträgerobjekt wird der Integritätsstatus „Unhealthy“ angezeigt, und das Objekt wird nicht vom Speicherplatzfeature verwendet.
Weitere Informationen OperationalStatus-Feld des PhysicalDisk-Objekts.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Aktion Wenn der Benutzer das betroffene Gerät nicht ersetzen möchte, kann er mithilfe des Reset-PhysicalDisk-Cmdlets den Schreibschutz des betroffenen PMEM-Moduls entfernen. In einer Speicherplatzumgebung wird dabei außerdem versucht, das PMEM-Gerät erneut in die Speicherplätze zu integrieren und den Reparaturvorgang zu starten.

Nächste Schritte

Verwandte Informationen finden Sie außerdem unter: