Vysvětlení a monitorování opětovné synchronizace úložiště

Platí pro: Azure Stack HCI verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019

Upozornění na opětovnou synchronizaci úložiště je funkce Prostory úložiště s přímým přístupem v Azure Stack HCI a Windows Serveru. Umožňuje službě Health Service vyvolat chybu a upozornit vás na opětovnou synchronizaci. To pomáhá zabránit tomu, abyste omylem spadli více serverů, což by mohlo ovlivnit více domén selhání, což by mohlo mít za následek vypnutí clusteru.

Tento článek obsahuje přehled opětovné synchronizace úložiště a toho, jak ji můžete monitorovat v clusteru s podporou převzetí služeb při selhání pomocí Prostory úložiště s přímým přístupem.

Informace o opětovné synchronizaci úložiště

Začněme jednoduchým příkladem, abychom pochopili, jak by se úložiště mohlo nesynchronizovat. Mějte na paměti, že toto chování vykazuje jakékoli řešení distribuovaného úložiště bez sdílení (pouze místní jednotky). Následující část ukazuje, jak se úložiště nesynchronizuje při výpadku jednoho uzlu serveru. Jeho jednotky se neaktualizují, dokud se nevrátí do režimu online – toto chování platí pro všechny hyperkonvergované architektury.

Předpokládejme, že chcete uložit řetězec "HELLO".

Obrázek s c i i řetězce hello.

Za předpokladu, že máte třícestnou odolnost proti zrcadlení, máte tři kopie tohoto řetězce. Pokud server č. 1 dočasně vypnete (kvůli údržbě), nebudete mít přístup ke kopírování č. 1.

Obrázek znázorňující, že nemáte přístup ke kopii číslo 1, pokud server s číslem 1 vypnete.

Předpokládejme, že v tuto chvíli aktualizujete řetězec z "HELLO" na "HELP!".

Obrázek s c i i pomoci! Řetězec.

Po aktualizaci řetězce se úspěšně aktualizují kopie č. 2 a 3. Ke kopírování č. 1 se ale nedá získat přístup, protože server č. 1 je dočasně mimo provoz (kvůli údržbě).

GIF zápisu pro zkopírování čísla 2 a 3.

Teď máte kopii č. 1 s nesynchronněnými daty. Operační systém používá podrobné sledování špinavých oblastí k udržování přehledu o nesynchronních bitech. Tímto způsobem, když se server č. 1 vrátí do online režimu, můžete synchronizovat změny tak, že si přečtete data z kopie č. 2 nebo č. 3 a přepíšete je v kopii č. 1. Při tomto přístupu je potřeba zkopírovat jenom data, která jsou zastaralá, a nesynchronizovat všechna data ze serveru č. 2 nebo serveru č. 3.

GIF přepsání pro zkopírování čísla 1.

Předchozí část popisuje, jak by se data mohla nesynchronizovat. Ale jak to vypadá na vysoké úrovni? Předpokládejme, že máte hyperkonvergovaný cluster se třemi servery. Když je server č. 1 v údržbě, uvidíte, že je mimo provoz. Když server č. 1 vrátíte zpět, začne znovu synchronizovat všechna jeho úložiště pomocí podrobného sledování špinavých oblastí (vysvětleno v předchozí části). Jakmile se všechna data znovu synchronizují, zobrazí se všechny servery jako spuštěné.

Následující obrázek GIF ukazuje, jak funguje opětovná synchronizace úložiště v hyperkonvergovaném clusteru:

GIF zobrazení resynchronizace správcem

Monitorování opětovné synchronizace úložiště

Počínaje Windows Serverem 2019 jsme do služby Health Service přidali novou chybu, která se zobrazí při opětovné synchronizaci úložiště.

Pokud chcete zobrazit tuto chybu v PowerShellu, spusťte následující rutinu:

Get-HealthFault

Tato nová chyba se zobrazí v PowerShellu, v sestavě ověření clusteru a kdekoli jinde, která je založená na chybách ve stavu.

Pokud chcete získat podrobnější přehled, můžete databázi časových řad dotazovat v PowerShellu následujícím způsobem:

Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded

Tady je příklad výstupu:

Object Description: ClusterNode Server1

Series                       Time                Value Unit
------                       ----                ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48     214 GB

Windows Admin Center k nastavení stavu a barvy uzlů clusteru používá chyby stavu. Na řídicím panelu HCI tato nová chyba umožňuje, aby uzly clusteru přecházely z červené (dolů) na žlutou (opětovnou synchronizaci) na zelenou (nahoru), místo aby přecházely přímo z červené na zelenou.

Následující obrázek porovnává průběh opětovné synchronizace úložiště v Windows Server 2016 a Windows Serveru 2019.

Obrázek Windows Server 2016 vs. zobrazení resynchronizace windows serveru 2019

Zobrazením celkového průběhu opětovné synchronizace úložiště můžete přesně zjistit, kolik dat není synchronizované a jestli váš systém postupuje dopředu. V Windows Admin Center přejděte na řídicí panel a zobrazte nové upozornění, jak je znázorněno na následujícím snímku obrazovky:

Snímek obrazovky s upozorněním v Windows Admin Center

Upozornění je užitečné při opakované synchronizaci, abyste omylem neodstraňovali více serverů (což by mohlo způsobit ovlivnění více domén selhání, což by mohlo způsobit, že dojde k výpadku clusteru).

Pokud chcete získat podrobné zobrazení resynchronizace úložiště na jednotlivých serverech v Windows Admin Center, přejděte na stránku Servery, klikněte na Inventář a zvolte konkrétní server. Přejděte na server a podívejte se na graf Úložiště a podívejte se na množství dat, která je potřeba opravit, na fialové čáře s přesným číslem přímo nad ní. Toto množství se zvyšuje, když je server mimo provoz (je potřeba znovu synchronizovat více dat), a postupně se snižuje, když se server vrátí do režimu online (data se synchronizují). Pokud je množství dat, která je potřeba opravit, 0, vaše úložiště se znovu synchronizuje – v případě potřeby teď můžete server zrušovat.

Následující snímek obrazovky zobrazuje zobrazení serveru v Windows Admin Center:

Snímek obrazovky se zobrazením serveru v Windows Admin Center

Monitorování opětovné synchronizace úložiště v Windows Server 2016

Upozornění, které je k dispozici ve Windows Serveru 2019 a novějších verzích, vám pomůže získat ucelený přehled o tom, co se děje ve vrstvě úložiště. Shrnuje informace, které můžete získat z rutiny Get-StorageJob . Tato rutina vrací informace o dlouhotrvajících úlohách modulu úložiště, jako je například operace opravy v prostoru úložiště, jak je znázorněno v následujícím příkladu výstupu.

Get-StorageJob

Tady je příklad výstupu:

Name                  ElapsedTime           JobState              PercentComplete       IsBackgroundTask
----                  -----------           --------              ---------------       ----------------
Regeneration          00:01:19              Running               50                    True

Toto zobrazení je podrobnější, protože úlohy úložiště jsou uvedené na svazku. Zobrazí se seznam spuštěných úloh a můžete sledovat jejich individuální průběh. Tato rutina funguje na Windows Server 2016 i 2019.

Další informace