フェールオーバークラスターのメンテナンス手順

[アーティクル]
04/18/2023

適用対象: Azure Stack HCI バージョン 22H2 および 21H2、Windows Server 2022、Windows Server 2019、Windows Server 2016

この記事では、メンテナンスを実行するために物理サーバーを電源オフにすること、または他の何らかの理由で再起動することが必要であると想定しています。サーバーをオフラインにせずに Azure Stack HCI クラスターに更新プログラムをインストールする場合は、「Azure Stack HCI クラスターを更新する」を参照してください。

メンテナンスのためにサーバーをオフラインにするには、フェールオーバークラスター内のすべてのサーバー間で共有されている記憶域の一部をオフラインにする必要があります。そのためには、オフラインにするサーバーを一時停止し、サーバーのディスクをメンテナンスモードにして、クラスタ化されたロールと仮想マシン (VM) をクラスター内の他のサーバーに移動して、クラスター内のその他のサーバーですべてのデータが使用できるようにする必要があります。このプロセスにより、メンテナンス期間の最初から最後まで、データが安全でアクセス可能な状態に保たれます。

メンテナンスのためにサーバーをオフラインにするには、Windows Admin Center または PowerShell のどちらでも使用できます。このトピックでは、両方の方法について説明します。

Windows Admin Center を使用してサーバーをオフラインにする

サーバーをオフラインにするための準備を行う最も簡単な方法は、Windows Admin Center を使用することです。

サーバーをオフラインにしても安全であることを確認する

Windows Admin Center を使用して、オフラインにするサーバーに接続します。 [ツール] メニューから [記憶域] > [ディスク] の順に選択し、各仮想ディスクの [状態] 列が [オンライン] と表示されていることを確認します。
次に、[記憶域] > [ボリューム] の順に選択し、各ボリュームの [正常性] 列が [正常] と表示されていること、および各ボリュームの [状態] 列が [OK] と表示されていることを確認します。

サーバーの一時停止とドレイン

サーバーをシャットダウンまたは再起動する前に、サーバーを一時停止し、実行中の VM などのクラスター化されたロールをドレイン (移動) する必要があります。クラスター化されたサーバーをメンテナンスのためにオフラインにする前に、常に一時停止してドレインします。

Windows Admin Center を使用してクラスターに接続し、クラスターマネージャーの [ツール] メニューから [コンピューティング] > [サーバー] の順に選択します。
[インベントリ] を選択します。一時停止してドレインするサーバーの名前をクリックし、 [一時停止] を選択します。次のプロンプトが表示されます。

Pause server(s) for maintenance: Are you sure you want to pause server(s)? (メンテナンスのためにサーバーを一時停止: サーバーを一時停止しますか?) This moves workloads, such as virtual machines, to other servers in the cluster. (これにより、仮想マシンなどのワークロードがクラスター内の他のサーバーに移動されます。)
サーバーを一時停止してドレインプロセスを開始するには、 [はい] を選択します。クラスターノードの状態は メンテナンス中、ドレイン処理 と表示され、Hyper-V や VM などのロールについては、クラスター内の他のサーバーへのライブマイグレーションが直ちに開始されます。これには数分かかることがあります。再開されるまで、ロールをサーバーに追加することはできません。ドレイン処理が完了すると、サーバーの状態が メンテナンス中、ドレイン完了と表示されます。オペレーティングシステムによって自動的に安全性のチェックが実行され、処理を続行しても安全であることが確認されます。正常でないボリュームがある場合は、停止して、安全に続行できないことを警告します。

サーバーをシャットダウンする

サーバーのドレインが完了したら、メンテナンスのためにシャットダウンしたり、再起動したりすることができます。

警告

サーバーで Azure Stack HCI バージョン 20H2、Windows Server 2019 または Windows Server 2016 が実行されている場合は、サーバーをシャットダウンする前にディスクをメンテナンスモードにする必要があり、サーバーをクラスターで再開する前にディスクのメンテナンスモードを解除する必要があります。

サーバーを再開する

クラスター化された役割と VM のホストをサーバーで再び開始する準備ができたら、サーバーを電源オンにし、起動するのを待ってから、次の手順に従ってサーバーを再開します。

クラスターマネージャーで、左側にある [ツール] メニューから [コンピューティング] > [サーバー] を選択します。
[インベントリ] を選択します。再開するサーバーの名前を選択し、 [再開] をクリックします。

クラスター化されたロールと VM については、すぐにサーバーへのライブマイグレーションが開始されます。これには数分かかることがあります。

記憶域が再同期されるまで待機する

サーバーが再開されると、利用できなかった間に発生した新しい書き込みについては再同期が必要になります。これは、インテリジェントな変更の追跡を使用して自動的に行われます。スキャンまたは同期する必要があるのは変更のみであり、"すべての" データではありません。このプロセスは、実稼働ワークロードへの影響を軽減するために調整されます。サーバーが一時停止されてからの時間と、書き込まれた新しいデータの量によっては、完了までに数分かかることがあります。

重要

クラスター内の他のサーバーをオフラインにする前に、再同期が完了するまで待機する必要があります。

ストレージの再同期が完了した場合にチェックするには:

Windows Admin Centerを使用してクラスターに接続し、[ストレージ > ボリューム] を選択します。
[インベントリ] を選択します。
すべてのボリュームの [状態] 列を確認します。 [OK] と表示された場合、ストレージの再同期は完了です。クラスター内の他のサーバーをオフラインにしても安全になりました。

PowerShell を使用してサーバーをオフラインにする

PowerShell を使用してフェールオーバークラスター内のサーバーを適切に一時停止、ドレイン、再開するには、次の手順を使用します。

サーバーをオフラインにしても安全であることを確認する

すべてのボリュームが正常であることを確認するには、次のコマンドレットを管理者として実行します。

Get-VirtualDisk

この出力の例を次に示します。

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

各ボリュームの HealthStatus プロパティが Healthy であり、OperationalStatus が OK と表示されていることを確認します。

フェールオーバークラスターマネージャーを使用してこれを行うには、 [ストレージ]>[ディスク] に移動します。

サーバーの一時停止とドレイン

サーバーの一時停止とドレインを行うには、次のコマンドレットを管理者として実行します。

Suspend-ClusterNode -Drain

これを行うには、フェールオーバークラスターマネージャーで、[ノード] に移動し、ノードを右クリックして、[一時停止]>[役割のドレイン] の順に選択します。

サーバーで Azure Stack HCI バージョン 21H2 または Windows Server 2022 が実行されている場合、サーバーの一時停止およびドレインにより、サーバーのディスクもメンテナンスモードになります。サーバーが Azure Stack HCI バージョン 20H2、Windows Server 2019、または Windows Server 2016 で実行されている場合は、これを手動で実行する必要があります (次の手順を参照してください)。

ディスクをメンテナンスモードにする

Azure Stack HCI バージョン 20H2、Windows Server 2019 および Windows Server 2016 では、サーバーのディスクをメンテナンスモードにすると、サーバーのシャットダウンがアプリケーションの状態に影響を及ぼさないようにするために、記憶域スペースダイレクトにデータを適切にフラッシュおよびコミットする機会が与えられます。ディスクがメンテナンスモードになったらすぐに、書き込みも許可されなくなります。ストレージの再同期時間を最小限に抑えるために、再起動の直前にディスクをメンテナンスモードにし、システムがバックアップされた後すぐにメンテナンスモードを終了することをお勧めします。

注意

サーバーで Azure Stack HCI バージョン 21H2 または Windows Server 2022 が実行されている場合は、サーバーの一時停止とドレイン時にディスクが自動的にメンテナンスモードに切り替わるため、この手順をスキップできます。これらのオペレーティングシステムには、再同期の高速化とシステムおよびネットワークのリソースに対する影響の低減を実現するきめ細かな修復機能が備わっています。これにより、サーバーとストレージのメンテナンスを一緒に実行できるようになります。

サーバーで Windows Server 2019 または Azure Stack HCI バージョン 20H2 が実行されている場合は、次のコマンドレットを管理者として実行します。

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

サーバーで Windows Server 2016 が実行されている場合は、代わりに次の構文を使用します。

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

サーバーをシャットダウンする

サーバーのドレインが完了すると、PowerShell とフェールオーバークラスターマネージャーに Paused として表示されます。

これで、Stop-Computer または Restart-Computer の PowerShell コマンドレットを使用するかフェールオーバークラスターマネージャーを使用して、サーバーを安全にシャットダウンまたは再起動できるようになりました。

注意

シャットダウンするか、クラスターサービスを開始または停止するサーバーで Get-VirtualDisk コマンドを実行すると、サーバーの動作状態が不完全または低下として報告され、正常性状態の列に警告が表示されることがあります。これは正常であり、問題は発生しません。すべてのボリュームは、オンラインでアクセス可能なままです。

ディスクのメンテナンスモードを解除する

サーバーで Azure Stack HCI バージョン 20H2、Windows Server 2019 または Windows Server 2016 が実行されている場合は、サーバーをクラスターで再開する前に、ディスクのストレージメンテナンスモードを無効にする必要があります。ストレージの再同期時間を最小限に抑えるために、システムがバックアップされた後すぐにメンテナンスモードを終了することをお勧めします。

注意

サーバーで Azure Stack HCI バージョン 21H2 または Windows Server 2022 が実行されている場合は、サーバーの再開時にディスクのメンテナンスモードが自動的に終了するため、この手順をスキップできます。

サーバーで Windows Server 2019 または Azure Stack HCI バージョン 20H2 が実行されている場合は、次のコマンドレットを管理者として実行して、ストレージメンテナンスモードを無効にします。

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

サーバーで Windows Server 2016 が実行されている場合は、代わりに次の構文を使用します。

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

サーバーを再開する

サーバーをクラスターで再開します。サーバーで以前に実行されていたクラスター化された役割と VM を戻すには、オプションの -Failback フラグを使用します。

Resume-ClusterNode –Failback Immediate

これを行うには、フェールオーバークラスターマネージャーで、[ノード] に移動し、ノードを右クリックして、[再開]>[役割のフェールバック] の順に選択します。

サーバーが再開されると、PowerShell およびフェールオーバークラスターマネージャーに Up として表示されます。

記憶域が再同期されるまで待機する

サーバーが再開されたら、クラスター内の他のサーバーをオフラインにする前に、再同期が完了するまで待機する必要があります。

進行状況を監視するには、次のコマンドレットを管理者として実行します。

Get-StorageJob

再同期が既に完了している場合、出力は何も表示されません。

実行中の再同期 (修復) ジョブを示す出力例を次に示します。

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

BytesTotal 列には、再同期する必要がある記憶域の量が表示されます。 PercentComplete 列に進行状況が表示されます。

警告

これらの修復ジョブが完了するまでは、他のサーバーを安全にオフラインにすることはできません。

この間、HealthStatus にはボリュームが Warning として引き続き表示されます。これは正常です。

たとえば、記憶域の再同期中に Get-VirtualDisk コマンドレットを使用すると、次の出力が表示される場合があります。

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

ジョブが完了したら、再度 Get-VirtualDisk コマンドレットを使用して、ボリュームが Healthy と表示されることを確認します。出力例を次に示します。

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

これで、クラスター内の他のサーバーの一時停止や再起動を安全に行うことができます。

次のステップ

関連情報については、以下もご覧ください。

フェールオーバークラスターのメンテナンス手順

Windows Admin Center を使用してサーバーをオフラインにする

サーバーをオフラインにしても安全であることを確認する

サーバーの一時停止とドレイン

サーバーをシャットダウンする

サーバーを再開する

記憶域が再同期されるまで待機する

PowerShell を使用してサーバーをオフラインにする

サーバーをオフラインにしても安全であることを確認する

サーバーの一時停止とドレイン

ディスクをメンテナンスモードにする

サーバーをシャットダウンする

ディスクのメンテナンスモードを解除する

サーバーを再開する

記憶域が再同期されるまで待機する

次のステップ

フィードバック

フィードバック

その他のリソース

フェールオーバー クラスターのメンテナンス手順

Windows Admin Center を使用してサーバーをオフラインにする

サーバーをオフラインにしても安全であることを確認する

サーバーの一時停止とドレイン

サーバーをシャットダウンする

サーバーを再開する

記憶域が再同期されるまで待機する

PowerShell を使用してサーバーをオフラインにする

サーバーをオフラインにしても安全であることを確認する

サーバーの一時停止とドレイン

ディスクをメンテナンス モードにする

サーバーをシャットダウンする

ディスクのメンテナンス モードを解除する

サーバーを再開する

記憶域が再同期されるまで待機する

次のステップ

フィードバック

フィードバック

その他のリソース

フェールオーバークラスターのメンテナンス手順

ディスクをメンテナンスモードにする

ディスクのメンテナンスモードを解除する