Azure Stack HCI バージョン 23H2 上のサーバーを修復する

[アーティクル]
05/17/2024

適用対象: Azure Stack HCI バージョン 23H2

この記事では、Azure Stack HCI クラスター上のサーバーを修復する方法について説明します。

修復サーバーについて

Azure Stack HCI は、既存のクラスターからサーバーを修復できるハイパーコンバージドシステムです。ハードウェア障害が発生した場合は、クラスター内のサーバーの修復が必要になる場合があります。

サーバーを修復する前に、ソリューションプロバイダーでチェックしてください。サーバー上のどのコンポーネントがフィールド置換ユニット (FRU) であり、自分で置き換えることができるか、どのコンポーネントを交換する必要がありますか。

ホットスワップをサポートするパーツでは、通常、マザーボードなどのホットスワップ不可能なコンポーネントとは異なり、サーバーを再イメージ化する必要はありません。ハードウェアの製造元に問い合わせて、サーバーの再イメージ化を必要とするコンポーネントの交換を決定してください。詳細については、「コンポーネントの置換」を参照してください。

サーバーワークフローを修復する

次のフロー図は、サーバーを修復するための全体的なプロセスを示しています。

*シャットダウンが可能な状態または必要な状態ではない可能性があります

既存のサーバーを修復するには、次の大まかな手順に従います。

可能であれば、修復するサーバーをシャットダウンします。サーバーの状態によっては、シャットダウンできない、または必要ない場合があります。
修復する必要があるサーバーを再イメージ化します。
修復サーバー操作を実行します。修復操作の一環として、Azure Stack HCI オペレーティングシステム、ドライバー、ファームウェアが更新されます。

ストレージは、再イメージ化されたサーバー上で自動的に再調整されます。記憶域の再調整は優先度の低いタスクであり、サーバーの数と使用されるストレージに応じて、数日実行できます。

注意

カスタムストレージ IP を使用して Azure Stack HCI クラスターをデプロイした場合は、サーバーの修復後に、ストレージネットワークアダプターに IP を手動で割り当てる必要があります。

サポートされるシナリオ

サーバーを修復すると、サーバーが再イメージ化され、以前の名前と構成でクラスターに戻されます。

1 台のサーバーを修復すると、データボリュームを保持するオプションを使用して再デプロイが行われます。システムボリュームのみが削除され、デプロイ中に新しくプロビジョニングされます。

重要

ワークロードのバックアップが常にあり、システムの回復性のみに依存していないことを確認します。これは、単一サーバーのシナリオでは特に重要です。

回復性の設定

このリリースでは、サーバーの修復操作では、デプロイ後に作成したワークロードボリュームに対して特定のタスクは実行されません。修復サーバー操作の場合、必要なインフラストラクチャボリュームとワークロードボリュームのみが復元され、クラスター共有ボリューム (CSV) として表示されます。

デプロイ後に作成した他のワークロードボリュームは引き続き保持され、コマンドレットを実行 Get-VirtuaDisk してこれらのボリュームを検出できます。ボリュームのロックを手動で解除し (ボリュームで BitLocker が有効になっている場合)、CSV を作成する必要があります (必要な場合)。

ハードウェア要件

サーバーを修復するときに、システムは新しい受信サーバーのハードウェアを検証し、サーバーがクラスターに追加される前にハードウェア要件を満たしていることを確認します。

コンポーネント	コンプリアンシーチェック
CPU	新しいサーバーに同じ数以上の CPU コアがあることを検証します。受信ノードの CPU コアがこの要件を満たしていない場合は、警告が表示されます。ただし、操作は許可されます。
メモリ	新しいサーバーに同じ量以上のメモリがインストールされていることを確認します。受信ノードのメモリがこの要件を満たしていない場合は、警告が表示されます。ただし、操作は許可されます。
ドライブ	新しいサーバーに、記憶域スペースダイレクトで使用可能な同じ数のデータドライブがあることを確認します。受信ノード上のドライブの数がこの要件を満たしていない場合は、エラーが報告され、操作がブロックされます。

サーバーの置き換え

サーバー全体を置き換えることができます。

古いサーバーとは異なるシリアル番号を持つ新しいサーバー。
再イメージ化した後、現在のサーバーを使用します。

サーバーの交換中は、次のシナリオがサポートされます。

サーバー	ディスク	サポートされています
新しいサーバー	新しいディスク	Yes
新しいサーバー	現在のディスク	Yes
現在のサーバー (再イメージ化)	現在のディスクの再フォーマット *	いいえ
現在のサーバー (再イメージ化)	新しいディスク	Yes
現在のサーバー (再イメージ化)	現在のディスク	Yes

**記憶域スペースダイレクトで使用されているディスクには、適切なクリーニングが必要です。再フォーマットだけでは不十分です。ドライブをクリーンアップする方法を参照してください。

重要

サーバーの修復中にコンポーネントを交換する場合は、データドライブを交換またはリセットする必要はありません。ドライブを交換またはリセットした場合、サーバーがクラスターに参加すると、ドライブは認識されません。

コンポーネントの交換

Azure Stack HCI クラスターでは、ホットスワップできないコンポーネントには次のものが含まれます。

マザーボード/ベースボード管理コントローラー (BMC)/ビデオカード
ディスクコントローラー/ホストバスアダプター (HBA)/バックプレース
ネットワークアダプター
グラフィックス処理装置
データドライブ (ホットスワップをサポートしないドライブ。例: PCI-e アドインカード)

ホットスワップ不可能なコンポーネントの実際の交換手順は、OEM (オリジナルの機器メーカー) ハードウェアベンダーによって異なります。ホットスワップ不可能なコンポーネントに対してサーバーの修復が必要な場合は、OEM ベンダーのドキュメントを参照してください。

前提条件

サーバーを修復する前に、次のことを確認する必要があります。

AzureStackLCMUser は Active Directory でアクティブです。詳細については、「 Active Directory の準備」を参照してください。
または同等のアクセス許可を持つ別のユーザーとして AzureStackLCMUser サインインしています。
の資格情報は AzureStackLCMUser 変更されていません。

必要に応じて、修復のために特定したサーバーをオフラインにします。次の手順に従います。

サーバーを修復する

このセクションでは、PowerShell を使用してサーバーを修復し、操作の状態を Repair-Server 監視し、問題が発生した場合のトラブルシューティングを行う方法について説明します。

前提条件を確認していることを確認します。

修復しようとしているサーバーで、次の手順に従います。

オペレーティングシステムと必要なドライバーをインストールします。「Azure Stack HCI バージョン 23H2 オペレーティングシステムをインストールする」の手順に従います。

注意

必要な Windows ロールもインストールする必要があります。
サーバーを Arc に登録します。「Arc に登録してアクセス許可を設定する」の手順に従います。

注意

Arc に登録するには、既存のノードと同じパラメーターを使用する必要があります。たとえば、リソースグループ名、リージョン、サブスクリプション、およびテント。

同じ Azure Stack HCI クラスターのメンバーである別のサーバーで、次の手順に従います。

サーバーを追加する前に、必ず更新された認証トークンを取得してください。次のコマンドを実行します。
```
 Update-AuthenticationToken
```
クラスターのデプロイ中に指定したドメインユーザー資格情報を使用して、既にクラスターのメンバーになっているサーバーにサインインします。次のコマンドを実行して、受信サーバーを修復します。
```
$Cred = Get-Credential 
Repair-Server -Name "< Name of the new server>" -LocalAdminCredential $Cred
```
コマンドによって Repair-Server 出力される操作 ID をメモしておきます。後でこれを使用して、操作の進行状況を Repair-Server 監視します。

注意

操作の進行状況を監視する

サーバーの追加操作の進行状況を監視するには、次の手順に従います。

次のコマンドレットを実行し、前の手順の操作 ID を指定します。

$ID = "<Operation ID>" 
Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID

操作が完了すると、バックグラウンドストレージの再調整ジョブは引き続き実行されます。ストレージの再調整ジョブが完了するまで待ちます。このストレージ再調整ジョブの進行状況を確認するには、次のコマンドレットを使用します。
```
Get-VirtualDisk|Get-StorageJob
```
ストレージの再調整ジョブが完了した場合、コマンドレットは出力を返しません。

復旧のシナリオ

サーバーを修復するために、次の回復シナリオと推奨される軽減手順を表に示します。

シナリオの説明	対応策	サポート対象
サーバー操作の修復に失敗しました。	操作を完了するには、エラーを調査します。を使用して、失敗した操作を `Add-Server -Rerun`再実行します。	Yes
サーバー操作の修復は部分的に成功しましたが、新しい操作システムのインストールから開始する必要がありました。	このシナリオでは、オーケストレーター (ライフサイクルマネージャーとも呼ばれます) によって、ナレッジストアが新しいサーバーで既に更新されています。修復サーバーのシナリオを使用します。	Yes

トラブルシューティング

サーバーの修復中にエラーまたはエラーが発生した場合は、ログファイルにエラーの出力をキャプチャできます。

クラスターのデプロイ中に指定したドメインユーザー資格情報でサインインします。ログファイルで問題をキャプチャします。
```
Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
```
失敗した操作を再実行するには、次のコマンドレットを使用します。
```
Repair-Server -Rerun
```

次の手順

サーバーを追加する方法の詳細については、こちらを参照してください。

Share via

Azure Stack HCI バージョン 23H2 上のサーバーを修復する

修復サーバーについて

サーバーワークフローを修復する

サポートされるシナリオ

回復性の設定

ハードウェア要件

サーバーの置き換え

コンポーネントの交換

前提条件

サーバーを修復する

操作の進行状況を監視する

復旧のシナリオ

トラブルシューティング

次の手順

フィードバック

フィードバック

その他のリソース

Share via

Azure Stack HCI バージョン 23H2 上のサーバーを修復する

修復サーバーについて

サーバー ワークフローを修復する

サポートされるシナリオ

回復性の設定

ハードウェア要件

サーバーの置き換え

コンポーネントの交換

前提条件

サーバーを修復する

操作の進行状況を監視する

復旧のシナリオ

トラブルシューティング

次の手順

フィードバック

フィードバック

その他のリソース

サーバーワークフローを修復する