Gestire il ciclo di vita delle macchine bare metal
Questo articolo descrive come eseguire operazioni di gestione del ciclo di vita su macchine bare metal (BMM). Questi passaggi devono essere usati per la risoluzione dei problemi per il ripristino da errori o durante l'esecuzione di azioni di manutenzione. I comandi per gestire il ciclo di vita di BMM includono:
Attenzione
Non eseguire alcuna azione contro i server di gestione senza prima consultare il personale di supporto Microsoft. In questo modo, l'integrità del cluster Operator Nexus potrebbe influire sull'integrità del cluster Operator Nexus.
- Spegnere BMM
- Avviare BMM
- Riavviare BMM
- Rendere il BMM non pianificabile (cordone senza evacuazione)
- Rendere il BMM non pianificabile (cordone con evacuazione)
- Rendere l'utilità di pianificazione BMM (uncordon)
- Ricreazione dell'immagine di BMM
- Sostituire BMM
Importante
Le richieste di comando di interruzione su un nodo KCP (Kubernetes Control Plane) vengono rifiutate se è già in esecuzione un altro comando di azione di interruzione su un altro nodo KCP o se il KCP completo non è disponibile. Questo controllo viene eseguito per mantenere l'integrità dell'istanza Nexus e assicurarsi che più nodi KCP non si arrestino contemporaneamente a causa di azioni di interruzione simultanee. Se più nodi vengono disattivati, la soglia del quorum integro del piano di controllo Kubernetes verrà interrotta.
Le azioni in grassetto nell'elenco precedente sono considerate di interruzione (Spegnimento, Riavvio, Ricrea immagine, Sostituisci). Il cordone senza evacuazione non è considerato dirompente. Il cordone con evacuazione è considerato dirompente.
Come indicato nella dichiarazione con cautela, l'esecuzione di azioni sui server di gestione, in particolare i nodi KCP, deve essere eseguita solo in consultazione con il personale di supporto Microsoft.
Prerequisiti
- Installare la versione più recente delle estensioni dell'interfaccia della riga di comando appropriate.
- Ottenere il nome del gruppo di risorse per BMM.
- Ottenere il nome della macchina bare metal che richiede un'operazione di gestione del ciclo di vita.
- Assicurarsi che il computer
poweredState
bare metal di destinazione sia impostatoOn
su ereadyState
impostato suTrue
.- Questo prerequisito non è applicabile per il
start
comando.
- Questo prerequisito non è applicabile per il
Spegnere BMM
Questo comando eseguirà power-off
l'oggetto specificato bareMetalMachineName
.
az networkcloud baremetalmachine power-off \
--name "bareMetalMachineName" \
--resource-group "resourceGroupName"
Avviare BMM
Questo comando eseguirà start
l'oggetto specificato bareMetalMachineName
.
az networkcloud baremetalmachine start \
--name "bareMetalMachineName" \
--resource-group "resourceGroupName"
Riavviare BMM
Questo comando eseguirà restart
l'oggetto specificato bareMetalMachineName
.
az networkcloud baremetalmachine restart \
--name "bareMetalMachineName" \
--resource-group "resourceGroupName"
Rendere un BMM non pianificabile (cordone)
È possibile rendere un BMM non pianificabile eseguendo il cordon
comando .
Durante l'esecuzione del cordon
comando, i carichi di lavoro Operator Nexus non vengono pianificati in BMM quando viene impostato il blocco. Qualsiasi tentativo di creare un carico di lavoro in un cordoned
BMM comporta l'impostazione pending
dello stato del carico di lavoro. I carichi di lavoro esistenti continuano a essere eseguiti.
Il comando cordon supporta un evacuate
parametro con il valore predefinito False
.
Durante l'esecuzione del cordon
comando, con il valore True
per il evacuate
parametro , i carichi di lavoro in esecuzione in BMM sono stopped
e BMM è impostato sullo pending
stato.
az networkcloud baremetalmachine cordon \
--evacuate "True" \
--name "bareMetalMachineName" \
--resource-group "resourceGroupName"
evacuate "True"
Rimuove i carichi di lavoro da tale nodo, impedendo evacuate "False"
al tempo stesso solo la pianificazione di nuovi carichi di lavoro.
Rendere un BMM "schedulable" (uncordon)
È possibile rendere un BMM "pianificabile" (utilizzabile) eseguendo il uncordon
comando . Tutti i carichi di lavoro in uno pending
stato in BMM sono restarted
quando BMM è uncordoned
.
az networkcloud baremetalmachine uncordon \
--name "bareMetalMachineName" \
--resource-group "resourceGroupName"
Ricreazione dell'immagine di un BMM
È possibile ripristinare la versione di runtime in un BMM eseguendo il reimage
comando . Questo processo ridistribuisce l'immagine di runtime in BMM di destinazione ed esegue i passaggi per ricongiurre il cluster con gli stessi identificatori. Questa azione non influisce sui file del carico di lavoro del tenant in questo BMM.
Come procedura consigliata, assicurarsi che i carichi di lavoro di BMM vengano svuotati usando il cordon
comando , con evacuate "True"
, prima di eseguire il reimage
comando .
Avviso
L'esecuzione di più di un baremetalmachine replace
comando o reimage
contemporaneamente o l'esecuzione di un replace
oggetto reimage
contemporaneamente lascerà i server in uno stato non funzionante. Assicurarsi che uno replace
/reimage
abbia completato completamente prima di avviarne un altro.
az networkcloud baremetalmachine reimage \
–-name "bareMetalMachineName" \
--resource-group "resourceGroupName"
Sostituire BMM
Usare il replace
comando quando un server rileva problemi hardware che richiedono una sostituzione hardware completa o parziale. Dopo la sostituzione di componenti come scheda madre o scheda di interfaccia di rete (NIC), l'indirizzo MAC di BMM cambierà, tuttavia l'indirizzo IP iDRAC e il nome host rimarranno invariati.
Avviso
L'esecuzione di più di un baremetalmachine replace
comando o reimage
contemporaneamente o l'esecuzione di un replace
oggetto reimage
contemporaneamente lascerà i server in uno stato non funzionante. Assicurarsi che uno replace
/reimage
abbia completato completamente prima di avviarne un altro.
az networkcloud baremetalmachine replace \
--name "bareMetalMachineName" \
--resource-group "resourceGroupName" \
--bmc-credentials password="{password}" username="{user}" \
--bmc-mac-address "00:00:4f:00:57:ad" \
--boot-mac-address "00:00:4e:00:58:af" \
--machine-name "name" \
--serial-number "BM1219XXX"