在 Azure Stack Hub - Ruggedized 中新增縮放單位節點
您可以新增另一部實體電腦,以增加現有縮放單位的整體容量。 實體電腦也稱為「縮放單位節點」。 因為節點已存在於縮放單位中,所以每個新節點都必須具有相同的 CPU 類型、記憶體、磁碟編號和大小。 且因為架構的限制,Azure Stack Hub 不支援使用移除縮放單位節點的方式來縮小。 您只能新增節點以擴大容量。
若要新增縮放單位節點,請登入 Azure Stack Hub。 執行硬體設備製造商 (OEM) 提供的工具。 OEM 工具會在硬體生命週期主機 (HLH) 上執行,以確定新實體電腦符合現有節點的韌體層級。
下列流程圖顯示新增縮放單位節點的一般程序:
無論 OEM 硬體廠商是否制訂實體伺服器機架設置和更新,韌體都會根據您的支援合約而有所不同。
新增節點時,請考慮下列限制:
- 新增節點的作業可能需要數小時或數天才能完成。 新增另一個縮放單位節點時,不會影響在系統上執行的工作負載。
- 新增另一個縮放單位節點的作業包括兩個不同階段:「計算」和「儲存」。
- 計算擴充階段時,您的 Azure Stack Hub 會顯示為擴充狀態。 完成計算擴充後,且當儲存體擴充正在執行時,戳記會顯示為設定儲存體狀態。 請先讓 Azure Stack Hub 回到執行中狀態,再新增其他節點。 這表示當新增多個節點時,您會需要新增節點,並等候狀態回到執行中,才能再新增另一個節點。
警告
當新增縮放單位節點作業已經在進行時,請勿嘗試下列任何作業:
- 更新 Azure Stack Hub
- 輪替憑證
- 停止 Azure Stack Hub
- 修復縮放單位節點
- 新增另一個節點 (上一個新增節點動作失敗也會視為進行中)
新增縮放單位節點
下列步驟是節點新增方式的高階概觀。 請務必先參考 OEM 提供的容量擴充文件,再依照這些步驟操作。
將新的實體伺服器放置在機架中,並適當地接上纜線。
使用 SSH 在這兩部 TOR 裝置上啟用實體交換器連接埠:
進入設定模式:
configure terminal
從 VLAN 2 (未使用的連接埠 VLAN) 移除介面 1/5-8:
Interface vlan 2 no untagged twentyFiveGigE 1/5-1/8 exit
從介面 1/5-8 移除現有的 L2 和交換器設定:
Interface range twentyFiveGigE 1/5-1/8 no spanning-tree rstp edge-port bpduguard no spanning-tree rstp rootguard no switchport
啟用介面 1/5-8,並為其設定與介面 1/1-4 相同的設定:
description CL01 Nodes NIC mtu 9216 portmode hybrid switchport spanning-tree rstp edge-port bpduguard spanning-tree rstp rootguard dcb-map AZS_SERVICES no shutdown exit
在 VLAN 7 中將介面 1/5-8 新增為未標記,在 VLAN 107 中新增為標記:
Interface vlan 7 untagged twentyFiveGigE 1/5-1/8 exit interface vlan 107 tagged twentyFiveGigE 1/5-1/8 exit
使用 SSH 在 BMC 裝置上啟用實體交換器連接埠:
進入設定模式:
configure terminal
啟用介面 1/5-8,並為其設定與介面 1/1-4 相同的設定:
interface range gigabitethernet 1/5-1/8 description BMCMgmt Ports no shutdown exit
從未使用的連接埠 VLAN (VLAN2) 移除介面 1/5-8,再將其新增至 BMC VLAN (VLAN125):
interface vlan 2 no untagged gigabitethernet 1/5-1/8 exit interface vlan 125 untagged gigabitethernet 1/5-1/8 exit
準備實體節點並套用最新的韌體和 BIOS 設定。 如需詳細資訊,請參閱伺服器韌體更新。
在 Azure Stack Hub 系統管理員入口網站中執行新增節點作業。
驗證新增節點作業執行成功。 若要這麼做,請查看縮放單位的狀態。
節點 5-8 上介面的纜線連接和 IP 變更
下列是將新節點以纜線連接至現有交換器的步驟,並描述其他 4 個節點之 BMC 介面所需要的 IP 變更。
一旦第二個 RCA 未裝箱且堆疊到第 1 個 RCA 附近,請連接 Pod1 盒和 Pod2 盒中節點的所有電源線。
- 此時請不要連接管理盒中任何裝置的電源線。
- 如果 Pod1 盒和 Pod2 盒中的節點開始開機,請按住電源按鈕幾秒鐘強制關機,直到電源按鈕的燈熄滅,而且節點前方磁碟沒有任何燈亮著。
您現在必須重新取得每個節點 BMC 管理 IP 的 IP 位址。 這項作業必須在可直接將纜線連接到每個節點 BMC NIC 的膝上型電腦上完成,如下所示:
在要用來變更 IP 位址的膝上型電腦上,請為 1 Gbps NIC 設定下列 IP 設定:
- IP 位址 – 10.10.21.90
- 子網路遮罩 – 255.255.255.192
- 閘道 – 無
從第 2 個 RCA 的節點 1 開始,完成全部 4 個節點的工作,直接將膝上型電腦連接到每個節點的 BMC NIC,並透過網頁瀏覽器連線到目前的 BMC 入口網站。 使用標準的 RCA 認證登入 (使用者:changeme、密碼:<指派給 RCA 的戳記預設密碼>),然後依照下表變更該節點的 IP:
第 2 個 RCA 節點 目前的 BMC IP 新的 BMC IP 節點 1 10.10.21.67 10.10.21.71 節點 2 10.10.21.68 10.10.21.72 節點 3 10.10.21.69 10.10.21.73 節點 4 10.10.21.70 10.10.21.74
使用 RCA 連接埠對應文件作為指南以及如下的對應節點,將第二個 RCA 的新節點以纜線連接到第一個 RCA 管理盒中的交換器:
- 第 2 個 RCA 的節點 1 = 節點 5
- 第 2 個 RCA 的節點 2 = 節點 6
- 第 2 個 RCA 的節點 3 = 節點 7
- 第 2 個 RCA 的節點 4 = 節點 8
新增節點
您可以使用系統管理員入口網站或 PowerShell 來新增節點。 新增節點作業會先新增縮放單位節點作為可用的計算容量,然後自動擴充儲存體容量。 容量會自動擴充,因為 Azure Stack Hub 是計算和儲存體一併調整的超融合系統。
- 以 Azure Stack Hub 操作員身分登入 Azure Stack Hub 系統管理員入口網站。
- 瀏覽至 [+ 建立資源][容量][縮放單位節點]。
- 在 [新增節點] 窗格上,選取「區域」,然後選取您想要將節點新增至其中的「縮放單位」。 此外,也請為您要新增的縮放單位節點指定「BMC IP 位址」。 您一次只能新增一個節點。
監視新增節點作業
使用系統管理員入口網站或 PowerShell 來取得新增節點作業的狀態。 新增節點作業可能需要數小時到數天才能完成。
使用管理員入口網站
若要監視新增節點的情形,請在系統管理員入口網站中檢閱縮放單位或縮放單位節點物件。 若要這樣做,請移至 [區域管理][縮放單位]。 接著,請選取您要檢視的縮放單位或縮放單位節點。
使用 PowerShell
縮放單位和縮放單位節點的狀態可使用 PowerShell 來擷取,如下所示:
#Retrieve Status for the Scale Unit
Get-AzsScaleUnit|select name,state
#Retrieve Status for each Scale Unit Node
Get-AzsScaleUnitNode |Select Name, ScaleUnitNodeStatus
新增節點作業的狀態
針對縮放單位
狀態 | 描述 |
---|---|
執行中 | 所有節點均有效參與縮放單位。 |
已停止 | 縮放單位節點已關閉或無法存取。 |
擴充中 | 有一或多個縮放單位節點目前正在新增為計算容量。 |
設定儲存 | 計算容量已擴充,且正在執行儲存體設定。 |
需要補救 | 偵測到需要修復一或多個縮放單位節點的錯誤。 |
針對縮放單位節點
狀態 | 描述 |
---|---|
執行中 | 節點正有效參與縮放單位。 |
已停止 | 節點無法使用。 |
新增中 | 節點正在新增至縮放單位。 |
修復中 | 正在修復節點。 |
維護 | 節點已暫停,且沒有作用中的使用者工作負載正在執行。 |
需要補救 | 偵測到需要修復節點的錯誤。 |
疑難排解
以下是新增節點時常見的問題。
案例 1:新增縮放單位節點作業失敗,但有一或多個節點會列示為「已停止」狀態
- 補救措施:使用修復作業來修復一或多個節點。 一次只能執行一個修復作業。
案例 2:已新增一或多個縮放單位節點,但儲存體擴充失敗
在此案例中,縮放單位節點物件報告了「執行中」狀態,但「設定儲存體」工作並未啟動。
補救措施:執行下列 PowerShell Cmdlet,以使用具特殊權限的端點檢視儲存體健康情況:
Get-VirtualDisk -CimSession s-cluster | Get-StorageJob
案例 3:您收到警示,指出儲存體相應放大作業失敗。
- 補救措施:在此情況下,儲存體設定工作已失敗。 發生此問題時,您必須連絡支援人員。
後續步驟
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應