在 Azure Stack HCI 和 Windows Server 上的 Azure Kubernetes Service (AKS) 中,建立並管理叢集的多個節點集區
在 Azure Stack HCI 和 Windows Server 上的 Azure Kubernetes Service (AKS) 中,具有相同設定的節點會共同組成節點集區。 這些節點集區包含用來執行應用程式的基礎 VM。
注意
此功能讓您更準確控制如何建立和管理多個節點集區。 因此,建立/更新/刪除作業需要個別的命令。 以往,只能選擇透過 New-AksHciCluster 或 Set-AksHciCluster 執行叢集作業,以建立/縮放具有一個 Windows 節點集區和一個 Linux 節點集區的叢集。 針對需要使用節點集區命令 New-AksHciNodePool、Set-AksHciNodePool、Get-AksHciNodePool 和 Remove-AksHciNodePool 在單獨節點集區上執行作業的節點集區,此功能公開另一組作業。
本文說明如何在 Azure Stack HCI 和 Windows Server 上的 AKS 叢集中,建立並管理多個節點集區。
開始之前
建議安裝最新的 1.1.6 版。 如果您已安裝 PowerShell 模組,請執行下列命令來查明版本。
Get-Command -Module AksHci
如果需要更新,請遵循此處的指示。
建立 Azure Stack HCI 和 Windows Server 上的 AKS 叢集
首先,請建立具有單一節點集區的 Azure Stack HCI 和 Windows Server 上 AKS 叢集。 下列範例使用 New-AksHciCluster 命令建立新的 Kubernetes 叢集,而叢集上有一個名為 linuxnodepool 的 Linux 節點集區和 1 個節點。 如果您已使用 Azure Stack HCI 和 Windows Sever 上的舊版 AKS 佈署叢集,而且想繼續使用舊佈署作業,便可跳過此步驟。 您仍然可以使用這組新的節點集區命令,將更多節點集區新增至現有的叢集。
New-AksHciCluster -name mycluster -nodePoolName linuxnodepool -nodeCount 1 -osType linux
注意
仍支援 New-AksHciCluster
舊有的參數集。 但將於未來版本中淘汰。
新增節點集區
上一個步驟所建立名為 mycluster 的叢集只有單一節點集區。 您可以使用 New-AksHciNodePool 命令,將第二個節點集區新增至現有的叢集。 下列範例建立具有一個節點的 Windows 節點集區,名為 windowsnodepool。 請確保此節點集區與另一個現有的節點集區是不同名稱。
New-AksHciNodePool -clusterName mycluster -name windowsnodepool -count 1 -osType windows
取得節點集區的設定資訊
若要查看節點集區的設定資訊,請使用 Get-AksHciNodePool 命令。
Get-AksHciNodePool -clusterName mycluster
範例輸出
ClusterName : mycluster
NodePoolName : linuxnodepool
Version : v1.20.7
OsType : Linux
NodeCount : 1
VmSize : Standard_K8S3_v1
Phase : Deployed
ClusterName : mycluster
NodePoolName : windowsnodepool
Version : v1.20.7
OsType : Windows
NodeCount : 1
VmSize : Standard_K8S3_v1
Phase : Deployed
若要查看某個特定節點集區的設定資訊,請在 Get-AksHciNodePool 中使用 -name
參數
Get-AksHciNodePool -clusterName mycluster -name linuxnodepool
範例輸出
ClusterName : mycluster
NodePoolName : linuxnodepool
Version : v1.20.7
OsType : Linux
NodeCount : 1
VmSize : Standard_K8S3_v1
Phase : Deployed
Get-AksHciNodePool -clusterName mycluster -name windowsnodepool
範例輸出
ClusterName : mycluster
NodePoolName : windowsnodepool
Version : v1.20.7
OsType : Windows
NodeCount : 1
VmSize : Standard_K8S3_v1
Phase : Deployed
注意
如果您在 New-AksHciCluster
中使用新的參數集來部署叢集,然後執行 Get-AksHciCluster
以取得叢集資訊,則輸出中的 WindowsNodeCount
和 LinuxNodeCount
欄位會傳回 0
。 若要找出每個節點集區中準確的節點數目,請使用 Get-AksHciNodePool
命令並指定叢集名稱。
縮放節點集區
您可以增加或減少節點集區的節點數目。
若要調整節點集區的節點數目,請使用 Set-AksHciNodePool 命令。 下列範例在名為 mycluster 的叢集上名為 linuxnodepool 的節點集區中,將節點數目調整為 3。
Set-AksHciNodePool -clusterName mycluster -name linuxnodepool -count 3
增減控制平面節點
控制平面節點未變更。 建立、增減和移除的方式維持不變。 您依舊使用 New-AksHciCluster 命令搭配 controlPlaneNodeCount
和 controlPlaneVmSize
參數,以部署控制平面節點,如果未指定任何值,則預設值分別為 1 和 Standard_A4_V2。
隨著應用程式的工作負載需求改變,您可能需要增減控制平面節點。 若要增減控制平面節點,請使用 Set-AksHciCluster 命令。 下列範例在先前步驟所建立名為 mycluster 的現有叢集上,將控制平面節點調整為 3 個。
Set-AksHciCluster -name mycluster -controlPlaneNodeCount 3
刪除節點集區
如果您需要刪除節點集區,請使用 Remove-AksHciNodePool 命令。 下列範例在名為 mycluster 的叢集上移除名為 windowsnodepool 的節點集區。
Remove-AksHciNodePool -clusterName mycluster -name windowsnodepool
指定節點集區的污點
建立節點集區時,您可以將該節點集區加上污點。 當您新增污點時,該節點集區的所有節點也會感染該污點。 如需污點和容忍的詳細資訊,請參閱 Kubernetes 污點和容忍。
設定節點集區污點
若要建立有污點的節點集區,請使用 New-AksHciNodePool。 指定名稱 taintnp,並使用 -taints
參數來指定污點為 sku=gpu:noSchedule
。
New-AksHciNodePool -clusterName mycluster -name taintnp -count 1 -osType linux -taints sku=gpu:NoSchedule
注意
只有在節點集區建立期間才能設定節點集區的污點。
執行下列命令,以確定成功以指定的污點部署節點集區。
Get-AksHciNodePool -clusterName mycluster -name taintnp
輸出
Status : {Phase, Details}
ClusterName : mycluster
NodePoolName : taintnp
Version : v1.20.7-kvapkg.1
OsType : Linux
NodeCount : 1
VmSize : Standard_K8S3_v1
Phase : Deployed
Taints : {sku=gpu:NoSchedule}
在上一個步驟中,您在建立節點集區時套用 sku=gpu:NoSchedule 污點。 下列基本範例 YAML 資訊清單使用容忍,以允許 Kubernetes 排程器在該節點集區的節點上執行 NGINX Pod。
建立名為 nginx-toleration.yaml
的檔案,並複製下列範例中的資訊。
apiVersion: v1
kind: Pod
metadata:
name: mypod
spec:
containers:
- image: mcr.microsoft.com/oss/nginx/nginx:1.15.9-alpine
name: mypod
resources:
requests:
cpu: 100m
memory: 128Mi
limits:
cpu: 1
memory: 2G
tolerations:
- key: "sku"
operator: "Equal"
value: "gpu"
effect: "NoSchedule"
然後,使用下列命令來排程 Pod。
kubectl apply -f nginx-toleration.yaml
若要確認已部署 Pod,請執行下列命令:
kubectl describe pod mypod
[...]
Tolerations: node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
sku=gpu:NoSchedule
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal Scheduled 32s default-scheduler Successfully assigned default/mypod to moc-lk4iodl7h2y
Normal Pulling 30s kubelet Pulling image "mcr.microsoft.com/oss/nginx/nginx:1.15.9-alpine"
Normal Pulled 26s kubelet Successfully pulled image "mcr.microsoft.com/oss/nginx/nginx:1.15.9-alpine" in 4.529046457s
Normal Created 26s kubelet Created container mypod