在 Azure Stack HCI 和 Windows Server 上的 Azure Kubernetes Service (AKS) 中,建立並管理叢集的多個節點集區

在 Azure Stack HCI 和 Windows Server 上的 Azure Kubernetes Service (AKS) 中,具有相同設定的節點會共同組成節點集區。 這些節點集區包含用來執行應用程式的基礎 VM。

注意

此功能讓您更準確控制如何建立和管理多個節點集區。 因此,建立/更新/刪除作業需要個別的命令。 以往,只能選擇透過 New-AksHciClusterSet-AksHciCluster 執行叢集作業,以建立/縮放具有一個 Windows 節點集區和一個 Linux 節點集區的叢集。 針對需要使用節點集區命令 New-AksHciNodePoolSet-AksHciNodePoolGet-AksHciNodePoolRemove-AksHciNodePool 在單獨節點集區上執行作業的節點集區,此功能公開另一組作業。

本文說明如何在 Azure Stack HCI 和 Windows Server 上的 AKS 叢集中,建立並管理多個節點集區。

開始之前

建議安裝最新的 1.1.6 版。 如果您已安裝 PowerShell 模組,請執行下列命令來查明版本。

Get-Command -Module AksHci

如果需要更新,請遵循此處的指示。

建立 Azure Stack HCI 和 Windows Server 上的 AKS 叢集

首先,請建立具有單一節點集區的 Azure Stack HCI 和 Windows Server 上 AKS 叢集。 下列範例使用 New-AksHciCluster 命令建立新的 Kubernetes 叢集,而叢集上有一個名為 linuxnodepool 的 Linux 節點集區和 1 個節點。 如果您已使用 Azure Stack HCI 和 Windows Sever 上的舊版 AKS 佈署叢集,而且想繼續使用舊佈署作業,便可跳過此步驟。 您仍然可以使用這組新的節點集區命令,將更多節點集區新增至現有的叢集。

New-AksHciCluster -name mycluster -nodePoolName linuxnodepool -nodeCount 1 -osType linux

注意

仍支援 New-AksHciCluster 舊有的參數集。 但將於未來版本中淘汰。

新增節點集區

上一個步驟所建立名為 mycluster 的叢集只有單一節點集區。 您可以使用 New-AksHciNodePool 命令,將第二個節點集區新增至現有的叢集。 下列範例建立具有一個節點的 Windows 節點集區,名為 windowsnodepool。 請確保此節點集區與另一個現有的節點集區是不同名稱。

New-AksHciNodePool -clusterName mycluster -name windowsnodepool -count 1 -osType windows

取得節點集區的設定資訊

若要查看節點集區的設定資訊,請使用 Get-AksHciNodePool 命令。

Get-AksHciNodePool -clusterName mycluster

範例輸出

ClusterName  : mycluster
NodePoolName : linuxnodepool
Version      : v1.20.7
OsType       : Linux
NodeCount    : 1
VmSize       : Standard_K8S3_v1
Phase        : Deployed

ClusterName  : mycluster
NodePoolName : windowsnodepool
Version      : v1.20.7
OsType       : Windows
NodeCount    : 1
VmSize       : Standard_K8S3_v1
Phase        : Deployed

若要查看某個特定節點集區的設定資訊,請在 Get-AksHciNodePool 中使用 -name 參數

Get-AksHciNodePool -clusterName mycluster -name linuxnodepool

範例輸出

ClusterName  : mycluster
NodePoolName : linuxnodepool
Version      : v1.20.7
OsType       : Linux
NodeCount    : 1
VmSize       : Standard_K8S3_v1
Phase        : Deployed
Get-AksHciNodePool -clusterName mycluster -name windowsnodepool

範例輸出

ClusterName  : mycluster
NodePoolName : windowsnodepool
Version      : v1.20.7
OsType       : Windows
NodeCount    : 1
VmSize       : Standard_K8S3_v1
Phase        : Deployed

注意

如果您在 New-AksHciCluster 中使用新的參數集來部署叢集,然後執行 Get-AksHciCluster 以取得叢集資訊,則輸出中的 WindowsNodeCountLinuxNodeCount 欄位會傳回 0。 若要找出每個節點集區中準確的節點數目,請使用 Get-AksHciNodePool 命令並指定叢集名稱。

縮放節點集區

您可以增加或減少節點集區的節點數目。

若要調整節點集區的節點數目,請使用 Set-AksHciNodePool 命令。 下列範例在名為 mycluster 的叢集上名為 linuxnodepool 的節點集區中,將節點數目調整為 3。

Set-AksHciNodePool -clusterName mycluster -name linuxnodepool -count 3

增減控制平面節點

控制平面節點未變更。 建立、增減和移除的方式維持不變。 您依舊使用 New-AksHciCluster 命令搭配 controlPlaneNodeCountcontrolPlaneVmSize 參數,以部署控制平面節點,如果未指定任何值,則預設值分別為 1 和 Standard_A4_V2。

隨著應用程式的工作負載需求改變,您可能需要增減控制平面節點。 若要增減控制平面節點,請使用 Set-AksHciCluster 命令。 下列範例在先前步驟所建立名為 mycluster 的現有叢集上,將控制平面節點調整為 3 個。

Set-AksHciCluster -name mycluster -controlPlaneNodeCount 3

刪除節點集區

如果您需要刪除節點集區,請使用 Remove-AksHciNodePool 命令。 下列範例在名為 mycluster 的叢集上移除名為 windowsnodepool 的節點集區。

Remove-AksHciNodePool -clusterName mycluster -name windowsnodepool

指定節點集區的污點

建立節點集區時,您可以將該節點集區加上污點。 當您新增污點時,該節點集區的所有節點也會感染該污點。 如需污點和容忍的詳細資訊,請參閱 Kubernetes 污點和容忍

設定節點集區污點

若要建立有污點的節點集區,請使用 New-AksHciNodePool。 指定名稱 taintnp,並使用 -taints 參數來指定污點為 sku=gpu:noSchedule

New-AksHciNodePool -clusterName mycluster -name taintnp -count 1 -osType linux -taints sku=gpu:NoSchedule

注意

只有在節點集區建立期間才能設定節點集區的污點。

執行下列命令,以確定成功以指定的污點部署節點集區。

Get-AksHciNodePool -clusterName mycluster -name taintnp

輸出

Status       : {Phase, Details}
ClusterName  : mycluster
NodePoolName : taintnp
Version      : v1.20.7-kvapkg.1
OsType       : Linux
NodeCount    : 1
VmSize       : Standard_K8S3_v1
Phase        : Deployed
Taints       : {sku=gpu:NoSchedule}

在上一個步驟中,您在建立節點集區時套用 sku=gpu:NoSchedule 污點。 下列基本範例 YAML 資訊清單使用容忍,以允許 Kubernetes 排程器在該節點集區的節點上執行 NGINX Pod。

建立名為 nginx-toleration.yaml 的檔案,並複製下列範例中的資訊。

apiVersion: v1
kind: Pod
metadata:
  name: mypod
spec:
  containers:
  - image: mcr.microsoft.com/oss/nginx/nginx:1.15.9-alpine
    name: mypod
    resources:
      requests:
        cpu: 100m
        memory: 128Mi
      limits:
        cpu: 1
        memory: 2G
  tolerations:
  - key: "sku"
    operator: "Equal"
    value: "gpu"
    effect: "NoSchedule"

然後,使用下列命令來排程 Pod。

kubectl apply -f nginx-toleration.yaml

若要確認已部署 Pod,請執行下列命令:

kubectl describe pod mypod
[...]
Tolerations:     node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                 node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
                 sku=gpu:NoSchedule
Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  32s   default-scheduler  Successfully assigned default/mypod to moc-lk4iodl7h2y
  Normal  Pulling    30s   kubelet            Pulling image "mcr.microsoft.com/oss/nginx/nginx:1.15.9-alpine"
  Normal  Pulled     26s   kubelet            Successfully pulled image "mcr.microsoft.com/oss/nginx/nginx:1.15.9-alpine" in 4.529046457s
  Normal  Created    26s   kubelet            Created container mypod