監視 Azure Stack HCI 叢集

已完成

Contoso 掙扎的挑戰之一,就是其多樣化、分散的運算環境,缺乏統一的監視和管理解決方案。 最近的停機就代表,實作這類解決方案必須符合任務關鍵性工作負載的服務等級協定,以及針對影響工作負載可用性的問題提供及時的回應。 在評估 Azure Stack HCI 功能的過程中,您決定要探索叢集監視選項。 您也想要找出解決方案,以提供單一的半透明解決方案,來監視 Contoso 內部部署資料中心內的各種硬體和軟體資源,包括 Azure Stack HCI 叢集。

Azure Stack HCI 叢集監視概觀

由於 Azure Stack HCI 的架構相當複雜,因此,全面的監視方法應該會提供其所有相關元件的可見度,包括:

  • 叢集
  • 叢集節點
  • 磁碟區
  • 磁碟機
  • 虛擬機器 (VM)

您可以使用 Windows Admin Center、Microsoft Azure 監視器或 PowerShell 的內建功能來實作這種方法。

使用 Windows Admin Center 監視 Azure Stack HCI

Windows Admin Center 提供預先定義的儀表板,可讓您快速評估叢集及其元件的狀態和效能。 當您連線到目標叢集時,儀表板所顯示的資料就會變成可用。

使用 Windows Admin Center 監視叢集

Windows Admin Center 的叢集管理員介面包含一個儀表板,其中顯示叢集狀態和效能的相關資訊,包括:

  • 叢集相關警示
  • 叢集節點清單
  • 叢集上可用的磁碟和磁碟區清單
  • 叢集上裝載的 VM 清單
  • (所有叢集節點上彙總的) 叢集 CPU 使用量總計
  • (所有叢集節點上彙總的) 叢集記憶體使用量總計
  • (所有叢集節點上彙總的) 叢集存放區使用量總計
  • 跨叢集節點的每秒輸入/輸出作業總數 (IOPS)
  • 跨叢集節點的平均磁碟操作延遲 (以毫秒為單位)

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of a cluster.

監視叢集節點

使用 Windows Admin Center 連線到叢集之後,您可以透過 [工具] 功能表存取 [伺服器] 窗格。 [伺服器] 窗格上的 [清查] 索引標籤可讓您顯示屬於 Azure Stack HCI 叢集成員之每部伺服器的相關資訊,包括:

  • 名稱
  • 作業系統狀態
  • 作業系統執行時間
  • 硬體製造商、型號和序號
  • CPU 和記憶體使用率

注意

針對每部伺服器,您可以從 Windows Admin Center 的 [效能監視器] 窗格中,設定監視個別效能計量。

注意

如果伺服器的 CPU 使用率超過 85% 或其可用記憶體低於 100 MB (在 10 分鐘或更長的時間內),您應該調查伺服器效能。

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of cluster nodes.

監視叢集磁碟區

連線到叢集之後,您也可以存取 [工具] 功能表中的 [磁碟區] 窗格。 該窗格上的 [清查] 索引標籤可讓您顯示屬於叢集儲存空間直接存取儲存集區之每個磁碟區的相關資訊,包括:

  • 名稱
  • 狀態
  • 檔案系統 (ReFS 或 CSVFS)
  • 復原 (雙向鏡像、三向鏡像或鏡像加速同位)
  • 總大小和已使用空間
  • 磁碟區所屬的存放集區
  • IOPS 效能

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of cluster volumes.

監視叢集磁碟機

若要快速評估連線到叢集節點的所有實體磁碟機的狀態,在使用 Windows Admin Center 連線到叢集之後,請透過 [工具] 功能表瀏覽至 [磁碟機] 窗格。 驅動程式窗格上的清查索引標籤可讓您顯示每個磁碟機的相關資訊,包括:

  • 模型與序號
  • 狀態
  • 總大小和已使用空間
  • 類型 (SSD 或 HDD)
  • 使用量 (快取或容量)
  • (儲存體介面卡和連接埠) 的位置,以及磁碟機所連線的伺服器
  • 磁碟機所屬的存放集區

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of cluster drives.

監視叢集 VM

您也可以選擇查看叢集中所執行 VM 的狀態和效能。 若要完成此動作,請在使用 Windows Admin center 連線到叢集之後,透過 [工具] 功能表瀏覽至 [虛擬機器] 窗格。 該窗格上的 [清查] 索引標籤可讓您顯示每個 VM 的相關資訊,包括:

  • 名稱
  • VM 狀態 (正在執行或已停止)
  • VM 執行所在的主機伺服器
  • 作業系統執行時間
  • 活動訊號狀態
  • 災害復原網站
  • CPU 和記憶體效能計量

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of clustered VMs.

注意

叢集依賴定期檢查 (稱為「活動訊號」) 來驗證 VM 的可用性。

使用 Azure 監視器來監視 Azure Stack HCI

整合 Azure Stack HCI 與 Azure 監視器,可為您提供深入的監視、警示及記錄分析。 將叢集上線至 Azure 監視器最簡單的方式,就是使用 Windows Admin Center,該工作流程會先在目標 Azure 訂用帳戶中佈建 Log Analytics 工作區,然後設定健全狀況服務,並在每個叢集節點上安裝必要的代理程式。

注意

健全狀況服務可增強儲存空間直接存取的監視。

上線流程完成之後,叢集節點會開始將遙測和記錄轉送至 Azure 監視器。 Azure 入口網站可做為主要監視儀表板,在 Azure 監視器分頁上顯示收集的資料,並可讓您藉由執行 Log Analytics 查詢進行分析。 Azure 監視器也可讓您選擇實作計量或記錄型的規則,以觸發警示和自動補救工作。

雲端式監視可能會消除對內部部署監視系統的需求。 考慮到 Azure 監視器提供多平台支援,Contoso 可以用它來跨不同的硬體和軟體資源實作統一的監視解決方案。

知識檢查

1.

在評估 Contoso Azure Stack HCI 的功能時,您決定要實作警示,以回應影響叢集工作負載的效能或穩定性問題。 您應該選擇哪一種技術來提供警示功能? 您的解決方案必須將管理工作降至最低。