單一副本叢集復原行為

 

適用版本: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

上次修改主題的時間: 2007-10-26

單一副本叢集 (SCC) 為提供資料存取權的服務提供備援。服務備援能在主機節點故障時進行快速復原,且不會遺失資料。因為 SCC 會將包含資料庫的儲存傳送至新節點作為容錯移轉服務的一部分,所以應會還原服務而不會遺失資料。

不過,在 SCC 中,儲存子系統是單一失敗點。儲存子系統完全失敗時通常會導致一天中斷,且平均遺失 12 個小時的資料。此假設每日要進行完整備份。此外,安裝或操作 SCC 解決方案的儲存組態,通常比叢集連續複寫 (CCR) 所需的儲存組態還要複雜,CCR 是另一種類型的 Exchange 叢集解決方案。如需 CCR 的相關資訊,請參閱叢集連續複寫

SCC 復原行為可帶來兩種類型的中斷:

  • 排定的中斷   排定的中斷是由系統管理員啟動的。排定的中斷可以用來復原監視系統偵測到的失敗,或執行部份系統管理工作,例如硬體維護或軟體或軟體更新的安裝。
  • 未排定的中斷   未排定的中斷是由系統啟動的,可作為偵測到之失敗的復原動作。當偵測到這些中斷,Windows 叢集服務就會觸發其復原作業。

下表說明各種失敗類型的預期復原動作。某些失敗需要系統管理員來啟動復原,其他失敗則由 Windows 叢集服務自動處理。

觸發排定與未排定中斷的方式雖然不同,但同樣會啟動被動節點並裝載資料庫,並假設已順利轉換共用磁碟。若無法正確地轉換共用磁碟 (也許是因為組態錯誤),行為仍然相同。不會裝載受影響的資料庫。

note附註:
一個被動節點上永遠只能啟動一個叢集信箱伺服器。若節點已在主控叢集信箱伺服器,則無法使另一個伺服器連線。
note附註:
與舊版 Exchange 不同,Microsoft Exchange Server 2007 不會於資料庫失敗後,觸發 SCC 自動未排定中斷 (容錯移轉)。

失敗的復原動作

失敗描述 動作 註解

作業系統停止錯誤、作業系統停止回應、節點的電力完全中斷、無法復原故障的處理器晶片、主機板或背板,或者節點通訊完全失敗

自動容錯移轉至被動節點 (如果有的話)。資料庫的儲存連線時便會裝載資料庫。

若要使被動節點可供使用,在失敗之後必須能夠建立仲裁。這代表剩餘的節點必須能存取仲裁。

主動節點上的儲存區完全失敗

整個監視系統報告儲存區失敗。系統管理員可復原儲存或必須使用備份來復原。

自動容錯移轉至被動節點 (如果有的話)。資料庫的儲存連線時便會裝載資料庫。

若要使被動節點可供使用,在失敗之後必須能夠建立仲裁。這代表剩餘的節點必須能存取仲裁。

儲存區完全失敗

整個監視系統報告儲存區失敗。系統管理員可復原儲存或必須使用備份來復原。

此失敗會報告為叢集 (及其所有資源) 的失敗,因為無法存取仲裁和資料庫。

資料中心失敗

沒有協力廠商複寫解決方案,便不支援自動容錯移轉。

若從即時資料複寫,則必須同步複寫。

作業系統磁碟機失敗

無自動復原動作。除非作業系統失敗,否則不會被 Exchange 偵測到。根據明顯的失敗而非主因來進行偵測。

作業系統磁碟機失敗是由作業系統監視服務來報告,且可能會導致作業系統失敗。

作業系統磁碟機空間不足

自動容錯移轉至被動節點 (如果有的話)。資料庫的儲存連線時便會裝載資料庫。

此失敗是透過監視服務來進行雙向報告。如果自動容錯移轉沒有發生或無法執行,即需由系統管理員來決定此案例的復原動作。

叢集的公用網路在主動節點上失敗

復原動作與電源完全故障案例的相同。

除了用於主動和被動節點之間通訊的軟硬體之外,未偵測公用網路健全狀態。Exchange 2007 未提供實際用戶端連線的驗證功能。

叢集公用網路的完全失敗

無自動復原動作。

若遺失公用網路,IP 位址資源將會進入失敗狀態。解決公用網路問題之後,資源即會重新上線。

失去叢集仲裁

叢集信箱伺服器和叢集仲裁都已離線。

如果無法形成仲裁,則此狀況將導致沒有任何服務。

資訊儲存庫失敗

資訊儲存庫資源自動重新啟動。

重複失敗之後,系統管理員可以嘗試將叢集信箱伺服器手動移至被動節點,並嘗試使其上線。

應用程式 (二進位檔案) 磁碟機失敗

無自動復原動作。

一般來說,此案例會導致其他失敗,這些失敗是透過監視服務進行雙向報告,並且可由系統管理員提出。此案例的復原動作是由系統管理員決定。

應用程式 (二進位檔案) 磁碟機空間不足

無自動復原動作。

監視服務會報告此狀況。此案例的復原動作是由系統管理員決定。

資料庫或儲存群組完全遺失,或資料庫完全失敗

自動嘗試重新裝載受影響的資料庫。若此嘗試失敗,資料庫將仍維持失敗狀態,但不會發生任何叢集信箱伺服器的容錯移轉。

儲存群組或資料庫因為軟體失敗或損毀而卸載,或是因為硬體失敗而失敗。例如,當儲存群組的記錄目錄無法使用時,它會對所有資料庫執行強迫式卸載。系統管理員會決定正確的動作。復原不得為排定的中斷以啟動被動節點。

儲存群組或資料庫局部失敗、某些資料無法使用,或初始資料庫裝載失敗

無自動復原動作。

局部失敗表示已報告某些損毀,但損毀情形不會迫使儲存群組或資料庫卸載。如果資料庫在啟動時未裝載,則不會採取任何動作,且監視服務會報告此失敗。偵測到此狀況時 (可由監視服務報告),Mailbox Server 會產生事件。監視也會偵測及報告卸載的資料庫。

偵測到儲存群組有損毀記錄

無自動復原動作。

監視服務會報告此狀況。

資料庫或交易記錄磁碟機空間不足

無自動復原動作。將卸載儲存群組中的資料庫。

缺少可用磁碟機空間的狀況會透過監視系統來報告。系統管理員會決定正確的動作。

若要確保您目前閱讀的是最新資訊,並尋找其他的 Exchange Server 2007 說明文件,請造訪 Exchange Server 技術資源中心.