轉換及容錯移轉

 

適用版本: Exchange Server 2010 SP2, Exchange Server 2010 SP3

上次修改主題的時間: 2016-11-28

轉換和容錯移轉是 Microsoft Exchange Server 2010 中兩種形式的中斷。「轉換」是排程中斷由系統管理員明確初始化的資料庫或伺服器,通常是用於準備執行維護作業。轉換包含系統管理員將作用中信箱資料庫副本移至資料庫可用性群組 (DAG) 中另一個伺服器的程序。

「容錯移轉」指的是導致服務、資料或二者皆無法使用的未預期事件。容錯移轉包含藉由啟動被動信箱資料庫副本,使其成為作用中信箱資料庫副本,讓系統自動從失敗復原的程序。

Exchange 2010 中的高可用性平台是專為處理轉換和容錯移轉而設計。

要尋找與高可用性和站台恢復相關的管理工作嗎?請參閱管理高可用性及站台恢復

轉換

Exchange 2010 中有三種轉換類型:

  • 資料庫轉換

  • 伺服器轉換

  • 資料中心轉換

資料庫轉換

「資料庫轉換」是由個別作用中資料庫轉換至另一個資料庫副本 (被動副本) 的程序,而該資料庫副本會建立新的作用中資料庫副本。資料庫轉換可能同時會在資料中心內部和之間發生。您可以使用 Exchange 管理主控台 (EMC) 或 Exchange 管理命令介面來進行資料庫轉換。不論使用哪一種介面,轉換的程序都一樣:

  1. 系統管理員初始化資料庫轉換,將目前作用中信箱資料庫副本移動到另一個伺服器。您可以使用 Move-ActiveMailboxDatabase 指令程式,或使用「啟動資料庫副本」精靈來初始化轉換程序。

  2. 工作所使用的用戶端會對 DAG 成員上的 Microsoft Exchange 複寫服務進行 RPC 呼叫。

  3. 如果 DAG 成員沒有保留 Primary Active Manager (PAM) 角色,則 DAG 成員會參照到 PAM 的工作。

  4. 工作會對 PAM 上的 Microsoft Exchange 複寫服務進行 RPC 呼叫。

  5. PAM 會讀取並更新儲存在 DAG 的叢集資料庫中的資料庫位置資訊。

  6. PAM 會聯繫 DAG 成員上的 Microsoft Exchange 複寫服務,該成員的被動副本將啟用為新的作用中信箱資料庫副本。

  7. 目標伺服器上的 Microsoft Exchange 複寫服務會在所有其他 DAG 成員上查詢 Microsoft Exchange 複寫服務,以判斷資料庫副本的最佳記錄檔來源。

  8. 資料庫會從目前的伺服器卸載,而目標伺服器上的 Microsoft Exchange 複寫服務會將剩餘的記錄檔複製到目標伺服器。

  9. 目標伺服器上的 Microsoft Exchange 複寫服務會要求裝載資料庫。

  10. 目標伺服器上的 Microsoft Exchange 資訊儲存庫服務會重新顯示記錄檔,並裝載資料庫。

  11. 所有錯誤碼都會傳回到目標伺服器上的 Microsoft Exchange 複寫服務。

  12. PAM 會更新 DAG 的叢集資料庫中的資料庫副本狀態資訊。

  13. 所有錯誤碼都會由目標伺服器上的 Microsoft Exchange 複寫服務傳回到 PAM 上的 Microsoft Exchange 複寫服務。

  14. PAM 上的 Microsoft Exchange 複寫服務會將所有錯誤傳回到呼叫工作的系統管理介面。

  15. 遠端 PowerShell 會將作業的結果傳回到呼叫的系統管理介面。

如需如何執行資料庫轉換的詳細步驟,請參閱啟動信箱資料庫副本

伺服器轉換

伺服器轉換是在一個或多個其他 DAG 成員上啟動 DAG 成員上的所有作用中資料庫的程序。和資料庫轉換類似,伺服器轉換可能會在一個資料中心內部和多個資料中心之間發生,而且可以藉由使用 EMC 和命令介面進行初始化。不論使用哪一種介面,轉換的程序都一樣:

  1. 系統管理員會初始化伺服器轉換,將所有目前的作用中信箱資料庫副本移動到一個或多個其他伺服器。您可以使用 Move-ActiveMailboxDatabase 指令程式,或使用轉換伺服器 UI 來初始化轉換程序。

  2. 工作會為目前伺服器上的每個作用中資料庫的資料庫轉換,執行本主題先前所述的相同步驟 (步驟 2 到 4)。

  3. PAM 會讀取並更新儲存在 DAG 的叢集資料庫中的資料庫位置資訊。

  4. PAM 會聯繫將啟用被動副本的每個 DAG 成員上的 Microsoft Exchange 複寫服務。

  5. 目標伺服器上的 Microsoft Exchange 複寫服務會查詢所有其他 DAG 成員上的 Microsoft Exchange 複寫服務,以判斷資料庫副本的最佳記錄檔來源。

  6. 資料庫會從目前的伺服器卸載,而每個目標伺服器上的 Microsoft Exchange 複寫服務會複製剩餘的記錄檔。

  7. 每個目標伺服器上的 Microsoft Exchange 複寫服務會要求裝載資料庫。

  8. 每個目標伺服器上的 Microsoft Exchange 資訊儲存庫服務會重新顯示記錄檔,並裝載資料庫。

  9. 所有錯誤碼都會傳回到目標伺服器上的 Microsoft Exchange 複寫服務。

  10. PAM 會更新 DAG 的叢集資料庫中的資料庫副本狀態資訊。

  11. 所有錯誤碼都會由目標伺服器上的 Microsoft Exchange 複寫服務傳回到 PAM 上的 Microsoft Exchange 複寫服務。

  12. PAM 上的 Microsoft Exchange 複寫服務會將所有錯誤傳回到呼叫工作的系統管理介面。

  13. 遠端 PowerShell 會將作業的結果傳回到呼叫的系統管理介面。

如需如何執行伺服器轉換的詳細步驟,請參閱執行伺服器轉換

資料中心轉換

資料中心或站台失敗的管理方式不同於可能導致伺服器或資料庫容錯移轉的失敗。在高可用性組態中,自動復原是由系統啟動,而失敗通常會在完整功能狀態下離開郵件系統。相較之下,資料中心失敗會被視為是災難復原事件,因此必須手動執行和完成復原,以便讓用戶端服務還原並讓中斷結束。您執行的程序稱為「資料中心轉換」。和許多災難復原案例一樣,資料中心轉換的優先規劃和準備可以簡化復原程序,並縮短中斷的持續時間。

如需資料中心轉換的詳細資訊,包括執行資料中心轉換的詳細步驟,請參閱資料中心轉換

如需執行資料中心轉換的協助,請參閱引導式逐步說明:資料庫可用性群組的 Exchange Server 2010 資料中心轉換

容錯移轉

容錯移轉是一種自動啟動程序,可能發生在資料庫或伺服器層級。容錯移轉的發生是為了回應影響到個別資料庫 (例如,隔離的儲存庫遺失) 或整個伺服器 (例如,主機板故障或斷電) 的失敗。

DAG 和信箱資料庫副本對於提供資料存取的資料和服務提供了完全備援 (因此可快速復原)。下表列出各種失敗類型的預期復原動作。某些失敗需要系統管理員啟動復原,其他失敗則由系統自動處理。

描述 自動啟動 自動修復動作 修復期間狀態:主動 修復期間狀態:被動 修復動作 註解

可延伸儲存引擎 (ESE) 軟體資料庫失敗:儲存資料庫的磁碟機在進行某些讀取時傳回錯誤 (例如,-1018 錯誤)。

可能會出現短暫中斷的情形。

可能會自動進行容錯移轉。

自動修補錯誤頁面。

手動轉換、自動容錯移轉或線上修復。

失敗

RAID 重建、資料庫和資料庫副本修復、還原和執行復原後修補頁面,或從副本修補頁面。

可能會包含其他軟體資料庫失敗碼。

不包括 NTFS 檔案系統區塊失敗。

如果執行了容錯移轉或轉換,就會更新主機伺服器。

ESE「半軟體」資料庫失敗:儲存資料庫的磁碟機在寫入某些資料時傳回錯誤。

自動容錯移轉時的短暫中斷。

在可能更換磁碟機之後的自動重建磁碟區/磁碟。

如果無法復原則予以卸載。

失敗

RAID 重建可能會解決問題。

複製及修復、還原及執行復原,或是在可能的更換作業之後重建磁碟區/磁碟。

ESE 半軟體寫入錯誤表示某些寫入已成功。

不包括 NTFS 區塊失敗。

ESE「半軟體」記錄檔失敗:儲存記錄檔資料的磁碟機在進行某些讀取或寫入時傳回非復原的錯誤。

自動容錯移轉時的短暫中斷。

在可能更換磁碟機之後的自動重建磁碟區/磁碟。

如果無法復原則予以卸載。

失敗

RAID 重建可能會解決問題。

複製及修復、還原及執行復原,或是在可能的更換作業之後重建磁碟區/磁碟。

ESE 半軟體讀取/寫入錯誤表示一些讀取/寫入已成功。

如果資料庫失敗,則會在記錄檔資料復原程序開始之前進行自動復原。

ESE 軟體錯誤或資源耗盡:ESE 終止執行個體 (例如,事件識別碼 1022,檢查點深度太深) 的錯誤。

自動容錯移轉時的短暫中斷。

無。

如果無法復原則予以卸載。

失敗

修正基礎的資源問題。

這項失敗可能是其他情況下出現的錯誤。

NTFS 區塊失敗:儲存資料庫或記錄檔的磁碟機發生對 NTFS 控制結構讀取錯誤或寫入錯誤。

自動容錯移轉時的短暫中斷。

在可能的磁碟機更換後對磁碟區進行完整的重建。

如果無法復原則予以卸載。

失敗

RAID 重建可能會解決問題。NTFS 公用程式可以解決 NTFS 問題。可能需要進行 Exchange 修復。

這更有可能會在 RAID 未使用時發生。如果這會影響作用中的記錄檔磁碟區,則會遺失某些最近的記錄檔。

不包含由 NTFS 或其基礎軟體或硬體堆疊自動修正的錯誤。

資料庫或記錄檔磁碟機失敗:儲存資料庫或記錄檔的磁碟機已經完全失敗且無法存取。

自動容錯移轉時的短暫中斷。

重新格式化或更換磁碟機,然後再進行完整的磁碟區重建。

如果無法復原則予以卸載。

失敗

在更換磁碟機之後,可能會重建 RAID。

在更換磁碟機之後,完整重建磁碟區。

完整重建磁碟區。

不適用。

資料庫或記錄檔磁碟區失敗:由於 NTFS 或較低層級的磁碟區問題造成磁碟區失敗。

自動容錯移轉時的短暫中斷。

重新格式化或更換磁碟機。

如果無法復原則予以卸載。

失敗

在更換磁碟機之後,可能會重建 RAID。

在更換磁碟機之後,完整重建磁碟區。

完整重建磁碟區。

不適用。

資料庫或記錄檔磁碟區空間不足:含有資料庫或記錄檔的 NTFS 檔案系統空間不足。

如果其他副本未處於類似的狀態則自動進行容錯移轉。

無。

已卸載。

失敗

執行完整或增量備份、手動刪除記錄檔、讓時間經過、繼續資料庫副本,或修復失敗的資料庫副本。

不適用。

系統管理員卸載錯誤的資料庫。

如果自動容錯移轉未被系統管理員封鎖,則會出現短暫的中斷。

如果禁止執行自動容錯移轉,則在裝載資料庫之前都會中斷。

無。

已卸載。

不適用

系統管理員修正錯誤。

不適用。

系統管理員擱置錯誤的資料庫副本。

依據組態和受影響的副本,可能無法自動復原。

無。

不適用。

已擱置

系統管理員修正錯誤。

不適用。

系統管理員卸載用於儲存區、NTFS 或磁碟區維護的資料庫。

如果自動容錯移轉未被系統管理員封鎖,則會出現短暫的中斷。

如果已封鎖自動容錯移轉,則在系統管理員完成工作前將會中斷。

無。

已卸載。

不適用

系統管理員完成工作。

不適用。

系統管理員擱置用於儲存區、NTFS 或磁碟區維護的資料庫副本。

依據組態和受影響的副本,可能無法自動復原。

無。

不適用。

已擱置

系統管理員完成動作。

不適用。

系統管理員卸載資料庫,進行離線資料庫維護。

中斷直到修復為止。

無。

已卸載。

已擱置

系統管理員完成動作。

主動和被動資料庫副本出現分歧的情況。

系統管理員必須擱置副本。

儲存區域網路 (SAN)、磁碟或儲存控制站失敗。

自動容錯移轉時的短暫中斷。

無。

已卸載。

任何

修復硬體。

被動資料庫副本將處於系統失敗時存在的狀態。

伺服器硬體維護。

自動容錯移轉時短暫中斷 (除非遭到系統管理員封鎖)。

無。

已卸載。

任何

完成動作。

被動資料庫副本的狀態,將是系統關閉時的狀態。

伺服器軟體維護。

自動容錯移轉時短暫中斷 (除非遭到系統管理員封鎖)。

無。

已卸載。

任何

完成動作。

被動資料庫副本的狀態,將是系統關閉時的狀態。

Microsoft Exchange 資訊儲存庫服務已由系統管理員停止或暫停。

無。

無。

已卸載。

任何

重新啟動 Microsoft Exchange 資訊儲存庫服務。

被動資料庫副本將處於服務停止時存在的狀態。

Microsoft Exchange 資訊儲存庫服務失敗;作業系統仍在執行中。

自動容錯移轉時的短暫中斷。

服務控制管理員重新啟動 Microsoft Exchange 資訊儲存庫服務。

已卸載。

任何

手動或自動重新啟動 Microsoft Exchange 資訊儲存庫服務。

被動資料庫副本將處於 Microsoft Exchange 資訊儲存庫服務失敗時存在的狀態。

部分 Microsoft Exchange 資訊儲存庫服務失敗;Exchange 儲存區的某些部分停止工作,但未將其識別為完全失敗。

自動容錯移轉期間的可能短暫中斷。

無。

已裝載和部分作用。

任何,不過可能只是部分作用

重新啟動伺服器、作業系統或 Microsoft Exchange 資訊儲存庫服務。

不適用。

伺服器失敗:由於下列其中一個原因而導致伺服器失敗:

  • 電力完全中斷

  • 無法復原故障的處理器晶片、主機板或背板

  • 作業系統停止錯誤

  • 作業系統停止回應

  • 通訊完全失敗

自動容錯移轉時的短暫中斷。

重新啟動電腦。

已卸載。

任何

還原電源、變更作業系統設定、變更硬體設定、更換硬體、重新啟動作業系統、服務作業系統、服務硬體,或修復通訊問題。

不適用。

DAG 遭遇仲裁失敗。

中斷直到修復為止。

無。

已卸載。

任何

修復失敗的仲裁、指派新仲裁,或還原導致仲裁失敗的網路。

被動資料庫副本將處於系統失敗時存在的狀態。

MAPI 網路通訊失敗:無法再使用 MAPI 網路上的伺服器。

自動容錯移轉時短暫中斷;不會有所損失。

無。將會繼續嘗試通訊。

已卸載。

任何

更正硬體或軟體問題,以修正通訊問題。

不適用。

複寫網路通訊失敗:伺服器無法透過失敗的複寫網路接收活動訊號、記錄檔副本或植入。

在工作量切換到其他網路時,可能會出現短暫的複製或植入中斷情形。

無。將會繼續嘗試通訊。

無。

任何

更正硬體或軟體問題,以修正通訊問題。

因失敗而影響恢復功能。

多個網路通訊失敗:伺服器無法透過多個網路接收活動訊號、記錄檔副本或植入。

自動容錯移轉時短暫中斷;不會有所損失。

無。將會繼續嘗試通訊。

已卸載。

任何

更正硬體或軟體問題,以修正通訊問題。

至少有一個網路仍正常運作。

一或多個網路的部分失敗:網路出現高錯誤率的情形。

未偵測到失敗,未執行任何動作。

無。

已裝載,但可能是效能問題。

任何

更正硬體或軟體問題,以修正通訊問題。

網路的錯誤率比一般情形更高。

無法偵測的作業系統當機:作業系統停止回應,但它不是由監視或叢集來偵測。

無。

無。

任何。

任何

重新啟動或結束沒有回應的資源。

未偵測到當機情形,因此不會採取任何動作。

某些功能可能會運作。

作業系統磁碟機發生失敗。

自動容錯移轉時的短暫中斷。

無。

已卸載。

任何

更換磁碟機和重建伺服器,或藉由使用 RAID 來重建磁碟區。

不適用。

作業系統磁碟機空間不足。

自動容錯移轉時的短暫中斷。

無。

已卸載。

任何

手動釋放磁碟區上的空間。

不適用。

Exchange 二進位碼檔案所在的磁碟機發生磁碟區或磁碟機失敗。

自動容錯移轉時的短暫中斷。

無。

已卸載。

任何

更換磁碟機和重新安裝應用程式,或藉由使用 RAID 來重建磁碟區。

不適用。

Exchange 二進位碼檔案所在磁碟機的空間不足。

自動容錯移轉時的短暫中斷。

無。

已卸載。

任何

手動釋放磁碟區上的空間。

不適用。

偵測到無效的新記錄檔:記錄檔順序已被現有的檔案中斷。

自動容錯移轉期間的短暫中斷;假設其他副本沒有相同問題。

無。

已卸載。

失敗

在判定來源之後移除中斷的記錄檔。

不應該複寫中斷的記錄檔。

連續複寫偵測到無效的記錄檔:在複製或重新顯示期間重新偵測不適當的記錄檔。

不適用。

捨棄記錄檔。

不適用。

失敗

捨棄無效的記錄檔;移動影響的記錄檔資料流。

不適用。

資料庫容錯移轉

當作用中的資料庫副本無法再保持作用中狀態時,就會發生資料庫容錯移轉。下列情況會在資料庫容錯移轉時發生:

  1. Microsoft Exchange 資訊儲存庫服務已偵測到資料庫失敗。

  2. Microsoft Exchange 資訊儲存庫服務寫入失敗事件到 crimson 頻道事件記錄檔。

  3. 包含失敗資料庫之伺服器上的 Active Manager 偵測到失敗事件。

  4. Active Manager 從保留資料庫副本的其他伺服器要求資料庫副本狀態。

  5. 其他伺服器對要求的 Active Manager 傳回所要求的資料庫副本狀態。

  6. PAM 使用最佳副本選取演算法,開始將主動資料庫移至 DAG 中的另一個伺服器。

  7. PAM 在叢集資料庫中更新資料庫裝載位置,以參照所選的伺服器。

  8. PAM 在所選伺服器上將要求傳送到 Active Manager,以成為資料庫主機。

  9. 所選伺服器上的 Active Manager 要求 Microsoft Exchange 複寫服務嘗試從先前伺服器複製最後的記錄檔,並且為資料庫設定可裝載旗標。

  10. Microsoft Exchange 複寫服務會從先前持有資料庫作用中副本的伺服器複製記錄檔。

  11. Active Manager 會從叢集資料庫讀取最大的記錄檔產生號碼。

  12. Microsoft Exchange 資訊儲存庫服務會裝載新的作用中資料庫副本。

伺服器容錯移轉

伺服器容錯移轉會在 DAG 成員無法再對 MAPI 網路提供服務,或當 DAG 成員上的叢集服務無法再聯繫其餘的 DAG 成員時發生。下列情況會在伺服器容錯移轉時發生:

  1. PAM 上的叢集服務會因為以下兩個條件之一而傳送通知給 PAM:

    1. 節點關閉   可以與伺服器連線,但無法參與 DAG 作業。

    2. MAPI 網路關閉   無法透過 MAPI 網路聯繫伺服器,因此無法參與 DAG 作業。

  2. 如果可以與伺服器連線,則 PAM 會聯繫受影響伺服器上的 Active Manager,並要求立即卸載所有資料庫。

  3. 每個受影響的資料庫副本:

    1. PAM 要求 DAG 中所有伺服器的資料庫副本狀態。

    2. PAM 從所有可連線和作用中 DAG 成員收到回應。

    3. 藉由從每個回應程式查詢最近的記錄檔產生號碼,PAM 會嘗試在所有回應的伺服器之間判斷最佳記錄檔來源。

    4. 每一部伺服器會以記錄檔產生號碼回應。

  4. PAM 從叢集資料庫擷取目前搜尋索引類別目錄狀態。

  5. PAM 會根據每個資料庫副本的記錄檔產生號碼和類別目錄健康情況,來選取要啟動的最佳副本。

  6. PAM 更新叢集資料庫中資料庫的裝載位置。

  7. PAM 藉由在一或多部其他伺服器上與 Active Manager 通訊,來啟動資料庫容錯移轉。

  8. 所選伺服器上的 Active Manager 要求 Microsoft Exchange 複寫服務嘗試從先前伺服器複製最後的記錄檔,並且設定可裝載旗標。

  9. 當資料庫處於可裝載狀態時,伺服器上的 Active Manager 會裝載資料庫。

如需 Active Manager 之最佳副本選擇程序的詳細資訊,請參閱瞭解 Active Manager

 © 2010 Microsoft Corporation. 著作權所有,並保留一切權利。