シングル コピー クラスタの回復動作

 

適用先: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007

トピックの最終更新日: 2007-10-26

シングル コピー クラスタ (SCC) は、データ アクセスを提供するサービスのために、冗長性を提供しています。サービスの冗長性によって、ホスト ノードに障害が発生した場合にデータ損失を引き起こすことなく、迅速に回復することができます。SCC は、データベースを含む記憶域をフェールオーバー サービスの一部として新しいノードに渡すので、データを失うことなく復元されます。

ただし、SCC では、記憶域サブシステムが単一障害点となります。記憶域サブシステムに全面的な障害が発生すると通常は、1 日停止し、平均 12 時間分のデータが失われます。これは、毎日完全バックアップを行っていることを前提としています。さらに、SCC ソリューションの記憶域構成は通常、Exchange クラスタ ソリューションのその他の種類であるクラスタ連続レプリケーション (CCR) ソリューションに必要な記憶域構成よりも、インストールおよび運用が複雑になります。CCR の詳細については、「クラスタ連続レプリケーション」を参照してください。

SCC の回復動作は、2 種類の停止に分けることができます。

  • スケジュールされた停止   スケジュールされた停止は管理者によって開始されます。スケジュールされた停止は、監視システムによって検出された障害から回復するとき、あるいはハードウェアの保守や、ソフトウェアまたはソフトウェア更新プログラムのインストールなどの管理タスクを実行するときに利用できます。
  • 計画されていないダウンタイム   計画されていないダウンタイムは、検出された障害に対する回復処理として、システムによって開始されます。計画されていないダウンタイムの検出、および計画されていないダウンタイムからの回復の開始は、Windows クラスタ サービスによって行われます。

次の表では、さまざまな障害の際に予期される回復処理について説明します。障害の中には、管理者が回復を開始する必要のある障害もありますが、それ以外の障害は、Windows クラスタ サービスによって自動的に処理されます。

トリガされる方法は異なりますが、スケジュールされた停止もスケジュールされていない停止も、共有ディスクが正常に移行したという前提で、結果的にパッシブ ノードがアクティブ化され、データベースがマウントされます。構成エラーの可能性によって共有ディスクが正しく移行できない場合も、動作は同じです。影響を受けるデータベースはマウントされません。

note注 :
特定の時点でパッシブ ノードでアクティブ化できるクラスタ化メールボックス サーバーは 1 つだけです。ノードが既にアクティブ クラスタ化メールボックス サーバーをホストしている場合、別のサーバーをオンラインにすることはできません。
note注 :
以前のバージョンの Exchange とは異なり、Microsoft Exchange Server 2007 は、データベースにエラーが発生した結果として、SCC のスケジュールされていない自動停止 (フェールオーバー) をトリガしません。

障害に対する回復処理

障害の説明 処理 コメント

オペレーティング システムの停止エラー、オペレーティング システムの応答停止、ノードの全面的な電源障害、プロセッサ チップ、マザーボード、またはバックプレーンの回復不能な障害、あるいはノードの全面的な通信障害

可能な場合はパッシブ ノードへの自動フェールオーバーを利用します。記憶域がオンラインになると、データベースがマウントされます。

パッシブ ノードを使用できるようにするためには、障害後にクォーラムを確立できる必要があります。これは、残りのノードがクォーラムにアクセスできるようにする必要があることを意味します。

アクティブ ノード全体のストレージ エラー

ストレージ エラーは、監視システムを通じて報告されます。管理者は、記憶域を回復できますが、回復にバックアップを使用する必要がある場合もあります。

可能な場合はパッシブ ノードへの自動フェールオーバーを利用します。記憶域がオンラインになると、データベースがマウントされます。

パッシブ ノードを使用できるようにするためには、障害後にクォーラムを確立できる必要があります。これは、残りのノードがクォーラムにアクセスできるようにする必要があることを意味します。

全体のストレージ エラー

ストレージ エラーは、監視システムを通じて報告されます。管理者は、記憶域を回復できますが、回復にバックアップを使用する必要がある場合もあります。

クォーラムおよびデータベースにはアクセスできないため、このエラーは、クラスタ (およびそのすべてのリソース) のエラーとして報告されます。

データ センターの障害

自動フェールオーバーは、サード パーティのレプリケーション ソリューション以外はサポートされていません。

ライブ データからレプリケートしている場合、レプリケーションは同期させる必要があります。

オペレーティング システム ドライブの障害

自動回復処理は行われません。オペレーティング システム障害が発生しない限り、Exchange では検出されません。根本的な原因ではなく、表面的な障害に基づいて検出されます。

オペレーティング システム ドライブの障害は、オペレーティング システムの監視サービスによって報告されますが、この障害によってオペレーティング システムに障害が発生している可能性があります。

オペレーティング システム ドライブの容量不足

可能な場合はパッシブ ノードへの自動フェールオーバーを利用します。記憶域がオンラインになると、データベースがマウントされます。

この障害は、監視サービスを通して報告されます。自動フェールオーバーが行われない、または行うことができない場合は、このシナリオの回復処理については管理者が判断します。

アクティブ ノードでのクラスタのパブリック ネットワークのエラー

全面的な電源障害のシナリオと同じ回復処理が行われます。

アクティブ ノードとパッシブ ノードとの間の通信に使用されるハードウェアとソフトウェア以外について、パブリック ネットワークの状態の検出は行われません。実際のクライアント接続の検証は、Exchange 2007 では提供されません。

クラスタのパブリック ネットワークの全面的な障害

自動回復処理は行われません。

パブリック ネットワークが失われた場合、IP アドレス リソースはエラー状態になります。パブリック ネットワークの問題が解決された後で、リソースをオンラインに戻すことができます。

クラスタ クォーラムの消失

クラスタ化メールボックス サーバーおよびクラスタ クォーラムがオフラインです。

このシナリオでは、クォーラムが形成できない場合はサービスが提供されません。

インフォメーション ストアの障害

インフォメーション ストアのリソースが自動的に再起動されます。

エラーが繰り返し発生する場合、管理者は、オンライン状態にするためにクラスタ化メールボックス サーバーの手動でのパッシブ ノードへの移動を試すことができます。

アプリケーション (バイナリ ファイル) ドライブの障害

自動回復処理は行われません。

通常、このシナリオでは別の障害が発生し、その障害が監視サービスを通して報告され、管理者によって回復処理が行われます。このシナリオの回復処理については、管理者が判断します。

アプリケーション (バイナリ ファイル) ドライブの容量不足

自動回復処理は行われません。

監視サービスによってこの状態が報告されます。このシナリオの回復処理については、管理者が判断します。

データベースやストレージ グループの完全な損失、またはデータベースの全面的な障害

影響を受けたデータベースの再マウントが自動的に試行されます。この試行が失敗した場合、データベースはエラー状態のままとなりますが、クラスタ化メールボックス サーバーのフェールオーバーは行われません。

ストレージ グループまたはデータベースが、ソフトウェアの障害または破損によってマウントを解除されたか、ハードウェアの障害のために失敗しました。たとえば、ストレージ グループは、ログ ディレクトリを使用できない場合はすべてのデータベースのマウントを強制的に解除します。管理者が修正処理を決定します。パッシブ ノードをアクティブ化するために、回復はスケジュールされた停止になる可能性があります。

ストレージ グループやデータベースの部分的な障害、使用できないデータの存在、またはデータベースの初期マウント エラー

自動回復処理は行われません。

部分的な障害とは、多少の破損が報告されていても、破損のためにストレージ グループやデータベースのマウントが強制的に解除されなかった状況を指します。データベースが起動時にマウントされなかった場合、処理は行われず、監視サービスによって障害が報告されます。この状態が検出されると、メールボックス サーバーによって、監視サービスで報告可能なイベントが生成されます。監視機能も、マウント解除されたデータベースを検出して報告します。

ストレージ グループの破損したログの検出

自動回復処理は行われません。

監視サービスによってこの状態が報告されます。

データベースまたはトランザクション ログ ドライブの空き容量の不足

自動回復処理は行われません。ストレージ グループのデータベースがマウント解除されます。

ドライブの空き領域が不足している状態が、監視システムによって報告されます。管理者が修正処理を決定します。

参照している情報が最新であることを確認したり、他の Exchange Server 2007 ドキュメントを見つけたりするには、Exchange Server TechCenter を参照してください。