Operations Manager の基本概念

重要

このバージョンの Operations Manager はサポート終了に達しました。 Operations Manager 2022 にアップグレードすることをお勧めします。

Microsoft System Center の 1 つのコンポーネントである Operations Manager は、1 つのコンソールから多数のコンピューターのサービス、デバイス、および操作を監視できるソフトウェアです。 この記事では、Operations Manager インフラストラクチャを管理する管理者と、ビジネスの IT サービスを監視およびサポートするオペレーターに対する Operations Manager に関する基本的な概念について説明します。

Operations Manager の機能

企業の多くは、その規模にかかわらず、ほとんどの業務をコンピューター環境で提供されるサービスやアプリケーションに依存しています。 IT 部門は、これらの重要なサービスやアプリケーションのパフォーマンスと可用性を保証する役割を担っています。 つまり、IT 部門は、問題が発生したタイミングを把握し、問題の原因を特定し、問題の原因を特定する必要があります。理想的には、アプリケーションのユーザーが問題に遭遇する前に発生します。 ビジネスのコンピューターとデバイスが多いほど、このタスクはより困難になります。

このような環境で Operations Manager を使用すれば、複数のコンピューター、デバイス、サービス、およびアプリケーションの監視が容易になります。 次の図に示すオペレーション コンソールを使用すると、環境内のすべての監視対象オブジェクトの正常性、パフォーマンス、可用性をチェックし、問題の特定と解決に役立ちます。

オペレーション コンソールのスクリーンショット。

Note

Operations Manager の各種コンソールの使い方については、この操作ガイドの Operations Manager のコンソールの比較に関する記事をご覧ください。

Operations Manager は、監視対象のオブジェクトが正常でないと通知し、問題が特定されたときにアラートを送信し、問題の原因と考えられる解決策を特定するのに役立つ情報を提供します。 管理者は、監視するコンピューターとデバイスを選択し、特定の機能やアプリケーションの監視に使用する管理パックを事前にインポートして、監視条件を構成します。 監視対象オブジェクトおよび監視の目的を決定するには、Operations Manager インフラストラクチャを構成する各機能、および Operations Manager の動作の仕組みを理解しておく必要があります。

Operations Manager インフラストラクチャ

Operations Manager をインストールすると、管理グループが作成されます。 この管理グループが機能の基本単位です。 1 つの管理グループは、最低 1 台の 管理サーバーと、その オペレーション データベース、および レポート作成用のデータ ウェアハウス データベースで構成されます。

  • 管理サーバー は、管理グループの管理と、データベースとの通信の起点となります。 オペレーション コンソールを開いて管理グループに接続すると、その管理グループの管理サーバーに接続されます。 コンピューティング環境の規模に応じて、1 つの管理グループに 1 台の管理サーバーを含めることも、複数の管理サーバーを含めることもできます。

  • オペレーション データベース は、管理グループのすべての構成データを格納している SQL Server データベースで、管理グループによって収集、処理された監視データをすべて保存します。 オペレーション データベースに保持されるデータは、短期的な (既定では 7 日間の) データです。

  • データ ウェアハウス データベース は、監視データやアラート データを履歴目的で保存する SQL Server データベースです。 Operations Manager データベースに書き込まれたデータは、データ ウェアハウス データベースにも書き込まれるため、レポートには、常に現在の最新データが含まれています。 データ ウェアハウス データベースは、データを長期間保持します。

Operations Manager レポート機能がインストールされると、管理グループには レポート サーバーも含まれます。このサーバーは、データ ウェアハウス データベース内のデータからレポートを作成して表示します。

次の図に示すように、管理グループのこれらのコア コンポーネントは、1 台のサーバー上に配置することも、複数のサーバーにわたって分散することもできます。

基本的な管理グループの図。

管理グループの各機能をインストールする方法については、Operations Manager 展開ガイドを参照してください。

管理サーバー

管理サーバーの役割は、管理グループの構成の管理、エージェントの管理とエージェントとの通信、および管理グループ内のデータベースとの通信を行うことです。

機能を強化する場合や、問題発生時の中断を防ぐために、管理グループに複数の管理サーバーを含めることもできます。 1 つの管理グループに複数の管理サーバーを追加すると、それらの管理サーバーが リソース プール の一部として機能するようになり、プールの各メンバーに負荷が分散されます。 リソース プールのメンバーの 1 つで障害が発生した場合、そのリソース プール内の他のメンバーが、そのメンバーのワークロードを引き継ぎます。 新しい管理サーバーが追加されると、新しい管理サーバーは、リソース プール内の既存のメンバーから一部の作業を自動的に取得します。 リソース プール内のすべてのメンバーは、リモート オブジェクトの個別のセットを管理します。同じプール内の 2 つのメンバーが同時に同じオブジェクトを管理することはありません。

特殊な種類の管理サーバーの 1 つに、 ゲートウェイ サーバーがあります。 ゲートウェイ サーバーを使うと、信頼されていないドメイン内のコンピューターを監視できます。 詳細については、「管理グループの設計の計画」を参照してください。

エージェント

Operations Manager エージェント は、コンピューターにインストールされるサービスの 1 つです。 エージェントはデータを収集し、サンプル データを定義済みの値と比較し、アラートを作成して、応答を実行します。 管理サーバーは、構成を受信して、その構成を監視対象コンピューター上のエージェントに配信します。

すべてのエージェントは、管理グループ内の管理サーバーに報告を行います。 この管理サーバーを、そのエージェントのプライマリ管理サーバーと呼びます。

エージェントは、監視対象コンピューター上のデータ ソースを監視し、管理サーバーから送信された構成に従って情報を収集します。 エージェントは、監視対象コンピューターとそのコンピューター上のオブジェクトのヘルス状態も計算し、管理サーバーに報告します。 監視対象オブジェクトのヘルス状態が変化するか、他の条件に一致した状態になると、エージェントでアラートが生成されます。 これにより、オペレーターは何か異常が発生したことを察知できます。 エージェントから管理サーバーに送信される監視対象オブジェクトのヘルス データをチェックすることで、そのオブジェクトがホストしているすべてのアプリケーションのヘルスに関する最新の状況を把握できます。

1 つのエージェントを プロキシ エージェントとして機能するように構成することもできます。 プロキシ エージェントは、エージェントのホスト コンピューター以外のコンピューターまたはネットワーク デバイスに関するデータを管理サーバーに送信できるエージェントです。 たとえば、SQL クラスターの物理ノードにインストールされているエージェントを、クラスター リソースを監視するためのプロキシとして使用できます。 プロキシ エージェントを使用すると、エージェントをインストールできないコンピューターとデバイスを監視できます。 詳細については、「 エージェントレス監視」を参照してください。

サービス

監視対象コンピューター上で、Operations Manager エージェントは、Microsoft Monitoring Agent サービスとして表示されます。 Microsoft Monitoring Agent サービスでは、パフォーマンス データの収集、タスクの実行などを行います。 このサービスは、報告先の管理サーバーと通信できなくなった場合でも稼働を続け、収集したデータやイベントを監視対象コンピューターのディスクに待機させておき、 接続が復旧し次第、それらのデータやイベントを管理サーバーに送信します。

Note

Microsoft Monitoring Agent サービスは、ヘルス サービスと呼ばれることがあります。

Microsoft Monitoring Agent サービスは、管理サーバー上でも実行されます。 管理サーバー上で、このサービスは、監視ワークフローを実行し、資格情報を管理します。 ワークフローを実行するために、このサービスでは、指定された資格情報を使用して MonitoringHost.exe プロセスを開始します。 これらのプロセスでは、イベント ログ データ、パフォーマンス カウンター データ、Windows Management Instrumentation (WMI) データを監視および収集し、スクリプトなどのアクションを実行します。

管理サーバーでは、System Center データ アクセス サービスと System Center 管理構成サービスも実行します。

System Center データ アクセス サービスでは、オペレーション コンソールにオペレーション データベースへのアクセスを提供し、データベースにデータを書き込みます。

System Center 管理構成サービスでは、管理グループのリレーションシップとトポロジを管理します。 また、監視対象オブジェクトに管理パックを配布します。

管理パック

System Center Management サービスが実行するワークフローは、 管理パックによって決まります。 管理パックには、エージェントが特定のアプリケーションやテクノロジのどの情報を収集して管理サーバーに報告するかが定義されています。 たとえば、BizTalk Server の管理パックには、BizTalk Server アプリケーションの正常性 (ヘルス) と効率性を保証するために重要なイベントと操作を収集して評価するルールおよびモニターが含まれています。

Operations Manager は、エージェントをコンピューターにインストールすると、初期構成をエージェントに送信します。 この初期構成には、管理パックからの オブジェクト検出 が含まれています。 管理パックは、Operations Manager によって検出されたコンピューターで監視されるアプリケーションや機能などのオブジェクトの種類を定義します。 エージェントは、コンピューターで検出されたオブジェクトのインスタンスを特定するデータを管理サーバーに送信します。 次に管理サーバーは、コンピューターごとに検出されたオブジェクトに適用される管理パックの要素 (ルールやモニターなど) をエージェントに送信します。

ルールでは、コンピューターから収集するイベントとパフォーマンス データ、および収集後の情報の処理を定義します。 ルールとは、単純に考えれば、If/Then ステートメントのようなものです。 たとえば、アプリケーションの管理パックには次のようなルールが含まれる場合があります。

  • アプリケーションをシャットダウンしているというメッセージがイベント ログに表示された場合に、アラートを作成する。

  • ソース ファイルのアップロードが失敗した場合は、このエラーを示すイベントを収集します。

これらの例からわかるとおり、ルールを使うと、エージェントが管理サーバーに送信するアラートを作成し、イベントやパフォーマンス データを収集できます。 また、エラーが発生したアプリケーションをルールで再起動するなどのスクリプトを実行することもできます。

検出されたオブジェクトのヘルス状態は、緑 (成功または正常)、黄 (警告)、または赤 (重大または異常) でオペレーション コンソールに反映されます。 モニター には、監視対象オブジェクトの特定の側面のヘルス状態が定義されています。 たとえば、ディスク ドライブの容量のモニターで、使用済み容量が 85% 未満の場合は緑、85% 以上の場合は黄、90% 以上の場合は赤と定義する場合があります。 状態が変わったときにアラートを発生するようにモニターを構成することもできます。

オブジェクトの検出と監視のしくみ

次の図は、オブジェクトの検出、監視プロセスを示したものです。

検出と監視の概要の図。

  1. 管理者は、管理するコンピューターを検索するように Operations Manager を構成します。 コンピューターの検出に関する詳細については、エージェントの展開計画に関する記事をご覧ください。

  2. 指定した条件を満たし、まだ管理されていないコンピューターが識別されます。

  3. 検出されたコンピューターに Operations Manager エージェントがインストールされます。

  4. エージェントは構成データを要求した後、管理サーバーは、検出するクラスを含む、インストールされている管理パックからエージェント構成データを送信します。 たとえば、Windows Server オペレーティング システム管理パックがインストールされている場合、管理サーバーはオペレーティング システムのクラスをエージェントに送信します。

  5. エージェントは、構成データをコンピューターと照合して、検出するオブジェクトを特定し、その情報を管理サーバーに返します。 たとえば、エージェントは、Windows Server 2019 オペレーティング システムのインスタンスがそのコンピューター上に存在するという情報を管理サーバーに返します。

  6. 管理サーバーは、検出されたオブジェクトに適用されるインストール済みの管理パックから、すべての監視ロジックをエージェントに送信します。 たとえば、Windows Server 2019 に適用される監視ロジックのすべてがエージェントで受信されます。

  7. エージェントは、ルールやモニターなどの監視ロジックを適用して、ワークフローを実行し、データを監視サーバーに返します。

  8. 検出されたオブジェクト (アプリケーションの追加やアンインストールなど) に変更が発生すると、エージェントは更新された情報を管理サーバーに送信し、更新された監視ロジックを送信します。

注意

Operations Manager は、ネットワーク デバイス、UNIX を実行しているコンピューター、Linux オペレーティング システムを検出して監視し、エージェントレス監視を提供することもできます。 詳細については、『操作ガイド』の「 Operations Manager Monitoring Scenarios (Operations Manager の監視環境) 」を参照してください。

エージェントと管理サーバー間の通信

Operations Manager エージェントでは、アラートと検出データをプライマリ管理サーバーに送信し、プライマリ管理サーバーでは、そのデータをオペレーション データベースに書き込みます。 また、エージェントのイベント、パフォーマンス、状態に関するデータもエージェントからプライマリ管理サーバーに送信され、プライマリ管理サーバーがそれらのデータをオペレーション データベースとデータ ウェアハウス データベースに同時に書き込みます。

エージェントは、各ルールとモニターのスケジュール パラメーターに従ってデータを送信します。 最適化された収集ルールでは、カウンターのサンプルと前のサンプルとの差が、指定された許容範囲 (10% など) に達した場合にのみ、データが転送されます。 これにより、ネットワーク トラフィック、およびオペレーション データベースに保存されるデータの量を削減できます。

また、すべてのエージェントは、 ハートビートと呼ばれるデータのパケットを管理サーバーに送信します。既定では、60 秒置きに送信します。 このハートビートは、エージェントの可用性、およびエージェントと管理サーバー間の通信をチェックするためのものです。 ハートビートの詳細については、「 Operations Manager のハートビートのしくみ」を参照してください。

Operations Manager は、リモート ヘルス サービスの状態を監視サーバーの視点から監視する ヘルス サービス ウォッチャーをエージェントごとに実行します。

Operations Manager の他のリソース