Operations Manager のイベント ID 2115 関連のパフォーマンスの問題のトラブルシューティング

この記事では、Operations Manager (OpsMgr) データベースおよびデータ ウェアハウス データ挿入時間に影響するパフォーマンスの問題を特定し、トラブルシューティングするのに役立ちます。 サポートされているすべてのバージョンのオペレーション マネージャー System Center適用されます。

元の製品バージョン:  System CenterOperations Manager
元の KB 番号:   2681388

Operations Manager データベースのパフォーマンスの問題の一般的な兆候は、Operations Manager イベント ログにイベント ID 2115 イベントが存在する点です。 通常、これらのイベントは、パフォーマンスの問題が管理サーバーまたは Microsoft SQL Server を実行しているサーバー上に存在し、Operations Manager または Operations Manager データ ウェアハウス データベースをホストしている状態を示します。

背景

データベースとデータ ウェアハウスの書き込みアクション ワークフローは、管理サーバー上で実行されます。 これらのワークフローでは、最初にエージェントおよびゲートウェイ サーバーから受信したデータを内部バッファーに保持します。 次に、内部バッファーからこのデータを収集し、データベースとデータ ウェアハウスに挿入します。 最初のデータ挿入が完了すると、ワークフローによって別のバッチが作成されます。

データの各バッチのサイズは、バッチの作成時にバッファー内で使用可能なデータの量によって異なります。 ただし、バッチには最大 5,000 のデータ アイテムがあります。 受信データ アイテムの速度が上がった場合、または Operation Manager およびデータ ウェアハウス データベースのスループットに対するデータ アイテムの挿入スループットが低下した場合、バッファーにより多くのデータが蓄積され、バッチ サイズが大きくなります。

管理サーバー上で実行される書き込みアクション ワークフローは複数あります。 たとえば、次のワークフローは、さまざまなデータ型の Operations Manager データベースとデータ ウェアハウス データベースへのデータ挿入を処理します。

  • Microsoft.SystemCenter.DataWarehouse.CollectEntityHealthStateChange
  • Microsoft.SystemCenter.DataWarehouse.CollectPerformanceData
  • Microsoft.SystemCenter.DataWarehouse.CollectEventData
  • Microsoft.SystemCenter.CollectAlerts
  • Microsoft.SystemCenter.CollectEntityState
  • Microsoft.SystemCenter.CollectPublishedEntityState
  • Microsoft.SystemCenter.CollectDiscoveryData
  • Microsoft.SystemCenter.CollectSignatureData
  • Microsoft.SystemCenter.CollectEventData

管理サーバー上のデータベースまたはデータ ウェアハウスの書き込みアクション ワークフローでデータ バッチの挿入が遅い場合 (たとえば、60 秒を超える場合)、ワークフローはイベント ID 2115 を Operations Manager イベント ログに記録し始める。 このイベントは、データ バッチがデータベースまたはデータ ウェアハウスに挿入されるまで、または書き込みアクション ワークフロー モジュールによってデータが削除されるまで、1 分ごとに記録されます。 したがって、データベースまたはデータ ウェアハウスへのデータの挿入中に発生する待機時間のために、イベント ID 2115 がログに記録されます。 書き込みアクション ワークフロー モジュールによってデータが削除されたため、ログに記録されるイベントの例を次に示します。

イベントの種類: エラー
イベント ソース: HealthService
イベント カテゴリ: なし
イベント ID: 4506
コンピューター: <RMS NAME>
説明:
管理グループの <RMS NAME> id:"{F56EB161-4ABE-5BC7-610F-4365524F294E}" で実行されているルール "Microsoft.SystemCenter.OperationalDataReporting.SubmitOperationalDataFailed.Alert" の未解決のデータが多すぎてデータが削除されました。 <MANAGEMENT GROUP NAME>

より深く見る

イベント ID 2115 には、次の 2 つの重要な情報が含まれる。

  • 問題が発生しているワークフローの名前
  • ワークフローがデータの最後のバッチを挿入し始めてから経過した時間

例:

ログ名: Operations Manager
ソース: HealthService
イベント ID: 2115
レベル: 警告
コンピューター: <RMS NAME>
説明:
管理グループのバインド データ ソースは、ワークフローにアイテムを投稿しましたが <MANAGEMENT GROUP NAME> 、300 秒で応答を受信していない。 これは、ワークフローのパフォーマンスまたは機能の問題を示します。
ワークフロー ID : Microsoft.SystemCenter.CollectPublishedEntityState
インスタンス : <RMS NAME>
インスタンス ID : {88676CDF-E284-7838-AC70-E898DA1720CB}

ワークフロー Microsoft.SystemCenter.CollectPublishedEntityState は、Operations Manager データベースにエンティティ状態データを書き込みます。 イベント ID 2115 メッセージは、ワークフローがエンティティ状態データのバッチを挿入しようとしていることを示し Microsoft.SystemCenter.CollectPublishedEntityState 、300 秒前に開始しました。 この例では、Entity State データの挿入は完了していない。 通常、データのバッチの挿入は 60 秒以内に終了する必要があります。

ワークフロー ID に DataWarehouse という用語が含まれている場合、この問題には Operations Manager データ ウェアハウス データベースが関係します。 それ以外の場合は、Operations Manager データベースへのデータの挿入が問題になります。

原因

次に示す問題が発生すると、このような問題が発生する可能性があります。

挿入の問題

この問題は、データベースのパフォーマンスの問題、またはエージェントから送信されるデータが多すぎる可能性があります。 イベント ID 2115 の説明は、データベースへのデータの挿入 (Operations Manager または Operations Manager データ ウェアハウス) に影響を与えるバックログが含まれます。 これらのイベントは、多くの理由で発生する可能性があります。 たとえば、突然大量の検出データが生じかねない。 または、データベース接続の問題が発生する可能性があります。 または、データベースが満たされている可能性があります。 または、ディスク関連またはネットワーク関連の制約がある場合があります。

Operations Manager では、検出データの挿入は比較的手間のかかるプロセスです。 また、管理サーバーによって大量のデータが受信されるバーストが発生する場合があります。 これらのバーストにより、イベント ID 2115 の一時的なインスタンスが発生する可能性がありますが、検出データ収集のためにイベント ID 2115 が一貫して表示される場合は、データベースまたはデータ ウェアハウスの挿入の問題、または検出ルールが管理パックで検出データを収集しすぎる可能性があります。

インスタンス領域の変更や管理パックのインポートによって発生する Operations Manager の構成更新は、データベース サーバーの CPU 使用率に直接影響します。 これは、データベースの挿入時間に影響を与える可能性があります。 管理パックのインポートまたは大規模なインスタンス領域の変更後、イベント ID 2115 メッセージが表示される予定です。 詳細については、「Operations Manager での頻繁 な構成変更の検出とトラブルシューティング」を参照してください

Operations Manager では、高コストのユーザー インターフェイス クエリがデータベースのリソース使用率に影響を与え、データベースの挿入時間が長くなる可能性があります。 ユーザーが高価なユーザー インターフェイス操作を実行すると、イベント ID 2115 メッセージがログに記録される場合があります。

データベースの完全またはオフライン

Operations Manager または Operations Manager データ ウェアハウス データベースが空き領域に含めなか、オフラインの場合、管理サーバーはイベント ID 2115 メッセージを Operations Manager イベント ログに記録し続ける必要があります。 また、保留中の時間が増加します。

書き込みアクション ワークフローが Operations Manager または Operations Manager データ ウェアハウス データベースに接続できない場合、または無効な資格情報を使用して接続を確立している場合は、データの挿入がブロックされ、このシナリオが解決されるまでイベント ID 2115 メッセージがログに記録されます。

構成と環境の問題

イベント ID 2115 メッセージは、Operations Manager データベース、データ ウェアハウス データベース、およびすべてのサポート環境が正しく構成されていない場合にパフォーマンスの問題を示す場合があります。 この問題の考えられる原因を次に示します。

  • ログSQL Serverデータベースの TempDB サイズが小さすぎるか、空き領域が空き領域になすぎます。
  • Operations Manager データベースとデータ ウェアハウス データベースから管理サーバーへのネットワーク リンクは、帯域幅に制約があるか、待機時間が大きいです。 このシナリオでは、管理サーバーを Operations Manager サーバーとデータ ウェアハウス サーバーと同じ LAN に置くのをお勧めします。
  • データベース、ログ、または Operations Manager データベースとデータ ウェアハウス データベースで使用されるデータ ディスクは低速で、機能上の TempDB 問題が発生します。 このシナリオでは、RAID 10 を使用し、アレイ コントローラーでバッテリバックアップ書き込みキャッシュを有効にすることをお勧めします。
  • Operations Manager データベースまたはデータ ウェアハウス サーバーには、十分なメモリまたは CPU リソースが存在しません。
  • Operations Manager SQL Serverまたはデータ ウェアハウスをホストするサーバー インスタンスはオフラインです。

また、管理サーバーを Operations Manager データベース サーバーおよびデータ ウェアハウス データベース サーバーと同じ LAN に置く必要があります。

イベント ID 2115 メッセージは、データベース、ログ、または Operations Manager データベースとデータ ウェアハウス データベースで使用されるディスク サブシステムが遅い場合や、機能上の問題が発生した場合にも発生する可能性があります。 TempDB RAID 10 を使用し、アレイ コントローラーでバッテリバックアップ書き込みキャッシュを有効にすることをお勧めします。

解決方法

パフォーマンス関連のイベント ID 2115 メッセージをトラブルシューティングする最初の手順は、イベント内で返されるデータ アイテムを識別することです。 たとえば、ワークフロー ID は、データ アイテムの種類 (検出、アラート、イベント、Perf など) と関係するデータベースを示します。 ワークフロー ID に DataWarehouse という用語が含まれている場合、トラブルシューティングのフォーカスは Operations Manager データ ウェアハウス データベースにある必要があります。 それ以外の場合は、Operations Manager データベースにフォーカスする必要があります。

シナリオ 1

次の例では、この問題はワークフローに関係 Microsoft.SystemCenter.CollectSignatureData します。

イベントの種類:
警告イベント ソース: HealthService
イベント カテゴリ: なし
イベント ID: 2115
コンピューター: <RMS NAME>
説明: 管理グループのバインド データ ソースは、ワークフローにアイテムを投稿しましたが <MANAGEMENT GROUP NAME> 、300 秒で応答を受信していない。 これは、ワークフローのパフォーマンスまたは機能の問題を示します。
ワークフロー ID : Microsoft.SystemCenter.CollectSignatureData
インスタンス : <RMS NAME>
インスタンス ID : {F56EB161-4ABE-5BC7-610F-4365524F294E}

解決策

この例では、次のクエリを実行して、パフォーマンス署名データ収集ルールSQLできます。 このクエリは、Operations Manager データベースSQL Server Management Studioに対して実行する必要があります。

-- Return all Performance Signature Collection Rules
Use OperationsManager
select
managementpack.mpname,
rules.rulename
from performancesignature with (nolock)
inner join rules with (nolock)
on rules.ruleid = performancesignature.learningruleid
inner join managementpack with(nolock)
on rules.managementpackid = managementpack.managementpackid
group by managementpack.mpname, rules.rulename
order by managementpack.mpname, rules.rulename

このクエリは、すべての Performance Signature Collection ルールとそれぞれの管理パック名を返します。 管理パック名とルール名の列が返されます。

管理サーバー上の次のパフォーマンス モニター カウンターは、データベースとデータ ウェアハウスの書き込みアクション挿入バッチ サイズと時間に関する情報を提供します。

  • OpsMgr DB Write Action modules(*)\Avg. バッチ サイズ
  • OpsMgr DB Write Action modules(*)\Avg. 処理時間
  • OpsMgr DW ライター モジュール (*)\Avg. バッチ処理時間、ms
  • OpsMgr DW ライター モジュール (*)\Avg. バッチ サイズ

バッチ サイズが増加している場合 (たとえば、既定のバッチ サイズは 5,000 アイテムです)、管理サーバーがデータベースまたはデータ ウェアハウスにデータを挿入する速度が遅い、またはエージェントまたはゲートウェイ サーバーからデータ アイテムのバーストを受け取っているかどうかを示します。

データベースとデータ ウェアハウス書き込みアクションアカウントの平均処理時間カウンターを調べることで、データベースとデータ ウェアハウスにデータのバッチを書き込むのに平均でかかる時間を理解できます。 データのバッチをデータベースに書き込む時間によっては、調整の機会が生じ得る場合があります。

シナリオ 2

Operations Manager データベースまたはデータ ウェアハウス データベースをホストする SQL Server インスタンスがオフラインの場合、イベント ID 2115 とイベント ID 29200 が Operations Manager イベント ログに記録されます。 例:

ログ名: Operations Manager
ソース: HealthService
日付:
イベント ID: 2115
レベル: 警告
説明:
管理グループ MSFT のバインド データ ソースは、ワークフローにアイテムを投稿しましたが、60 秒で応答を受信していない。 これは、ワークフローのパフォーマンスまたは機能の問題を示します。
ワークフロー ID: Microsoft.SystemCenter.CollectEventData
インスタンス: name.contoso.local
インスタンス ID: {88676CDF-E284-7838-AC70-E898DA1720CB}

ログ名: Operations Manager
ソース: OpsMgr Config Service
イベント ID: 29200
レベル: エラー
説明:
OpsMgr Config Service が OpsMgr データベースへの接続を失ったため、データベースから更新プログラムを取得できません。 これは、自動的に回復される可能性がある一時的な問題である可能性があります。 問題が解決しない場合は、通常、データベースの問題を示します。 理由:
ネットワークに関連するエラーまたはインスタンス固有のエラーが発生し、ネットワークへの接続を確立SQL Server。 サーバーが見つからないか、アクセスできません。 インスタンス名が正しく、リモート接続を許可SQL Server構成されていることを確認します。 (プロバイダー: 名前付きパイプ プロバイダー、エラー: 40 - プロバイダーへの接続を開SQL Server)

解決策

この問題を解決するには、次の手順を行います。

  1. Connectをホストするサーバーにアクセスします。
  2. サービス アプレット 開きます。
  3. クライアント サーバー (MSSQLSERVER) SQL Server が開始され、実行されている状態を確認します。
  4. サービス SQL Server (MSSQLSERVER) サービスが開始および実行されていない場合は、サービスを開始します。

データベース接続が復元されると、ワークフローは正常にそれぞれのデータベースにデータを再度格納し始める必要があります。 イベント ID 31554 は、情報が正常に書き込まれたと確認します。

ログ名: Operations Manager
ソース: ヘルス サービス モジュール
イベント ID: 31554
タスク カテゴリ: データ ウェアハウス
レベル: 情報
説明:
データ ウェアハウスへのデータの格納に成功したワークフロー
1 つ以上のワークフローが影響を受けた。
ワークフロー名: Microsoft.SystemCenter.DataWarehouse.CollectEventData
インスタンス名: name.contoso.local
インスタンス ID: {88676CDF-E284-7838-AC70-E898DA1720CB}

シナリオ 3

イベント ID 2115 は、無効な RunAs 資格情報によって発生します。

解決策

Operations Manager イベント ログで次のイベントを確認します。 これらのイベントは、通常、認証アカウントのデータ ウェアハウスSQL Server資格情報 が正しくない可能性があります。

ログ名: Operations Manager
ソース: HealthService
イベント ID: 7000
タスク カテゴリ: ヘルス サービス
レベル: エラー
説明: 管理ヘルス サービス RunAs アカウントにログオンできない場合 <ACCOUNT NAME> があります <MANAGEMENT GROUP NAME> 。 エラーはログオンエラーです。不明なユーザー名またはパスワードが無効です。(1326L)。 これにより、正常性サービスは、この RunAs アカウントを使用してアクションを監視または実行できません。

ログ名: Operations Manager
ソース: HealthService
イベント ID: 7015
タスク カテゴリ: ヘルス サービス
レベル: エラー
説明:
このヘルス サービス、管理グループの RunAs アカウントの将来の有効性 <ACCOUNT NAME> を確認できません <MANAGEMENT GROUP NAME> 。 エラーはログオンエラーです。不明なユーザー名またはパスワードが無効です。(1326L)。

この問題を解決するには、次の手順を行います。

  1. Operations Manager コンソールを開きます。
  2. [管理 ] を選択します
  3. [構成 として実行][アカウント] を選択します
  4. Data Warehouse 認証アカウントの適切な 資格情報SQL Server構成します

シナリオ 4

ディスクのパフォーマンスの問題によって発生するイベント ID 2115。 これは、Operations Manager およびデータ ウェアハウス データベースで使用されるデータベース、ログ、または TempDB をホストするデータ ディスクが遅い場合や、問題が発生した場合に発生する可能性があります。 このシナリオでは、RAID 10 を使用し、アレイ コントローラーでバッテリバックアップ書き込みキャッシュを有効にすることをお勧めします。

解決策

最初に、データ ファイルまたはログ ファイルを含むすべてのドライブに対してSQL Serverディスク カウンターをキャプチャします。

  • % アイドル時間: ディスクアイドル時間が報告されている量。 50% 未満の場合は、ディスクのボトルネックを示している可能性があります。

  • Avg. Disk Queue Length: この値は、LUN 上にあるスピンドルの数の 2 倍を超えないようにしてください。 たとえば、LUN に 25 のスピンドルがある場合、 値 50 を使用できます。 ただし、LUN に 10 のスピンドルがある場合、 値 25 は 高すぎます。 RAID 構成では、RAID レベルとディスク数に基づいて次の数式を使用できます。

    • RAID 0: すべてのディスクが RAID 0 セットで動作しています。

      Average Disk Queue Length <= # (Disks in the array) *2

    • RAID 1: ディスクの半分が動作しています。 したがって、ディスク キューにカウントできるのは半分のみです。

      Average Disk Queue Length <= # (Disks in the array/2) *2

    • RAID 10: ディスクの半分が動作しています。 したがって、ディスク キューにカウントできるのは半分のみです。

      Average Disk Queue Length <= # (Disks in the array/2) *2

    • RAID 5: すべてのディスクが RAID 5 セットで動作しています。

      Average Disk Queue Length <= # (Disks in the array/2) *2

      Avg. Disk sec/Transfer: 1 つのディスク I/O を完了するために必要な秒の数。
      Avg. Disk sec/Read: ディスクからデータを読み取る平均時間 (秒)。
      Avg. Disk sec/Write: データをディスクに書き込む平均時間 (秒)。
      Disk Bytes/sec: ディスクとの間で転送される 1 秒あたりのバイト数。
      ディスク転送/秒: 1 秒あたりの入出力操作の数 (IOPS)。

      注意

      このリストの最後の 3 つのカウンターは、一貫して 約 .020 (20 ミリ秒) 以下の値を持ち、.050 (50 ミリ秒) を超えないようにする必要があります。

      次のしきい値については、「パフォーマンスのトラブルシューティング ガイドSQL Server説明します。

      • 10 ミリ秒未満: 非常に良好
      • 10~20 ミリ秒: 良い
      • 20~50 ミリ秒: 低速、注意が必要
      • 50 ミリ秒を超える: 重大な I/O ボトルネック
      • ディスクバイト/秒: ディスクとの間で転送される 1 秒あたりのバイト数
      • ディスク転送/秒: 1 秒あたりの入出力操作数 (IOPS)

    %Idle Time が低 い (10% 以下) 場合、ディスクが完全に利用されます。 この場合、このリストの最後の 2 つのカウンター (Disk Bytes/sec および Disk Transfers/sec) は、ドライブの最大スループットをそれぞれバイト単位および IOPS 単位で示します。 SAN ドライブのスループットは、スピンドルの数、ドライブの速度、チャネルの速度に応じて大きな変動があります。 ドライブがサポートするバイト数と IOPS 数について SAN ベンダーに問い合することをお勧めします。 %Idle Time が低 く、これら 2 つのカウンターの値がドライブの予想スループットを満たしない場合は、SAN ベンダーに問い合わせてトラブルシューティングのヘルプを確認してください。

次の記事では、パフォーマンスの問題に関するトラブルシューティングを行う方法SQL Server説明します。

シナリオ 5

イベント ID 2115 がログに記録され、管理サーバーは Operations Manager の Data Warehouse アラートにデータを書き込めない状態を生成します。 また、管理サーバー コンピューターで次の現象が発生します。

  • 管理サーバーは、次のような 1 つ以上のアラートを生成します。

    データ ウェアハウスにデータを書き込めないパフォーマンス データ収集プロセス。 データ ウェアハウスにデータを格納できなかった。
    例外 'SqlException': id '9069F7BD-55B8-C8E8-1CF9-4395F45527E2' を持つ管理グループは、ログイン 'contoso\Action_Account' でデータ ウェアハウスにアクセスできない 1 つ以上のワークフローが影響を受けた。
    ワークフロー名: Microsoft.SystemCenter.DataWarehouse.CollectPerformanceData
    インスタンス名: dataWarehouseServer.contoso.com
    インスタンス ID: {48936EE3-4E3E-BEE1-8C09-AFDAB8ECF236}
    管理グループ: <Management Group Name>

  • 次のイベントは、管理サーバーの Operations Manager イベント ログに記録されます。

    イベントの種類: 警告
    イベント ソース: HealthService
    イベント カテゴリ: なし
    イベント ID: 2115
    日付: 日付
    時間: 時間
    ユーザー: N/A
    コンピューター: <ManagementServerName>
    説明: 管理グループのバインド データ ソースは、ワークフローにアイテムを投稿しましたが <Management Group Name> 、1712 秒で応答を受信していない。 これは、ワークフローのパフォーマンスまたは機能の問題を示します。 ワークフロー ID: Microsoft.SystemCenter.DataWarehouse.CollectPerformanceData
    インスタンス: ManagementServerName.contoso.com
    インスタンス ID: {C7FDDE2A-E0AA-4B80-70DE-1D50D9965221}

解決策

この問題は、管理サーバーにデータ ウェアハウス RunAs プロファイルに指定されたアカウントが存在しない場合に発生する可能性があります。 この問題は、セカンダリ管理サーバーに影響を与える可能性が高い。 この問題を解決するには、次の手順を実行します。

  1. Operations Manager を実行しているコンピューターで、操作コンソールを開きます。

  2. ナビゲーション ウィンドウで、[管理] を 選択します

  3. [セキュリティ ] を展開 し、[プロファイルとして 実行] を選択します

  4. [プロファイルの 実行] ビューで 、[データ ウェアハウス アカウント ] をダブルクリックします

  5. [プロファイルの 実行プロパティ - データ ウェアハウス アカウントのプロパティ]ダイアログ ボックスで、[実行アカウント] タブを選択し、[新規] を 選択します

  6. [実行アカウント ] ボックスの一覧で 、[ データ ウェアハウス アクション アカウント] を選択します

  7. [名前 ] ボックスの 一覧で、アラートを生成した管理サーバーを選択します。

  8. [OK] を 2 回選択します。

  9. 手順 4 ~ 8 に従って、適切な RunAs アカウントを次のプロファイルに割り当てる。

    • データ ウェアハウス構成同期リーダー アカウント
    • データ ウェアハウス レポート展開アカウント
    • Data Warehouse SQL Server認証アカウント
  10. プロファイルごとに、RunAs プロファイルの名前に一致する RunAs アカウントを選択します。 たとえば、次の割り当てを行います。

    • データ ウェアハウス構成同期リーダー アカウントをデータ ウェアハウス構成同期リーダー アカウント プロファイルに割り当てる。
    • データ ウェアハウス レポート展開アカウントをデータ ウェアハウス レポート展開アカウント プロファイルに割り当てる。
    • 認証アカウント プロファイルにデータ ウェアハウス SQL Serverデータ ウェアハウス アカウントを割りSQL Server割り当てる。
  11. アラートを生成した管理サーバーで 、OpsMgr サーバーを再起動ヘルス サービス。

  12. 管理サーバーの Operations Manager イベント ログで、イベント ID 31554 イベントがログに記録されるのを確認します。 イベント ID 31554 は、モニターの状態が [正常] に変更されたかどうかを 示します。 この変更により、アラートが解決されます。

シナリオ 6

イベント ID 2115 は、HP MPIO FF DSM XP 3.01 を実行しているサーバー上で発生します。このサーバーには、表示される LUN はありません。 ユーザーがパフォーマンス モニターを開き、カウンターを追加しようとすると、パフォーマンス モニターがハングし、このアプリケーションのハンドル数が急速に増加します。

回避策

この問題には、次の 2 つの回避策があります。

  • ファイルの名前HPPerfProv.dllし、ファイルを再起動Windows。 ファイルの名前が変更され、読み込まれなくても、パフォーマンス モニターは問題なく動作します。
  • システムに少なくとも 1 つの LUN が存在する。