Concepts clés d’Operations Manager

Important

Cette version d’Operations Manager a atteint la fin du support. Nous vous recommandons de mettre à niveau vers Operations Manager 2022.

Operations Manager, un composant de Microsoft System Center, est un logiciel qui vous aide à surveiller des services, des appareils et des opérations pour de nombreux ordinateurs à partir d’une seule console. Cet article explique les concepts de base d’Operations Manager pour l’administrateur qui gère l’infrastructure Operations Manager et l’opérateur qui surveille et prend en charge les services informatiques de votre entreprise.

Ce que fait Operations Manager

Les entreprises, petites et grandes, dépendent généralement des services et applications fournis par leur environnement informatique. Les services informatiques sont chargés de garantir les performances et la disponibilité de ces applications et services critiques. Cela signifie que les services informatiques doivent savoir quand il y a un problème, identifier où se trouve le problème et déterminer la cause du problème, idéalement avant que les utilisateurs des applications ne rencontrent les problèmes. Plus il y a d’ordinateurs et d’appareils dans l’entreprise, plus cette tâche devient difficile.

L'utilisation d'Operations Manager dans l'environnement facilite l'analyse de plusieurs ordinateurs, périphériques, services et applications. La console Opérateur, illustrée dans l’image suivante, vous permet d’case activée l’intégrité, les performances et la disponibilité de tous les objets analysés dans l’environnement, et vous aide à identifier et à résoudre les problèmes.

Capture d’écran de la console Opérateur.

Notes

Pour en savoir plus sur les consoles Operations Manager, consultez Comparing the Operations Manager Consoles (Comparaison des consoles Operations Manager) dans l'Operations Guide.

Operations Manager vous indique quels objets surveillés ne sont pas sains, envoie des alertes lorsque des problèmes sont identifiés et fournit des informations pour vous aider à identifier la cause d’un problème et les solutions possibles. En tant qu'administrateur, vous configurez ce qui sera analysé en sélectionnant des ordinateurs et des périphériques à analyser et en important des packs d'administration qui fournissent une analyse pour des fonctionnalités et applications spécifiques. Pour décider quels objets analyser et les éléments à analyser, vous devez comprendre les fonctionnalités qui composent l'infrastructure Operations Manager ainsi que le fonctionnement d'Operations Manager.

L’infrastructure Operations Manager

L’installation d’Operations Manager crée un groupe d’administration. Le groupe d'administration est l'unité de base de la fonctionnalité. Au minimum, un groupe d'administration se compose d'un serveur d'administration, de la base de données opérationnelleet de la base de données de l'entrepôt de données de rapports.

  • Le serveur d'administration est le point focal pour administrer le groupe d'administration et communiquer avec la base de données. Lorsque vous ouvrez la console Opérateur et vous connectez à un groupe d'administration, vous vous connectez à un serveur d'administration pour ce groupe d'administration. Selon la taille de votre environnement informatique, un groupe d'administration peut contenir un seul serveur d'administration ou plusieurs serveurs d'administration.

  • La base de données opérationnelle est une base de données SQL Server qui contient toutes les données de configuration pour le groupe d'administration et stocke toutes les données d'analyse collectées et traitées pour le groupe d'administration. La base de données opérationnelle conserve les données à court terme, par défaut pendant 7 jours.

  • La base de données de l'entrepôt de données est une base de données SQL Server qui stocke les données d'analyse et d'alerte à des fins historiques. Les données qui sont écrites dans la base de données d'Operations Manager sont également écrites dans la base de données de l'entrepôt de données, donc les rapports contiennent toujours les données en cours. La base de données de l'entrepôt de données conserve les données à long terme.

Lorsque la fonctionnalité de création de rapports Operations Manager est installée, le groupe d’administration contient également un serveur de rapports, qui génère et présente des rapports à partir des données de la base de données de l’entrepôt de données.

Ces composants principaux d'un groupe d'administration peuvent exister sur un serveur unique, ou ils peuvent être distribués sur plusieurs serveurs, comme illustré sur l'image suivante.

Illustration du groupe d’administration de base.

Pour plus d’informations sur l’installation des fonctionnalités du groupe d’administration, consultez le Guide de déploiement d’Operations Manager.

Serveurs d'administration

Le rôle du serveur d'administration consiste à administrer la configuration du groupe d'administration, administrer et communiquer avec les agents et communiquer avec les bases de données du groupe d'administration.

Le groupe d'administration peut contenir plusieurs serveurs d'administration pour fournir d'autres capacités et une disponibilité permanente. Lorsque deux serveurs d'administration ou plus sont ajoutés à un groupe d'administration, les serveurs d'administration deviennent partie intégrante d'un pool de ressources et le travail est réparti entre les membres du pool. En cas de défaillance d'un membre du pool de ressources, les autres membres du pool de ressources intègrent la charge de travail de ce membre. Lorsqu’un nouveau serveur d’administration est ajouté, le nouveau serveur d’administration récupère automatiquement une partie du travail des membres existants dans le pool de ressources. Tous les membres du pool de ressources gèrent un ensemble distinct d’objets distants ; à un moment donné, deux membres du même pool ne gèrent pas le même objet en même temps.

Un type spécialisé de serveur d'administration est le serveur de passerelle. Un serveur de passerelle permet d'analyser des ordinateurs dans des domaines non approuvés. Pour plus d’informations, consultez Planification d’une conception de groupe d’administration.

Agents

Un agent Operations Manager est un service qui est installé sur un ordinateur. L’agent collecte des données, compare des exemples de données à des valeurs prédéfinies, crée des alertes et exécute des réponses. Un serveur d'administration reçoit et distribue des configurations aux agents sur des ordinateurs analysés.

Chaque agent dépend d'un serveur d'administration du groupe d'administration. Ce serveur d'administration est appelé serveur d'administration principal de l'agent.

Les agents observent les sources de données sur l'ordinateur analysé et collectent des informations en fonction de la configuration qui leur est envoyée par leur serveur d'administration. L'agent calcule également l'état d'intégrité de l'ordinateur et des objets analysés sur l'ordinateur analysé et le signale au serveur d'administration. Lorsque l’état d’intégrité d’un objet analysé change ou que d’autres critères sont remplis, l’agent peut générer une alerte. Cela permet aux opérateurs de savoir que quelque chose requiert leur attention. En fournissant au serveur d'administration des données d'intégrité sur l'objet analysé, l'agent fournit une image à jour concernant l'intégrité du périphérique et de toutes les applications qu'il héberge.

Un agent peut être configuré pour agir comme un agent proxy. Un agent proxy est un agent qui peut transférer des données à un serveur d'administration pour le compte d'un ordinateur ou d'un périphérique réseau autre que son ordinateur hôte. Par exemple, un agent qui est installé sur le nœud physique d'un cluster SQL peut être activé pour agir en tant que proxy afin d'analyser la ressource de cluster. Les agents proxy permettent la surveillance des ordinateurs et des appareils sur lesquels un agent ne peut pas être installé. Pour plus d'informations, consultez Agentless Monitoring (Analyse sans agent).

Services

Sur un ordinateur surveillé, l’agent Operations Manager est répertorié comme service Microsoft Monitoring Agent. Le service Microsoft Monitoring Agent collecte des données de performances, exécute des tâches et ainsi de suite. Même si le service ne parvient pas à communiquer avec le serveur d'administration dont il dépend, le service continue d'être exécuté et met les données et événements collectés en file d'attente sur le disque de l'ordinateur analysé. Quand la connexion est rétablie, le service Microsoft Monitoring Agent envoie les données et événements collectés au serveur d’administration.

Notes

Le service Microsoft Monitoring Agent est parfois appelé service de contrôle d’intégrité.

Le service Microsoft Monitoring Agent s’exécute également sur les serveurs d’administration. Sur un serveur d’administration, le service exécute des flux de travail de surveillance et gère les informations d’identification. Pour exécuter des flux de travail, le service lance des processus MonitoringHost.exe à l’aide des informations d’identification spécifiées. Ces processus analysent et collectent les données du journal des événements, les données du compteur de performances, les données de l'infrastructure de gestion Windows (WMI) et exécutent des actions telles que des scripts.

Les serveurs d'administration exécutent également le service d'accès aux données System Center et du service de configuration d'administration System Center.

Le service d'accès aux données System Center fournit un accès pour la console Opérateur à la base de données opérationnelle et écrit des données dans la base de données.

Le service de configuration d'administration System Center gère les relations et la topologie du groupe d'administration. Il distribue également des packs d'administration aux objets analysés.

Packs d’administration

Les flux de travaux exécutés par le service d'administration System Center sont définis par des packs d'administration. Les packs d'administration définissent les informations que l'agent collecte et renvoie au serveur d'administration pour une application ou une technologie spécifique. Par exemple, le pack d'administration de BizTalk Server contient des règles et des analyses qui collectent et évaluent les événements et opérations qui sont importants pour garantir l'intégrité et l'efficacité de l'application BizTalk Server.

Une fois qu'Operations Manager a installé un agent sur un ordinateur, il envoie une configuration initiale à l'agent. La configuration initiale inclut des détection d'objet à partir de packs d'administration. Le pack d’administration définit les types d’objets, tels que les applications et les fonctionnalités qui seront surveillées sur les ordinateurs qui ont été découverts par Operations Manager. Agents envoient des données au serveur d'administration qui identifie les instances d'objets détectés sur l'ordinateur. Le serveur d'administration envoie ensuite aux agents les éléments de packs d'administration qui s'appliquent aux objets détectés pour chaque ordinateur, tels que de règles et des analyses.

Une règle définit les événements et les données de performances à collecter à partir des ordinateurs, et ce qu’il faut faire avec les informations une fois qu’elles ont été collectées. Pour simplifier, imaginez une règle comme une instruction if/then (si/alors). Par exemple, un pack d'administration destiné à une application peut contenir les règles suivantes :

  • Si un message indiquant que l'application est en cours d'arrêt est ajouté au journal des événements, créer une alerte.

  • Si le chargement d’un fichier source échoue, collectez l’événement qui indique cet échec.

Comme le montrent ces exemples, les règles peuvent créer des alertes et collecter des événements ou des données de performances que l'agent envoie au serveur d'administration. Elles peuvent également exécuter des scripts, par exemple pour autoriser une règle à tenter de redémarrer une application qui a échoué.

L'état d'intégrité des objets détectés se reflète dans la console Opérateur en vert (réussi ou sain), en jaune (avertissement) ou en rouge (critique ou non intègre). LesAnalyses définissent les états d'intégrité pour les aspects particuliers de l'objet analysé. Par exemple, une analyse de la capacité du disque dur peut définir le vert comme plein à moins de 85 %, le jaune comme plein à plus de 85 % et le rouge comme plein à plus de 90 %. Une analyse peut être configurée pour générer une alerte lorsqu'un changement d'état se produit.

Processus de détection et d’analyse des objets

L'image suivante est une illustration simplifiée de la façon dont les objets sont détectés et analysés.

Illustration d’une vue d’ensemble de la découverte et de la surveillance.

  1. L'administrateur configure Operations Manager pour qu'il recherche des ordinateurs à gérer. Pour plus d'informations sur la détection d'ordinateurs, consultez Planification du déploiement d’un agent.

  2. Les ordinateurs qui répondent aux critères spécifiés et qui ne sont pas déjà gérés sont identifiés.

  3. Un agent Operations Manager est installé sur l'ordinateur détecté.

  4. L’agent demande des données de configuration, puis le serveur d’administration envoie les données de configuration de l’agent à partir des packs d’administration installés, qui incluent les classes à découvrir. Par exemple, si les packs d'administration du système d'exploitation Windows Server sont installés, le serveur d'administration envoie à l'agent les classes du système d'exploitation.

  5. L'agent compare les données de configuration à l'ordinateur, identifie les objets qu'il détecte et renvoie les informations au serveur d'administration. Par exemple, l’agent indiquera au serveur d’administration qu’une instance du système d’exploitation Windows Server 2019 se trouve sur l’ordinateur.

  6. Le serveur d’administration envoie à l’agent toute la logique de surveillance à partir des packs d’administration installés qui s’appliquent aux objets découverts. Par exemple, l’agent recevra toute la logique d’analyse qui s’applique à Windows Server 2019.

  7. L'agent applique la logique d'analyse, telle que les règles et les analyses, exécute les flux de travaux et renvoie les données au serveur d'administration.

  8. Lorsque des modifications se produisent sur les objets découverts, tels que les applications ajoutées ou désinstallées, l’agent envoie les informations mises à jour au serveur d’administration, qui envoie ensuite la logique d’analyse mise à jour.

Notes

Operations Manager peut également découvrir et surveiller des appareils réseau, des ordinateurs exécutant des systèmes d’exploitation UNIX et Linux, et fournir une surveillance sans agent. Pour plus d'informations, consultez Operations Manager Monitoring Scenarios (Scénarios d'analyse d'Operations Manager) dans le guide des opérations.

Communication entre les agents et les serveurs d'administration

L'agent Operations Manager envoie des données d'alerte et de découverte au serveur d'administration principal, qui écrit les données dans la base de données opérationnelle. L'agent envoie également des événements, des performances et des données d'état au serveur d'administration principal pour cet agent, qui écrit les données dans les bases de données opérationnelle et de l'entrepôt de données simultanément.

L'agent envoie des données en fonction des paramètres de planification pour chaque règle et analyse. Pour les règles de collecte optimisées, les données sont transmises uniquement si l'échantillon d'un compteur diffère de l'échantillon précédent par une tolérance spécifiée, par exemple 10 %. Cela permet de réduire le trafic réseau et le volume des données stockées dans la base de données opérationnelle.

En outre, tous les agents envoient un paquet de données, appelé une pulsation, au serveur d'administration à intervalles réguliers, par défaut toutes les 60 secondes. L'objectif de la pulsation est de valider la disponibilité de l'agent et la communication entre l'agent et le serveur d'administration. Pour plus d'informations sur les pulsations, consultez How Heartbeats Work in Operations Manager (Fonctionnement des pulsations dans Operations Manager).

Pour chaque agent, Operations Manager exécute un observateur du service d'intégrité, qui analyse l'état du service d'intégrité à distance du point de vue du serveur d'administration.

Autres ressources pour Operations Manager