Surveiller un seul cluster Azure Stack HCI version 23H2 avec Insights

S’applique à : Azure Stack HCI, version 23H2

Cet article explique comment utiliser Insights pour surveiller un seul cluster Azure Stack HCI. Pour plusieurs clusters Azure Stack HCI, consultez Surveiller plusieurs clusters Azure Stack HCI avec Insights.

Insights est une fonctionnalité d’Azure Monitor qui vous permet de commencer rapidement à surveiller votre cluster Azure Stack HCI. Vous pouvez afficher les métriques clés, l’intégrité et les informations d’utilisation concernant le cluster, les serveurs, les machines virtuelles et le stockage.

Prenez quelques instants pour watch la procédure vidéo pas à pas sur Insights pour Azure Stack HCI :

Avantages

Insights pour Azure Stack HCI offre les avantages suivants :

  • Géré par Azure. Insights est géré par Azure et accessible via le Portail Azure, ce qui garantit qu’il est toujours à jour. Il n’est pas nécessaire de configurer une base de données ou un logiciel spécial.

  • Scalabilité. Insights est capable de charger plus de 400 jeux d’informations de cluster simultanément sur plusieurs abonnements. Il n’existe aucune limitation sur le cluster, le domaine ou l’emplacement physique.

  • Possibilités de personnalisation. L’expérience d’Insight s’appuie sur des modèles de classeur Azure Monitor. Cela vous permet de modifier les vues et les requêtes, de modifier ou de définir des seuils qui s’alignent sur vos limites spécifiques, puis d’enregistrer ces personnalisations dans un classeur. Vous pouvez ensuite épingler des graphiques dans les classeurs aux tableaux de bord Azure.

Prérequis

Voici les conditions préalables à l’utilisation d’Insights pour Azure Stack HCI :

  • Vous devez avoir accès à un cluster Azure Stack HCI déployé et inscrit.

  • L’identité managée pour la ressource Azure doit être activée. Pour plus d’informations, consultez Gestion améliorée activée.

Activer les insights

L’activation d’Insights vous aide à surveiller tous les clusters Azure Stack HCI actuellement associés à l’espace de travail Log Analytics en fournissant des métriques d’intégrité utiles. Insights installe l’agent Azure Monitor et vous aide à configurer des règles de collecte de données pour la surveillance de votre cluster Azure Stack HCI.

Procédez comme suit pour activer Insights à partir du Portail Azure :

  1. Dans le Portail Azure, accédez à la page de ressources de votre cluster Azure Stack HCI, puis sélectionnez votre cluster. Sous l’onglet Fonctionnalités, sélectionnez Insights.

    Capture d’écran montrant la vignette Insights.

  2. Dans la page Insights , sélectionnez Prise en main.

    Capture d’écran montrant le bouton Prise en main.

  3. Dans la page de configuration d’Insights , sélectionnez un DCR existant dans la liste déroulante Règle de collecte de données . La DCR spécifie les journaux d’événements et les compteurs de performances qui doivent être collectés et les stocke dans un espace de travail Log Analytics. Insights crée un DCR par défaut s’il n’en existe pas déjà un. Seuls les contrôleurs de domaine activés pour Insights sont inclus.

    Capture d’écran montrant la fenêtre de configuration d’Insights.

  4. (Facultatif) Vous pouvez également créer un DCR en sélectionnant Create Nouveau dans la page de configuration d’Insights.

    Important

    Nous vous recommandons vivement de ne pas créer votre propre DCR. Le DCR créé par Insights inclut un flux de données spécial requis pour son fonctionnement. Vous pouvez modifier cette DCR pour collecter plus de données, telles que des événements Windows et Syslog. Les contrôleurs de domaine créés via l’installation d’AMA auront un préfixe AzureStackHCI- associé au nom DCR.

    1. Dans la page Nouvelle règle de collecte de données , spécifiez l’abonnement, le nom DCR et le nom du point de terminaison de collecte de données (DCE). Les contrôleurs de domaine sont utilisés pour accéder au service de configuration afin d’extraire les contrôleurs de domaine associés pour l’agent Azure Monitor. Pour plus d’informations sur DCE, consultez Points de terminaison de collecte de données dans Azure Monitor.

      Notes

      Si vous utilisez des liens privés sur l’agent, vous devez ajouter des contrôleurs de domaine. Pour plus d’informations sur les paramètres réseau AMA, consultez Définir les paramètres réseau de l’Agent Azure Monitor.

      Capture d’écran montrant la fenêtre de règle de collecte de données.

    2. Sélectionnez le bouton Vérifier + Créer.

      Si un DCR n’est pas encore créé pour le cluster non surveillé, il en est créé avec les compteurs de performances activés et le canal du journal des événements Windows activé.

  5. Passez en revue l’écran final avec un résumé du nom DCR, du nombre de journaux d’événements, des compteurs de performances et du nom de l’espace de travail Log Analytics dans lequel les données sont stockées. Sélectionnez Configurer.

    Capture d’écran montrant le sélecteur de liste déroulante des règles de collecte de données.

    Après avoir sélectionné Configurer, vous êtes redirigé vers la page Extensions, où vous pouvez voir les status de l’installation de votre agent. En configurant Insights, AMA est automatiquement installé sur tous les nœuds du cluster.

  6. Accédez à la page de ressources de votre cluster Azure Stack HCI, puis sélectionnez votre cluster. Insights s’affiche désormais comme Configuré sous l’onglet Fonctionnalités :

    Capture d’écran montrant la vignette Insights comme configurée.

Règles de collecte des données

Lorsque vous activez Insights sur une machine avec l’agent Azure Monitor, vous devez spécifier une DCR à utiliser. Pour plus d’informations sur les contrôleurs de domaine, consultez Règles de collecte de données dans Azure Monitor.

Option Description
Compteurs de performances Spécifie les compteurs de performances de données à collecter à partir du système d’exploitation. Cette option est requise pour tous les ordinateurs. Ces compteurs de performances sont utilisés pour remplir les visualisations dans le classeur Insights. Actuellement, le classeur Insights utilise cinq compteurs de performances : Memory()\Available Bytes, Network Interface()\Bytes Total/sec, Processor(_Total)\% Processor Time, RDMA Activity()\RDMA Inbound Bytes/secet RDMA Activity()\RDMA Outbound Bytes/sec
Canal du journal des événements Spécifie les journaux d’événements Windows à collecter à partir du système d’exploitation. Cette option est requise pour tous les ordinateurs. Les journaux d’événements Windows sont utilisés pour remplir les visualisations dans le classeur Insights. Actuellement, les données sont collectées via deux canaux de journal des événements Windows : - microsoft-windows-health/operational et microsoft-windows-sddc-management/operational
Espace de travail Log Analytics Espace de travail pour stocker les données. Seuls les espaces de travail avec Insights sont répertoriés.

Canal d’événements

Le Microsoft-windows-sddc-management/operational canal d’événements Windows et Microsoft-windows-health/operational est ajouté à votre espace de travail Log Analytics sous Journaux d’événements Windows.

Capture d’écran montrant la fenêtre Ajouter une source de données.

En collectant ces journaux, Insights affiche la status d’intégrité des serveurs, lecteurs, volumes et machines virtuelles individuels. Par défaut, cinq compteurs de performances sont ajoutés.

Compteurs de performance

Par défaut, cinq compteurs de performances sont ajoutés :

Capture d’écran montrant l’ajout de compteurs de performances.

Le tableau suivant décrit les compteurs de performance supervisés :

Compteurs de performance Description
Mémoire (*)\Octets disponibles Octets disponibles est la quantité de mémoire physique, en octets, immédiatement disponible pour l'allocation à un processus ou pour l'utilisation du système.
Performances Interface réseau(*)\Total des octets/s Vitesse à laquelle les octets sont envoyés et reçus sur chaque carte réseau, y compris les caractères de trame. Total des octets/s est la somme des octets reçus par seconde et des octets envoyés par seconde.
Processor(_Total)% de temps de processeur Temps écoulé en pourcentage que tous les threads de processus a passé à utiliser le processeur pour exécuter des instructions.
Activité RDMA(*)\Octets entrants/s RDMA Taux de données reçues sur RDMA par la carte réseau par seconde.
Activité RDMA(*)\Octets sortants/s RDMA Taux de données envoyés sur RDMA par la carte réseau par seconde.

Après avoir activé Insights, il peut prendre jusqu’à 15 minutes pour collecter les données. Une fois le processus terminé, vous pouvez voir une visualisation complète de l’intégrité de votre cluster à partir du menu Insights dans le volet gauche :

Capture d’écran montrant les visualisations Insight.

Désactiver Insights

Pour désactiver Insights, procédez comme suit :

  1. Sélectionnez Insights sous l'onglet Fonctionnalités.

  2. Sélectionner Désactiver Insights.

    Capture d’écran montrant la fenêtre Désactiver Insights.

Lorsque vous désactivez la fonctionnalité Insights, l’association entre la règle de collecte de données et le cluster est supprimée et les journaux de gestion du service d’intégrité et du SDDC ne sont plus collectés ; toutefois, les données existantes ne sont pas supprimées. Si vous souhaitez supprimer ces données, accédez à votre espace de travail DCR et Log Analytics et supprimez les données manuellement.

Mettre à jour Insights

La vignette Insights affiche un message Nécessite une mise à jour dans les cas suivants :

  • Une règle de collecte de données est modifiée.
  • Un événement d’intégrité du journal des événements Windows est supprimé.
  • L’un des cinq compteurs de performances de l’espace de travail Log Analytics est supprimé.

Pour réactiver Insights, procédez comme suit :

  1. Sélectionnez la vignette Insights sous Fonctionnalités.

  2. Sélectionnez Mettre à jour pour afficher à nouveau les visualisations.

    Capture d’écran montrant la fenêtre Update Insights.

Dépanner

Cette section fournit des conseils pour résoudre les problèmes liés à l’utilisation d’Insights pour Azure Stack HCI.

Page Résoudre les problèmes liés aux classeurs vides sans données renseignées

Question. Vous voyez une page Classeurs vide sans données renseignées, comme illustré dans la capture d’écran suivante :

Capture d’écran d’une page classeurs vide.

Causes possibles. Il peut y avoir plusieurs causes à ce problème, comme une configuration récente d’Insights ou une configuration incorrecte du DCR associé.

Solution. Pour résoudre le problème, effectuez les étapes suivantes dans l’ordre :

  1. Si vous avez récemment configuré Insights, attendez jusqu’à une heure pour qu’AMA collecte des données.
  2. Vérifiez la configuration du DCR associé. Assurez-vous que les canaux d’événements et les compteurs de performances sont ajoutés en tant que sources de données au DCR associé, comme décrit dans la section Règles de collecte de données .
  3. Si le problème persiste après avoir effectué les étapes ci-dessus et que vous ne voyez toujours aucune donnée, contactez le support technique pour obtenir de l’aide.

Pour obtenir des conseils de dépannage plus détaillés, consultez Conseils de résolution des problèmes pour l’agent Azure Monitor.

Visualisations d’insights

Une fois Insights activé, les tableaux suivants fournissent des détails sur toutes les ressources.

Santé

Fournit des erreurs d’intégrité sur un cluster.

Métrique Description Unité Exemple
Erreur Brève description des erreurs d’intégrité. En cliquant sur le lien, un panneau latéral s’ouvre avec plus d’informations. Aucune unité PoolCapacityThresholdExceeded
Type de ressource défaillante Type de ressource qui a rencontré une erreur. Aucune unité StoragePool
ID de ressource défaillante ID unique pour la ressource qui a rencontré une erreur d’intégrité. ID unique {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
severity La gravité de l’erreur peut être avertissement ou critique. Aucune unité Avertissement
Heure d’erreur initiale Timestamp de la dernière mise à jour du serveur. Datetime 09/04/2022 12:15:42

Serveur

Métrique Description Unité Exemple
Serveurs Noms des serveurs dans le cluster. Aucune unité VM-1
Dernière mise à jour Date et heure de la dernière mise à jour du serveur. Datetime 09/04/2022 12:15:42
Statut Intégrité des ressources du serveur dans le cluster. Il peut être sain, en avertissement, critique et autre. Healthy
Utilisation de l’UC Le % du temps que le processus a utilisé le processeur. Pourcentage 56 %
Utilisation de la mémoire L’utilisation de la mémoire du processus serveur est égale à Octets traités/privés, plus la taille des données mappées en mémoire. Pourcentage 16 %
Processeurs logiques Nombre de processeurs logiques. Nombre 2
UC Nombre d'UC. Nombre 2
Uptime Temps pendant lequel une machine, en particulier un ordinateur, est en cours d’opération. Timespan 2 609 h
Site Nom du site auquel appartient le serveur. Nom du site SiteA
Nom de domaine Domaine local auquel le serveur appartient. Aucune unité Contoso.local

Machines virtuelles

Fournit l’état de toutes les machines virtuelles du cluster. Une machine virtuelle peut se trouver dans l’un des états suivants : exécution, arrêt, échec ou autre (inconnu, démarrage, capture instantanée, enregistrement, arrêt, pause, pause, suspension).

Métrique Description Unité Exemple
Serveurs Le nom du serveur Aucune unité Sample-VM-1
Dernière mise à jour Cela indique la date et l’heure de la dernière mise à jour du serveur Datetime 09/04/2022 12:24:02
Nombre total de machines virtuelles Nombre de machines virtuelles dans un nœud de serveur. Count 0 sur 0 en cours d’exécution
Exécution en cours Nombre de machines virtuelles en cours d’exécution dans un nœud de serveur. Nombre 2
Arrêté Nombre de machines virtuelles arrêtées dans un nœud de serveur. Nombre 3
Échec Nombre de machines virtuelles ayant rencontré une erreur dans un nœud de serveur. Nombre 2
Autre Si la machine virtuelle se trouve dans l’un des états suivants (Inconnu, Démarrage, Capture instantanée, Enregistrement, Arrêt, Suspension, Reprise, Pause, Suspendu), elle est considérée comme « Autre ». Nombre 2

Stockage

Le tableau suivant fournit l’intégrité des volumes et des lecteurs dans le cluster :

Métrique Description Unité Exemple
Volumes Nom du volume Aucune unité ClusterPerformanceHistory
Dernière mise à jour Date et heure de la dernière mise à jour du stockage. Datetime 14/04/2022 14:58:55
Statut L’état du volume. Sain, en avertissement, critique et autre Healthy
Capacité totale Capacité totale de l’appareil en octets pendant la période de reporting. Octets 2,5 Go
Capacité disponible Capacité disponible en octets pendant la période du rapport. Octets 20B
IOPS Opérations d’entrée/sortie par seconde. À la seconde 45/s
Débit Nombre d’octets par seconde servis par Application Gateway. Octets par seconde 5 bits/s
Latence Temps moyen nécessaire à la fin de la demande d’E/S. Second 0,0016 s
Résilience Capacité de récupération suite à des défaillances. Optimise la disponibilité des données. Aucune unité Miroir triple :
Déduplication Processus consistant à réduire le nombre physique d’octets de données qui doivent être stockés sur le disque. Disponible ou non Oui/Non
Système de fichiers Type de système de fichiers. Aucune unité ReFS

Tarifs Azure Monitor

Lorsque vous activez la visualisation de surveillance, les journaux sont collectés à partir de :

  • Gestion de l’intégrité (Microsoft-windows-health/operational).
  • SDDC Management (Microsoft-Windows-SDDC-Management/Operational; Event ID: 3000, 3001, 3002, 3003, 3004).

Vous êtes facturé en fonction de la quantité de données ingérées et des paramètres de rétention des données de votre espace de travail Log Analytics.

Azure Monitor offre une tarification avec paiement à l’accès, et les cinq premiers Go du compte de facturation par mois est gratuit. Étant donné que la tarification peut varier selon plusieurs facteurs, notamment la région Azure que vous utilisez, consultez la calculatrice de prix Azure Monitor pour obtenir les calculs de tarification les plus récents.

Étapes suivantes