Рекомендации по мониторингу рабочих нагрузок Решение Azure VMware

В этой статье рассматривается область проектирования мониторинга рабочей нагрузки Решение Azure VMware. В этой области основное внимание уделяется рекомендациям по наблюдаемости. Руководство предназначено для операционной группы. Корпорация Майкрософт, VMware и сторонние компании предоставляют различные средства, которые можно использовать для мониторинга инфраструктуры и приложений. В этой статье перечислены эти параметры.

Каждый вариант предлагает решения для мониторинга с различной степенью затрат на лицензирование, варианты интеграции, мониторинг область и поддержку. Внимательно ознакомьтесь с применимыми условиями, прежде чем использовать эти средства.

Сбор данных инфраструктуры

Влияние: эффективность работы

Мониторинг рабочей нагрузки включает сбор данных из Решение Azure VMware инфраструктуры и различных компонентов решения VMware. Решение Azure VMware интегрирован с программно-определяемым центром обработки данных (SDDC) VMware, в котором выполняется несколько собственных компонентов решения VMware, таких как VMware Aria. Этот набор средств, включая VMware Aria Operations, можно использовать для управления различными аспектами инфраструктуры.  

Другим инструментом в вашем распоряжении является состояние работоспособности VMware vSphere для Решение Azure VMware. Это средство помогает обеспечить постоянное обнаружение и устранение упреждающих проблем в среде Решение Azure VMware. В частности, это средство находит неправильные конфигурации в инфраструктуре VMware vSphere и обнаруживает узкие места производительности. Он также предоставляет аналитические сведения об использовании ресурсов и общей производительности работоспособности окружающей среды.

VMware Aria Operations for Networks помогает обеспечить полную видимость сети, упростить процессы устранения неполадок и оптимизировать производительность сети.

Рекомендации
  • Настройте состояние работоспособности VMware vSphere, чтобы получить общее представление о состоянии работоспособности Решение Azure VMware частного облака.
  • Используйте сторонние средства, такие как VMware Aria Suite, для улучшения видимости и аналитики Решение Azure VMware сетевой инфраструктуры частного облака.
  • Используйте собственные средства мониторинга Azure, такие как:
    • Azure Monitor.
    • VMware Aria Operations для операционного мониторинга.
    • Политика Azure и связанную с ней панель мониторинга для мониторинга соответствия требованиям.
    • Microsoft Defender для облака и Microsoft Sentinel для мониторинга безопасности.

Управление журналами и архивами

Влияние: эффективность работы

Чтобы получить данные о работоспособности из компонентов решения VMware, необходим доступ к журналам, которые собирает служба системного журнала VMware. Примеры компонентов решения: VMware ESXi, VMware vSAN, VMware NSX-T Data Center и VMware vCenter Server. Журналы из этих компонентов доступны в Решение Azure VMware инфраструктуре. Агент или расширение Log Analytics отправляет гостевые журналы на уровне виртуальной машины в Log Analytics. В Решение Azure VMware можно отправлять журналы Решение Azure VMware в большой двоичный объект собственного хранилища Azure. Для отправки журналов в большой двоичный объект хранилища можно настроить серверы пересылки с централизованного сервера системного журнала или настроить большой двоичный объект в качестве назначения в Azure Monitor. Для пересылки журналов также можно использовать собственное средство Azure, например Azure Logic Apps или Функции Azure. Эти средства можно использовать для создания прослушивателей для входящих журналов из Решение Azure VMware и отправки журналов в большой двоичный объект хранилища.

Архивация журналов — это стратегия для сокращения затрат на хранение. Blob-объекты службы хранилища Azure и Log Analytics могут передавать журналы для долгосрочного архивирования. Использование большого двоичного объекта хранилища является менее затратным вариантом. Но Log Analytics имеет расширенные интеграции для оповещений, визуализации, запросов и получения аналитических сведений на основе машинного обучения. При выборе решения учитывайте бюджет, варианты функционального использования и варианты долгосрочного использования.

Рекомендации
  • Соберите журналы из службы системного журнала VMware, чтобы получить данные о работоспособности из компонентов решения VMware, таких как VMware ESXi, VMware vSAN, VMware NSX-T Data Center и VMware vCenter Server.
  • Настройте такие средства, как VMware Aria Operations для ведения журнала, чтобы собирать различные журналы для запросов, анализа и создания отчетов.
  • Настройте продолжительность хранения для отправки журналов в долгосрочное хранилище, чтобы сократить время выполнения запросов и сэкономить на хранении.

Мониторинг операционной системы на виртуальной машине

Влияние: эффективность работы

В операционной системе на виртуальной машине доступны метрики для использования диска, производительности приложения, использования системных ресурсов и активности пользователей. Рассмотрите возможность использования Azure Arc для Решение Azure VMware (предварительная версия) для управления ресурсами инфраструктуры VMware в Azure. Дополнительные сведения см. в статье Развертывание Azure Arc для Решение Azure VMware.

Рекомендации
  • Включите гостевое управление и установите расширения Azure после включения частного облака с помощью Azure Arc для серверов или Azure Arc для Решение Azure VMware (предварительная версия).
  • Установите дополнительные агенты для сбора данных, чтобы включить управление гостевыми компьютерами и мониторинг на Решение Azure VMware гостевых виртуальных машинах.  

Реализация мониторинга безопасности

Влияние: безопасность, эффективность работы

Мониторинг безопасности имеет решающее значение для обнаружения аномальных действий и реагирования на них. Рабочие нагрузки, выполняемые в Решение Azure VMware частном облаке, нуждаются в комплексном мониторинге безопасности, который охватывает сети, ресурсы Azure и Решение Azure VMware частное облако. Вы можете централизовать события безопасности, развернув рабочую область Microsoft Sentinel. Используя эту интеграцию, команда эксплуатации может просматривать, анализировать и обнаруживать инциденты безопасности в контексте более широкого ландшафта угроз организации.

Рекомендации
  • Включите Defender для облака в подписке Azure, которая используется для развертывания Решение Azure VMware частного облака. Убедитесь, что в плане Defender для облака параметр Защита облачной рабочей нагрузки (CWP) имеет значение ON для серверов.
  • Действия аудита, которые привилегированные пользователи выполняют в Решение Azure VMware частном облаке. Дополнительные сведения см. в разделе Журнал действий аудита для назначений групп в управлении привилегированными пользователями.
  • Интеграция Microsoft Sentinel с Defender для облака. Включите сборщик данных для событий безопасности и подключите его к Defender для облака.
  • Используйте решения для мониторинга безопасности от проверенных партнеров в Решение Azure VMware.

Мониторинг и анализ сетей

Влияние: безопасность, эффективность работы

Процесс мониторинга сети проверяет весь трафик, который поступает в Решение Azure VMware частного облака и выходит из него. В Решение Azure VMware безопасность сети действует на уровнях сети и узла.

Рекомендации
  • Сбор и мониторинг журналов брандмауэра сети, развернутых в Решение Azure VMware частном облаке. Кроме того, отслеживайте журналы, развернутые в Azure, когда приложение распространяется на собственные устройства Azure, такие как Брандмауэр Azure или Шлюз приложений Azure. Дополнительные сведения см. в статье Интеграция брандмауэра с Решением Azure VMware.
  • Используйте Брандмауэр Azure книги или аналогичные средства для мониторинга общих метрик и журналов, связанных с устройствами брандмауэра.
  • Сопоставлять журналы из нескольких векторов безопасности, таких как удостоверения, сети и векторы инфраструктуры.

Настройка и оптимизация оповещений

Влияние: эффективность работы, оптимизация затрат

При выполнении рабочих нагрузок в Решение Azure VMware частном облаке необходимо эффективно отслеживать производительность рабочей нагрузки. Например, следует записывать журналы, метрики и запросы трассировки для уровней приложения и инфраструктуры.

Оповещения помогают реагировать на изменения в базовых показателях производительности. Вы также можете использовать оповещения для предоставления сведений о необходимых изменениях в обслуживании или конфигурации. Например, вы можете получать уведомления о истечении срока действия ключа, потере подключения или о риске превышения емкости ресурса.

Чтобы обеспечить эффективность оповещений, настройте их для уведомления подотчетных команд при соблюдении определенных условий. Кроме того, рассмотрите возможность объединения оповещений, чтобы уменьшить количество отправляемых отдельных уведомлений:

  • Вместо выдачи оповещений для каждого компьютера, на котором мало места, рассмотрите возможность консолидации оповещений по узлам, группам ресурсов или кластерам.
  • Используйте этот подход также при проблемах с узлом, ЦП и пиковых нагрузках хранилища.
  • Создание оповещений по временным окнам. Например, если узел выдает оповещения в течение короткого времени, вы можете отключить оповещения в соответствии с определенным пороговым значением времени. Например, вы можете отправить оповещение только по истечении пяти минут.
Рекомендации
  • Обсудите и определите базовые показатели, основанные на данных о производительности.
  • Определите соответствующие критерии генерации оповещений, такие как пороговые значения, уровни серьезности или конкретные условия.
  • Используйте подсистему событий и оповещений VMware vSphere для мониторинга VMware vSphere и настройки триггеров.
  • Настройка оповещений Azure в Решение Azure VMware для реагирования на события в режиме реального времени.
  • Убедитесь, что оповещения настроены таким образом, чтобы пространство резерва хранилища данных VMware vSAN поддерживалось на уровнях, предусмотренных соглашением об уровне обслуживания (SLA).
  • Настройте оповещения о работоспособности ресурсов, чтобы получать сведения о состоянии работоспособности Решение Azure VMware частном облаке в режиме реального времени.
  • Используйте средства мониторинга производительности приложений (APM) для получения аналитических сведений о производительности на уровне кода приложения.
  • Используйте сочетание методов мониторинга, таких как искусственные транзакции, мониторинг пульса и мониторинг конечных точек.
  • Приоритизация оповещений в зависимости от их влияния на операции или важности затронутых систем. Точная настройка оповещений для активации только значимых событий.
  • Чтобы уменьшить уровень шума и эффективно управлять оповещениями, используйте методы сокращения количества отдельных уведомлений, которые выдаются.
  • Чтобы свести к минимуму усталость от оповещений, используйте механизм уведомления ключевых заинтересованных лиц только о важных событиях.
  • Используйте каналы уведомлений, такие как SMS, электронная почта, push-уведомления и платформы совместной работы, такие как Microsoft Teams, чтобы обеспечить эффективную доставку оповещений.

Управление затратами

Влияние: оптимизация затрат, эффективность работы

Мониторинг затрат — это возможность отслеживать затраты, связанные с Решение Azure VMware частном облаке.

Рекомендации
  • Используйте подсистему событий и оповещений VMware vSphere для мониторинга VMware vSphere и настройки триггеров.
  • Настройка оповещений Azure на основе запросов Log Analytics для Решение Azure VMware. Эти оповещения помогают рабочей группе реагировать на ожидаемые и непредвиденные события в режиме реального времени.

Использование средств устранения неполадок и отладки

Влияние: оптимизация затрат, эффективность работы

Для эффективной отладки и устранения неполадок приложения требуются журналы, метрики и связанные сведения. Эти сведения включают действия событий, позволяющие выявлять, анализировать и устанавливать связи между событиями.

Рекомендации
  • Настройте систему для пересылки журналов из службы системного журнала Решение Azure VMware в Log Analytics. Пересылать все соответствующие журналы, метрики и диагностические сведения.
  • Настройте агент сервера, включенный Azure Arc на гостевых виртуальных машинах, работающих в Решение Azure VMware частном облаке.

Использование панелей мониторинга

Влияние: эффективность работы

Панели мониторинга приложений помогают визуализировать и отслеживать производительность, работоспособность и другие метрики приложения:

  • Отчеты мониторинга на панелях мониторинга помогают быстро анализировать первопричины и устранять неполадки. Операционные группы могут использовать эти панели мониторинга для просмотра всех ключевых ресурсов, составляющих Решение Azure VMware, в одной области.
  • Метрики панели мониторинга позволяют получить представление о том, как изменения кода и инфраструктуры влияют на поведение приложения.
  • Визуальные элементы помогают группам поддержки клиентов понять влияние изменений, проблем с производительностью и доступностью на приложение.
  • Показатели эффективности приносят пользу руководству исполнительной власти и заинтересованным лицам. Эти средства информируют о принятии решений, которые соответствуют производительности приложения бизнес-целям. Например, руководитель может отслеживать обязательства перед клиентами, просматривая такие метрики, как доступность служб, время разрешения инцидентов и среднее время отклика. Эти метрики помогают гарантировать, что организация предоставляет услуги в соответствии с соглашением об уровне обслуживания.

Помимо предоставления аналитических сведений, панели мониторинга также могут повысить прозрачность и стимулировать совместную работу, например, когда вы предоставляете соответствующим заинтересованным лицам доступ к панелям мониторинга приложений. Этот акт культивирует общее понимание производительности приложения. Эта практика также позволяет организации принимать обоснованные решения. В результате заинтересованные лица могут сосредоточиться на реализации важных инициатив, которые продвигают бизнес вперед.

Рекомендации
  • Создание панели мониторинга приложения с помощью Application Insights или Grafana. Подключите панель мониторинга к соответствующим источникам данных, в которой хранятся метрики из среды Решение Azure VMware.
  • Создайте книгу Azure в качестве центрального репозитория для часто выполняемых запросов, метрик и интерактивных отчетов.
  • Убедитесь, что источник данных соответствует требованиям безопасности и соответствия требованиям.
  • Определите элементы управления доступом и разрешения, такие как проверка подлинности пользователей и управление доступом на основе ролей. Убедитесь, что у каждого заинтересованного лица есть соответствующий доступ, основанный на его роли.
  • Проводите периодические проверки доступа, чтобы проверка, что доступ пользователей обновлен и соответствует текущим ролям и обязанностям.

Дальнейшие действия

Теперь, когда вы изучили рекомендации по наблюдаемости в Решение Azure VMware, изучите механизмы, средства и периметры, которые можно использовать для дальнейшей защиты рабочих нагрузок в SDDC.

Используйте средство оценки для оценки вариантов разработки.