Выполнение безопасного развертывания новых развертываний для вывода в режиме реального времени

Статья
10/24/2023

ОБЛАСТЬ ПРИМЕНЕНИЯ:Расширение машинного обучения Azure CLI версии 2 (current)Python SDK azure-ai-ml версии 2 (current)

В этой статье вы узнаете, как развернуть новую версию модели машинного обучения в рабочей среде без каких-либо нарушений. Вы будете использовать стратегию развертывания сине-зеленого цвета (также называемую стратегией безопасного развертывания) для внедрения новой версии веб-службы в рабочую среду. Эта стратегия позволит развернуть новую версию веб-службы в небольшое подмножество пользователей или запросов, прежде чем полностью развернуть ее.

В этой статье предполагается, что вы используете сетевые конечные точки, то есть конечные точки, используемые для вывода в сети (в режиме реального времени). Существует два типа сетевых конечных точек: управляемые и Kubernetes. Дополнительные сведения о конечных точках и различиях между управляемыми сетевыми конечными точками и сетевыми конечными точками Kubernetes см. в статье "Что такое Машинное обучение Azure конечных точек?".

Основной пример в этой статье использует управляемые сетевые конечные точки для развертывания. Чтобы использовать конечные точки Kubernetes, ознакомьтесь с заметками в этом документе, которые встраиваются в обсуждение управляемой сетевой конечной точки.

Из этой статьи вы узнаете следующее.

Определение сетевой конечной точки с помощью развертывания с именем blue для обслуживания модели версии 1
Масштабирование синего развертывания для обработки дополнительных запросов
Разверните версию 2 модели (называемую "зеленым" развертыванием) в конечную точку, но отправьте развертывание без динамического трафика.
Тестирование зеленого развертывания в режиме изоляции.
Зеркальное отображение процента динамического трафика в зеленом развертывании для проверки
Отправка небольшого процента динамического трафика в зеленое развертывание
Отправка по всему динамическому трафику в зеленое развертывание
Удаление более не используемого синего развертывания версии 1.

Необходимые компоненты

Перед выполнением действий, описанных в этой статье, убедитесь, что выполнены следующие необходимые условия:

Azure CLI и расширение ml для Azure CLI. Дополнительные сведения см. в разделе Установка, настройка и использование CLI (версия 2).

Внимание

В примерах CLI в этой статье предполагается, что вы используете оболочку Bash (или совместимый вариант). Например, из системы Linux или подсистемы Windows для Linux.
Рабочая область Машинного обучения Azure. Если у вас ее нет, выполните действия, описанные в разделе Установка, настройка и использование CLI (версия 2), чтобы создать ее.

Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Машинном обучении Azure. Чтобы выполнить действия, описанные в этой статье, учетной записи пользователя должна быть назначена роль владельца или участника для рабочей области Машинного обучения Azure либо пользовательская роль с разрешением Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*. Дополнительные сведения см. в статье Управление доступом к рабочей области Машинного обучения Azure.
(Необязательно) Для локального развертывания необходимо установить подсистему Docker на локальном компьютере. Настоятельно рекомендуем использовать этот вариант, чтобы упростить отладку.

ОБЛАСТЬ ПРИМЕНЕНИЯ: Пакет SDK для Python azure-ai-ml версии 2 (current)

Перед выполнением действий, описанных в этой статье, убедитесь, что выполнены следующие необходимые условия:

Рабочая область Машинного обучения Azure. Если у вас ее нет, создайте ее по инструкциям, приведенным в кратком руководстве по созданию ресурсов рабочей области.
Чтобы установить пакет SDK для Python версии 2, используйте следующую команду:
```
pip install azure-ai-ml azure-identity
```
Чтобы обновить существующую установку пакета SDK до последней версии, выполните следующую команду:
```
pip install --upgrade azure-ai-ml azure-identity
```
Дополнительные сведения см. в статье "Установка пакета SDK для Python версии 2 для Машинное обучение Azure".

Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Машинном обучении Azure. Чтобы выполнить действия, описанные в этой статье, учетной записи пользователя должна быть назначена роль владельца или участника для рабочей области Машинного обучения Azure либо пользовательская роль с разрешением Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*. Дополнительные сведения см. в статье Управление доступом к рабочей области Машинного обучения Azure.
(Необязательно) Для локального развертывания необходимо установить подсистему Docker на локальном компьютере. Настоятельно рекомендуем использовать этот вариант, чтобы упростить отладку.

Перед выполнением действий, описанных в этой статье, убедитесь, что выполнены следующие необходимые условия:

Подписка Azure. Если у вас еще нет подписки Azure, создайте бесплатную учетную запись, прежде чем начинать работу. Попробуйте бесплатную или платную версию Машинного обучения Azure.
Рабочая область Машинное обучение Azure и вычислительный экземпляр. Если у вас нет этих ресурсов, выполните действия, описанные в кратком руководстве. Создание ресурсов рабочей области для их создания.
Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Машинном обучении Azure. Чтобы выполнить действия, описанные в этой статье, учетной записи пользователя должна быть назначена роль владельца или участника для рабочей области Машинного обучения Azure либо пользовательская роль с разрешением Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*. Дополнительные сведения см. в статье Управление доступом к рабочей области Машинного обучения Azure.

Подготовка системы

Настройка переменных среды

Если вы еще не задали параметры по умолчанию для Azure CLI, сохраните их. Чтобы не указывать параметры для подписки, рабочей области и группы ресурсов несколько раз, используйте следующий код:

az account set --subscription <subscription id>
az configure --defaults workspace=<Azure Machine Learning workspace name> group=<resource group>

Клонирование репозитория примеров

Чтобы следовать этой статье, сначала клонируйте репозиторий примеров (azureml-examples). Затем перейдите в каталог репозитория cli/ :

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples
cd cli

Совет

Используется --depth 1 для клонирования только последней фиксации в репозитории. Это сокращает время завершения операции.

Команды, приведенные в этом руководстве, находятся в файле deploy-safe-rollout-online-endpoints.sh в cli каталоге, а файлы конфигурации YAML находятся в подкаталоге endpoints/online/managed/sample/ .

Примечание.

Файлы конфигурации YAML для конечных точек Kubernetes в сети находятся в подкаталоге endpoints/online/kubernetes/ .

Клонирование репозитория примеров

Чтобы запустить примеры обучения, сначала клонируйте репозиторий примеров (azureml-examples). Затем перейдите в azureml-examples/sdk/python/endpoints/online/managed каталог:

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/sdk/python/endpoints/online/managed

Совет

Сведения в этой статье основаны на записной книжке online-endpoints-safe-rollout.ipynb . Он содержит то же содержимое, что и эта статья, хотя порядок кодов немного отличается.

Примечание.

Действия для веб-конечной точки Kubernetes основаны на записной книжке kubernetes-online-endpoints-safe-rollout.ipynb .

Подключение к рабочей области Машинного обучения Azure

Рабочая область — это ресурс верхнего уровня для Машинного обучения Azure, который обеспечивает централизованное расположение для работы со всеми артефактами, созданными в Машинном обучении Azure. В этом разделе мы подключимся к рабочей области, в которой будут выполняться задачи развертывания. Чтобы продолжить, откройте online-endpoints-safe-rollout.ipynb записную книжку.

Импортируйте необходимые библиотеки:
```
# import required libraries
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    Model,
    Environment,
    CodeConfiguration,
)
from azure.identity import DefaultAzureCredential
```
Примечание.

Если вы используете конечную точку Kubernetes online, импортируйте KubernetesOnlineEndpoint и KubernetesOnlineDeployment класс из библиотеки azure.ai.ml.entities .
Настройте сведения о рабочей области и получите дескриптор для рабочей области:

Чтобы подключиться к рабочей области, нам нужны параметры идентификатора — подписка, группа ресурсов и имя рабочей области. Мы будем использовать эти сведения в MLClient из azure.ai.ml для получения дескриптора необходимой рабочей области машинного обучения Azure. В этом примере используется проверка подлинности Azure по умолчанию.
```
# enter details of your AML workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AML_WORKSPACE_NAME>"
```
```
# get a handle to the workspace
ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)
```

Если на локальном компьютере установлен Git, следуйте инструкциям, чтобы клонировать репозиторий примеров. В противном случае следуйте инструкциям по скачиванию файлов из репозитория примеров.

Клонирование репозитория примеров

Для выполнения этой статьи сначала клонируйте репозиторий примеров (azureml-examples), а затем перейдите azureml-examples/cli/endpoints/online/model-1 в каталог.

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/cli/endpoints/online/model-1

Совет

При использовании параметра --depth 1 клонируется только последняя фиксация, что сокращает время выполнения операции.

Скачивание файлов из репозитория примеров

Если вы клонировали репозиторий примеров, локальный компьютер уже имеет копии файлов для этого примера, и вы можете перейти к следующему разделу. Если вы не клонируйте репозиторий, его можно скачать на локальный компьютер.

Переход к https://github.com/Azure/azureml-examples/.
Перейдите к кнопке "Код" на странице и выберите "Скачать ZIP" на вкладке "Локальный".<>
Найдите папку /cli/endpoints/online/model-1/model модели и скрипт /cli/endpoints/online/model-1/onlinescoring/score.py оценки для первой модели model-1.
Найдите папку /cli/endpoints/online/model-2/model модели и скрипт /cli/endpoints/online/model-2/onlinescoring/score.py оценки для второй модели model-2.

Определение конечной точки и развертывания

Подключенные конечные точки используются для вывода онлайн (в режиме реального времени). Сетевые конечные точки содержат развертывания, которые готовы получать данные от клиентов и отправлять ответы обратно в режиме реального времени.

Определение конечной точки

В следующей таблице перечислены ключевые атрибуты, которые необходимо указать при определении конечной точки.

Атрибут	Описание
Имя.	Необходимые. Имя конечной точки. Оно должно быть уникальным в рамках региона Azure. Дополнительные сведения о правилах именования см. в разделе "Ограничения конечной точки".
Режим проверки подлинности	Способ проверки подлинности для конечной точки. Выберите проверку подлинности на основе ключей и проверку подлинности `keyaml_token`на основе маркеров Машинное обучение Azure. Срок действия ключа не истекает, но срок действия маркера истекает. Дополнительные сведения о проверке подлинности см. в статье Проверка подлинности подключенной конечной точки.
Description	Описание конечной точки.
Теги	Словарь тегов для конечной точки.
Трафик	Правила маршрутизации трафика между развертываниями. Представляет трафик в виде словаря пар "ключ-значение", где ключ представляет имя развертывания и значение, представляет процент трафика для этого развертывания. Трафик можно задать только при создании развертываний в конечной точке. Вы также можете обновить трафик для сетевой конечной точки после создания развертываний. Дополнительные сведения об использовании зеркало трафика см. в статье "Выделение небольшого процента динамического трафика для нового развертывания".
Зеркальный трафик	Процент динамического трафика для зеркального отображения в развертывании. Дополнительные сведения об использовании зеркало трафика см. в статье "Тестирование развертывания с использованием зеркало трафика".

Полный список атрибутов, которые можно указать при создании конечной точки, см. в статье CLI (версия 2) схема YAML веб-конечной точки или класс MANAGEDOnlineEndpoint версии 2.

Определение развертывания

Развертывание представляет собой набор ресурсов, необходимых для размещения модели, которая выполняет процесс вывода. В следующей таблице описываются ключевые атрибуты, которые необходимо указать при определении развертывания.

Атрибут	Описание
Имя.	Необходимые. Имя развертывания.
Имя конечной точки	Обязательный. Имя конечной точки для создания развертывания.
Модель	Модель, которая будет использоваться для развертывания. Это значение может быть ссылкой на существующую модель с управлением версиями в рабочей области или спецификацией встроенной модели. В нашем примере есть модель scikit-learn, выполняющая регрессию.
Путь к коду	Путь к каталогу в локальной среде разработки, содержащей весь исходный код Python для оценки модели. Вы можете использовать вложенные каталоги и пакеты.
Scoring script (Скрипт оценки)	Код Python, который выполняет модель в заданном входном запросе. Это значение может быть относительным путем к файлу оценки в каталоге исходного кода. Скрипт оценки получает данные, отправленные в развернутую веб-службу, и передает его модели. Затем скрипт выполняет модель и возвращает ответ клиенту. Скрипт оценки зависит от модели и должен понимать данные, которые модель ожидает в качестве входных данных и возвращает в качестве выходных данных. В этом примере у нас есть файл score.py . Этот код Python должен содержать функции `init()` и `run()`. Функция `init()` будет вызвана после создания или обновления модели (например, можно использовать ее для кэширования модели в памяти). Функция `run()` вызывается при каждом вызове конечной точки для фактического выполнения оценки и прогнозирования.
Среда	Обязательный. Среда для размещения модели и кода. Это значение может быть ссылкой на существующую среду с управлением версиями в рабочей области или спецификацией встроенной среды. Среда может быть образом Docker с зависимостями Conda, Dockerfile или зарегистрированной средой.
Тип экземпляра	Обязательный. Размер виртуальной машины, используемый для развертывания. Список поддерживаемых размеров см. в списке SKU управляемых сетевых конечных точек.
Число экземпляров	Обязательный. Число экземпляров, которые будут использоваться для развертывания. Это значение должно быть основано на предполагаемой рабочей нагрузке. Для обеспечения высокой доступности рекомендуется задать значение по крайней мере `3`. Мы резервируем дополнительные 20 % для выполнения обновлений. Дополнительные сведения см. в разделе об ограничениях для сетевых конечных точек.

Полный список атрибутов, которые можно указать при создании развертывания, см. в статье CLI (версия 2) управляемого сетевого развертывания yaml schema or SDK (v2) ManagedOnlineDeployment Class.

Создание сетевой конечной точки

Сначала задайте имя конечной точки и настройте ее. В этой статье вы будете использовать файл endpoints/online/managed/sample/endpoint.yml для настройки конечной точки. В следующем фрагменте кода показано содержимое файла:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

Справка по формату YAML конечной точки представлена в приведенной ниже таблице. Чтобы узнать, как указать эти атрибуты, ознакомьтесь со ссылкой на YAML для веб-конечной точки. Сведения об ограничениях, связанных с управляемыми сетевыми конечными точками, см. в разделе об ограничениях для сетевых конечных точек.

Ключ.	Description
`$schema`	(Необязательно) Схема YAML. Чтобы просмотреть все доступные параметры в ФАЙЛЕ YAML, можно просмотреть схему в предыдущем фрагменте кода в браузере.
`name`	Имя конечной точки.
`auth_mode`	Используйте `key` для аутентификации на основе ключей. Используйте `aml_token` для проверки подлинности в службе "Машинное обучение Azure" на основе маркеров. Чтобы получить последний маркер, используйте `az ml online-endpoint get-credentials` команду.

Чтобы создать конечную точку в Сети, выполните приведенные действия.

Задайте имя конечной точки:

Для Unix выполните следующую команду (замените YOUR_ENDPOINT_NAME уникальным именем):
```
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
```
Внимание

Имена конечных точек должны быть уникальными в рамках региона Azure. Например, в регионе westus2 Azure может быть только одна конечная точка с именем my-endpoint.
Создайте конечную точку в облаке:

Выполните следующий код, чтобы использовать файл для настройки конечной endpoint.yml точки:
```
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/managed/sample/endpoint.yml
```

Создание "синего" развертывания

В этой статье вы будете использовать файл endpoints/online/managed/sample/blue-deployment.yml для настройки ключевых аспектов развертывания. В следующем фрагменте кода показано содержимое файла:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: blue
endpoint_name: my-endpoint
model:
  path: ../../model-1/model/
code_configuration:
  code: ../../model-1/onlinescoring/
  scoring_script: score.py
environment: 
  conda_file: ../../model-1/environment/conda.yaml
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
instance_type: Standard_DS3_v2
instance_count: 1

Чтобы создать развертывание с именем blue конечной точки, выполните следующую команду, чтобы использовать blue-deployment.yml файл для настройки.

az ml online-deployment create --name blue --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/blue-deployment.yml --all-traffic

Внимание

Флаг --all-traffic в az ml online-deployment create выделении 100 % трафика конечной точки только что созданному синему развертыванию.

blue-deployment.yaml В файле мы укажем path (где отправлять файлы из) встраиваем. CLI автоматически отправляет файлы и регистрирует модель и среду. Для рабочей среды рекомендуется отдельно зарегистрировать модель и среду, а также указать зарегистрированное имя и версию в YAML. Используйте формат model: azureml:my-model:1 или environment: azureml:my-env:1.

Для регистрации вы можете извлечь определения YAML model и environment в отдельные файлы YAML и использовать команды az ml model create и az ml environment create. Чтобы узнать больше об этих командах, выполните команду az ml model create -h и az ml environment create -h.

Дополнительные сведения о регистрации модели в качестве ресурса см. в разделе "Регистрация модели в качестве ресурса" в Машинное обучение с помощью интерфейса командной строки. Дополнительные сведения о создании среды см. в статье "Управление средами Машинное обучение Azure с помощью ИНТЕРФЕЙСА командной строки и пакета SDK (версия 2)".

Создание сетевой конечной точки

Чтобы создать управляемую конечную точку ManagedOnlineEndpoint в Сети, используйте класс. Этот класс позволяет пользователям настраивать ключевые аспекты конечной точки.

Настройка конечной точки:

# Creating a unique endpoint name with current datetime to avoid conflicts
import random

online_endpoint_name = "endpt-moe-" + str(random.randint(0, 10000))

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint",
    auth_mode="key",
    tags={"foo": "bar"},
)

Примечание.

Чтобы создать конечную точку Kubernetes online, используйте KubernetesOnlineEndpoint класс.

Создание конечной точки:

ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Создание "синего" развертывания

Чтобы создать развертывание для управляемой сетевой конечной точки, используйте ManagedOnlineDeployment класс. Этот класс позволяет пользователям настраивать ключевые аспекты развертывания. В следующей таблице описываются атрибуты a deployment:

Настройка синего развертывания:
```
# create blue deployment
model = Model(path="../model-1/model/sklearn_regression_model.pkl")
env = Environment(
    conda_file="../model-1/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    code_configuration=CodeConfiguration(
        code="../model-1/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)
```
В этом примере мы указываем path (откуда загружать файлы) встроенным. Пакет SDK автоматически отправляет файлы и регистрирует модель и среду. Рекомендуется зарегистрировать модель и среду в рабочей среде и указать зарегистрированное имя и версию отдельно в кодах.

Дополнительные сведения о регистрации модели в качестве ресурса см. в разделе "Регистрация модели в качестве ресурса" в Машинное обучение с помощью пакета SDK.

Дополнительные сведения о создании среды см. в статье "Управление средами Машинное обучение Azure с помощью ИНТЕРФЕЙСА командной строки и пакета SDK (версия 2)".

Примечание.

Чтобы создать развертывание для веб-конечной точки Kubernetes, используйте KubernetesOnlineDeployment класс.

Создание развертывания:

ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.online_endpoints.begin_create_or_update(endpoint).result()

При создании управляемой сетевой конечной точки в Студия машинного обучения Azure необходимо определить начальное развертывание для конечной точки. Прежде чем определить развертывание, необходимо иметь зарегистрированную модель в рабочей области. Начнем с регистрации модели, используемой для развертывания.

Регистрация модели

Регистрация модели — это логическая сущность в рабочей области. Эта сущность может содержать один файл модели или каталог нескольких файлов. Рекомендуется зарегистрировать модель и среду в рабочей среде. При создании конечной точки и развертывания в этой статье предполагается, что вы зарегистрировали папку модели, содержащую модель.

Чтобы зарегистрировать пример модели, выполните следующие действия.

Перейдите в Студию машинного обучения Azure.
Перейдите на вкладку Модели на панели навигации слева.
Выберите " Регистрация" и выберите " Из локальных файлов".
Выберите неуказанный тип для типа модели.
Нажмите кнопку "Обзор" и выберите "Обзор папки".
\azureml-examples\cli\endpoints\online\model-1\model Выберите папку из локальной копии репозитория, клонированного или скачаемого ранее. При появлении запроса нажмите кнопку "Отправить " и подождите завершения отправки.
Нажмите кнопку "Далее" после завершения отправки папки.
Введите понятное Имя модели. Действия, описанные в этой статье, предполагают, что модель называется model-1.
Нажмите Далее, а затем Зарегистрировать для завершения регистрации.
Повторите предыдущие шаги, чтобы зарегистрировать model-2 папку \azureml-examples\cli\endpoints\online\model-2\model в локальной копии репозитория, клонированного или скачаного ранее.

См. дополнительные сведения о регистрации моделей и работе с ними".

Сведения о создании среды в студии см. в статье "Создание среды".

Создание управляемой сетевой конечной точки и развертывания blue

Используйте Студия машинного обучения Azure для создания управляемой сетевой конечной точки непосредственно в браузере. При создании управляемой сетевой конечной точки в студии необходимо определить первоначальное развертывание. Создание пустой такой точки невозможно.

Одним из способов создания управляемой сетевой конечной точки в студии является страница "Модели ". Этот метод также предоставляет простой способ добавления модели в существующее управляемое сетевое развертывание. Чтобы развернуть модель с именем model-1 , зарегистрированной ранее в разделе "Регистрация модели ", выполните указанные ниже действия.

Перейдите в Студию машинного обучения Azure.
Перейдите на вкладку Модели на панели навигации слева.
Выберите модель с именемmodel-1, проверка круг рядом с его именем.
Выберите "Развернуть>конечную точку в режиме реального времени".

Это действие открывает окно, в котором можно указать сведения о конечной точке.
Введите имя конечной точки.
Сохраните выбранные по умолчанию параметры: управляемое для типа вычислений и проверки подлинности на основе ключей для типа проверки подлинности .
Нажмите кнопку "Далее", пока не получите на страницу "Развертывание". Здесь выполните следующие задачи:
- Присвойте развертыванию "синий".
- Установите флажок Включить Аналитика диагностика приложения и сбор данных, чтобы вы могли просматривать графики действий конечной точки в студии позже.
Нажмите кнопку "Далее ", чтобы перейти на страницу "Среда". Ниже приведены действия.
- В поле "Выбор файла оценки и зависимостей" найдите и выберите \azureml-examples\cli\endpoints\online\model-1\onlinescoring\score.py файл из репозитория, клонированного или скачаированного ранее.
- Начните вводить sklearn в поле поиска над списком сред и выберите среду AzureML-sklearn-0.24 .
Нажмите кнопку "Далее ", чтобы перейти на страницу "Вычисления". Здесь сохраните выбор по умолчанию для виртуальной машины "Standard_DS3_v2" и измените число экземпляров на 1.
Нажмите кнопку "Далее", чтобы принять выделение трафика по умолчанию (100 %) к синему развертыванию.
Просмотрите параметры развертывания и нажмите кнопку "Создать ".

Кроме того, можно создать управляемую конечную точку в сети на странице конечных точек в студии.

Перейдите в Студию машинного обучения Azure.
На панели навигации слева выберите Конечные точки.
Выберите + Создать.

Это действие открывает окно для указания сведений о конечной точке и развертывании. Введите параметры для конечной точки и развертывания, как описано на предыдущих шагах 5-11, принимая значения по умолчанию, пока не появится запрос на создание развертывания.

Подтверждение существующего развертывания

Один из способов подтверждения существующего развертывания — вызвать конечную точку, чтобы оценить модель для заданного входного запроса. При вызове конечной точки с помощью интерфейса командной строки или пакета SDK для Python можно указать имя развертывания, которое будет получать входящий трафик.

Примечание.

В отличие от интерфейса командной строки или пакета SDK для Python, Студия машинного обучения Azure требует указания развертывания при вызове конечной точки.

Вызов конечной точки с именем развертывания

При вызове конечной точки с именем развертывания, которое будет получать трафик, Машинное обучение Azure перенаправит трафик конечной точки непосредственно в указанное развертывание и возвращает выходные данные. Чтобы указать развертывание, можно использовать --deployment-name параметр CLI версии 2 или deployment_name для пакета SDK версии 2 .

Вызов конечной точки без указания развертывания

Если вы вызываете конечную точку без указания развертывания, которое будет получать трафик, Машинное обучение Azure перенаправит входящий трафик конечной точки в развертывание в конечной точке на основе параметров управления трафиком.

Параметры управления трафиком выделяют указанные проценты входящего трафика для каждого развертывания в конечной точке. Например, если правила трафика указывают, что определенное развертывание в конечной точке получит входящие трафик 40 % времени, Машинное обучение Azure будет направлять 40 % трафика конечной точки в это развертывание.

Чтобы проверить состояние существующей конечной точки и развертывания, выполните следующую команду:

az ml online-endpoint show --name $ENDPOINT_NAME 

az ml online-deployment show --name blue --endpoint $ENDPOINT_NAME

Вы должны увидеть конечную точку с именем $ENDPOINT_NAME и развертывание blue.

Тестирование конечной точки с образцами данных

Конечную точку можно вызвать с помощью invoke команды. Мы отправим пример запроса с помощью json-файла.

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json

Проверьте статус, чтобы узнать, удалось ли развернуть модель без ошибок:

ml_client.online_endpoints.get(name=online_endpoint_name)

Тестирование конечной точки с образцами данных

Используя созданный ранее объект MLClient, мы получим дескриптор конечной точки. Конечную точку можно вызвать с помощью команды invoke со следующими параметрами:

endpoint_name — имя конечной точки
request_file — файл с данными запроса
deployment_name — имя конкретного развертывания для тестирования в конечной точке.

Мы отправим пример запроса с помощью json-файла.

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="../model-1/sample-request.json",
)

Масштабирование существующего развертывания для обслуживания большего трафика

В развертывании, описанном в разделе Развертывание и оценка модели машинного обучения с помощью подключенной конечной точки, необходимо задать для параметра instance_count в файле развертывания yaml значение 1. Вы можете горизонтально увеличить масштаб с помощью команды update:

az ml online-deployment update --name blue --endpoint-name $ENDPOINT_NAME --set instance_count=2

Примечание.

Обратите внимание, что в приведенной выше команде используется --set для переопределения конфигурации развертывания. Кроме того, можно обновить файл yaml и передать его в качестве входных данных для команды update, используя входные данные --file.

Используя созданный ранее объект MLClient, мы получим дескриптор развертывания. Развертывание можно масштабировать путем увеличения или уменьшения instance_count.

# scale the deployment
blue_deployment = ml_client.online_deployments.get(
    name="blue", endpoint_name=online_endpoint_name
)
blue_deployment.instance_count = 2
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

Получение сведений о конечной точке

# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

Развертывание новой модели без трафика

Создайте пакет развертывания с именем green:

az ml online-deployment create --name green --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/green-deployment.yml

Так как мы явно не выделили трафик green, он имеет нулевой трафик, выделенный для него. Вы можете проверить это с помощью команды:

az ml online-endpoint show -n $ENDPOINT_NAME --query traffic

Тестирование нового развертывания

Несмотря на то, что для green выделено 0% трафика, его можно вызвать напрямую, указав имя --deployment:

az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment-name green --request-file endpoints/online/model-2/sample-request.json

Если вы хотите с помощью клиента REST непосредственно вызвать развертывание без прохода по правилам трафика, задайте следующий заголовок HTTP: azureml-model-deployment: <deployment-name>. В приведенном ниже фрагменте кода используется curl для прямого вызова развертывания. Фрагмент кода должен работать в средах Unix/WSL:

# get the scoring uri
SCORING_URI=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query scoring_uri)
# use curl to invoke the endpoint
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --header "azureml-model-deployment: green" --data @endpoints/online/model-2/sample-request.json

Создайте новое развертывание для управляемой сетевой конечной точки и присвойте развертыванию greenимя:

# create green deployment
model2 = Model(path="../model-2/model/sklearn_regression_model.pkl")
env2 = Environment(
    conda_file="../model-2/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

green_deployment = ManagedOnlineDeployment(
    name="green",
    endpoint_name=online_endpoint_name,
    model=model2,
    environment=env2,
    code_configuration=CodeConfiguration(
        code="../model-2/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)

# use MLClient to create green deployment
ml_client.online_deployments.begin_create_or_update(green_deployment).result()

Примечание.

Если вы создаете развертывание для виртуальной конечной точки Kubernetes, используйте KubernetesOnlineDeployment класс и укажите тип экземпляра Kubernetes в кластере Kubernetes.

Тестирование нового развертывания

Хотя green у вас есть 0 % выделенного трафика, вы по-прежнему можете вызвать конечную точку и развертывание с помощью json-файла .

ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="green",
    request_file="../model-2/sample-request.json",
)

Создайте новое развертывание для добавления в управляемую конечную точку в Сети и присвойте развертыванию greenимя.

На странице Сведения о конечной точке выполните указанные ниже действия.

Нажмите кнопку " Добавить развертывание " на странице "Сведения" конечной точки.
Выберите " Развернуть модель".
Нажмите кнопку "Далее", чтобы перейти на страницу "Модель" и выберите модель-2.
Нажмите кнопку "Далее ", чтобы перейти на страницу "Развертывание" и выполните следующие задачи:
1. Присвойте развертыванию "зеленый".
2. Включите диагностика application Insights и сбор данных.
Нажмите кнопку "Далее ", чтобы перейти на страницу "Среда". Ниже приведены действия.
- В поле "Выбор файла оценки и зависимостей" найдите и выберите \azureml-examples\cli\endpoints\online\model-2\onlinescoring\score.py файл из репозитория, клонированного или скачаированного ранее.
- Начните вводить sklearn в поле поиска над списком сред и выберите среду AzureML-sklearn-0.24 .
Нажмите кнопку "Далее ", чтобы перейти на страницу "Вычисления". Здесь сохраните выбор по умолчанию для виртуальной машины "Standard_DS3_v2" и измените число экземпляров на 1.
Нажмите кнопку "Далее ", чтобы перейти на страницу "Трафик". Здесь следует сохранить распределение трафика по умолчанию для развертываний (100 % трафика на синий и 0 % — зеленый).
Нажмите кнопку "Далее ", чтобы просмотреть параметры развертывания.
Нажмите кнопку "Создать ", чтобы создать развертывание.

Кроме того, для добавления развертывания можно использовать страницу Модели.

Перейдите на вкладку Модели на панели навигации слева.
Выберите модель, щелкнув кружок рядом с ее именем.
Выберите "Развернуть>конечную точку в режиме реального времени".
Выберите развертывание в существующей управляемой сетевой конечной точке.
Выполните предыдущие шаги 3–9, чтобы завершить создание зеленого развертывания.

Примечание.

При добавлении нового развертывания в конечную точку можно настроить баланс трафика между развертываниями на странице "Трафик". Однако на этом этапе следует сохранить распределение трафика по умолчанию для развертываний (100% трафика на "синий" и 0% трафика на "зеленый").

Тестирование нового развертывания

Хотя green выделено 0% трафика, можно вызвать конечную точку и развертывание. Перейдите на вкладку "Тест" на странице сведений о конечной точке, чтобы протестировать управляемое сетевое развертывание. Введите тестовые входные данные и просмотрите результаты.

Откройте вкладку Тест на странице сведений о конечной точке.
Выберите зеленое развертывание в раскрывающемся меню.
Скопируйте пример входных данных из json-файла .
Вставьте пример входных данных в поле теста.
Выберите Тест.

Тестирование развертывания с зеркальным трафиком

После тестирования green развертывания вы можете зеркало (или скопировать) процент динамического трафика. Трафик зеркало (также называемый тень) не изменяет результаты, возвращенные клиентам, — запросы по-прежнему потоком 100 % к развертываниюblue. Зеркало процент трафика копируется и отправляется в green развертывание, чтобы вы могли собирать метрики и ведение журнала, не влияя на ваши клиенты. Зеркалирование удобно применить в том случае, когда требуется проверить новое развертывание без влияния на клиентов. Например, можно использовать зеркало для проверка, если задержка находится в допустимых границах или проверка отсутствуют ошибки HTTP. Тестирование нового развертывания с помощью трафика зеркало/тени также называется теневым тестированием. Развертывание, green получающее зеркало зеркало трафик (в данном случае развертывание) также можно назвать теневым развертыванием.

Зеркалирование имеет следующие ограничения:

Зеркальное отображение поддерживается для интерфейса командной строки (версии 2.4.0 или более поздней) и пакета SDK Для Python версии 2 (версия 1.0.0 или более поздней). Если вы используете старую версию CLI/SDK для обновления конечной точки, вы потеряете параметр трафика зеркало.
Зеркальное отображение в настоящее время не поддерживается для конечных точек Kubernetes online.
Трафик можно зеркало только к одному развертыванию в конечной точке.
Максимальный процент трафика, который можно зеркало, составляет 50 %. Это ограничение заключается в том, чтобы уменьшить влияние квоты пропускной способности конечной точки (по умолчанию 5 МБ PS) — пропускная способность конечной точки регулируется, если превышена выделенная квота. Дополнительные сведения о мониторинге регулирования пропускной способности см. в разделе Мониторинг управляемых подключенных конечных точек.

Кроме того, обратите внимание на следующее поведение:

Развертывание можно настроить для получения только динамического трафика или зеркало трафика, а не для обоих.
При вызове конечной точки можно указать имя любого из его развертываний ( даже теневого развертывания), чтобы вернуть прогноз.
При вызове конечной точки с именем развертывания, которое будет получать входящий трафик, Машинное обучение Azure не будет зеркало трафика в теневое развертывание. Машинное обучение Azure зеркало трафик к теневому развертыванию от трафика, отправленного в конечную точку, если не указать развертывание.

Теперь давайте задали зеленое развертывание для получения 10 % зеркало трафика. Клиенты по-прежнему получат прогнозы только из синего развертывания.

Diagram showing 10% traffic mirrored to one deployment.

Следующая команда зеркалирует 10 % трафика в развертывание green:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=10"

Вы можете протестировать трафик зеркало, вызвав конечную точку несколько раз, не указав развертывание для получения входящего трафика:

for i in {1..20} ; do
    az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
done

Вы можете убедиться, что определенный процент трафика был отправлен green в развертывание, просмотрив журналы из развертывания:

az ml online-deployment get-logs --name blue --endpoint $ENDPOINT_NAME

После тестирования можно задать нулевое значение для зеркалирования трафика, чтобы отключить зеркалирование:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=0"

Следующая команда зеркалирует 10 % трафика в развертывание green:

endpoint.mirror_traffic = {"green": 10}
ml_client.begin_create_or_update(endpoint).result()

# You can test mirror traffic by invoking the endpoint several times
for i in range(20):
    ml_client.online_endpoints.invoke(
        endpoint_name=online_endpoint_name,
        request_file="../model-1/sample-request.json",
    )

ml_client.online_deployments.get_logs(
    name="green", endpoint_name=online_endpoint_name, lines=50
)

endpoint.mirror_traffic = {"green": 0}
ml_client.begin_create_or_update(endpoint).result()

Чтобы зеркало 10 % трафика к развертываниюgreen:

На странице сведений о конечной точке выберите "Обновить трафик".
Сместите кнопку, чтобы включить зеркало трафик.
Выберите зеленое развертывание в раскрывающемся меню "Имя развертывания".
Сохраните выделение трафика по умолчанию 10 %.
Выберите Обновить.

На странице сведений о конечной точке теперь отображается зеркало распределение трафика 10 % для green развертывания.

Чтобы проверить зеркало трафик, ознакомьтесь с вкладками Azure CLI или Python, чтобы вызвать конечную точку несколько раз. Убедитесь, что определенный процент трафика был отправлен green в развертывание, просмотрив журналы из развертывания. Журналы развертывания можно получить на вкладке журналов развертывания конечной точки. Вы также можете использовать метрики и журналы для мониторинга производительности зеркало трафика. Дополнительные сведения см. в статье Отслеживание сетевых конечных точек.

После тестирования можно отключить зеркало ing:

На странице сведений о конечной точке выберите "Обновить трафик".
Переместите кнопку рядом с параметром "Включить зеркало е трафик", чтобы отключить зеркало трафик.
Выберите Обновить.

Выделение небольшого процента динамического трафика для нового развертывания

После тестирования развертывания green выделите ему небольшой процент трафика:

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=90 green=10"

После тестирования развертывания green выделите ему небольшой процент трафика:

endpoint.traffic = {"blue": 90, "green": 10}
ml_client.begin_create_or_update(endpoint).result()

После тестирования развертывания green выделите ему небольшой процент трафика:

На странице сведений о конечной точке выберите "Обновить трафик".
Настройте трафик развертывания, распределив 10 % зеленым развертыванием и 90 % для синего развертывания.
Выберите Обновить.

Совет

Общий процент трафика должен превышать 0 % (для отключения трафика) или 100 % (для включения трафика).

Теперь развертывание green получает 10% от всего динамического трафика. Клиенты получат прогнозы как от развертываний blue , так и green от развертывания.

Diagram showing traffic split between deployments.

Отправка всего трафика на новое развертывание

Когда вы полностью удовлетворены green развертыванием, переключите весь трафик на него.

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=0 green=100"

Когда вы полностью удовлетворены green развертыванием, переключите весь трафик на него.

endpoint.traffic = {"blue": 0, "green": 100}
ml_client.begin_create_or_update(endpoint).result()

Когда вы полностью удовлетворены green развертыванием, переключите весь трафик на него.

На странице сведений о конечной точке выберите "Обновить трафик".
Настройте трафик развертывания, распределив 100 % зеленым развертыванием и 0 % к синему развертыванию.
Выберите Обновить.

Удаление старого развертывания

Чтобы удалить отдельное развертывание из управляемой сетевой конечной точки, выполните указанные ниже действия. Удаление отдельного развертывания влияет на другие развертывания в управляемой сетевой конечной точке:

az ml online-deployment delete --name blue --endpoint $ENDPOINT_NAME --yes --no-wait

ml_client.online_deployments.begin_delete(
    name="blue", endpoint_name=online_endpoint_name
).wait()

Удаление конечной точки и развертывания

Если вы не собираетесь использовать конечную точку и развертывание, удалите их. Удалив конечную точку, вы также удалите все его базовые развертывания.

az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

Выполнение безопасного развертывания новых развертываний для вывода в режиме реального времени

Необходимые компоненты

Подготовка системы

Настройка переменных среды

Клонирование репозитория примеров

Клонирование репозитория примеров

Подключение к рабочей области Машинного обучения Azure

Клонирование репозитория примеров

Скачивание файлов из репозитория примеров

Определение конечной точки и развертывания

Определение конечной точки

Определение развертывания

Создание сетевой конечной точки

Создание "синего" развертывания

Создание сетевой конечной точки

Создание "синего" развертывания

Регистрация модели

Создание управляемой сетевой конечной точки и развертывания blue

Подтверждение существующего развертывания

Вызов конечной точки с именем развертывания

Вызов конечной точки без указания развертывания

Тестирование конечной точки с образцами данных

Тестирование конечной точки с образцами данных

Просмотр управляемых сетевых конечных точек

Тестирование конечной точки с образцами данных

Масштабирование существующего развертывания для обслуживания большего трафика

Получение сведений о конечной точке

Развертывание новой модели без трафика

Тестирование нового развертывания

Тестирование нового развертывания

Тестирование нового развертывания

Тестирование развертывания с зеркальным трафиком

Выделение небольшого процента динамического трафика для нового развертывания

Отправка всего трафика на новое развертывание

Удаление старого развертывания

Удаление конечной точки и развертывания

Дополнительные ресурсы

Выполнение безопасного развертывания новых развертываний для вывода в режиме реального времени

Необходимые компоненты

Подготовка системы

Настройка переменных среды

Клонирование репозитория примеров

Определение конечной точки и развертывания

Определение конечной точки

Определение развертывания

Создание сетевой конечной точки

Создание "синего" развертывания

Подтверждение существующего развертывания

Вызов конечной точки с именем развертывания

Вызов конечной точки без указания развертывания

Тестирование конечной точки с образцами данных

Масштабирование существующего развертывания для обслуживания большего трафика

Развертывание новой модели без трафика

Тестирование нового развертывания

Тестирование развертывания с зеркальным трафиком

Выделение небольшого процента динамического трафика для нового развертывания

Отправка всего трафика на новое развертывание

Удаление старого развертывания

Удаление конечной точки и развертывания

Связанный контент

Дополнительные ресурсы