AksEndpointDeploymentConfiguration Класс

Примечание

Это экспериментальный класс, который может быть изменен в любое время. Дополнительные сведения см. по адресу https://aka.ms/azuremlexperimental.

Представляет сведения о конфигурации развертывания для службы, развернутой в Службе Kubernetes Azure.

Создает объект AksEndpointDeploymentConfiguration с помощью метода deploy_configuration класса AksEndpoint.

Инициализируйте объект конфигурации для развертывания конечной точки в целевом объекте вычислений AKS.

Наследование
AksEndpointDeploymentConfiguration

Конструктор

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Параметры

autoscale_enabled
bool
Обязательно

Указывает, следует ли включить автомасштабирование для этой Веб-службы. По умолчанию используется значение True, если num_replicas = None (Нет).

autoscale_min_replicas
int
Обязательно

Минимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. По умолчанию равен 1.

autoscale_max_replicas
int
Обязательно

Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию равно 10.

autoscale_refresh_seconds
int
Обязательно

Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.

autoscale_target_utilization
int
Обязательно

Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.

collect_model_data
bool
Обязательно

Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.

auth_enabled
bool
Обязательно

Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

cpu_cores
float
Обязательно

Количество ядер ЦП, выделяемых для этой Веб-службы. Может выражаться десятичным числом. Значение по умолчанию — 0,1

memory_gb
float
Обязательно

Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5

enable_app_insights
bool
Обязательно

Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.

scoring_timeout_ms
int
Обязательно

Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.

replica_max_concurrent_requests
int
Обязательно

Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.

max_request_wait_time
int
Обязательно

Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.

num_replicas
int
Обязательно

Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.

primary_key
str
Обязательно

Первичный ключ проверки подлинности, используемый для этой веб-службы.

secondary_key
str
Обязательно

Вторичный ключ проверки подлинности, используемый для этой веб-службы.

tags
dict[str, str]
Обязательно

Словарь тегов значений ключа для предоставления этой веб-службе

properties
dict[str, str]
Обязательно

Словарь свойств значений ключа для предоставления этой веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".

description
str
Обязательно

Описание для предоставления этой веб-службе.

gpu_cores
int
Обязательно

Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.

period_seconds
int
Обязательно

Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.

initial_delay_seconds
int
Обязательно

Количество секунд после запуска контейнера перед инициированием пробы активности. Значение по умолчанию — 310.

timeout_seconds
int
Обязательно

Период в секундах, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.

success_threshold
int
Обязательно

Минимальное число последовательных успешных попыток проведения пробы активности после сбоя, которое нужно, чтобы проба считалась успешной. По умолчанию равен 1. Минимальное значение — 1.

failure_threshold
int
Обязательно

Количество попыток (failureThreshold), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.

namespace
str
Обязательно

Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.

token_auth_enabled
bool
Обязательно

Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.

version_name
str
Обязательно

Имя версии в конечной точке.

traffic_percentile
float
Обязательно

Объем трафика, который получает версия в конечной точке.

cpu_cores_limit
float
Обязательно

Максимальное число ядер ЦП, которое может использовать эта веб-служба. Может выражаться десятичным числом.

memory_gb_limit
float
Обязательно

Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом.

autoscale_enabled
bool
Обязательно

Указывает, следует ли включить автомасштабирование для этой Веб-службы. По умолчанию используется значение True, если num_replicas = None (Нет).

autoscale_min_replicas
int
Обязательно

Минимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. По умолчанию равен 1.

autoscale_max_replicas
int
Обязательно

Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию равно 10.

autoscale_refresh_seconds
int
Обязательно

Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.

autoscale_target_utilization
int
Обязательно

Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.

collect_model_data
bool
Обязательно

Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.

auth_enabled
bool
Обязательно

Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

cpu_cores
float
Обязательно

Количество ядер ЦП, выделяемых для этой Веб-службы. Может выражаться десятичным числом. Значение по умолчанию — 0,1

memory_gb
float
Обязательно

Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5

enable_app_insights
bool
Обязательно

Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.

scoring_timeout_ms
int
Обязательно

Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.

replica_max_concurrent_requests
int
Обязательно

Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.

max_request_wait_time
int
Обязательно

Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.

num_replicas
int
Обязательно

Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.

primary_key
str
Обязательно

Первичный ключ проверки подлинности, используемый для этой веб-службы.

secondary_key
str
Обязательно

Вторичный ключ проверки подлинности, используемый для этой веб-службы.

tags
dict[str, str]
Обязательно

Словарь тегов значений ключа для предоставления этой веб-службе

properties
dict[str, str]
Обязательно

Словарь свойств значений ключа для предоставления этой веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".

description
str
Обязательно

Описание для предоставления этой веб-службе.

gpu_cores
int
Обязательно

Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.

period_seconds
int
Обязательно

Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.

initial_delay_seconds
int
Обязательно

Количество секунд после запуска контейнера перед инициированием пробы активности. Значение по умолчанию — 310.

timeout_seconds
int
Обязательно

Период в секундах, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.

success_threshold
int
Обязательно

Минимальное число последовательных успешных попыток проведения пробы активности после сбоя, которое нужно, чтобы проба считалась успешной. По умолчанию равен 1. Минимальное значение — 1.

failure_threshold
int
Обязательно

Количество попыток (failureThreshold), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.

namespace
str
Обязательно

Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.

token_auth_enabled
bool
Обязательно

Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.

version_name
str
Обязательно

Имя версии в конечной точке.

traffic_percentile
float
Обязательно

Объем трафика, который получает версия в конечной точке.

compute_target_name
str
Обязательно

Имя целевого объект вычислений, в который будет выполняться развертывание.

cpu_cores_limit
float
Обязательно

Максимальное число ядер ЦП, которое может использовать этот объект WebService. Может выражаться десятичным числом.

memory_gb_limit
float
Обязательно

Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом.

Переменные

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Указывает, следует ли включить автомасштабирование для этой Веб-службы. По умолчанию используется значение True, если num_replicas = None (Нет).

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

Минимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. По умолчанию равен 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию равно 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

Количество ядер ЦП, выделяемых для этой Веб-службы. Может выражаться десятичным числом. Значение по умолчанию — 0,1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

Первичный ключ проверки подлинности, используемый для этой веб-службы.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

Вторичный ключ проверки подлинности, используемый для этой веб-службы.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Словарь тегов значений ключа для предоставления этой веб-службе

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Словарь свойств значений ключа для предоставления этой веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

Описание для предоставления этой веб-службе.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

Количество секунд после запуска контейнера перед инициированием пробы активности. Значение по умолчанию — 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

Период в секундах, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Минимальное число последовательных успешных попыток проведения пробы активности после сбоя, которое нужно, чтобы проба считалась успешной. По умолчанию равен 1. Минимальное значение — 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

Количество попыток (failureThreshold), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

Имя версии в конечной точке.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

Объем трафика, который получает версия в конечной точке.

Методы

validate_endpoint_configuration

Проверка допустимости указанных значений конфигурации.

При сбое проверки будет вызвано исключение WebserviceException.

validate_endpoint_configuration

Проверка допустимости указанных значений конфигурации.

При сбое проверки будет вызвано исключение WebserviceException.

validate_endpoint_configuration()

Исключения