AksServiceDeploymentConfiguration Класс

Представляет сведения о конфигурации развертывания для службы, развернутой в Службе Kubernetes Azure.

Создает объект AksServiceDeploymentConfiguration с помощью метода deploy_configuration классаAksWebservice.

Инициализируйте объект конфигурации для развертывания в целевом объекте вычислений AKS.

Наследование
AksServiceDeploymentConfiguration

Конструктор

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Параметры

cpu_cores_limit
Обязательно

Максимальное число ядер ЦП, которое может использовать эта веб-служба. Может выражаться десятичным числом.

memory_gb_limit
Обязательно

Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом.

autoscale_enabled
bool
Обязательно

Указывает, следует ли включить автомасштабирование для этой Веб-службы. По умолчанию используется значение True, если num_replicas = None (Нет).

autoscale_min_replicas
int
Обязательно

Минимальное число контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1.

autoscale_max_replicas
int
Обязательно

Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10.

autoscale_refresh_seconds
int
Обязательно

Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.

autoscale_target_utilization
int
Обязательно

Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.

collect_model_data
bool
Обязательно

Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.

auth_enabled
bool
Обязательно

Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

cpu_cores
float
Обязательно

Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1

memory_gb
float
Обязательно

Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5

enable_app_insights
bool
Обязательно

Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.

scoring_timeout_ms
int
Обязательно

Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.

replica_max_concurrent_requests
int
Обязательно

Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.

max_request_wait_time
int
Обязательно

Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.

num_replicas
int
Обязательно

Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.

primary_key
str
Обязательно

Первичный ключ проверки подлинности, используемый для этой Веб-службы.

secondary_key
str
Обязательно

Вторичный ключ проверки подлинности, используемый для этой Веб-службы.

tags
dict[str, str]
Обязательно

Словарь тегов значений ключа для предоставления этой Веб-службе.

properties
dict[str, str]
Обязательно

Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".

description
str
Обязательно

Описание для предоставления этой веб-службе.

gpu_cores
int
Обязательно

Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.

period_seconds
int
Обязательно

Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.

initial_delay_seconds
int
Обязательно

Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310.

timeout_seconds
int
Обязательно

Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.

success_threshold
int
Обязательно

Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1.

failure_threshold
int
Обязательно

Количество попыток (failureThreshold), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.

namespace
str
Обязательно

Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.

token_auth_enabled
bool
Обязательно

Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.

cpu_cores_limit
Обязательно

Максимальное число ядер ЦП, которое может использовать этот объект WebService. Может выражаться десятичным числом.

memory_gb_limit
Обязательно

Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом.

blobfuse_enabled
bool
значение по умолчанию: None

Следует ли включить blobfuse для загрузки модели для этой Веб-службы. Значение по умолчанию: true

autoscale_enabled
bool
Обязательно

Указывает, следует ли включить автомасштабирование для этой Веб-службы. По умолчанию используется значение True, если num_replicas = None (Нет).

autoscale_min_replicas
int
Обязательно

Минимальное число контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1.

autoscale_max_replicas
int
Обязательно

Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10.

autoscale_refresh_seconds
int
Обязательно

Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.

autoscale_target_utilization
int
Обязательно

Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.

collect_model_data
bool
Обязательно

Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.

auth_enabled
bool
Обязательно

Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

cpu_cores
float
Обязательно

Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1

memory_gb
float
Обязательно

Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5

enable_app_insights
bool
Обязательно

Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.

scoring_timeout_ms
int
Обязательно

Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.

replica_max_concurrent_requests
int
Обязательно

Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.

max_request_wait_time
int
Обязательно

Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.

num_replicas
int
Обязательно

Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.

primary_key
str
Обязательно

Первичный ключ проверки подлинности, используемый для этой Веб-службы.

secondary_key
str
Обязательно

Вторичный ключ проверки подлинности, используемый для этой Веб-службы.

tags
dict[str, str]
Обязательно

Словарь тегов значений ключа для предоставления этой Веб-службе.

properties
dict[str, str]
Обязательно

Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".

description
str
Обязательно

Описание для предоставления этой веб-службе.

gpu_cores
int
Обязательно

Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.

period_seconds
int
Обязательно

Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.

initial_delay_seconds
int
Обязательно

Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310.

timeout_seconds
int
Обязательно

Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.

success_threshold
int
Обязательно

Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1.

failure_threshold
int
Обязательно

Количество попыток (failureThreshold), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.

namespace
str
Обязательно

Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.

token_auth_enabled
bool
Обязательно

Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.

compute_target_name
str
Обязательно

Имя целевого объект вычислений, в который будет выполняться развертывание

cpu_cores_limit
float
Обязательно

Максимальное число ядер ЦП, которое может использовать этот объект WebService. Может выражаться десятичным числом.

memory_gb_limit
float
Обязательно

Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом.

blobfuse_enabled
bool
Обязательно

Следует ли включить blobfuse для загрузки модели для этой Веб-службы. Значение по умолчанию: true

Переменные

autoscale_enabled
bool

Указывает, следует ли включить автомасштабирование для этой Веб-службы. По умолчанию используется значение True, если num_replicas = None (Нет).

autoscale_min_replicas
int

Минимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. По умолчанию равен 1.

autoscale_max_replicas
int

Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10.

autoscale_refresh_seconds
int

Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.

autoscale_target_utilization
int

Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.

collect_model_data
bool

Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.

auth_enabled
bool

Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.

cpu_cores
float

Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1

memory_gb
float

Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5

enable_app_insights
bool

Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.

scoring_timeout_ms
int

Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.

replica_max_concurrent_requests
int

Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.

max_request_wait_time
int

Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.

num_replicas
int

Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.

primary_key
str

Первичный ключ проверки подлинности, используемый для этой Веб-службы.

secondary_key
str

Вторичный ключ проверки подлинности, используемый для этой Веб-службы.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Словарь тегов значений ключа для предоставления этой Веб-службе.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Описание для предоставления этой веб-службе.

gpu_cores
int

Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.

period_seconds
int

Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.

initial_delay_seconds
int

Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310.

timeout_seconds
int

Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.

success_threshold
int

Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1.

failure_threshold
int

Количество попыток (failureThreshold), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.

token_auth_enabled
bool

Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.

Методы

print_deploy_configuration

Печать конфигурации развертывания.

validate_configuration

Проверка допустимости указанных значений конфигурации.

При сбое проверки будет вызвано исключение WebserviceException.

print_deploy_configuration

Печать конфигурации развертывания.

print_deploy_configuration()

validate_configuration

Проверка допустимости указанных значений конфигурации.

При сбое проверки будет вызвано исключение WebserviceException.

validate_configuration()

Исключения