AksServiceDeploymentConfiguration Класс
Представляет сведения о конфигурации развертывания для службы, развернутой в Службе Kubernetes Azure.
Создает объект AksServiceDeploymentConfiguration с помощью метода deploy_configuration
классаAksWebservice.
Инициализируйте объект конфигурации для развертывания в целевом объекте вычислений AKS.
- Наследование
-
AksServiceDeploymentConfiguration
Конструктор
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Параметры
- cpu_cores_limit
Максимальное число ядер ЦП, которое может использовать эта веб-служба. Может выражаться десятичным числом.
- memory_gb_limit
Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом.
- autoscale_enabled
- bool
Указывает, следует ли включить автомасштабирование для этой Веб-службы.
По умолчанию используется значение True, если num_replicas
= None (Нет).
- autoscale_min_replicas
- int
Минимальное число контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1.
- autoscale_max_replicas
- int
Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10.
- autoscale_refresh_seconds
- int
Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.
- autoscale_target_utilization
- int
Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.
- collect_model_data
- bool
Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.
- auth_enabled
- bool
Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.
- cpu_cores
- float
Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1
- memory_gb
- float
Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5
- enable_app_insights
- bool
Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.
- scoring_timeout_ms
- int
Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.
- replica_max_concurrent_requests
- int
Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.
- max_request_wait_time
- int
Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.
- num_replicas
- int
Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.
- secondary_key
- str
Вторичный ключ проверки подлинности, используемый для этой Веб-службы.
Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".
- gpu_cores
- int
Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.
- period_seconds
- int
Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.
- initial_delay_seconds
- int
Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310.
- timeout_seconds
- int
Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.
- success_threshold
- int
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1.
- failure_threshold
- int
Количество попыток (failureThreshold
), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.
- namespace
- str
Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.
- token_auth_enabled
- bool
Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.
- cpu_cores_limit
Максимальное число ядер ЦП, которое может использовать этот объект WebService. Может выражаться десятичным числом.
- memory_gb_limit
Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом.
- blobfuse_enabled
- bool
Следует ли включить blobfuse для загрузки модели для этой Веб-службы. Значение по умолчанию: true
- autoscale_enabled
- bool
Указывает, следует ли включить автомасштабирование для этой Веб-службы.
По умолчанию используется значение True, если num_replicas
= None (Нет).
- autoscale_min_replicas
- int
Минимальное число контейнеров, используемых при автомасштабировании этой веб-службы. По умолчанию равен 1.
- autoscale_max_replicas
- int
Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10.
- autoscale_refresh_seconds
- int
Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.
- autoscale_target_utilization
- int
Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.
- collect_model_data
- bool
Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.
- auth_enabled
- bool
Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.
- cpu_cores
- float
Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1
- memory_gb
- float
Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5
- enable_app_insights
- bool
Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.
- scoring_timeout_ms
- int
Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.
- replica_max_concurrent_requests
- int
Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.
- max_request_wait_time
- int
Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.
- num_replicas
- int
Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.
- secondary_key
- str
Вторичный ключ проверки подлинности, используемый для этой Веб-службы.
Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".
- gpu_cores
- int
Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.
- period_seconds
- int
Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.
- initial_delay_seconds
- int
Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310.
- timeout_seconds
- int
Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.
- success_threshold
- int
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1.
- failure_threshold
- int
Количество попыток (failureThreshold
), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.
- namespace
- str
Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.
- token_auth_enabled
- bool
Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.
- compute_target_name
- str
Имя целевого объект вычислений, в который будет выполняться развертывание
- cpu_cores_limit
- float
Максимальное число ядер ЦП, которое может использовать этот объект WebService. Может выражаться десятичным числом.
- memory_gb_limit
- float
Максимальный объем памяти (в ГБ), который может использовать этот объект WebService. Может выражаться десятичным числом.
- blobfuse_enabled
- bool
Следует ли включить blobfuse для загрузки модели для этой Веб-службы. Значение по умолчанию: true
Переменные
- autoscale_enabled
- bool
Указывает, следует ли включить автомасштабирование для этой Веб-службы.
По умолчанию используется значение True, если num_replicas
= None (Нет).
- autoscale_min_replicas
- int
Минимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. По умолчанию равен 1.
- autoscale_max_replicas
- int
Максимальное число контейнеров, используемых при автомасштабировании этой Веб-службы. Значение по умолчанию — 10.
- autoscale_refresh_seconds
- int
Частота, с которой должны выполняться попытки автомасштабирования этой Веб-службы. По умолчанию равен 1.
- autoscale_target_utilization
- int
Целевой объем использования, который нужно пытаться поддерживать при автомасштабировании этой Веб-службы (в процентах от 100). Значение по умолчанию — 70.
- collect_model_data
- bool
Указывает, следует ли включить сбор данных модели для этой веб-службы. Значение по умолчанию — False.
- auth_enabled
- bool
Указывает, следует ли включить проверку подлинности для этой веб-службы. Значение по умолчанию — True.
- cpu_cores
- float
Количество ядер ЦП, выделяемых для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,1
- memory_gb
- float
Объем памяти (в ГБ), выделяемой для этого объекта WebService. Может выражаться десятичным числом. Значение по умолчанию — 0,5
- enable_app_insights
- bool
Указывает, следует ли включить ведение журнала Application Insights для этой Веб-службы. Значение по умолчанию — False.
- scoring_timeout_ms
- int
Время ожидания для вызовов оценок этой Веб-службы. Значение по умолчанию — 60000.
- replica_max_concurrent_requests
- int
Максимальное количество одновременных запросов на реплику, которое будет разрешено для этой Веб-службы. По умолчанию равен 1. Не изменяйте этот параметр со значения по умолчанию 1, если это не требует служба технической поддержки Майкрософт или член команды Машинного обучения Azure.
- max_request_wait_time
- int
Максимальный период времени (в миллисекундах), в течение которого запрос будет оставаться в очереди до возврата ошибки 503. По умолчанию: 500.
- num_replicas
- int
Количество контейнеров, выделяемых для этой Веб-службы. Значения по умолчанию нет. Если этот параметр не задан, средство автомасштабирования будет включено по умолчанию.
- primary_key
- str
Первичный ключ проверки подлинности, используемый для этой Веб-службы.
- secondary_key
- str
Вторичный ключ проверки подлинности, используемый для этой Веб-службы.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Словарь тегов значений ключа для предоставления этой Веб-службе.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Словарь свойств значений ключа для предоставления этой Веб-службе. Эти свойства нельзя изменить после развертывания, однако можно добавить новые пары "ключ-значение".
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Описание для предоставления этой веб-службе.
- gpu_cores
- int
Количество ядер GPU, выделяемых для этого объекта WebService. Значение по умолчанию — 0.
- period_seconds
- int
Частота (в секундах) выполнения пробы активности. Значение по умолчанию — 10 секунд. Минимальное значение — 1.
- initial_delay_seconds
- int
Количество секунд после запуска контейнера до начала пробы активности. Значение по умолчанию — 310.
- timeout_seconds
- int
Количество секунд, после которого истекает время ожидания пробы активности. Значение по умолчанию — 2 секунды. Минимальное значение — 1.
- success_threshold
- int
Минимальное число последовательных успешных попыток пробы активности после сбоя, после которых проба будет считаться успешной. По умолчанию равен 1. Минимальное значение — 1.
- failure_threshold
- int
Количество попыток (failureThreshold
), выполняемых Kubernetes, до их полного прекращения в случае запуска pod, но сбоя пробы активности. Значение по умолчанию — 3. Минимальное значение — 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
Пространство имен Kubernetes, в котором развертывается эта Веб-служба: до 63 строчных букв, цифр (a–z, 0–9) и дефисов (-). Первый и последний символы не могут быть дефисами.
- token_auth_enabled
- bool
Указывает, следует ли включить проверку подлинности Azure Active Directory для этой веб-службы. Если этот параметр включен, пользователи могут получить маркер доступа для доступа к этой веб-службе с помощью учетных данных Azure Active Directory. Значение по умолчанию — False.
Методы
print_deploy_configuration |
Печать конфигурации развертывания. |
validate_configuration |
Проверка допустимости указанных значений конфигурации. При сбое проверки будет вызвано исключение WebserviceException. |
print_deploy_configuration
Печать конфигурации развертывания.
print_deploy_configuration()
validate_configuration
Проверка допустимости указанных значений конфигурации.
При сбое проверки будет вызвано исключение WebserviceException.
validate_configuration()
Исключения
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по