Share via


AksServiceDeploymentConfiguration Klas

Vertegenwoordigt informatie over een implementatieconfiguratie voor een service die is geïmplementeerd op Azure Kubernetes Service.

Maak een AksServiceDeploymentConfiguration-object met behulp van de deploy_configuration methode van de AksWebservice klasse.

Initialiseer een configuratieobject voor implementatie naar een AKS-rekendoel.

Overname
AksServiceDeploymentConfiguration

Constructor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parameters

cpu_cores_limit
Vereist

Het maximum aantal CPU-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.

memory_gb_limit
Vereist

De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.

autoscale_enabled
bool
Vereist

Hiermee wordt aangegeven of automatisch schalen voor deze webservice moet worden ingeschakeld. De standaardwaarde is Waar als num_replicas Geen is.

autoscale_min_replicas
int
Vereist

Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. Standaardwaarde is 1.

autoscale_max_replicas
int
Vereist

Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10

autoscale_refresh_seconds
int
Vereist

Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. Standaardwaarde is 1.

autoscale_target_utilization
int
Vereist

Het doelgebruik (in procenten van 100) dat de automatische schaalaanpassing moet proberen te onderhouden voor deze webservice. De standaardwaarde is 70.

collect_model_data
bool
Vereist

Of het verzamelen van modelgegevens voor deze webservice al dan niet moet worden ingeschakeld. Standaard ingesteld op False.

auth_enabled
bool
Vereist

Of verificatie voor deze webservice moet worden ingeschakeld. De standaardwaarde is True.

cpu_cores
float
Vereist

Het aantal CPU-kernen dat moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0.1

memory_gb
float
Vereist

De hoeveelheid geheugen (in GB) die voor deze webservice moet worden toegewezen. Kan een decimaal getal zijn. De standaardwaarde is 0,5

enable_app_insights
bool
Vereist

Of application insights-logboekregistratie voor deze webservice al dan niet moet worden ingeschakeld. Standaard ingesteld op False.

scoring_timeout_ms
int
Vereist

Een time-out die moet worden afgedwongen voor het scoren van aanroepen naar deze webservice. De standaardwaarde is 60000.

replica_max_concurrent_requests
int
Vereist

Het aantal maximale gelijktijdige aanvragen per replica dat deze webservice toestaat. Standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij u hiervoor instructies krijgt van de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.

max_request_wait_time
int
Vereist

De maximale hoeveelheid tijd die een aanvraag in de wachtrij blijft (in milliseconden) voordat een fout van 503 wordt geretourneerd. De standaardwaarde is 500.

num_replicas
int
Vereist

Het aantal containers dat moet worden toegewezen voor deze webservice. Geen standaardwaarde, als deze parameter niet is ingesteld, is automatische schaalaanpassing standaard ingeschakeld.

primary_key
str
Vereist

Een primaire verificatiesleutel die moet worden gebruikt voor deze webservice.

secondary_key
str
Vereist

Een secundaire verificatiesleutel die moet worden gebruikt voor deze webservice.

tags
dict[str, str]
Vereist

Woordenlijst met sleutelwaardetags voor deze webservice.

properties
dict[str, str]
Vereist

Woordenlijst met sleutelwaarde-eigenschappen voor deze webservice. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar er kunnen wel nieuwe sleutelwaardeparen worden toegevoegd.

description
str
Vereist

Een beschrijving voor deze webservice.

gpu_cores
int
Vereist

Het aantal GPU-kernen dat voor deze webservice moet worden toegewezen. De standaardwaarde is 0.

period_seconds
int
Vereist

Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.

initial_delay_seconds
int
Vereist

Aantal seconden nadat de container is gestart voordat de activiteitstests worden gestart. De standaardwaarde is 310.

timeout_seconds
int
Vereist

Het aantal seconden waarna er een time-out optreedt voor de activiteitstest. De standaardinstelling is 2 seconden. Minimumwaarde is 1.

success_threshold
int
Vereist

De minimale opeenvolgende successen voor de activiteitstest voordat de test succesvol of mislukt is. Standaardwaarde is 1. Minimumwaarde is 1.

failure_threshold
int
Vereist

Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert failureThreshold Kubernetes het af en toe voordat hij opgeeft. Standaardwaarde is 3. Minimumwaarde is 1.

namespace
str
Vereist

De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 kleine alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn.

token_auth_enabled
bool
Vereist

Of Azure Active Directory-verificatie voor deze webservice al dan niet moet worden ingeschakeld. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. Standaard ingesteld op False.

cpu_cores_limit
Vereist

Het maximum aantal CPU-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.

memory_gb_limit
Vereist

De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.

blobfuse_enabled
bool
standaardwaarde: None

Of u blobfuse wilt inschakelen voor het downloaden van modellen voor deze webservice. De standaardwaarde is True

autoscale_enabled
bool
Vereist

Hiermee wordt aangegeven of automatisch schalen voor deze webservice moet worden ingeschakeld. De standaardwaarde is Waar als num_replicas Geen is.

autoscale_min_replicas
int
Vereist

Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. Standaardwaarde is 1.

autoscale_max_replicas
int
Vereist

Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10

autoscale_refresh_seconds
int
Vereist

Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. Standaardwaarde is 1.

autoscale_target_utilization
int
Vereist

Het doelgebruik (in procenten van 100) dat de automatische schaalaanpassing moet proberen te onderhouden voor deze webservice. De standaardwaarde is 70.

collect_model_data
bool
Vereist

Of het verzamelen van modelgegevens voor deze webservice al dan niet moet worden ingeschakeld. Standaard ingesteld op False.

auth_enabled
bool
Vereist

Of verificatie voor deze webservice moet worden ingeschakeld. De standaardwaarde is True.

cpu_cores
float
Vereist

Het aantal CPU-kernen dat moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0.1

memory_gb
float
Vereist

De hoeveelheid geheugen (in GB) die voor deze webservice moet worden toegewezen. Kan een decimaal getal zijn. De standaardwaarde is 0,5

enable_app_insights
bool
Vereist

Of u Application Insights-logboekregistratie wilt inschakelen voor deze webservice. Standaard ingesteld op False.

scoring_timeout_ms
int
Vereist

Een time-out die moet worden afgedwongen voor score-aanroepen naar deze webservice. De standaardwaarde is 60000.

replica_max_concurrent_requests
int
Vereist

Het aantal maximale gelijktijdige aanvragen per replica dat deze webservice toestaat. Standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij u hiervoor instructies krijgt van de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.

max_request_wait_time
int
Vereist

De maximale hoeveelheid tijd die een aanvraag in de wachtrij blijft (in milliseconden) voordat een fout van 503 wordt geretourneerd. De standaardwaarde is 500.

num_replicas
int
Vereist

Het aantal containers dat voor deze webservice moet worden toegewezen. Geen standaardwaarde, als deze parameter niet is ingesteld, is automatische schaalaanpassing standaard ingeschakeld.

primary_key
str
Vereist

Een primaire verificatiesleutel die moet worden gebruikt voor deze webservice.

secondary_key
str
Vereist

Een secundaire verificatiesleutel die moet worden gebruikt voor deze webservice.

tags
dict[str, str]
Vereist

Woordenlijst met sleutelwaardelabels voor deze webservice.

properties
dict[str, str]
Vereist

Woordenlijst met sleutelwaarde-eigenschappen voor deze webservice. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar er kunnen wel nieuwe sleutelwaardeparen worden toegevoegd.

description
str
Vereist

Een beschrijving voor deze webservice.

gpu_cores
int
Vereist

Het aantal GPU-kernen dat voor deze webservice moet worden toegewezen. De standaardwaarde is 0.

period_seconds
int
Vereist

Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.

initial_delay_seconds
int
Vereist

Aantal seconden nadat de container is gestart voordat de activiteitstests worden gestart. De standaardwaarde is 310.

timeout_seconds
int
Vereist

Het aantal seconden waarna er een time-out optreedt voor de liveness-test. De standaardwaarde is 2 seconden. Minimumwaarde is 1.

success_threshold
int
Vereist

De minimale opeenvolgende successen voor de activiteitstest voordat de test succesvol of mislukt is. Standaardwaarde is 1. Minimumwaarde is 1.

failure_threshold
int
Vereist

Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert failureThreshold Kubernetes het op tijd voordat het opgeeft. Standaardwaarde is 3. Minimumwaarde is 1.

namespace
str
Vereist

De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 kleine alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn.

token_auth_enabled
bool
Vereist

Of u Azure Active Directory-verificatie wilt inschakelen voor deze webservice. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. Standaard ingesteld op False.

compute_target_name
str
Vereist

De naam van het rekendoel voor implementatie

cpu_cores_limit
float
Vereist

Het maximum aantal CPU-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.

memory_gb_limit
float
Vereist

De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.

blobfuse_enabled
bool
Vereist

Of u blobfuse wilt inschakelen voor het downloaden van modellen voor deze webservice. Standaard ingesteld op True

Variabelen

autoscale_enabled
bool

Hiermee wordt aangegeven of automatisch schalen moet worden ingeschakeld voor deze webservice. De standaardwaarde is Waar als num_replicas Geen is.

autoscale_min_replicas
int

Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. Standaardwaarde is 1.

autoscale_max_replicas
int

Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10

autoscale_refresh_seconds
int

Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. Standaardwaarde is 1.

autoscale_target_utilization
int

Het doelgebruik (in procent van 100) dat de automatische schaalaanpassing voor deze webservice moet onderhouden. De standaardwaarde is 70.

collect_model_data
bool

Of het verzamelen van modelgegevens voor deze webservice al dan niet moet worden ingeschakeld. Standaard ingesteld op False.

auth_enabled
bool

Of verificatie voor deze webservice al dan niet moet worden ingeschakeld. De standaardwaarde is Waar.

cpu_cores
float

Het aantal CPU-kernen dat voor deze webservice moet worden toegewezen. Kan een decimaal getal zijn. Standaard ingesteld op 0.1

memory_gb
float

De hoeveelheid geheugen (in GB) die voor deze webservice moet worden toegewezen. Kan een decimaal getal zijn. De standaardwaarde is 0,5

enable_app_insights
bool

Of u Application Insights-logboekregistratie wilt inschakelen voor deze webservice. Standaard ingesteld op False.

scoring_timeout_ms
int

Een time-out die moet worden afgedwongen voor score-aanroepen naar deze webservice. De standaardwaarde is 60000.

replica_max_concurrent_requests
int

Het aantal maximale gelijktijdige aanvragen per replica dat deze webservice toestaat. Standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij u hiervoor instructies krijgt van de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.

max_request_wait_time
int

De maximale hoeveelheid tijd die een aanvraag in de wachtrij blijft (in milliseconden) voordat een fout van 503 wordt geretourneerd. De standaardwaarde is 500.

num_replicas
int

Het aantal containers dat voor deze webservice moet worden toegewezen. Geen standaardwaarde, als deze parameter niet is ingesteld, is automatische schaalaanpassing standaard ingeschakeld.

primary_key
str

Een primaire verificatiesleutel die moet worden gebruikt voor deze webservice.

secondary_key
str

Een secundaire verificatiesleutel die moet worden gebruikt voor deze webservice.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Woordenlijst met sleutelwaardelabels voor deze webservice.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Woordenlijst met sleutelwaarde-eigenschappen voor deze webservice. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar er kunnen wel nieuwe sleutelwaardeparen worden toegevoegd.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Een beschrijving voor deze webservice.

gpu_cores
int

Het aantal GPU-kernen dat voor deze webservice moet worden toegewezen. De standaardwaarde is 0.

period_seconds
int

Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.

initial_delay_seconds
int

Aantal seconden nadat de container is gestart voordat de activiteitstests worden gestart. De standaardwaarde is 310.

timeout_seconds
int

Het aantal seconden waarna er een time-out optreedt voor de liveness-test. De standaardwaarde is 2 seconden. Minimumwaarde is 1.

success_threshold
int

De minimale opeenvolgende successen voor de activiteitstest voordat de test succesvol of mislukt is. Standaardwaarde is 1. Minimumwaarde is 1.

failure_threshold
int

Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert failureThreshold Kubernetes het op tijd voordat het opgeeft. Standaardwaarde is 3. Minimumwaarde is 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 kleine alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn.

token_auth_enabled
bool

Of u Azure Active Directory-verificatie wilt inschakelen voor deze webservice. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. Standaard ingesteld op False.

Methoden

print_deploy_configuration

De implementatieconfiguratie afdrukken.

validate_configuration

Controleer of de opgegeven configuratiewaarden geldig zijn.

Hiermee wordt een WebserviceException weergegeven als de validatie mislukt.

print_deploy_configuration

De implementatieconfiguratie afdrukken.

print_deploy_configuration()

validate_configuration

Controleer of de opgegeven configuratiewaarden geldig zijn.

Hiermee wordt een WebserviceException weergegeven als de validatie mislukt.

validate_configuration()

Uitzonderingen