AksServiceDeploymentConfiguration Klas
Vertegenwoordigt informatie over een implementatieconfiguratie voor een service die is geïmplementeerd op Azure Kubernetes Service.
Maak een AksServiceDeploymentConfiguration-object met behulp van de deploy_configuration
methode van de AksWebservice klasse.
Initialiseer een configuratieobject voor implementatie naar een AKS-rekendoel.
- Overname
-
AksServiceDeploymentConfiguration
Constructor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parameters
- cpu_cores_limit
Het maximum aantal CPU-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.
- memory_gb_limit
De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.
- autoscale_enabled
- bool
Hiermee wordt aangegeven of automatisch schalen voor deze webservice moet worden ingeschakeld.
De standaardwaarde is Waar als num_replicas
Geen is.
- autoscale_min_replicas
- int
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. Standaardwaarde is 1.
- autoscale_max_replicas
- int
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10
- autoscale_refresh_seconds
- int
Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. Standaardwaarde is 1.
- autoscale_target_utilization
- int
Het doelgebruik (in procenten van 100) dat de automatische schaalaanpassing moet proberen te onderhouden voor deze webservice. De standaardwaarde is 70.
- collect_model_data
- bool
Of het verzamelen van modelgegevens voor deze webservice al dan niet moet worden ingeschakeld. Standaard ingesteld op False.
- auth_enabled
- bool
Of verificatie voor deze webservice moet worden ingeschakeld. De standaardwaarde is True.
- cpu_cores
- float
Het aantal CPU-kernen dat moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0.1
- memory_gb
- float
De hoeveelheid geheugen (in GB) die voor deze webservice moet worden toegewezen. Kan een decimaal getal zijn. De standaardwaarde is 0,5
- enable_app_insights
- bool
Of application insights-logboekregistratie voor deze webservice al dan niet moet worden ingeschakeld. Standaard ingesteld op False.
- scoring_timeout_ms
- int
Een time-out die moet worden afgedwongen voor het scoren van aanroepen naar deze webservice. De standaardwaarde is 60000.
- replica_max_concurrent_requests
- int
Het aantal maximale gelijktijdige aanvragen per replica dat deze webservice toestaat. Standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij u hiervoor instructies krijgt van de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.
- max_request_wait_time
- int
De maximale hoeveelheid tijd die een aanvraag in de wachtrij blijft (in milliseconden) voordat een fout van 503 wordt geretourneerd. De standaardwaarde is 500.
- num_replicas
- int
Het aantal containers dat moet worden toegewezen voor deze webservice. Geen standaardwaarde, als deze parameter niet is ingesteld, is automatische schaalaanpassing standaard ingeschakeld.
- primary_key
- str
Een primaire verificatiesleutel die moet worden gebruikt voor deze webservice.
- secondary_key
- str
Een secundaire verificatiesleutel die moet worden gebruikt voor deze webservice.
Woordenlijst met sleutelwaarde-eigenschappen voor deze webservice. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar er kunnen wel nieuwe sleutelwaardeparen worden toegevoegd.
- gpu_cores
- int
Het aantal GPU-kernen dat voor deze webservice moet worden toegewezen. De standaardwaarde is 0.
- period_seconds
- int
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.
- initial_delay_seconds
- int
Aantal seconden nadat de container is gestart voordat de activiteitstests worden gestart. De standaardwaarde is 310.
- timeout_seconds
- int
Het aantal seconden waarna er een time-out optreedt voor de activiteitstest. De standaardinstelling is 2 seconden. Minimumwaarde is 1.
- success_threshold
- int
De minimale opeenvolgende successen voor de activiteitstest voordat de test succesvol of mislukt is. Standaardwaarde is 1. Minimumwaarde is 1.
- failure_threshold
- int
Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert failureThreshold
Kubernetes het af en toe voordat hij opgeeft. Standaardwaarde is 3. Minimumwaarde is 1.
- namespace
- str
De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 kleine alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn.
- token_auth_enabled
- bool
Of Azure Active Directory-verificatie voor deze webservice al dan niet moet worden ingeschakeld. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. Standaard ingesteld op False.
- cpu_cores_limit
Het maximum aantal CPU-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.
- memory_gb_limit
De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.
- blobfuse_enabled
- bool
Of u blobfuse wilt inschakelen voor het downloaden van modellen voor deze webservice. De standaardwaarde is True
- autoscale_enabled
- bool
Hiermee wordt aangegeven of automatisch schalen voor deze webservice moet worden ingeschakeld.
De standaardwaarde is Waar als num_replicas
Geen is.
- autoscale_min_replicas
- int
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. Standaardwaarde is 1.
- autoscale_max_replicas
- int
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10
- autoscale_refresh_seconds
- int
Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. Standaardwaarde is 1.
- autoscale_target_utilization
- int
Het doelgebruik (in procenten van 100) dat de automatische schaalaanpassing moet proberen te onderhouden voor deze webservice. De standaardwaarde is 70.
- collect_model_data
- bool
Of het verzamelen van modelgegevens voor deze webservice al dan niet moet worden ingeschakeld. Standaard ingesteld op False.
- auth_enabled
- bool
Of verificatie voor deze webservice moet worden ingeschakeld. De standaardwaarde is True.
- cpu_cores
- float
Het aantal CPU-kernen dat moet worden toegewezen voor deze webservice. Kan een decimaal getal zijn. Standaard ingesteld op 0.1
- memory_gb
- float
De hoeveelheid geheugen (in GB) die voor deze webservice moet worden toegewezen. Kan een decimaal getal zijn. De standaardwaarde is 0,5
- enable_app_insights
- bool
Of u Application Insights-logboekregistratie wilt inschakelen voor deze webservice. Standaard ingesteld op False.
- scoring_timeout_ms
- int
Een time-out die moet worden afgedwongen voor score-aanroepen naar deze webservice. De standaardwaarde is 60000.
- replica_max_concurrent_requests
- int
Het aantal maximale gelijktijdige aanvragen per replica dat deze webservice toestaat. Standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij u hiervoor instructies krijgt van de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.
- max_request_wait_time
- int
De maximale hoeveelheid tijd die een aanvraag in de wachtrij blijft (in milliseconden) voordat een fout van 503 wordt geretourneerd. De standaardwaarde is 500.
- num_replicas
- int
Het aantal containers dat voor deze webservice moet worden toegewezen. Geen standaardwaarde, als deze parameter niet is ingesteld, is automatische schaalaanpassing standaard ingeschakeld.
- primary_key
- str
Een primaire verificatiesleutel die moet worden gebruikt voor deze webservice.
- secondary_key
- str
Een secundaire verificatiesleutel die moet worden gebruikt voor deze webservice.
Woordenlijst met sleutelwaarde-eigenschappen voor deze webservice. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar er kunnen wel nieuwe sleutelwaardeparen worden toegevoegd.
- gpu_cores
- int
Het aantal GPU-kernen dat voor deze webservice moet worden toegewezen. De standaardwaarde is 0.
- period_seconds
- int
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.
- initial_delay_seconds
- int
Aantal seconden nadat de container is gestart voordat de activiteitstests worden gestart. De standaardwaarde is 310.
- timeout_seconds
- int
Het aantal seconden waarna er een time-out optreedt voor de liveness-test. De standaardwaarde is 2 seconden. Minimumwaarde is 1.
- success_threshold
- int
De minimale opeenvolgende successen voor de activiteitstest voordat de test succesvol of mislukt is. Standaardwaarde is 1. Minimumwaarde is 1.
- failure_threshold
- int
Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert failureThreshold
Kubernetes het op tijd voordat het opgeeft. Standaardwaarde is 3. Minimumwaarde is 1.
- namespace
- str
De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 kleine alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn.
- token_auth_enabled
- bool
Of u Azure Active Directory-verificatie wilt inschakelen voor deze webservice. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. Standaard ingesteld op False.
- cpu_cores_limit
- float
Het maximum aantal CPU-kernen dat deze webservice mag gebruiken. Kan een decimaal getal zijn.
- memory_gb_limit
- float
De maximale hoeveelheid geheugen (in GB) die deze webservice mag gebruiken. Kan een decimaal getal zijn.
- blobfuse_enabled
- bool
Of u blobfuse wilt inschakelen voor het downloaden van modellen voor deze webservice. Standaard ingesteld op True
Variabelen
- autoscale_enabled
- bool
Hiermee wordt aangegeven of automatisch schalen moet worden ingeschakeld voor deze webservice.
De standaardwaarde is Waar als num_replicas
Geen is.
- autoscale_min_replicas
- int
Het minimale aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. Standaardwaarde is 1.
- autoscale_max_replicas
- int
Het maximum aantal containers dat moet worden gebruikt bij het automatisch schalen van deze webservice. De standaardwaarde is 10
- autoscale_refresh_seconds
- int
Hoe vaak de automatische schaalaanpassing moet proberen deze webservice te schalen. Standaardwaarde is 1.
- autoscale_target_utilization
- int
Het doelgebruik (in procent van 100) dat de automatische schaalaanpassing voor deze webservice moet onderhouden. De standaardwaarde is 70.
- collect_model_data
- bool
Of het verzamelen van modelgegevens voor deze webservice al dan niet moet worden ingeschakeld. Standaard ingesteld op False.
- auth_enabled
- bool
Of verificatie voor deze webservice al dan niet moet worden ingeschakeld. De standaardwaarde is Waar.
- cpu_cores
- float
Het aantal CPU-kernen dat voor deze webservice moet worden toegewezen. Kan een decimaal getal zijn. Standaard ingesteld op 0.1
- memory_gb
- float
De hoeveelheid geheugen (in GB) die voor deze webservice moet worden toegewezen. Kan een decimaal getal zijn. De standaardwaarde is 0,5
- enable_app_insights
- bool
Of u Application Insights-logboekregistratie wilt inschakelen voor deze webservice. Standaard ingesteld op False.
- scoring_timeout_ms
- int
Een time-out die moet worden afgedwongen voor score-aanroepen naar deze webservice. De standaardwaarde is 60000.
- replica_max_concurrent_requests
- int
Het aantal maximale gelijktijdige aanvragen per replica dat deze webservice toestaat. Standaardwaarde is 1. Wijzig deze instelling niet van de standaardwaarde 1, tenzij u hiervoor instructies krijgt van de technische ondersteuning van Microsoft of een lid van het Azure Machine Learning-team.
- max_request_wait_time
- int
De maximale hoeveelheid tijd die een aanvraag in de wachtrij blijft (in milliseconden) voordat een fout van 503 wordt geretourneerd. De standaardwaarde is 500.
- num_replicas
- int
Het aantal containers dat voor deze webservice moet worden toegewezen. Geen standaardwaarde, als deze parameter niet is ingesteld, is automatische schaalaanpassing standaard ingeschakeld.
- primary_key
- str
Een primaire verificatiesleutel die moet worden gebruikt voor deze webservice.
- secondary_key
- str
Een secundaire verificatiesleutel die moet worden gebruikt voor deze webservice.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Woordenlijst met sleutelwaardelabels voor deze webservice.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Woordenlijst met sleutelwaarde-eigenschappen voor deze webservice. Deze eigenschappen kunnen niet worden gewijzigd na de implementatie, maar er kunnen wel nieuwe sleutelwaardeparen worden toegevoegd.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Een beschrijving voor deze webservice.
- gpu_cores
- int
Het aantal GPU-kernen dat voor deze webservice moet worden toegewezen. De standaardwaarde is 0.
- period_seconds
- int
Hoe vaak (in seconden) de activiteitstest moet worden uitgevoerd. De standaardwaarde is 10 seconden. Minimumwaarde is 1.
- initial_delay_seconds
- int
Aantal seconden nadat de container is gestart voordat de activiteitstests worden gestart. De standaardwaarde is 310.
- timeout_seconds
- int
Het aantal seconden waarna er een time-out optreedt voor de liveness-test. De standaardwaarde is 2 seconden. Minimumwaarde is 1.
- success_threshold
- int
De minimale opeenvolgende successen voor de activiteitstest voordat de test succesvol of mislukt is. Standaardwaarde is 1. Minimumwaarde is 1.
- failure_threshold
- int
Wanneer een pod wordt gestart en de activiteitstest mislukt, probeert failureThreshold
Kubernetes het op tijd voordat het opgeeft. Standaardwaarde is 3. Minimumwaarde is 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
De Kubernetes-naamruimte waarin deze webservice moet worden geïmplementeerd: maximaal 63 kleine alfanumerieke tekens ('a'-'z', '0'-'9') en afbreekstreepjes ('-'). De eerste en laatste tekens mogen geen afbreekstreepjes zijn.
- token_auth_enabled
- bool
Of u Azure Active Directory-verificatie wilt inschakelen voor deze webservice. Als dit is ingeschakeld, hebben gebruikers toegang tot deze webservice door het toegangstoken op te halen met behulp van hun Azure Active Directory-referenties. Standaard ingesteld op False.
Methoden
print_deploy_configuration |
De implementatieconfiguratie afdrukken. |
validate_configuration |
Controleer of de opgegeven configuratiewaarden geldig zijn. Hiermee wordt een WebserviceException weergegeven als de validatie mislukt. |
print_deploy_configuration
De implementatieconfiguratie afdrukken.
print_deploy_configuration()
validate_configuration
Controleer of de opgegeven configuratiewaarden geldig zijn.
Hiermee wordt een WebserviceException weergegeven als de validatie mislukt.
validate_configuration()
Uitzonderingen
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor