AksWebservice Třída
Představuje model strojového učení nasazený jako koncový bod webové služby na Azure Kubernetes Service.
Nasazená služba se vytvoří z modelu, skriptu a přidružených souborů. Výsledná webová služba je koncový bod HTTP s vyrovnáváním zatížení s rozhraním REST API. Do tohoto rozhraní API můžete odesílat data a přijímat předpovědi vrácené modelem.
AksWebservice nasadí jednu službu do jednoho koncového bodu. Pokud chcete nasadit více služeb do jednoho koncového bodu, použijte třídu .AksEndpoint
Další informace najdete v tématu Nasazení modelu do clusteru Azure Kubernetes Service.
Inicializujte instanci webové služby.
Konstruktor Webservice načte cloudovou reprezentaci objektu webové služby přidruženého k poskytnutému pracovnímu prostoru. Vrátí instanci podřízené třídy odpovídající konkrétnímu typu načteného objektu Webservice.
- Dědičnost
-
AksWebservice
Konstruktor
AksWebservice(workspace, name)
Parametry
- workspace
- Workspace
Objekt pracovního prostoru obsahující objekt webové služby, který se má načíst.
Poznámky
Doporučeným vzorem nasazení je vytvoření objektu konfigurace nasazení pomocí deploy_configuration
metody a jeho následné použití s deploy
metodou Model třídy, jak je znázorněno níže.
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
Úplná ukázka je k dispozici na webu https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb
Existuje několik způsobů, jak nasadit model jako webovou službu, včetně:
deploy
Model pro modely již zaregistrované v pracovním prostoru.deploy_from_image
metoda metody Webservice.deploy_from_model
Webservice pro modely již zaregistrované v pracovním prostoru. Tato metoda vytvoří image.deploy
Webservicemetoda , která zaregistruje model a vytvoří image.
Informace o práci s webovými službami najdete v tématu
Využívání modelu služby Azure Machine Learning nasazeného jako webová služba
Monitorování a shromažďování dat z koncových bodů webové služby ML
Část Variables (Proměnné) obsahuje seznam atributů místní reprezentace cloudového objektu AksWebservice. Tyto proměnné by se měly považovat za jen pro čtení. Změna jejich hodnot se neprojeví v odpovídajícím cloudovém objektu.
Proměnné
- enable_app_insights
- bool
Určuje, jestli je pro webovou službu povolené protokolování AppInsights.
- autoscaler
- AutoScaler
Objekt automatického škálování pro webovou službu.
- compute_name
- str
Název computeTarget, do kterého je webová služba nasazená.
- container_resource_requirements
- ContainerResourceRequirements
Požadavky na prostředky kontejneru pro webovou službu.
- liveness_probe_requirements
- LivenessProbeRequirements
Požadavky sondy živosti pro webovou službu
- data_collection
- DataCollection
Objekt DataCollection pro webovou službu.
- max_concurrent_requests_per_container
- int
Maximální počet souběžných požadavků na kontejner pro webovou službu.
- max_request_wait_time
- int
Maximální doba čekání požadavku pro webovou službu v milisekundách
- num_replicas
- int
Počet replik pro webovou službu. Každá replika odpovídá podu AKS.
- scoring_timeout_ms
- int
Časový limit skóre pro webovou službu v milisekundách
- azureml.core.webservice.AksWebservice.scoring_uri
- str
Bodovací koncový bod pro webovou službu
- is_default
- bool
Pokud je výchozí verzí nadřazeného bodu AksEndpoint webová služba.
- traffic_percentile
- int
Jaké procento provozu se má směrovat do webové služby v nadřazené sadě AksEndpoint.
- version_type
- VersionType
Typ verze webové služby v nadřazené sadě AksEndpoint.
- token_auth_enabled
- bool
Určuje, jestli je pro webovou službu povolené ověřování tokenů.
- environment
- Environment
Objekt Prostředí, který byl použit k vytvoření webové služby.
- deployment_status
- str
Stav nasazení webové služby.
- namespace
- str
Obor názvů AKS webové služby.
- azureml.core.webservice.AksWebservice.swagger_uri
- str
Koncový bod swaggeru pro webovou službu.
Metody
add_properties |
Přidejte páry klíčových hodnot do slovníku vlastností této webové služby. |
add_tags |
Přidejte páry hodnot klíčů do slovníku značek této webové služby. Vyvolá .WebserviceException |
deploy_configuration |
Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS. |
get_access_token |
Načte ověřovací token pro tuto webovou službu. |
get_token |
ZASTARALÉ. Místo toho použijte Načte ověřovací token pro tuto webovou službu. |
remove_tags |
Odeberte zadané klíče ze slovníku značek této webové služby. |
run |
Zavolejte tuto webovou službu se zadaným vstupem. |
serialize |
Převeďte tuto webovou službu na serializovaný slovník JSON. |
update |
Aktualizujte webovou službu pomocí zadaných vlastností. Hodnoty ponechané jako None zůstanou v této webové službě nezměněné. |
add_properties
Přidejte páry klíčových hodnot do slovníku vlastností této webové služby.
add_properties(properties)
Parametry
add_tags
Přidejte páry hodnot klíčů do slovníku značek této webové služby.
Vyvolá .WebserviceException
add_tags(tags)
Parametry
Výjimky
deploy_configuration
Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
Parametry
- autoscale_enabled
- bool
Zda se má povolit automatické škálování pro tuto webovou službu. Výchozí hodnota je True, pokud num_replicas je None.)
- autoscale_min_replicas
- int
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.
- autoscale_max_replicas
- int
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10.
- autoscale_refresh_seconds
- int
Jak často se má automatické škálování pokoušet škálovat tuto webovou službu. Výchozí hodnota je 1.
- autoscale_target_utilization
- int
Cílové využití (v procentech ze 100) by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70.
- collect_model_data
- bool
Zda se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False.
- auth_enabled
- bool
Zda se má povolit ověřování klíčů pro tuto webovou službu. Výchozí hodnota je Pravda.
- cpu_cores
- float
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinná čárka. Výchozí hodnota je 0.1. Odpovídá požadavku jádra podu, nikoli limitu, ve Azure Kubernetes Service.
- memory_gb
- float
Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5. Odpovídá požadavku na paměť podu, nikoli limitu, v Azure Kubernetes Service.
- enable_app_insights
- bool
Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False.
- scoring_timeout_ms
- int
Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000.
- replica_max_concurrent_requests
- int
Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning.
- max_request_wait_time
- int
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.
- num_replicas
- int
Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.
- primary_key
- str
Primární ověřovací klíč, který se má použít pro tuto webovou službu.
- secondary_key
- str
Sekundární ověřovací klíč, který se má použít pro tuto webovou službu.
Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů.
- gpu_cores
- int
Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0.
- period_seconds
- int
Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.
- initial_delay_seconds
- int
Počet sekund po spuštění kontejneru, než se zahájí sondy aktivity. Výchozí hodnota je 310.
- timeout_seconds
- int
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.
- success_threshold
- int
Minimální po sobě jdoucí úspěch sondy živosti, která se má po neúspěchu považovat za úspěšnou. Výchozí hodnota je 1. Minimální hodnota je 1.
- failure_threshold
- int
Když se pod spustí a sonda živosti selže, Kubernetes se pokusí o selháníThreshold times, než to vzdát. Výchozí hodnota je 3. Minimální hodnota je 1.
- namespace
- str
Obor názvů Kubernetes, ve kterém se má tato webová služba nasadit: až 63 alfanumerických znaků s malými písmeny (a-z, 0-9) a spojovníku (-). První a poslední znak nesmí být pomlčky.
- token_auth_enabled
- bool
Zda se má povolit ověřování tokenů pro tuto webovou službu. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.
- cpu_cores_limit
- float
Maximální počet jader procesoru, které může tato webová služba používat. Může být desetinná čárka.
- memory_gb_limit
- float
Maximální velikost paměti (v GB), kterou může tato webová služba používat. Může být desetinná čárka.
- blobfuse_enabled
- bool
Jestli chcete povolit blobfuse pro stahování modelů pro tuto webovou službu. Výchozí hodnota je True.
Návraty
Objekt konfigurace, který se má použít při nasazení služby AksWebservice.
Návratový typ
Výjimky
get_access_token
Načte ověřovací token pro tuto webovou službu.
get_access_token()
Návraty
Objekt popisující ověřovací token pro tuto webovou službu.
Návratový typ
Výjimky
get_token
ZASTARALÉ. Místo toho použijte get_access_token
metodu .
Načte ověřovací token pro tuto webovou službu.
get_token()
Návraty
Ověřovací token pro tuto webovou službu a kdy ji aktualizovat.
Návratový typ
Výjimky
remove_tags
Odeberte zadané klíče ze slovníku značek této webové služby.
remove_tags(tags)
Parametry
run
Zavolejte tuto webovou službu se zadaným vstupem.
run(input_data)
Parametry
- input_data
- <xref:varies>
Vstup pro volání webové služby
Návraty
Výsledek volání webové služby
Návratový typ
Výjimky
serialize
Převeďte tuto webovou službu na serializovaný slovník JSON.
serialize()
Návraty
Reprezentace JSON této webové služby.
Návratový typ
update
Aktualizujte webovou službu pomocí zadaných vlastností.
Hodnoty ponechané jako None zůstanou v této webové službě nezměněné.
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
Parametry
- autoscale_enabled
- bool
Povolit nebo zakázat automatické škálování této webové služby
- autoscale_min_replicas
- int
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby
- autoscale_max_replicas
- int
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby
- autoscale_refresh_seconds
- int
Jak často se má automatické škálování pokoušet o škálování této webové služby
- autoscale_target_utilization
- int
Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu
- collect_model_data
- bool
Povolit nebo zakázat shromažďování dat modelu pro tuto webovou službu
- cpu_cores
- float
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinná čárka.
- memory_gb
- float
Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka.
- enable_app_insights
- bool
Jestli se má povolit protokolování Application Insights pro tuto webovou službu
- scoring_timeout_ms
- int
Vypršení časového limitu pro vynucení bodování volání této webové služby
- replica_max_concurrent_requests
- int
Maximální počet souběžných požadavků na repliku, které mají být pro tuto webovou službu povoleny.
- max_request_wait_time
- int
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách), než se vrátí chyba 503
- num_replicas
- int
Počet kontejnerů, které mají být přiděleny pro tuto webovou službu
Slovník značek klíčových hodnot pro tuto webovou službu. Nahradí existující značky.
Slovník vlastností hodnoty klíče, které se mají přidat do existujícího slovníku vlastností
Seznam objektů modelu, které se mají zabalit s aktualizovanou službou
- inference_config
- InferenceConfig
InferenceConfig Objekt slouží k poskytnutí požadovaných vlastností nasazení modelu.
- period_seconds
- int
Jak často (v sekundách) se má provádět sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.
- initial_delay_seconds
- int
Počet sekund po spuštění kontejneru, než se spustí sondy aktivity.
- timeout_seconds
- int
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity Výchozí hodnota je 1 sekunda. Minimální hodnota je 1.
- success_threshold
- int
Minimální počet po sobě jdoucích úspěchů sondy aktivity, které se mají po neúspěchu považovat za úspěšné. Výchozí hodnota je 1. Minimální hodnota je 1.
- failure_threshold
- int
Když se pod spustí a sonda aktivity selže, Kubernetes se pokusí o selháníThreshold Times předtím, než to vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.
- namespace
- str
Obor názvů Kubernetes, do kterého se má tato webová služba nasadit: až 63 znaků malých alfanumerických znaků (a-z, 0-9) a spojovníku (-). První a poslední znaky nesmí být pomlčky.
- token_auth_enabled
- bool
Určuje, jestli se má povolit ověřování tokenů pro tuto webovou službu. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupových tokenů pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.
- cpu_cores_limit
- float
Maximální počet jader procesoru, které může tato webová služba používat. Může být desetinná čárka.
- memory_gb_limit
- float
Maximální velikost paměti (v GB), kterou může tato webová služba používat. Může být desetinná čárka.
- kwargs
- <xref:varies>
zahrnují parametry pro podporu migrace webové služby AKS do online koncového bodu Kubernetes a nasazení. is_migration=Pravda| False, compute_target=.
Výjimky
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro