AksWebservice Osztály
Webszolgáltatás-végpontként üzembe helyezett gépi tanulási modellt jelöl a Azure Kubernetes Service.
Az üzembe helyezett szolgáltatás modellből, szkriptből és társított fájlokból jön létre. Az eredményként kapott webszolgáltatás egy elosztott terhelésű HTTP-végpont REST API-val. Adatokat küldhet erre az API-ra, és megkaphatja a modell által visszaadott előrejelzést.
Az AksWebservice egyetlen szolgáltatást helyez üzembe egyetlen végponton. Ha több szolgáltatást szeretne üzembe helyezni egy végponton, használja az osztályt AksEndpoint .
További információ: Modell üzembe helyezése Azure Kubernetes Service fürtön.
Inicializálja a webszolgáltatás-példányt.
A Webservice-konstruktor lekéri a megadott munkaterülethez társított webszolgáltatás-objektum felhőbeli ábrázolását. Egy gyermekosztály egy példányát adja vissza, amely megfelel a lekért webszolgáltatás-objektum adott típusának.
- Öröklődés
-
AksWebservice
Konstruktor
AksWebservice(workspace, name)
Paraméterek
Megjegyzések
Az ajánlott üzembehelyezési minta egy üzembehelyezési konfigurációs objektum létrehozása a deploy_configuration
metódussal, majd az osztály metódusával deploy
való használata az Model alább látható módon.
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
A teljes minta a következő forrásból érhető el: https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb
A modellek webszolgáltatásként való üzembe helyezésének számos módja van, többek között az alábbiakkal:
deploy
Model a munkaterületen már regisztrált modellek metódusát.deploy_from_image
metódusa Webservice.deploy_from_model
metódust Webservice a munkaterületen már regisztrált modellekhez. Ez a metódus létrehoz egy képet.deploy
metódusa Webservice, amely regisztrál egy modellt, és létrehoz egy képet.
A webszolgáltatások használatával kapcsolatos információkért lásd:
Azure Machine Learning-modell felhasználása webszolgáltatásként
Adatok ML-webszolgáltatási végpontokról való monitorozása és gyűjtése
A Változók szakasz a felhőbeli AksWebservice objektum helyi reprezentációjának attribútumait sorolja fel. Ezeket a változókat írásvédettnek kell tekinteni. Az értékek módosítása nem jelenik meg a megfelelő felhőobjektumban.
Változók
- enable_app_insights
- bool
Azt jelzi, hogy az AppInsights naplózása engedélyezve van-e a webszolgáltatáshoz.
- autoscaler
- AutoScaler
A webszolgáltatás Automatikus skálázási objektuma.
- compute_name
- str
Annak a ComputeTargetnek a neve, amelybe a webszolgáltatás telepítve van.
- container_resource_requirements
- ContainerResourceRequirements
A webszolgáltatás tárolóerőforrás-követelményei.
- liveness_probe_requirements
- LivenessProbeRequirements
A webszolgáltatás élettartam-mintavételi követelményei.
- data_collection
- DataCollection
A webszolgáltatás DataCollection objektuma.
- max_concurrent_requests_per_container
- int
A webszolgáltatás tárolónkénti egyidejű kéréseinek maximális száma.
- max_request_wait_time
- int
A webszolgáltatás maximális kérés várakozási ideje ezredmásodpercben.
- num_replicas
- int
A webszolgáltatás replikáinak száma. Minden replika egy AKS-podnak felel meg.
- scoring_timeout_ms
- int
A webszolgáltatás pontozási időtúllépése ezredmásodpercben.
- azureml.core.webservice.AksWebservice.scoring_uri
- str
A webszolgáltatás pontozási végpontja
- is_default
- bool
Ha a webszolgáltatás a szülő AksEndpoint alapértelmezett verziója.
- traffic_percentile
- int
A webszolgáltatás felé a szülő AksEndpointban átirányítandó forgalom százalékos aránya.
- version_type
- VersionType
A webszolgáltatás verziótípusa a szülő AksEndpointban.
- token_auth_enabled
- bool
Azt jelzi, hogy engedélyezve van-e a jogkivonat-hitelesítés a webszolgáltatásban.
- environment
- Environment
A webszolgáltatás létrehozásához használt Environment objektum.
A webszolgáltatásban üzembe helyezett modellek listája.
- deployment_status
- str
A webszolgáltatás üzembehelyezési állapota.
- namespace
- str
A webszolgáltatás AKS-névtere.
- azureml.core.webservice.AksWebservice.swagger_uri
- str
A webszolgáltatás Swagger-végpontja.
Metódusok
add_properties |
Adjon hozzá kulcsértékpárokat a webszolgáltatás tulajdonságszótárához. |
add_tags |
Adjon hozzá kulcsértékpárokat a webszolgáltatás címkeszótárához. Egy értéket ad WebserviceExceptionmeg. |
deploy_configuration |
Hozzon létre egy konfigurációs objektumot egy AKS számítási célon való üzembe helyezéshez. |
get_access_token |
A webszolgáltatás hitelesítési jogkivonatának lekérése. |
get_token |
ELAVULT. Használja A webszolgáltatás hitelesítési jogkivonatának lekérése. |
remove_tags |
Távolítsa el a megadott kulcsokat a webszolgáltatás címkékből álló szótárából. |
run |
Hívja meg ezt a webszolgáltatást a megadott bemenettel. |
serialize |
Konvertálja ezt a webszolgáltatást JSON szerializált szótárlá. |
update |
Frissítse a webszolgáltatást a megadott tulajdonságokkal. A Nincs érték változatlan marad ebben a webszolgáltatásban. |
add_properties
Adjon hozzá kulcsértékpárokat a webszolgáltatás tulajdonságszótárához.
add_properties(properties)
Paraméterek
add_tags
Adjon hozzá kulcsértékpárokat a webszolgáltatás címkeszótárához.
Egy értéket ad WebserviceExceptionmeg.
add_tags(tags)
Paraméterek
Kivételek
deploy_configuration
Hozzon létre egy konfigurációs objektumot egy AKS számítási célon való üzembe helyezéshez.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
Paraméterek
- autoscale_enabled
- bool
A webszolgáltatás automatikus skálázásának engedélyezése vagy sem. Alapértelmezés szerint Igaz, ha num_replicas Nincs.
- autoscale_min_replicas
- int
A webszolgáltatás automatikus skálázásához használandó tárolók minimális száma. Alapértelmezés szerint 1.
- autoscale_max_replicas
- int
A webszolgáltatás automatikus skálázása során használandó tárolók maximális száma. Alapértelmezés szerint 10.
- autoscale_refresh_seconds
- int
Milyen gyakran próbálja meg az automatikus skálázási eszköz skálázni ezt a webszolgáltatást. Alapértelmezés szerint 1.
- autoscale_target_utilization
- int
A cél kihasználtsága (a 100-ból százalékban) az automatikus skálázónak meg kell kísérelnie a webszolgáltatás karbantartását. Alapértelmezés szerint 70.
- collect_model_data
- bool
Azt jelzi, hogy engedélyezi-e a webszolgáltatás modelladat-gyűjtését. Alapértelmezés szerint Hamis.
- auth_enabled
- bool
Azt jelzi, hogy engedélyezi-e a kulcs-hitelesítést ehhez a webszolgáltatáshoz. Alapértelmezés szerint Igaz.
- cpu_cores
- float
A webszolgáltatáshoz lefoglalandó processzormagok száma. Lehet decimális. Alapértelmezett érték: 0.1. A podmag kérésének felel meg, nem a korlátnak, Azure Kubernetes Service.
- memory_gb
- float
A webszolgáltatáshoz lefoglalandó memória mennyisége (GB-ban). Lehet decimális. Alapértelmezés szerint 0,5. A pod memóriakérelmének felel meg, nem a korlátnak, Azure Kubernetes Service.
- enable_app_insights
- bool
Azt jelzi, hogy engedélyezi-e az Application Insights naplózását ehhez a webszolgáltatáshoz. Alapértelmezés szerint Hamis.
- scoring_timeout_ms
- int
Időtúllépés a webszolgáltatás pontozási hívásainak kényszerítéséhez. Alapértelmezés szerint 60000.
- replica_max_concurrent_requests
- int
A webszolgáltatás engedélyezéséhez replikánkénti maximális egyidejű kérések száma. Alapértelmezés szerint 1. Ne módosítsa ezt a beállítást az alapértelmezett 1 értékről, kivéve, ha a Microsoft műszaki támogatási szolgálata vagy az Azure Machine Learning-csapat tagja utasítja.
- max_request_wait_time
- int
Az 503-at tartalmazó hiba visszaadása előtt a kérések maximális időtartama (ezredmásodpercben) az üzenetsorban marad. Alapértelmezés szerint 500.
- num_replicas
- int
A webszolgáltatáshoz lefoglalandó tárolók száma. Nincs alapértelmezett érték, ha ez a paraméter nincs beállítva, akkor az automatikus skálázás alapértelmezés szerint engedélyezve van.
- primary_key
- str
A webszolgáltatáshoz használandó elsődleges hitelesítési kulcs.
- secondary_key
- str
A webszolgáltatáshoz használandó másodlagos hitelesítési kulcs.
A webszolgáltatáshoz tartozó kulcsértékcímkék szótára.
A webszolgáltatáshoz tartozó kulcsérték-tulajdonságok szótára. Ezek a tulajdonságok nem módosíthatók az üzembe helyezés után, azonban új kulcsértékpárok is hozzáadhatók.
- gpu_cores
- int
A webszolgáltatáshoz lefoglalandó GPU-magok száma. Alapértelmezés szerint 0.
- period_seconds
- int
Milyen gyakran (másodpercben) hajtja végre az élőségi mintavételt. Alapértelmezés szerint 10 másodperc. A minimális érték 1.
- initial_delay_seconds
- int
A tároló elindítása utáni másodpercek száma az élőségi mintavételek elindítása előtt. Alapértelmezés szerint 310.
- timeout_seconds
- int
Az a másodperc, amely után az élőségi mintavétel túllépi az időkorlátot. Alapértelmezés szerint 2 másodperc. A minimális érték 1.
- success_threshold
- int
A sikertelen működés után sikeresnek ítélt élettartam-mintavétel minimális egymást követő sikerei. Alapértelmezés szerint 1. A minimális érték 1.
- failure_threshold
- int
Amikor elindul egy pod, és az élőképesség-mintavétel meghiúsul, a Kubernetes megpróbálja a hibátMegtartási időpontok a feladás előtt. Alapértelmezés szerint 3. A minimális érték 1.
- namespace
- str
A Webservice üzembe helyezéséhez használható Kubernetes-névtér: legfeljebb 63 kisbetűs alfanumerikus ('a'-'z', '0'-'9') és kötőjel ('-') karakter. Az első és az utolsó karakter nem lehet kötőjel.
- token_auth_enabled
- bool
Azt jelzi, hogy engedélyezi-e a jogkivonat hitelesítését ehhez a webszolgáltatáshoz. Ha ez engedélyezve van, a felhasználók elérhetik ezt a webszolgáltatást úgy, hogy lekérnek egy hozzáférési jogkivonatot az Azure Active Directory hitelesítő adataikkal. Alapértelmezés szerint Hamis.
- compute_target_name
- str
A központilag üzembe helyezendő számítási cél neve
- cpu_cores_limit
- float
A webszolgáltatás által használható processzormagok maximális száma. Lehet decimális.
- memory_gb_limit
- float
A webszolgáltatás által használható maximális memóriamennyiség (GB-ban). Lehet decimális.
- blobfuse_enabled
- bool
Azt jelzi, hogy engedélyezi-e a blobfuse-t a webszolgáltatás modellletöltéséhez. Alapértelmezett érték: True
Válaszok
Az AksWebservice üzembe helyezésekor használandó konfigurációs objektum.
Visszatérési típus
Kivételek
get_access_token
A webszolgáltatás hitelesítési jogkivonatának lekérése.
get_access_token()
Válaszok
A webszolgáltatás hitelesítési jogkivonatát leíró objektum.
Visszatérési típus
Kivételek
get_token
ELAVULT. Használja get_access_token
inkább a metódust.
A webszolgáltatás hitelesítési jogkivonatának lekérése.
get_token()
Válaszok
A webszolgáltatás hitelesítési jogkivonata, és annak frissítése.
Visszatérési típus
Kivételek
remove_tags
Távolítsa el a megadott kulcsokat a webszolgáltatás címkékből álló szótárából.
remove_tags(tags)
Paraméterek
run
Hívja meg ezt a webszolgáltatást a megadott bemenettel.
run(input_data)
Paraméterek
- input_data
- <xref:varies>
A webszolgáltatás meghívásának bemenete a következővel:
Válaszok
A webszolgáltatás meghívásának eredménye
Visszatérési típus
Kivételek
serialize
Konvertálja ezt a webszolgáltatást JSON szerializált szótárlá.
serialize()
Válaszok
A webszolgáltatás JSON-reprezentációja.
Visszatérési típus
update
Frissítse a webszolgáltatást a megadott tulajdonságokkal.
A Nincs érték változatlan marad ebben a webszolgáltatásban.
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
Paraméterek
- autoscale_enabled
- bool
A webszolgáltatás automatikus skálázásának engedélyezése vagy letiltása
- autoscale_min_replicas
- int
A webszolgáltatás automatikus skálázása során használandó tárolók minimális száma
- autoscale_max_replicas
- int
A webszolgáltatás automatikus skálázása során használandó tárolók maximális száma
- autoscale_refresh_seconds
- int
Milyen gyakran próbálja meg az automatikus skálázási szolgáltató skálázni ezt a webszolgáltatást?
- autoscale_target_utilization
- int
A cél kihasználtsága (a 100-ból százalékban) az automatikus skálázónak meg kell kísérelnie a webszolgáltatás karbantartását
- collect_model_data
- bool
Modelladatok gyűjtésének engedélyezése vagy letiltása ehhez a webszolgáltatáshoz
- auth_enabled
- bool
Azt jelzi, hogy engedélyezi-e a hitelesítést ehhez a webszolgáltatáshoz
- cpu_cores
- float
A webszolgáltatáshoz lefoglalandó processzormagok száma. Decimális is lehet
- memory_gb
- float
A webszolgáltatáshoz lefoglalandó memória mennyisége (GB-ban). Decimális is lehet
- enable_app_insights
- bool
Azt jelzi, hogy engedélyezi-e az Application Insights naplózását ehhez a webszolgáltatáshoz
- scoring_timeout_ms
- int
Időtúllépés a webszolgáltatás pontozási hívásainak kényszerítéséhez
- replica_max_concurrent_requests
- int
A webszolgáltatás engedélyezéséhez replikánkénti maximális egyidejű kérések száma.
- max_request_wait_time
- int
Az 503-at tartalmazó hiba visszaadása előtt a kérések maximális időtartama (ezredmásodpercben) az üzenetsorban marad
A webszolgáltatáshoz tartozó kulcsértékcímkék szótára. Lecseréli a meglévő címkéket.
A meglévő tulajdonságok szótárához hozzáadandó kulcsérték-tulajdonságok szótára
A frissített szolgáltatással csomagolandó modellobjektumok listája
- inference_config
- InferenceConfig
Egy InferenceConfig objektum, amely a modell szükséges üzembehelyezési tulajdonságainak megadására szolgál.
- period_seconds
- int
Milyen gyakran (másodpercben) hajtja végre az élőségi mintavételt. Alapértelmezés szerint 10 másodperc. A minimális érték 1.
- initial_delay_seconds
- int
A tároló elindítása utáni másodpercek száma az élőségi mintavételek elindítása előtt.
- timeout_seconds
- int
Azon másodpercek száma, amelyek után az élőképesség-mintavétel túllépi az időkorlátot. Alapértelmezés szerint 1 másodperc. A minimális érték 1.
- success_threshold
- int
A sikertelen működés után sikeresnek ítélt élettartam-mintavétel minimális egymást követő sikerei. Alapértelmezés szerint 1. A minimális érték 1.
- failure_threshold
- int
Amikor elindul egy pod, és az élőképesség-mintavétel meghiúsul, a Kubernetes megpróbálja a hibátMegtartási időpontok a feladás előtt. Alapértelmezés szerint 3. A minimális érték 1.
- namespace
- str
A Webservice üzembe helyezéséhez használható Kubernetes-névtér: legfeljebb 63 kisbetűs alfanumerikus ('a'-'z', '0'-'9') és kötőjel ('-') karakter. Az első és az utolsó karakter nem lehet kötőjel.
- token_auth_enabled
- bool
Azt jelzi, hogy engedélyezi-e a jogkivonat hitelesítését ehhez a webszolgáltatáshoz. Ha ez engedélyezve van, a felhasználók hozzáférhetnek ehhez a webszolgáltatáshoz úgy, hogy lekérik a hozzáférési jogkivonatot az Azure Active Directory hitelesítő adataikkal. Alapértelmezett érték: Hamis
- cpu_cores_limit
- float
A webszolgáltatás által használható processzormagok maximális száma. Lehet decimális.
- memory_gb_limit
- float
A webszolgáltatás által használható maximális memóriamennyiség (GB-ban). Lehet decimális.
- kwargs
- <xref:varies>
az AKS-webszolgáltatás Kubernetes online végpontra és üzembe helyezésre való migrálását támogató paramokat is tartalmazhat. is_migration=Igaz| Hamis, compute_target=.
Kivételek
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: