AksWebservice Kelas

Referensi

Mewakili model pembelajaran mesin yang disebarkan sebagai titik akhir layanan web pada Azure Kubernetes Service.

Layanan yang disebarkan dibuat dari model, skrip, serta file yang diasosiasikan. Layanan web yang dihasilkan adalah titik akhir HTTP yang bebannya diseimbangkan dengan REST API. Anda dapat mengirim data ke API ini serta menerima prediksi yang dikembalikan oleh model.

AksWebservice menyebarkan satu layanan ke satu titik akhir. Untuk menyebarkan beberapa layanan ke satu titik akhir, gunakanlah kelas AksEndpoint.

Untuk informasi selengkapnya, lihat Menyebarkan model ke kluster Azure Kubernetes Service.

Menginisialisasi instans Webservice.

Konstruktor Webservice mengambil representasi cloud dari objek Webservice yang terkait dengan ruang kerja yang disediakan. Ini akan mengembalikan instans kelas anak yang sesuai dengan jenis tertentu dari objek Webservice yang diambil.

Warisan: Webservice

AksWebservice

Konstruktor

AksWebservice(workspace, name)

Parameter

workspace: Workspace

Diperlukan

Objek ruang kerja yang berisi objek Layanan Web yang akan diambil.

name: str

Diperlukan

Nama objek Layanan Web yang akan diambil.

Keterangan

Pola penyebaran yang disarankan adalah membuat objek konfigurasi penyebaran dengan deploy_configuration metode lalu kemudian menggunakannya dengan deploy metode Model kelas seperti yang ditunjukkan di bawah ini.


   # Set the web service configuration (using default here)
   aks_config = AksWebservice.deploy_configuration()

   # # Enable token auth and disable (key) auth on the webservice
   # aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)

Sampel lengkap tersedia dari https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb

Ada sejumlah cara untuk menyebarkan model sebagai layanan web, termasuk dengan:

deploy metode untuk Model model yang sudah terdaftar di ruang kerja.
deploy_from_image metode dari Webservice.
deploy_from_model metode dari Webservice untuk model yang sudah terdaftar di ruang kerja. Metode ini akan membuat sebuah gambar.
deploymetode dari Webservice, yang akan mendaftarkan model dan membuat gambar.

Untuk informasi tentang bekerja dengan layanan web, lihat

Bagian Variabel mencantumkan atribut representasi lokal objek AksWebservice cloud. Variabel-variabel ini harus dianggap baca-saja. Mengubah nilainya tidak akan tercermin dalam objek cloud yang sesuai.

Variabel

enable_app_insights: bool

Apakah pengelogan Application Insights diaktifkan untuk Layanan Web atau tidak.

autoscaler: AutoScaler

Objek Penskala otomatis untuk Layanan web.

compute_name: str

Nama ComputeTarget tempat Layanan web disebarkan.

container_resource_requirements: ContainerResourceRequirements

Persyaratan sumber daya kontainer untuk Layanan Web.

liveness_probe_requirements: LivenessProbeRequirements

Persyaratan pemeriksaan keaktifan untuk Layanan Web.

data_collection: DataCollection

Objek DataCollection untuk Layanan web.

max_concurrent_requests_per_container: int

Jumlah maksimum permintaan serentak per kontainer untuk Layanan Web.

max_request_wait_time: int

Waktu tunggu permintaan maksimum untuk Layanan Web, dalam milidetik.

num_replicas: int

Jumlah replika untuk Layanan Web. Setiap replika sesuai dengan pod AKS.

scoring_timeout_ms: int

Batas waktu penilaian untuk Layanan Web, dalam milidetik.

azureml.core.webservice.AksWebservice.scoring_uri: str

Titik akhir penilaian untuk Layanan Web

is_default: bool

Jika Webservice adalah versi default untuk AksEndpoint induk.

traffic_percentile: int

Berapa persentase lalu lintas untuk dirutekan ke Webservice di AksEndpoint induk.

version_type: VersionType

Jenis versi untuk Layanan Web di induk AksEndpoint.

token_auth_enabled: bool

Apakah autentikasi token diaktifkan untuk Layanan Web atau tidak.

environment: Environment

Objek Lingkungan yang digunakan untuk membuat Layanan Web.

azureml.core.webservice.AksWebservice.models: list[Model]

Daftar Model yang disebarkan ke Layanan web.

deployment_status: str

Status penyebaran Layanan Web.

namespace: str

Kumpulan nama XML AKS dari Layanan Web.

azureml.core.webservice.AksWebservice.swagger_uri: str

Titik akhir swagger untuk Layanan Web.

Metode

add_properties	Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.
add_tags	Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini. Menaikkan WebserviceException.
deploy_configuration	Buat objek konfigurasi untuk disebarkan ke target komputasi AKS.
get_access_token	Mengambil token autentikasi untuk Layanan web ini.
get_token	TIDAK DIGUNAKAN LAGI. Gunakan metode `get_access_token` sebagai gantinya. Mengambil token autentikasi untuk Layanan web ini.
remove_tags	Hapus kunci yang ditentukan dari kamus tag Layanan Web ini.
run	Hubungi Layanan Web ini dengan input yang disediakan.
serialize	Konversi Layanan Web ini menjadi kamus serial JSON.
update	Perbarui Layanan Web dengan properti yang disediakan. Nilai yang dibiarkan None akan tetap tidak berubah di Layanan Web ini.

add_properties

Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.

add_properties(properties)

Parameter

properties: dict[str, str]

Diperlukan

Kamus properti yang ditambahkan.

add_tags

Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.

Menaikkan WebserviceException.

add_tags(tags)

Parameter

tags: dict[str, str]

Diperlukan

Kamus tag yang ditambahkan.

Pengecualian

WebserviceException

deploy_configuration

Buat objek konfigurasi untuk disebarkan ke target komputasi AKS.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)

Parameter

autoscale_enabled: bool

nilai default: None

Apakah akan mengaktifkan penskalaan otomatis untuk Webservice ini atau tidak. Default ke True jika num_replicas Tidak Ada.

autoscale_min_replicas: int

nilai default: None

Jumlah minimum kontainer yang digunakan saat melakukan penskalaan otomatis Webservice ini. Default ke 1.

autoscale_max_replicas: int

nilai default: None

Jumlah maksimum kontainer yang digunakan ketika melakukan penskalaan otomatis Webservice ini. Default ke 10.

autoscale_refresh_seconds: int

nilai default: None

Seberapa sering pembuat skala otomatis mencoba menskalakan Webservice ini. Default ke 1.

autoscale_target_utilization: int

nilai default: None

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.

collect_model_data: bool

nilai default: None

Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.

auth_enabled: bool

nilai default: None

Apakah akan mengaktifkan autentikasi kunci untuk Layanan web ini atau tidak. Default ke True.

cpu_cores: float

nilai default: None

Jumlah inti cpu yang akan dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0.1. Sesuai dengan permintaan inti pod, bukan batas, pada Azure Kubernetes Service.

memory_gb: float

nilai default: None

Jumlah memori (dalam GB) yang akan dialokasikan untuk Webservice ini. Bisa berupa desimal. Default ke 0.5. Sesuai dengan permintaan memori pod, bukan batasnya, di Azure Kubernetes Service.

enable_app_insights: bool

nilai default: None

Apakah akan mengaktifkan pengelogan Application Insights untuk Layanan web ini atau tidak. Default ke False.

scoring_timeout_ms: int

nilai default: None

Batas waktu untuk memberlakukan penilaian panggilan ke Layanan web ini. Default ke 60000.

replica_max_concurrent_requests: int

nilai default: None

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time: int

nilai default: None

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas: int

nilai default: None

Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.

primary_key: str

nilai default: None

Kunci autentikasi utama yang digunakan untuk Layanan Web ini.

secondary_key: str

nilai default: None

Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.

tags: dict[str, str]

nilai default: None

Kamus tag nilai kunci untuk memberikan Layanan Web ini.

properties: dict[str, str]

nilai default: None

Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

description: str

nilai default: None

Deskripsi untuk diberikan ke Layanan Web ini.

gpu_cores: int

nilai default: None

Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.

period_seconds: int

nilai default: None

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds: int

nilai default: None

Jumlah detik setelah kontainer dimulai sebelum pemeriksaan keaktifan diinisiasi. Default ke 310.

timeout_seconds: int

nilai default: None

Jumlah detik setelah waktu probe keaktifan habis. Default ke 2 detik. Nilai minimalnya adalah 1.

success_threshold: int

nilai default: None

Keberhasilan minimum berturut-turut untuk pemeriksaan keaktifan yang dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold: int

nilai default: None

Saat sebuah Pod dimulai dan probe keaktifan gagal, Kube akan mencoba waktu failureThreshold sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace: str

nilai default: None

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled: bool

nilai default: None

Apakah akan mengaktifkan autentikasi Token untuk Layanan web ini atau tidak. Jika diaktifkan, pengguna dapat mengakses Layanan Web ini dengan mengambil token akses menggunakan info masuk Azure Active Directory. Default ke False.

compute_target_name: str

nilai default: None

Nama target komputasi tujuan penyebaran

cpu_cores_limit: float

nilai default: None

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit: float

nilai default: None

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

blobfuse_enabled: bool

nilai default: None

Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True

Mengembalikan

Objek konfigurasi yang digunakan saat menyebarkan AksWebservice.

Tipe hasil

AksServiceDeploymentConfiguration

Pengecualian

WebserviceException

get_access_token

Mengambil token autentikasi untuk Layanan web ini.

get_access_token()

Mengembalikan

Objek yang menjelaskan token autentikasi untuk Layanan web ini.

Tipe hasil

AksServiceAccessToken

Pengecualian

WebserviceException

get_token

TIDAK DIGUNAKAN LAGI. Gunakan metode get_access_token sebagai gantinya.

Mengambil token autentikasi untuk Layanan web ini.

get_token()

Mengembalikan

Token autentikasi untuk Layanan web ini dan kapan harus melakukan refresh.

Tipe hasil

str, datetime

Pengecualian

WebserviceException

remove_tags

Hapus kunci yang ditentukan dari kamus tag Layanan Web ini.

remove_tags(tags)

Parameter

tags: list[str]

Diperlukan

Daftar kunci yang akan dihapus

run

Hubungi Layanan Web ini dengan input yang disediakan.

run(input_data)

Parameter

input_data: <xref:varies>

Diperlukan

Input untuk memanggil Layanan Web

Mengembalikan

Hasil dari pemanggilan Layanan Web

Tipe hasil

dict

Pengecualian

WebserviceException

serialize

Konversi Layanan Web ini menjadi kamus serial JSON.

serialize()

Mengembalikan

Representasi JSON dari Layanan Web ini.

Tipe hasil

dict

update

Perbarui Layanan Web dengan properti yang disediakan.

Nilai yang dibiarkan None akan tetap tidak berubah di Layanan Web ini.

update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)

Parameter

image: Image

nilai default: None

Gambar baru yang akan disebarkan ke Layanan Web

autoscale_enabled: bool

nilai default: None

Mengaktifkan atau menonaktifkan penskalaan otomatis Layanan web ini

autoscale_min_replicas: int

nilai default: None

Jumlah minimum kontainer yang digunakan saat melakukan penskalaan otomatis Layanan web ini

autoscale_max_replicas: int

nilai default: None

Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini

autoscale_refresh_seconds: int

nilai default: None

Seberapa sering penskala otomatis mencoba menskalakan Layanan Web ini

autoscale_target_utilization: int

nilai default: None

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini

collect_model_data: bool

nilai default: None

Mengaktifkan atau menonaktifkan pengumpulan data model untuk Layanan web ini

auth_enabled: bool

nilai default: None

Apakah akan mengaktifkan autentikasi untuk Layanan web ini atau tidak

cpu_cores: float

nilai default: None

Jumlah inti cpu yang akan dialokasikan untuk Layanan web ini. Bisa berupa desimal

memory_gb: float

nilai default: None

Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal

enable_app_insights: bool

nilai default: None

Apakah akan mengaktifkan pengelogan Application Insights untuk Layanan web ini atau tidak

scoring_timeout_ms: int

nilai default: None

Batas waktu untuk memberlakukan penilaian panggilan ke Layanan web ini

replica_max_concurrent_requests: int

nilai default: None

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini.

max_request_wait_time: int

nilai default: None

Jumlah maksimum waktu permintaan akan tetap dalam antrean (dalam milidetik) sebelum menampilkan kesalahan 503

num_replicas: int

nilai default: None

Jumlah kontainer yang dialokasikan untuk Layanan web ini

tags: dict[str, str]

nilai default: None

Kamus tag nilai kunci untuk memberikan Layanan Web ini. Akan menggantikan tag yang tersedia.

properties: dict[str, str]

nilai default: None

Kamus properti nilai kunci untuk ditambahkan ke kamus properti yang tersedia

description: str

nilai default: None

Deskripsi yang akan diberikan untuk Layanan web ini

models: list[Model]

nilai default: None

Daftar objek Model yang untuk paket dengan layanan yang diperbarui

inference_config: InferenceConfig

nilai default: None

Objek InferenceConfig yang digunakan untuk menyediakan properti penyebaran model yang diperlukan.

gpu_cores: int

nilai default: None

Jumlah core GPU yang akan dialokasikan untuk Layanan web ini

period_seconds: int

nilai default: None

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds: int

nilai default: None

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai.

timeout_seconds: int

nilai default: None

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Default ke 1 detik. Nilai minimalnya adalah 1.

success_threshold: int

nilai default: None

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold: int

nilai default: None

Saat sebuah Pod dimulai dan probe keaktifan gagal, Kube akan mencoba waktu failureThreshold sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace: str

nilai default: None

token_auth_enabled: bool

nilai default: None

Apakah akan mengaktifkan autentikasi Token untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan info masuk Azure Active Directory mereka. Default ke False

cpu_cores_limit: float

nilai default: None

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit: float

nilai default: None

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

kwargs: <xref:varies>

Diperlukan

sertakan params untuk mendukung migrasi layanan web AKS ke titik akhir dan penyebaran online Kubernetes. is_migration=True|False, compute_target=.

Pengecualian

WebserviceException

Share via

AksWebservice Kelas

Konstruktor

Parameter

Keterangan

Variabel

Metode

add_properties

Parameter

add_tags

Parameter

Pengecualian

deploy_configuration

Parameter

Mengembalikan

Tipe hasil

Pengecualian

get_access_token

Mengembalikan

Tipe hasil

Pengecualian

get_token

Mengembalikan

Tipe hasil

Pengecualian

remove_tags

Parameter

run

Parameter

Mengembalikan

Tipe hasil

Pengecualian

serialize

Mengembalikan

Tipe hasil

update

Parameter

Pengecualian

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan: