AksWebservice Kelas
Mewakili model pembelajaran mesin yang disebarkan sebagai titik akhir layanan web pada Azure Kubernetes Service.
Layanan yang disebarkan dibuat dari model, skrip, serta file yang diasosiasikan. Layanan web yang dihasilkan adalah titik akhir HTTP yang bebannya diseimbangkan dengan REST API. Anda dapat mengirim data ke API ini serta menerima prediksi yang dikembalikan oleh model.
AksWebservice menyebarkan satu layanan ke satu titik akhir. Untuk menyebarkan beberapa layanan ke satu titik akhir, gunakanlah kelas AksEndpoint.
Untuk informasi selengkapnya, lihat Menyebarkan model ke kluster Azure Kubernetes Service.
Menginisialisasi instans Webservice.
Konstruktor Webservice mengambil representasi cloud dari objek Webservice yang terkait dengan ruang kerja yang disediakan. Ini akan mengembalikan instans kelas anak yang sesuai dengan jenis tertentu dari objek Webservice yang diambil.
- Warisan
-
AksWebservice
Konstruktor
AksWebservice(workspace, name)
Parameter
Keterangan
Pola penyebaran yang disarankan adalah membuat objek konfigurasi penyebaran dengan deploy_configuration
metode lalu kemudian menggunakannya dengan deploy
metode Model kelas seperti yang ditunjukkan di bawah ini.
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
Sampel lengkap tersedia dari https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb
Ada sejumlah cara untuk menyebarkan model sebagai layanan web, termasuk dengan:
deploy
metode untuk Model model yang sudah terdaftar di ruang kerja.deploy_from_image
metode dari Webservice.deploy_from_model
metode dari Webservice untuk model yang sudah terdaftar di ruang kerja. Metode ini akan membuat sebuah gambar.deploy
metode dari Webservice, yang akan mendaftarkan model dan membuat gambar.
Untuk informasi tentang bekerja dengan layanan web, lihat
Menggunakan model Azure Machine Learning yang disebarkan sebagai layanan web
Memantau dan mengumpulkan data dari titik akhir layanan web ML
Bagian Variabel mencantumkan atribut representasi lokal objek AksWebservice cloud. Variabel-variabel ini harus dianggap baca-saja. Mengubah nilainya tidak akan tercermin dalam objek cloud yang sesuai.
Variabel
- enable_app_insights
- bool
Apakah pengelogan Application Insights diaktifkan untuk Layanan Web atau tidak.
- autoscaler
- AutoScaler
Objek Penskala otomatis untuk Layanan web.
- compute_name
- str
Nama ComputeTarget tempat Layanan web disebarkan.
- container_resource_requirements
- ContainerResourceRequirements
Persyaratan sumber daya kontainer untuk Layanan Web.
- liveness_probe_requirements
- LivenessProbeRequirements
Persyaratan pemeriksaan keaktifan untuk Layanan Web.
- data_collection
- DataCollection
Objek DataCollection untuk Layanan web.
- max_concurrent_requests_per_container
- int
Jumlah maksimum permintaan serentak per kontainer untuk Layanan Web.
- max_request_wait_time
- int
Waktu tunggu permintaan maksimum untuk Layanan Web, dalam milidetik.
- num_replicas
- int
Jumlah replika untuk Layanan Web. Setiap replika sesuai dengan pod AKS.
- scoring_timeout_ms
- int
Batas waktu penilaian untuk Layanan Web, dalam milidetik.
- azureml.core.webservice.AksWebservice.scoring_uri
- str
Titik akhir penilaian untuk Layanan Web
- is_default
- bool
Jika Webservice adalah versi default untuk AksEndpoint induk.
- traffic_percentile
- int
Berapa persentase lalu lintas untuk dirutekan ke Webservice di AksEndpoint induk.
- version_type
- VersionType
Jenis versi untuk Layanan Web di induk AksEndpoint.
- token_auth_enabled
- bool
Apakah autentikasi token diaktifkan untuk Layanan Web atau tidak.
- environment
- Environment
Objek Lingkungan yang digunakan untuk membuat Layanan Web.
Daftar Model yang disebarkan ke Layanan web.
- deployment_status
- str
Status penyebaran Layanan Web.
- namespace
- str
Kumpulan nama XML AKS dari Layanan Web.
- azureml.core.webservice.AksWebservice.swagger_uri
- str
Titik akhir swagger untuk Layanan Web.
Metode
add_properties |
Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini. |
add_tags |
Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini. Menaikkan WebserviceException. |
deploy_configuration |
Buat objek konfigurasi untuk disebarkan ke target komputasi AKS. |
get_access_token |
Mengambil token autentikasi untuk Layanan web ini. |
get_token |
TIDAK DIGUNAKAN LAGI. Gunakan metode Mengambil token autentikasi untuk Layanan web ini. |
remove_tags |
Hapus kunci yang ditentukan dari kamus tag Layanan Web ini. |
run |
Hubungi Layanan Web ini dengan input yang disediakan. |
serialize |
Konversi Layanan Web ini menjadi kamus serial JSON. |
update |
Perbarui Layanan Web dengan properti yang disediakan. Nilai yang dibiarkan None akan tetap tidak berubah di Layanan Web ini. |
add_properties
Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.
add_properties(properties)
Parameter
add_tags
Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.
Menaikkan WebserviceException.
add_tags(tags)
Parameter
Pengecualian
deploy_configuration
Buat objek konfigurasi untuk disebarkan ke target komputasi AKS.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
Parameter
- autoscale_enabled
- bool
Apakah akan mengaktifkan penskalaan otomatis untuk Webservice ini atau tidak. Default ke True jika num_replicas Tidak Ada.
- autoscale_min_replicas
- int
Jumlah minimum kontainer yang digunakan saat melakukan penskalaan otomatis Webservice ini. Default ke 1.
- autoscale_max_replicas
- int
Jumlah maksimum kontainer yang digunakan ketika melakukan penskalaan otomatis Webservice ini. Default ke 10.
- autoscale_refresh_seconds
- int
Seberapa sering pembuat skala otomatis mencoba menskalakan Webservice ini. Default ke 1.
- autoscale_target_utilization
- int
Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.
- collect_model_data
- bool
Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.
- auth_enabled
- bool
Apakah akan mengaktifkan autentikasi kunci untuk Layanan web ini atau tidak. Default ke True.
- cpu_cores
- float
Jumlah inti cpu yang akan dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0.1. Sesuai dengan permintaan inti pod, bukan batas, pada Azure Kubernetes Service.
- memory_gb
- float
Jumlah memori (dalam GB) yang akan dialokasikan untuk Webservice ini. Bisa berupa desimal. Default ke 0.5. Sesuai dengan permintaan memori pod, bukan batasnya, di Azure Kubernetes Service.
- enable_app_insights
- bool
Apakah akan mengaktifkan pengelogan Application Insights untuk Layanan web ini atau tidak. Default ke False.
- scoring_timeout_ms
- int
Batas waktu untuk memberlakukan penilaian panggilan ke Layanan web ini. Default ke 60000.
- replica_max_concurrent_requests
- int
Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.
- max_request_wait_time
- int
Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.
- num_replicas
- int
Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.
- secondary_key
- str
Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.
Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.
- gpu_cores
- int
Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.
- period_seconds
- int
Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.
- initial_delay_seconds
- int
Jumlah detik setelah kontainer dimulai sebelum pemeriksaan keaktifan diinisiasi. Default ke 310.
- timeout_seconds
- int
Jumlah detik setelah waktu probe keaktifan habis. Default ke 2 detik. Nilai minimalnya adalah 1.
- success_threshold
- int
Keberhasilan minimum berturut-turut untuk pemeriksaan keaktifan yang dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.
- failure_threshold
- int
Saat sebuah Pod dimulai dan probe keaktifan gagal, Kube akan mencoba waktu failureThreshold sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.
- namespace
- str
Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.
- token_auth_enabled
- bool
Apakah akan mengaktifkan autentikasi Token untuk Layanan web ini atau tidak. Jika diaktifkan, pengguna dapat mengakses Layanan Web ini dengan mengambil token akses menggunakan info masuk Azure Active Directory. Default ke False.
- cpu_cores_limit
- float
Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.
- memory_gb_limit
- float
Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.
- blobfuse_enabled
- bool
Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True
Mengembalikan
Objek konfigurasi yang digunakan saat menyebarkan AksWebservice.
Tipe hasil
Pengecualian
get_access_token
Mengambil token autentikasi untuk Layanan web ini.
get_access_token()
Mengembalikan
Objek yang menjelaskan token autentikasi untuk Layanan web ini.
Tipe hasil
Pengecualian
get_token
TIDAK DIGUNAKAN LAGI. Gunakan metode get_access_token
sebagai gantinya.
Mengambil token autentikasi untuk Layanan web ini.
get_token()
Mengembalikan
Token autentikasi untuk Layanan web ini dan kapan harus melakukan refresh.
Tipe hasil
Pengecualian
remove_tags
Hapus kunci yang ditentukan dari kamus tag Layanan Web ini.
remove_tags(tags)
Parameter
run
Hubungi Layanan Web ini dengan input yang disediakan.
run(input_data)
Parameter
- input_data
- <xref:varies>
Input untuk memanggil Layanan Web
Mengembalikan
Hasil dari pemanggilan Layanan Web
Tipe hasil
Pengecualian
serialize
Konversi Layanan Web ini menjadi kamus serial JSON.
serialize()
Mengembalikan
Representasi JSON dari Layanan Web ini.
Tipe hasil
update
Perbarui Layanan Web dengan properti yang disediakan.
Nilai yang dibiarkan None akan tetap tidak berubah di Layanan Web ini.
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
Parameter
- autoscale_enabled
- bool
Mengaktifkan atau menonaktifkan penskalaan otomatis Layanan web ini
- autoscale_min_replicas
- int
Jumlah minimum kontainer yang digunakan saat melakukan penskalaan otomatis Layanan web ini
- autoscale_max_replicas
- int
Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini
- autoscale_refresh_seconds
- int
Seberapa sering penskala otomatis mencoba menskalakan Layanan Web ini
- autoscale_target_utilization
- int
Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini
- collect_model_data
- bool
Mengaktifkan atau menonaktifkan pengumpulan data model untuk Layanan web ini
- auth_enabled
- bool
Apakah akan mengaktifkan autentikasi untuk Layanan web ini atau tidak
- cpu_cores
- float
Jumlah inti cpu yang akan dialokasikan untuk Layanan web ini. Bisa berupa desimal
- memory_gb
- float
Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal
- enable_app_insights
- bool
Apakah akan mengaktifkan pengelogan Application Insights untuk Layanan web ini atau tidak
- scoring_timeout_ms
- int
Batas waktu untuk memberlakukan penilaian panggilan ke Layanan web ini
- replica_max_concurrent_requests
- int
Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini.
- max_request_wait_time
- int
Jumlah maksimum waktu permintaan akan tetap dalam antrean (dalam milidetik) sebelum menampilkan kesalahan 503
Kamus tag nilai kunci untuk memberikan Layanan Web ini. Akan menggantikan tag yang tersedia.
Kamus properti nilai kunci untuk ditambahkan ke kamus properti yang tersedia
Daftar objek Model yang untuk paket dengan layanan yang diperbarui
- inference_config
- InferenceConfig
Objek InferenceConfig yang digunakan untuk menyediakan properti penyebaran model yang diperlukan.
- period_seconds
- int
Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.
- initial_delay_seconds
- int
Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai.
- timeout_seconds
- int
Jumlah detik setelah waktu pemeriksaan keaktifan habis. Default ke 1 detik. Nilai minimalnya adalah 1.
- success_threshold
- int
Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.
- failure_threshold
- int
Saat sebuah Pod dimulai dan probe keaktifan gagal, Kube akan mencoba waktu failureThreshold sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.
- namespace
- str
Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.
- token_auth_enabled
- bool
Apakah akan mengaktifkan autentikasi Token untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan info masuk Azure Active Directory mereka. Default ke False
- cpu_cores_limit
- float
Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.
- memory_gb_limit
- float
Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.
- kwargs
- <xref:varies>
sertakan params untuk mendukung migrasi layanan web AKS ke titik akhir dan penyebaran online Kubernetes. is_migration=True|False, compute_target=.
Pengecualian
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk