AksServiceDeploymentConfiguration Kelas

Mewakili informasi konfigurasi penyebaran untuk layanan yang diterapkan pada Azure Kubernetes Service.

Buat objek AksServiceDeploymentConfiguration menggunakan metode deploy_configuration dari kelas AksWebservice.

Menginisialisasi objek konfigurasi untuk disebarkan ke target komputasi AKS.

Warisan
AksServiceDeploymentConfiguration

Konstruktor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parameter

cpu_cores_limit
Diperlukan

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit
Diperlukan

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

autoscale_enabled
bool
Diperlukan

Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini. Defaultnya diatur ke True jika num_replicas adalah None.

autoscale_min_replicas
int
Diperlukan

Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.

autoscale_max_replicas
int
Diperlukan

Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10

autoscale_refresh_seconds
int
Diperlukan

Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.

autoscale_target_utilization
int
Diperlukan

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.

collect_model_data
bool
Diperlukan

Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.

auth_enabled
bool
Diperlukan

Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.

cpu_cores
float
Diperlukan

Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1

memory_gb
float
Diperlukan

Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5

enable_app_insights
bool
Diperlukan

Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False

scoring_timeout_ms
int
Diperlukan

Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.

replica_max_concurrent_requests
int
Diperlukan

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time
int
Diperlukan

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas
int
Diperlukan

Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.

primary_key
str
Diperlukan

Kunci autentikasi utama yang digunakan untuk Layanan Web ini.

secondary_key
str
Diperlukan

Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.

tags
dict[str, str]
Diperlukan

Kamus tag nilai kunci untuk memberikan Layanan Web ini.

properties
dict[str, str]
Diperlukan

Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

description
str
Diperlukan

Deskripsi untuk diberikan ke Layanan Web ini.

gpu_cores
int
Diperlukan

Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.

period_seconds
int
Diperlukan

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds
int
Diperlukan

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.

timeout_seconds
int
Diperlukan

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.

success_threshold
int
Diperlukan

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold
int
Diperlukan

Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace
str
Diperlukan

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled
bool
Diperlukan

Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.

cpu_cores_limit
Diperlukan

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit
Diperlukan

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

blobfuse_enabled
bool
nilai default: None

Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True

autoscale_enabled
bool
Diperlukan

Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini. Defaultnya diatur ke True jika num_replicas adalah None.

autoscale_min_replicas
int
Diperlukan

Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.

autoscale_max_replicas
int
Diperlukan

Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10

autoscale_refresh_seconds
int
Diperlukan

Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.

autoscale_target_utilization
int
Diperlukan

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.

collect_model_data
bool
Diperlukan

Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.

auth_enabled
bool
Diperlukan

Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.

cpu_cores
float
Diperlukan

Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1

memory_gb
float
Diperlukan

Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5

enable_app_insights
bool
Diperlukan

Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False

scoring_timeout_ms
int
Diperlukan

Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.

replica_max_concurrent_requests
int
Diperlukan

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time
int
Diperlukan

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas
int
Diperlukan

Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.

primary_key
str
Diperlukan

Kunci autentikasi utama yang digunakan untuk Layanan Web ini.

secondary_key
str
Diperlukan

Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.

tags
dict[str, str]
Diperlukan

Kamus tag nilai kunci untuk memberikan Layanan Web ini.

properties
dict[str, str]
Diperlukan

Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

description
str
Diperlukan

Deskripsi untuk diberikan ke Layanan Web ini.

gpu_cores
int
Diperlukan

Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.

period_seconds
int
Diperlukan

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds
int
Diperlukan

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.

timeout_seconds
int
Diperlukan

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.

success_threshold
int
Diperlukan

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold
int
Diperlukan

Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace
str
Diperlukan

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled
bool
Diperlukan

Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.

compute_target_name
str
Diperlukan

Nama target komputasi tujuan penyebaran

cpu_cores_limit
float
Diperlukan

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit
float
Diperlukan

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

blobfuse_enabled
bool
Diperlukan

Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True

Variabel

autoscale_enabled
bool

Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini. Defaultnya diatur ke True jika num_replicas adalah None.

autoscale_min_replicas
int

Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.

autoscale_max_replicas
int

Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10

autoscale_refresh_seconds
int

Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.

autoscale_target_utilization
int

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.

collect_model_data
bool

Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.

auth_enabled
bool

Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.

cpu_cores
float

Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1

memory_gb
float

Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5

enable_app_insights
bool

Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False

scoring_timeout_ms
int

Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.

replica_max_concurrent_requests
int

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time
int

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas
int

Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.

primary_key
str

Kunci autentikasi utama yang digunakan untuk Layanan Web ini.

secondary_key
str

Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Kamus tag nilai kunci untuk memberikan Layanan Web ini.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Deskripsi untuk diberikan ke Layanan Web ini.

gpu_cores
int

Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.

period_seconds
int

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds
int

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.

timeout_seconds
int

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.

success_threshold
int

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold
int

Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled
bool

Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.

Metode

print_deploy_configuration

Cetak konfigurasi penyebaran.

validate_configuration

Periksa apakah nilai konfigurasi yang ditentukan valid.

Akan memunculkan WebserviceException jika validasi gagal.

print_deploy_configuration

Cetak konfigurasi penyebaran.

print_deploy_configuration()

validate_configuration

Periksa apakah nilai konfigurasi yang ditentukan valid.

Akan memunculkan WebserviceException jika validasi gagal.

validate_configuration()

Pengecualian