Kuota dan batas layanan Ucapan

Artikel ini berisi referensi cepat dan deskripsi terperinci tentang kuota dan batas untuk layanan Ucapan di Azure Cognitive Services. Informasi ini berlaku untuk semua tingkatan harga layanan. Ini juga berisi beberapa praktik terbaik untuk menghindari pembatasan permintaan.

Referensi kuota dan batas

Bagian berikut memberi Anda panduan cepat tentang kuota dan batas yang berlaku untuk layanan Ucapan.

Kuota dan batas ucapan ke teks per sumber daya

Dalam tabel berikut, parameter tanpa baris Dapat disesuaikan tidak dapat disesuaikan untuk semua tingkatan harga.

Transkripsi online

Anda dapat menggunakan transkripsi online dengan Speech SDK atau REST API ucapan ke teks untuk audio singkat.

Kuota Gratis (F0)1 Standar (S0)
Batas permintaan bersamaan - titik akhir model dasar 1 100 (nilai default)
Dapat disesuaikan No2 Ya2
Batas permintaan bersamaan - titik akhir kustom 1 100 (nilai default)
Dapat disesuaikan No2 Ya2

Transkripsi batch

Kuota Gratis (F0)1 Standar (S0)
Batas REST API ucapan ke teks V2.0 dan v3.0 Tidak tersedia untuk F0 300 permintaan per menit
Ukuran file input audio maks T/A 1 GB
Ukuran blob input maks (misalnya, dapat berisi lebih dari satu file dalam arsip zip). Perhatikan batas ukuran file dari baris sebelumnya. T/A 2,5 GB
Ukuran kontainer blob maks T/A 5 GB
Jumlah maksimal blob per kontainer T/A 10000
Jumlah maksimum file per permintaan transkripsi (saat Anda menggunakan beberapa URL konten sebagai input). T/A 1000

Kustomisasi model

Kuota Gratis (F0)1 Standar (S0)
Batas REST API 300 permintaan per menit 300 permintaan per menit
Jumlah maksimal himpunan data ucapan 2 500
Ukuran file himpunan data akustik maks untuk impor data 2 GB 2 GB
Ukuran file himpunan data bahasa maks untuk impor data 200 MB 1,5 GB
Ukuran file himpunan data pengucapan untuk impor data 1 KB 1 MB
Ukuran teks maksimum saat Anda menggunakan parameter text dalam permintaan API Buat Model 200 KB 500 KB

1 Untuk tingkat harga gratis (F0), lihat juga alokasi bulanan di halaman harga.
2 Lihat penjelasan tambahan, praktik terbaik, dan petunjuk penyesuaian.

Kuota dan batasan teks ke ucapan per sumber daya

Dalam tabel berikut, parameter tanpa baris Dapat disesuaikan tidak dapat disesuaikan untuk semua tingkatan harga.

Umum

Kuota Gratis (F0)3 Standar (S0)
Jumlah maksimum transaksi per periode waktu tertentu per sumber daya layanan Ucapan
API real-time. Suara neural bawaan dan suara neural kustom. 20 transaksi per 60 detik 200 transaksi per detik (TPS) (nilai default)
Dapat disesuaikan No4 Ya5, hingga 1000 TPS
Kuota khusus HTTP
Panjang audio maks yang dihasilkan per permintaan 10 menit 10 menit
Jumlah maksimum tag <voice> dan <audio> yang berbeda dalam SSML 50 50
Kuota spesifik websocket
Panjang audio maks yang dihasilkan per giliran 10 menit 10 menit
Jumlah maksimum tag <voice> dan <audio> yang berbeda dalam SSML 50 50
Ukuran pesan SSML maks per giliran 64 KB 64 KB

API Long Audio

Kuota Gratis (F0)3 Standar (S0)
Panjang teks minimum T/A 400 karakter untuk teks biasa; 400 karakter yang dapat ditagih untuk SSML
Panjang teks maksimum T/A 10000 paragraf
Waktu mulai T/A 10 tugas atau 10.000 karakter terakumulasi

Suara Saraf Kustom

Kuota Gratis (F0)3 Standar (S0)
Jumlah maksimum transaksi per detik (TPS) per sumber daya layanan Ucapan Tidak tersedia untuk F0 Lihat Umum
Jumlah maksimum himpunan data per sumber daya layanan Ucapan T/A 500
Jumlah maksimum unggahan himpunan data serentak per sumber daya layanan Ucapan T/A 5
Ukuran file data maks untuk impor data per himpunan data T/A 2 GB
Mengunggah audio atau audio panjang tanpa skrip T/A Ya
Jumlah maksimum pelatihan model serentak per sumber daya layanan Ucapan T/A 3
Jumlah maksimum titik akhir kustom per sumber daya layanan Ucapan T/A 50
Batas permintaan bersamaan untuk Suara Neural Kustom
Nilai default T/A 10
Dapat disesuaikan T/A Ya5

Alat Pembuatan Konten Audio

Kuota Gratis (F0) Standar (S0)
Ukuran file 3.000 karakter per file 20.000 karakter per file
Mengekspor ke pustaka audio 1 tugas bersamaan T/A

3 Untuk tingkat harga gratis (F0), lihat juga alokasi bulanan di halaman harga.
4 Lihat penjelasan tambahan dan praktik terbaik.
5 Lihat penjelasan tambahan, praktik terbaik, dan petunjuk penyesuaian.

Deskripsi mendetail, penyesuaian kuota, dan praktik terbaik

Sebelum meminta peningkatan kuota (jika ada), pastikan bahwa hal ini diperlukan. Layanan Ucapan menggunakan teknologi penskalaan otomatis untuk membawa sumber daya komputasi yang diperlukan dalam mode sesuai permintaan. Pada saat yang sama, layanan Ucapan mencoba untuk menjaga biaya Anda tetap rendah dengan tidak mempertahankan kapasitas perangkat keras yang berlebihan.

Mari kita lihat contoh. Misalkan aplikasi Anda menerima kode respons 429, yang menunjukkan bahwa ada terlalu banyak permintaan. Aplikasi Anda menerima respons ini meskipun beban kerja Anda berada dalam batas yang ditentukan oleh Referensi kuota dan batas. Penjelasan yang paling tepat adalah bahwa layanan Ucapan melakukan peningkatan berdasarkan permintaan Anda dan masih belum mencapai skala yang diperlukan. Oleh karena itu, layanan tidak segera memiliki sumber daya yang cukup untuk melayani permintaan. Dalam kebanyakan kasus, keadaan yang dibatasi ini bersifat sementara.

Praktik terbaik umum untuk mengurangi pelambatan selama penskalaan otomatis

Untuk meminimalkan masalah yang berkaitan dengan pembatasan, ada baiknya Anda menggunakan teknik berikut:

  • Terapkan logika coba lagi di aplikasi Anda.
  • Hindari perubahan ekstrem dalam beban kerja. Tingkatkan beban kerja secara bertahap. Misalnya, katakanlah aplikasi Anda menggunakan teks ke ucapan, dan beban kerja Anda saat ini adalah 5 TPS. Detik berikutnya, Anda meningkatkan beban menjadi 20 TPS (yaitu empat kali lebih banyak). Layanan Ucapan segera memulai peningkatan skala untuk memenuhi beban baru, tetapi tidak dapat menskalakan sesuai kebutuhan dalam satu detik. Beberapa permintaan akan mendapatkan kode respons 429 (terlalu banyak permintaan).
  • Uji pola peningkatan beban yang berbeda. Untuk informasi selengkapnya, lihat contoh pola beban kerja.
  • Buat sumber daya layanan Ucapan tambahan di berbagai wilayah, dan distribusikan beban kerja di antara wilayah tersebut. (Membuat beberapa sumber daya layanan Ucapan di wilayah yang sama tidak akan memengaruhi performa, karena semua sumber daya akan dilayani oleh kluster backend yang sama).

Bagian berikutnya menjelaskan kasus-kasus khusus dalam menyesuaikan kuota.

Ucapan ke teks: meningkatkan batas permintaan transkripsi online secara bersamaan

Secara default, jumlah permintaan bersamaan dibatasi hingga 100 per sumber daya dalam model dasar, dan 100 per titik akhir kustom dalam model kustom. Untuk tingkat harga standar, Anda dapat meningkatkan jumlah ini. Sebelum mengirimkan permintaan, pastikan Anda tidak asing dengan materi yang dibahas sebelumnya dalam artikel ini, seperti praktik terbaik untuk mengurangi pembatasan.

Catatan

Jika Anda menggunakan model kustom, ketahui bahwa satu sumber daya layanan Ucapan dapat dikaitkan dengan banyak titik akhir kustom yang menghosting banyak penyebaran model kustom. Setiap titik akhir kustom memiliki batas default permintaan bersamaan (100) yang ditetapkan oleh pembuatan. Jika Anda perlu menyesuaikannya, Anda perlu membuat penyesuaian setiap titik akhir khusus secara terpisah. Perhatikan juga bahwa nilai batas permintaan bersamaan untuk model dasar sumber daya tidak berpengaruh terhadap titik akhir kustom yang terkait dengan sumber daya ini.

Meningkatkan batas permintaan bersamaan tidak memengaruhi biaya Anda secara langsung. Layanan Ucapan menggunakan model pembayaran yang mengharuskan Anda membayar hanya untuk apa yang Anda gunakan. Batas menentukan seberapa tinggi layanan dapat diskalakan sebelum mulai membatasi permintaan Anda.

Batas permintaan bersamaan untuk model dasar dan kustom perlu disesuaikan secara terpisah.

Anda tidak dapat melihat nilai yang ada dari parameter batas permintaan bersamaan di portal Azure, alat baris perintah, atau permintaan API. Untuk memverifikasi nilai yang ada, buat permintaan dukungan Azure.

Catatan

Kontainer ucapan tidak memerlukan peningkatan batas permintaan bersamaan, karena kontainer hanya dibatasi oleh CPU dari perangkat keras tempat kontainer tersebut dihosting. Namun, kontainer ucapan memiliki batasan kapasitasnya sendiri yang harus diperhitungkan. Untuk informasi selengkapnya, lihat FAQ kontainer ucapan.

Menyiapkan informasi yang diperlukan

  • Untuk model dasar:
    • ID sumber daya ucapan
    • Wilayah
  • Untuk model kustom:
    • Wilayah
    • ID titik akhir kustom

Cara mendapatkan informasi untuk model dasar:

  1. Buka portal Azure.
  2. Pilih sumber daya layanan Ucapan yang ingin Anda tingkatkan batas permintaan bersamaannya.
  3. Dari grup Pengelolaan Sumber Daya, pilih Properti.
  4. Menyalin dan menyimpan nilai bidang berikut:
    • ID Sumber Daya
    • Lokasi (wilayah titik akhir Anda)

Cara mendapatkan informasi untuk model kustom:

  1. Buka portal Speech Studio.
  2. Masuk jika perlu, dan buka Ucapan Kustom.
  3. Pilih proyek Anda, dan buka Penyebaran.
  4. Pilih titik akhir yang diperlukan.
  5. Menyalin dan menyimpan nilai bidang berikut:
    • Wilayah Layanan (wilayah titik akhir Anda)
    • ID Titik Akhir

Membuat dan mengirimkan permintaan dukungan

Mulai peningkatan batas untuk permintaan bersamaan sumber daya Anda, atau jika perlu periksa batas saat ini, dengan mengirimkan permintaan dukungan. Berikut caranya:

  1. Pastikan Anda memiliki informasi yang diperlukan yang tercantum di bagian sebelumnya.
  2. Buka portal Azure.
  3. Pilih sumber daya layanan Ucapan yang ingin Anda tingkatkan (atau periksa) batas permintaan bersamaannya.
  4. Di grup Dukungan + pemecahan masalah, pilih Permintaan dukungan baru. Jendela baru akan muncul dengan informasi yang terisi otomatis tentang langganan Azure dan sumber daya Azure Anda.
  5. Dalam Ringkasan, jelaskan apa yang Anda inginkan (misalnya, "Tingkatkan batas permintaan bersamaan ucapan ke teks").
  6. Di Jenis masalah, pilih Masalah Kuota atau Langganan.
  7. Di Subjenis masalah, pilih:
    • Peningkatan permintaan bersamaan atau kuota untuk permintaan yang meningkat.
    • Validasi kuota atau penggunaan untuk memeriksa batas yang ada.
  8. Pilih Berikutnya: Solusi. Lanjutkan lebih jauh dengan pembuatan permintaan.
  9. Pada tab Detail, di bidang Deskripsi, masukkan hal berikut:
    • Catatan bahwa permintaan tersebut tentang kuota ucapan ke teks.
    • Pilih model dasar atau kustom.
    • Informasi sumber daya Azure yang Anda kumpulkan sebelumnya.
    • Informasi lain yang diperlukan.
  10. Di tab Tinjau + buat, pilih Buat.
  11. Catat nomor permintaan dukungan di pemberitahuan portal Azure. Anda akan segera dihubungi terkait permintaan Anda.

Contoh praktik terbaik pola beban kerja

Berikut adalah contoh umum dari pendekatan yang tepat untuk dilakukan. Ini dimaksudkan hanya sebagai template yang dapat Anda sesuaikan sesuai kebutuhan untuk penggunaan Anda sendiri.

Misalkan sumber daya layanan Ucapan memiliki batas permintaan bersamaan yang ditetapkan ke 300. Mulai beban kerja dari 20 sambungan bersamaan, dan tingkatkan beban sebanyak 20 sambungan bersamaan setiap 90-120 detik. Kontrol respons layanan, dan terapkan logika yang mundur (mengurangi beban) jika Anda mendapatkan terlalu banyak permintaan (kode respons 429). Kemudian, coba lagi peningkatan beban dalam satu menit, dan jika masih tidak berfungsi, coba lagi dalam dua menit. Gunakan pola 1-2-4-4 menit untuk intervalnya.

Umumnya, merupakan ide yang sangat bagus untuk menguji beban kerja dan pola beban kerja sebelum melanjutkan ke produksi.

Teks ke ucapan: meningkatkan batas permintaan bersamaan

Untuk tingkat harga standar, Anda dapat meningkatkan jumlah ini. Sebelum mengirimkan permintaan, pastikan Anda tidak asing dengan materi yang dibahas sebelumnya dalam artikel ini, seperti praktik terbaik untuk mengurangi pembatasan.

Meningkatkan batas permintaan bersamaan tidak memengaruhi biaya Anda secara langsung. Layanan Ucapan menggunakan model pembayaran yang mengharuskan Anda membayar hanya untuk apa yang Anda gunakan. Batas menentukan seberapa tinggi layanan dapat diskalakan sebelum mulai membatasi permintaan Anda.

Anda tidak dapat melihat nilai yang ada dari parameter batas permintaan bersamaan di portal Azure, alat baris perintah, atau permintaan API. Untuk memverifikasi nilai yang ada, buat permintaan dukungan Azure.

Catatan

Kontainer ucapan tidak memerlukan peningkatan batas permintaan bersamaan, karena kontainer hanya dibatasi oleh CPU dari perangkat keras tempat kontainer tersebut dihosting.

Menyiapkan informasi yang diperlukan

Untuk membuat permintaan peningkatan, sediakan wilayah penyebaran dan ID titik akhir kustom Anda. Untuk mendapatkannya, lakukan tindakan berikut:

  1. Buka portal Speech Studio.
  2. Masuk jika perlu, dan buka Suara Kustom.
  3. Pilih proyek Anda, dan buka Penyebaran.
  4. Pilih titik akhir yang diperlukan.
  5. Menyalin dan menyimpan nilai bidang berikut:
    • Wilayah Layanan (wilayah titik akhir Anda)
    • ID Titik Akhir

Membuat dan mengirimkan permintaan dukungan

Mulai peningkatan batas untuk permintaan bersamaan sumber daya Anda, atau jika perlu periksa batas saat ini, dengan mengirimkan permintaan dukungan. Berikut caranya:

  1. Pastikan Anda memiliki informasi yang diperlukan yang tercantum di bagian sebelumnya.
  2. Buka portal Azure.
  3. Pilih sumber daya layanan Ucapan yang ingin Anda tingkatkan (atau periksa) batas permintaan bersamaannya.
  4. Di grup Dukungan + pemecahan masalah, pilih Permintaan dukungan baru. Jendela baru akan muncul dengan informasi yang terisi otomatis tentang langganan Azure dan sumber daya Azure Anda.
  5. Dalam Ringkasan, jelaskan hal yang Anda inginkan (misalnya, "Tingkatkan batas permintaan bersamaan teks ke ucapan").
  6. Di Jenis masalah, pilih Masalah Kuota atau Langganan.
  7. Di Subjenis masalah, pilih:
    • Peningkatan permintaan bersamaan atau kuota untuk permintaan yang meningkat.
    • Validasi kuota atau penggunaan untuk memeriksa batas yang ada.
  8. Pilih Berikutnya: Solusi. Lanjutkan lebih jauh dengan pembuatan permintaan.
  9. Pada tab Detail, di bidang Deskripsi, masukkan hal berikut:
    • Catatan bahwa permintaan tersebut tentang kuota teks ke ucapan.
    • Pilih model dasar atau kustom.
    • Informasi sumber daya Azure yang Anda kumpulkan sebelumnya.
    • Informasi lain yang diperlukan.
  10. Di tab Tinjau + buat, pilih Buat.
  11. Catat nomor permintaan dukungan di pemberitahuan portal Azure. Anda akan segera dihubungi terkait permintaan Anda.