Konuşma hizmeti kotaları ve sınırları

Bu makale, Azure yapay zeka hizmetlerinde Konuşma hizmeti için kotaların ve sınırların ayrıntılı bir açıklamasını ve hızlı başvuruyu içerir. Bilgiler, hizmetin tüm fiyatlandırma katmanları için geçerlidir. Ayrıca istek azaltmayı önlemek için bazı en iyi yöntemleri içerir.

Ücretsiz (F0) fiyatlandırma katmanı için fiyatlandırma sayfasındaki aylık izinlere de bakın.

Kotalar ve limitler başvurusu

Aşağıdaki bölümlerde Konuşma hizmeti için geçerli olan kotalar ve sınırlar için hızlı bir kılavuz sağlanır.

Standart (S0) Konuşma kaynakları için ayarlanabilir kotalar hakkında bilgi için daha fazla açıklamaya, en iyi yöntemlere ve ayarlama yönergelerine bakın. Ücretsiz (F0) Konuşma kaynaklarının kotaları ve sınırları ayarlanamaz.

Önemli

Konuşma kaynağını Ücretsiz (F0) olan Standart (S0) fiyatlandırma katmanına değiştirirseniz, ilgili kotaların değiştirilmesi birkaç saate kadar sürebilir.

Kaynak başına metin kotalarına ve sınırlarına konuşma

Bu bölümde Konuşma kaynağı başına konuşmayı metne dönüştürme kotaları ve sınırları açıklanmaktadır. Aksi belirtilmediği sürece sınırlar ayarlanamaz.

Gerçek zamanlı konuşmayı metne dönüştürme ve konuşma çevirisi

Kısa ses için Konuşma SDK'sı veya Konuşmayı metne dönüştürme REST API'siyle metinde gerçek zamanlı konuşma kullanabilirsiniz.

Önemli

Bu sınırlar, metin isteklerine eş zamanlı gerçek zamanlı konuşma ve konuşma çevirisi isteklerinin birleştirilmesi için geçerlidir. Örneğin, metin isteklerine yönelik 60 eşzamanlı konuşma ve 40 eşzamanlı konuşma çevirisi isteğiniz varsa, 100 eşzamanlı istek sınırına ulaşırsınız.

Kota Ücretsiz (F0) Standart (S0)
Eşzamanlı istek sınırı - temel model uç noktası 1

Bu sınır ayarlanamaz.
100 (varsayılan değer)

Oran Standart (S0) kaynakları için ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın.
Eşzamanlı istek sınırı - özel uç nokta 1

Bu sınır ayarlanamaz.
100 (varsayılan değer)

Oran Standart (S0) kaynakları için ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın.
Gerçek zamanlı darizasyon için maksimum ses uzunluğu. Yok Dosya başına 240 dakika

Toplu transkripsiyon

Kota Ücretsiz (F0) Standart (S0)
Konuşmayı metne dönüştürme REST API sınırı F0 için kullanılamaz 10 saniyede 100 istek (dakikada 600 istek)
Maksimum ses giriş dosyası boyutu Yok 1 GB
Kapsayıcı başına en fazla blob sayısı Yok 10000
Transkripsiyon isteği başına en fazla dosya sayısı (giriş olarak birden çok içerik URL'sini kullandığınızda). Yok 1000
Darizasyon etkin transkripsiyonlar için maksimum ses uzunluğu. Yok Dosya başına 240 dakika

Model özelleştirme

Bu tablodaki sınırlar, özel bir konuşma modeli oluşturduğunuzda Konuşma kaynağı başına uygulanır.

Kota Ücretsiz (F0) Standart (S0)
REST API sınırı 10 saniyede 100 istek (dakikada 600 istek) 10 saniyede 100 istek (dakikada 600 istek)
En fazla konuşma veri kümesi sayısı 2 500
Veri içeri aktarma için maksimum akustik veri kümesi dosya boyutu 2 GB 2 GB
Veri içeri aktarma için en fazla dil veri kümesi dosya boyutu 200 MB 1.5 GB
Veri içeri aktarma için en fazla söyleniş veri kümesi dosya boyutu 1 KB 1 MB
Models_Create API isteğinde parametresini text kullanırken en büyük metin boyutu 200 KB 500 KB

Kaynak başına metin okuma kotaları ve sınırları

Bu bölümde Konuşma kaynağı başına metin okuma kotaları ve sınırları açıklanmaktadır.

Gerçek zamanlı metin okuma

Konuşma SDK'sı veya Metin okuma REST API'siyle gerçek zamanlı metin kullanarak konuşma yapabilirsiniz. Aksi belirtilmediği sürece sınırlar ayarlanamaz.

Kota Ücretsiz (F0) Standart (S0)
Önceden oluşturulmuş sinir sesleri ve özel nöral sesler için zaman aralığı başına işlem sayısı üst sınırı. 60 saniyede 20 işlem

Bu sınır ayarlanamaz.
Saniyede 200 işlem (TPS) (varsayılan değer)

Standart (S0) kaynaklar için hız 1000 TPS'ye kadar ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın.
İstek başına üretilen maksimum ses uzunluğu 10 dk 10 dk
SSML'de en fazla benzersiz <voice> ve <audio> etiket sayısı 50 50
Websocket için dönüş başına en fazla SSML ileti boyutu 64 KB 64 KB

Toplu sentez

Bu sınırlar ayarlanmıyor. Toplu sentez gecikme süresi hakkında daha fazla bilgi için bkz . toplu sentez gecikme süresi ve en iyi yöntemler.

Kota Ücretsiz (F0) Standart (S0)
REST API sınırı F0 için kullanılamaz 10 saniyede 100 istek
Sentez işi oluşturmak için maksimum JSON yükü boyutu Yok 2 megabayt
Eşzamanlı etkin sentez işleri Yok Sınırsız
Sentez işi başına en fazla metin girişi sayısı Yok 10000
Son durumunda olduğundan bir sentez işi için en fazla yaşam süresi Yok 31 güne kadar (özellikler kullanılarak belirtilir)

Özel sinir sesi - profesyonel

Bu tablodaki sınırlar, profesyonel bir özel sinir sesi modeli oluşturduğunuzda Konuşma kaynağı başına uygulanır.

Kota Ücretsiz (F0) Standart (S0)
Saniye başına en fazla işlem sayısı (TPS) F0 için kullanılamaz Saniyede 200 işlem (TPS) (varsayılan değer)
En fazla veri kümesi sayısı Yok 500
En fazla eşzamanlı veri kümesi yükleme sayısı Yok 5
Veri kümesi başına veri içeri aktarma için maksimum veri dosyası boyutu Yok 2 GB
Betik olmadan uzun ses veya ses yükleme YOK Evet
En fazla eşzamanlı model eğitimi sayısı Yok 4
En fazla özel uç nokta sayısı Yok 50

Özel sinir sesi - kişisel ses

Bu tablodaki sınırlar, kişisel bir ses oluşturduğunuzda Konuşma kaynağı başına uygulanır.

Kota Ücretsiz (F0) Standart (S0)
REST API sınırı (konuşma sentezi dahil değildir) F0 için kullanılamaz 10 saniyede 50 istek
Konuşma sentezi için saniye başına en fazla işlem sayısı (TPS) F0 için kullanılamaz Saniyede 200 işlem (TPS) (varsayılan değer)

Gerçek zamanlı metin okuma avatarı

Kota Ücretsiz (F0) Standart (S0)
Dakika başına yeni bağlantılar F0 için kullanılamaz Dakikada iki yeni bağlantı

Ses İçeriği Oluşturma aracı

Kota Ücretsiz (F0) Standart (S0)
Dosya boyutu (SSML'de düz metin)1 Dosya başına 3.000 karakter Dosya başına 20.000 karakter
Dosya boyutu (sözlük dosyası)2 Dosya başına 30 KB Dosya başına 100 KB
SSML'de faturalanabilir karakterler Dosya başına 15.000 karakter Dosya başına 100.000 karakter
Ses kitaplığına aktar 1 eşzamanlı görev Yok

1 Sınır yalnızca SSML'deki düz metinler için geçerlidir ve etiket içermez.

2 Sözlük dosyasının karakterleri ücretlendirilmiyor. Yalnızca SSML'deki sözlük öğeleri faturalanabilir karakterler olarak sayılır. Daha fazla bilgi edinmek için faturalanabilir karakterlere bakın.

Kaynak başına konuşmacı tanıma kotaları ve sınırları

Konuşmacı tanıma, saniyede 20 işlemle (TPS) sınırlıdır.

Ayrıntılı açıklama, kota ayarlama ve en iyi yöntemler

Konuşma hizmeti kotalarından bazıları ayarlanabilir. Bu bölümde daha fazla açıklama, en iyi yöntem ve ayarlama yönergeleri sağlanmaktadır.

Standart (S0) kaynaklar için aşağıdaki kotalar ayarlanabilir. Ücretsiz (F0) istek sınırları ayarlanmıyor.

Kota artışı istemeden önce (varsa), gerekli olduğundan emin olun. Konuşma hizmeti, gerekli hesaplama kaynaklarını isteğe bağlı moda getirmek için otomatik ölçeklendirme teknolojilerini kullanır. Konuşma hizmeti aynı zamanda aşırı miktarda donanım kapasitesi korumayarak maliyetlerinizi düşük tutmaya çalışır.

Bir örneğe göz atalım. Uygulamanızın çok fazla istek olduğunu belirten 429 yanıt kodunu aldığını varsayalım. İş yükünüz Kotalar ve sınırlar başvurusu tarafından tanımlanan sınırlar içinde olsa bile uygulamanız bu yanıtı alır. En olası açıklama, Konuşma hizmetinin talebinize göre ölçeği artırması ve henüz gerekli ölçeğe ulaşmamış olmasıdır. Bu nedenle, hizmetin isteği sunmak için hemen yeterli kaynağı yoktur. Çoğu durumda bu kısıtlanmış durum geçicidir.

Otomatik ölçeklendirme sırasında azaltmayı azaltmak için genel en iyi yöntemler

Azaltmayla ilgili sorunları en aza indirmek için aşağıdaki teknikleri kullanmak iyi bir fikirdir:

  • Uygulamanıza yeniden deneme mantığı ekleyin.
  • İş yükünde ani değişikliklerden kaçının. İş yükünü kademeli olarak artırın. Örneğin, uygulamanızın metin okuma özelliğini kullandığını ve geçerli iş yükünüzün 5 TPS olduğunu düşünelim. Sonraki saniye, yükü 20 TPS'ye (yani dört kat daha fazla) yükseltin. Konuşma hizmeti yeni yükü yerine getirmek için ölçeği hemen artırmaya başlar, ancak bir saniye içinde gerektiğinde ölçeklendirilemez. İsteklerden bazıları 429 yanıt kodunu (çok fazla istek) alır.
  • Farklı yük artışı desenlerini test edin. Daha fazla bilgi için iş yükü deseni örneğine bakın.
  • Farklı bölgelerde daha fazla Konuşma hizmeti kaynağı oluşturun ve iş yükünü bunlar arasında dağıtın. (Tüm kaynaklar aynı arka uç kümesi tarafından sunulduğundan, aynı bölgede birden çok Konuşma hizmeti kaynağı oluşturulması performansı etkilemez).

Sonraki bölümlerde kotaları ayarlamayla ilgili belirli durumlar açıklanmaktadır.

Konuşmayı metne dönüştürme: Gerçek zamanlı konuşmayı metne eş zamanlı istek sınırını artırma

Varsayılan olarak, birleştirilen metin ve konuşma çevirisi isteklerine eş zamanlı gerçek zamanlı konuşma sayısı, temel modeldeki kaynak başına 100 ve özel modelde özel uç nokta başına 100 ile sınırlıdır. Standart fiyatlandırma katmanı için bu miktarı artırabilirsiniz. İsteği göndermeden önce, azaltmayı azaltmak için en iyi yöntemler gibi bu makalenin önceki bölümlerinde açıklanan malzemeyi bildiğinizden emin olun.

Not

Temel ve özel modeller için eşzamanlı istek sınırlarının ayrı olarak ayarlanması gerekir. Birçok özel model dağıtımlarını barındıran birçok özel uç noktayla ilişkili bir Konuşma hizmeti kaynağınız olabilir. Gerektiğinde, özel uç nokta başına sınır ayarlamaları ayrı olarak istenmelidir.

Eşzamanlı istek sınırını artırmak maliyetlerinizi doğrudan etkilemez. Konuşma hizmeti, yalnızca kullandığınız kadar ödeme yapılmasını gerektiren bir ödeme modeli kullanır. Sınır, hizmetin isteklerinizi kısıtlamaya başlamadan önce ne kadar yüksek ölçeklendirilebileceğini tanımlar.

Azure portalında, komut satırı araçlarında veya API isteklerinde eşzamanlı istek sınırı parametresinin mevcut değerini göremezsiniz. Mevcut değeri doğrulamak için bir Azure desteği isteği oluşturun.

Not

Konuşma kapsayıcıları , yalnızca barındırıldıkları donanımın CPU'ları tarafından kısıtlandığından eşzamanlı istek sınırının artmasına gerek yoktur. Ancak konuşma kapsayıcılarının dikkate alınması gereken kendi kapasite sınırlamaları vardır. Daha fazla bilgi için bkz. Konuşma kapsayıcıları hakkında SSS.

Gerekli bilgileri hazır bulundurun

  • Temel model için:
    • Konuşma kaynağı kimliği
    • Bölge
  • Özel model için:
    • Bölge
    • Özel uç nokta kimliği

Temel model hakkında bilgi alma:

  1. Azure portalına gidin.
  2. Eşzamanlılık isteği sınırını artırmak istediğiniz Konuşma hizmeti kaynağını seçin.
  3. Kaynak Yönetimi grubunda Özellikler'i seçin.
  4. Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
    • Kaynak Kimliği
    • Konum (uç nokta bölgeniz)

Özel modelle ilgili bilgi alma:

  1. Speech Studio portalına gidin.
  2. Gerekirse oturum açın ve Özel konuşma'ya gidin.
  3. Projenizi seçin ve Dağıtım'a gidin.
  4. Gerekli uç noktayı seçin.
  5. Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
    • Hizmet Bölgesi (uç nokta bölgeniz)
    • Uç Nokta Kimliği

Destek isteği oluşturma ve gönderme

Kaynağınız için eşzamanlı istekler için sınırın artırılmasını başlatın veya gerekirse bir destek isteği göndererek geçerli sınırı denetleyin. Şunu yapabilirsiniz:

  1. Önceki bölümde listelenen gerekli bilgilere sahip olduğunuzdan emin olun.
  2. Azure portalına gidin.
  3. Eşzamanlılık isteği sınırını artırmak (veya denetlemek) istediğiniz Konuşma hizmeti kaynağını seçin.
  4. Destek + sorun giderme grubunda Yeni destek isteği'ni seçin. Azure aboneliğiniz ve Azure kaynağınızla ilgili otomatik olarak doldurulmuş bilgiler içeren yeni bir pencere görüntülenir.
  5. Özet'te ne istediğinizi açıklayın (örneğin, "Konuşmayı metin eşzamanlılığı istek sınırını artırma").
  6. Sorun türü'nde Kota veya Abonelik sorunları'yı seçin.
  7. Sorun alt türü'nde aşağıdakilerden birini seçin:
    • Bir artış isteği için kota veya eşzamanlı istekler artar .
    • Mevcut sınırı denetlemek için kota veya kullanım doğrulaması .
  8. İleri: Çözümler'i seçin. İstek oluşturma işlemine devam edin.
  9. Ayrıntılar sekmesindeki Açıklama alanına aşağıdakileri girin:
    • İsteğin konuşmadan metne kotayla ilgili olduğunu belirten bir not.
    • Temel veya özel modeli seçin.
    • Daha önce topladığınız Azure kaynak bilgileri.
    • Diğer gerekli bilgiler.
  10. Gözden Geçir + oluştur sekmesinde Oluştur'u seçin.
  11. Azure portal bildirimlerindeki destek isteği numarasını not alın. İsteğiniz hakkında kısa süre sonra sizinle iletişime geçilir.

İş yükü deseni en iyi uygulaması örneği

İşte iyi bir yaklaşımın genel bir örneği. Yalnızca kendi kullanımınız için gereken şekilde ayarlayabileceğiniz bir şablon olarak tasarlanabilir.

Konuşma hizmeti kaynağının eşzamanlı istek sınırının 300 olarak ayarlandığını varsayalım. İş yükünü 20 eşzamanlı bağlantıdan başlatın ve yükü her 90-120 saniyede bir 20 eşzamanlı bağlantı artırın. Hizmet yanıtlarını denetleyin ve çok fazla istek alırsanız (yanıt kodu 429) geri kalan mantığı uygulayın (yükü azaltır). Ardından yük artışını bir dakika içinde yeniden deneyin ve yine de işe yaramazsa iki dakika içinde yeniden deneyin. Aralıklar için 1-2-4-4 dakikalık bir desen kullanın.

Genel olarak, üretime geçmeden önce iş yükünü ve iş yükü desenlerini test etmek iyi bir fikirdir.

Metin okuma: eşzamanlı istek sınırını artırma

Standart fiyatlandırma katmanı için bu miktarı artırabilirsiniz. İsteği göndermeden önce, azaltmayı azaltmak için en iyi yöntemler gibi bu makalenin önceki bölümlerinde açıklanan malzemeyi bildiğinizden emin olun.

Eşzamanlı istek sınırını artırmak maliyetlerinizi doğrudan etkilemez. Konuşma hizmeti, yalnızca kullandığınız kadar ödeme yapılmasını gerektiren bir ödeme modeli kullanır. Sınır, hizmetin isteklerinizi kısıtlamaya başlamadan önce ne kadar yüksek ölçeklendirilebileceğini tanımlar.

Azure portalında, komut satırı araçlarında veya API isteklerinde eşzamanlı istek sınırı parametresinin mevcut değerini göremezsiniz. Mevcut değeri doğrulamak için bir Azure desteği isteği oluşturun.

Not

Konuşma kapsayıcıları , yalnızca barındırıldıkları donanımın CPU'ları tarafından kısıtlandığından eşzamanlı istek sınırının artmasına gerek yoktur.

Gerekli bilgileri hazırlama

Bir artış isteği oluşturmak için bilgilerinizi sağlamanız gerekir.

  • Önceden oluşturulmuş ses için:
    • Konuşma kaynağı kimliği
    • Bölge
  • Özel ses için:
    • Dağıtım bölgesi
    • Özel uç nokta kimliği

Önceden oluşturulmuş ses hakkında bilgi alma:

  1. Azure portalına gidin.
  2. Eşzamanlılık isteği sınırını artırmak istediğiniz Konuşma hizmeti kaynağını seçin.
  3. Kaynak Yönetimi grubunda Özellikler'i seçin.
  4. Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
    • Kaynak Kimliği
    • Konum (uç nokta bölgeniz)

Özel ses hakkında bilgi alma:

  1. Speech Studio portalına gidin.
  2. Gerekirse oturum açın ve Özel ses'e gidin.
  3. Projenizi seçin ve Modeli dağıtma'ya gidin.
  4. Gerekli uç noktayı seçin.
  5. Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
    • Hizmet Bölgesi (uç nokta bölgeniz)
    • Uç Nokta Kimliği

Destek isteği oluşturma ve gönderme

Kaynağınız için eşzamanlı istekler için sınırın artırılmasını başlatın veya gerekirse bir destek isteği göndererek geçerli sınırı denetleyin. Şunu yapabilirsiniz:

  1. Önceki bölümde listelenen gerekli bilgilere sahip olduğunuzdan emin olun.
  2. Azure portalına gidin.
  3. Eşzamanlılık isteği sınırını artırmak (veya denetlemek) istediğiniz Konuşma hizmeti kaynağını seçin.
  4. Destek + sorun giderme grubunda Yeni destek isteği'ni seçin. Azure aboneliğiniz ve Azure kaynağınızla ilgili otomatik olarak doldurulmuş bilgiler içeren yeni bir pencere görüntülenir.
  5. Özet bölümünde ne istediğinizi açıklayın (örneğin, "Metni konuşma eşzamanlılığı istek sınırını artırma").
  6. Sorun türü'nde Kota veya Abonelik sorunları'yı seçin.
  7. Sorun alt türü'nde aşağıdakilerden birini seçin:
    • Bir artış isteği için kota veya eşzamanlı istekler artar .
    • Mevcut sınırı denetlemek için kota veya kullanım doğrulaması .
  8. Önerilen çözüm sekmesinde İleri'yi seçin.
  9. Ek ayrıntılar sekmesinde tüm gerekli öğeleri doldurun. Ayrıntılar alanına aşağıdakileri girin:
    • İsteğin metin okuma kotası ile ilgili olduğuna dikkat edin.
    • Önceden oluşturulmuş sesi veya özel sesi seçin.
    • Daha önce topladığınız Azure kaynak bilgileri.
    • Diğer gerekli bilgiler.
  10. Gözden Geçir + oluştur sekmesinde Oluştur'u seçin.
  11. Azure portal bildirimlerindeki destek isteği numarasını not alın. İsteğiniz hakkında kısa süre sonra sizinle iletişime geçilir.