Share via


Azure OpenAI Hizmeti kotaları ve sınırları

Bu makale, Azure AI hizmetlerinde Azure OpenAI için kotaların ve sınırların ayrıntılı bir açıklamasını ve hızlı başvuruyu içerir.

Kotalar ve limitler başvurusu

Aşağıdaki bölümlerde, Azure OpenAI için geçerli olan varsayılan kotalar ve sınırlar için hızlı bir kılavuz sağlanır:

Sınır Adı Sınır Değeri
Azure aboneliği başına bölge başına OpenAI kaynakları 30
Varsayılan DALL-E 2 kota sınırları 2 eşzamanlı istek
Varsayılan DALL-E 3 kota sınırları 2 kapasite birimi (dakikada 6 istek)
İstek başına en fazla istem belirteci Modele göre değişir. Daha fazla bilgi için bkz. Azure OpenAI Hizmeti modelleri
En fazla ince ayarlı model dağıtımı 5
Kaynak başına toplam eğitim işi sayısı 100
Kaynak başına en fazla eşzamanlı çalışan eğitim işi 1
Kuyruğa alınan en fazla eğitim işi 20
Kaynak başına En Fazla Dosya (ince ayar) 50
Kaynak başına tüm dosyaların toplam boyutu (ince ayar) 1 GB
En fazla eğitim işi süresi (aşılırsa iş başarısız olur) 720 saat
En fazla eğitim işi boyutu (eğitim dosyasındaki belirteçler) x (dönem sayısı) 2 Milyar
Karşıya yükleme başına tüm dosyaların en büyük boyutu (verilerinizde Azure OpenAI) 16MB
Ile dizideki maksimum sayı veya giriş sayısı /embeddings 2048
En fazla /chat/completions ileti sayısı 2048
Maksimum işlev sayısı /chat/completions 128
En fazla /chat completions araç sayısı 128
Dağıtım başına sağlanan aktarım hızı birimi sayısı üst sınırı 100.000
Yardımcı/iş parçacığı başına en fazla dosya 20
Yardımcılar için en büyük dosya boyutu ve ince ayar 512 MB
Yardımcılar belirteci sınırı 2.000.000 belirteç sınırı

Bölgesel kota sınırları

Modeller için varsayılan kota modele ve bölgeye göre değişir. Varsayılan kota sınırları değiştirilebilir.

Standart dağıtım kotası, Dakika Başına Belirteçler (TPM) açısından açıklanmıştır.

Bölge GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Metin Ekleme-Ada-002 metin ekleme-3-küçük metin ekleme-3-büyük Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
australiaeast 40 K 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
Güney Brezilya - - - - - - 350 K - - - - - - - - -
canadaeast 40 K 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - - 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
francecentral 20 K 60 K 80 K - 240 K - 240 K - - - - - - - - -
japaneast - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
Doğu Norveç - - 150 K - - - 350 K - - - - - - - - -
Güney Afrika'nın Kuzeyi - - - - - - 350 K - - - - - - - - -
Orta Güney ABD - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
Orta İsveç 40 K 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
Kuzey İsviçre 40 K 80 K - 30 K 300 K - 350 K - - - - - - - - -
İsviçrewest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
westeurope - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - 80 K - - - 350 K - - - - - - - - -

1 K = 1000 Dakika Başına Belirteç (TPM). TPM ile Dakika Başına İstekler (RPM) arasındaki ilişki şu anda 1000 TPM için 6 RPM olarak tanımlanmıştır.

Hız sınırları içinde kalmak için genel en iyi yöntemler

Hız sınırlarıyla ilgili sorunları en aza indirmek için aşağıdaki teknikleri kullanmak iyi bir fikirdir:

  • Uygulamanıza yeniden deneme mantığı ekleyin.
  • İş yükünde ani değişikliklerden kaçının. İş yükünü kademeli olarak artırın.
  • Farklı yük artışı desenlerini test edin.
  • Dağıtımınıza atanan kotayı artırın. Gerekirse kotayı başka bir dağıtımdan taşıyın.

Varsayılan kotalara ve sınırlara artış isteme

Kota artışı istekleri Azure OpenAI Studio'nun Kotalar sayfasından gönderilebilir. Yoğun talep nedeniyle kota artışı isteklerinin kabul edildiğini ve alındıkları sırayla doldurulacağını lütfen unutmayın. Mevcut kota ayırmayı kullanan trafik oluşturan müşterilere öncelik verilir ve bu koşul karşılanmazsa isteğiniz reddedilebilir.

Diğer fiyat sınırları için lütfen bir hizmet isteği gönderin.

Sonraki adımlar

Azure OpenAI dağıtımlarınız için kotayı yönetmeyi keşfedin. Azure OpenAI'yi destekleyen temel modeller hakkında daha fazla bilgi edinin.