Limity služeb ve službě Azure AI Search

Maximální limity úložiště, úloh a množství indexů a dalších objektů závisí na tom, jestli vytváříte Azure AI Search na cenových úrovních Free, Basic, Standard nebo Storage Optimized .

  • Free je víceklientová sdílená služba, která je součástí vašeho předplatného Azure.

  • Basic poskytuje vyhrazené výpočetní prostředky pro produkční úlohy v menším měřítku, ale sdílí určitou síťovou infrastrukturu s jinými tenanty.

  • Standard běží na vyhrazených počítačích s větší kapacitou úložiště a zpracování na všech úrovních. Standard má čtyři úrovně: S1, S2, S3 a S3 HD. S3 High Density (S3 HD) je navržen pro víceklientskou architekturu a velké množství malých indexů (3 000 indexů na službu). S3 HD neposkytuje funkci indexeru a příjem dat musí používat rozhraní API, která nasdílí data ze zdroje do indexu.

  • Optimalizováno pro úložiště běží na vyhrazených počítačích s větší celkovou velikostí úložiště, šířkou pásma úložiště a pamětí než standard. Tato úroveň cílí na velké pomalé indexy. Optimalizované úložiště má dvě úrovně: L1 a L2.

Omezení předplatného

Můžete vytvořit více fakturovatelných vyhledávacích služeb (Basic a vyšší), až do maximálního počtu služeb povolených na každé úrovni. Můžete například vytvořit až 16 služeb na úrovni Basic a dalších 16 služeb na úrovni S1 v rámci stejného předplatného. Další informace o úrovních najdete v tématu Volba úrovně (nebo skladové položky) pro Azure AI Search.

Maximální limity služeb je možné na vyžádání zvýšit. Pokud potřebujete více služeb ve stejném předplatném, vytvořte žádost o podporu.

Prostředek Zdarma 1 Basic S1 S2 S3 S3 HD L1 L2
Maximální počet služeb 0 16 16 8 6 6 6 6
Maximální počet jednotek vyhledávání (SU)2 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Můžete mít jednu bezplatnou vyhledávací službu pro každé předplatné Azure. Úroveň Free je založená na infrastruktuře sdílené s ostatními zákazníky. Vzhledem k tomu, že hardware není vyhrazený, vertikální navýšení kapacity se nepodporuje a úložiště je omezené na 50 MB.

2 Jednotky vyhledávání (SU) jsou fakturační jednotky přidělené jako replikanebo oddíl. Potřebujete obojí. Další informace o kombinacích SU najdete v tématu Odhad a správa kapacity vyhledávací služby.

Omezení služby

Search omezení pro úložiště, oddíly a repliky se liší podle data vytvoření služby s vyššími limity pro novější služby v podporovaných oblastech.

Vyhledávací služba podléhá maximálnímu limitu úložiště (velikost oddílu vynásobené počtem oddílů) nebo pevným limitem maximálního počtu indexů nebo indexerů podle toho, co nastane dříve.

Smlouvy o úrovni služeb (SLA) se vztahují na fakturovatelné služby, které mají dvě nebo více replik pro úlohy dotazů nebo tři nebo více replik pro úlohy dotazů a indexování. Počet oddílů není důležitým aspektem smlouvy SLA. Další informace najdete v tématu Spolehlivost ve službě Azure AI Search.

Bezplatné služby nemají pevné oddíly ani repliky a sdílejí prostředky s dalšími předplatiteli.

Před 3. dubna 2024

Prostředek Bezplatný Basic S1 S2 S3 S3 HD L1 L2
Smlouva o úrovni služeb (SLA) No Ano Ano Ano Ano Ano Ano Yes
Úložiště (velikost oddílu) 50 MB 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Oddíly 0 12 12 12 3 12 12
Repliky 3 12 12 12 12 12 12

Po 3. dubnu 2024

Nové služby vytvořené po 3. dubnu 2024:

  • Úroveň Basic může mít až tři oddíly a tři repliky a celkem devět jednotek vyhledávání (SU).
  • Basic, S1, S2, S3 mají více úložiště na oddíl, od 3 do 7krát více v závislosti na úrovni.
  • Vaše nová vyhledávací služba musí být v podporované oblasti, aby získala dodatečnou kapacitu pro úrovně Basic a další.

V současné době neexistuje žádný místní upgrade. Měli byste vytvořit novou vyhledávací službu , která bude těžit z dodatečného úložiště.

Prostředek Bezplatný Basic S1 S2 S3 S3 HD L1 L2
Smlouva o úrovni služeb (SLA) No Ano Ano Ano Ano Ano Ano Yes
Úložiště (velikost oddílu) 50 MB 15 GB 160 GB 350 GB 700 GB 700 GB 1 TB 2 TB
Oddíly 3 12 12 12 3 12 12
Repliky 3 12 12 12 12 12 12

Podporované oblasti s vyššími limity úložiště

Služby vytvořené po 3. dubnu 2024 musí být v jedné z následujících oblastí, aby bylo možné získat dodatečné úložiště. Podívejte se na oznámení v části Co je nového ve službě Azure AI Search pro rozšíření do jiných oblastí.

Země Oblasti poskytující dodatečnou kapacitu na oddíl
USA USA – východ, USA – východ 2, USA – střed, USA – středosever, USA – středojiž, USA – západ, USA – západ 2, USA – západ 3, USA – středozápad
Spojené království Velká Británie – jih, Velká Británie – západ
Spojené arabské emiráty Spojené arabské emiráty – sever
Švýcarsko Švýcarsko – západ
Švédsko Švédsko – střed
Polsko Polsko – střed
Norsko Norsko – východ
Korea Korea – střed, Korea – jih
Japonsko Japonsko – východ, Japonsko – západ
Itálie Itálie – sever
Indie Indie – střed, Jio India – západ
Francie Francie – střed
Evropa Severní Evropa
Kanada Kanada – střed, Kanada – východ
Bazil Brazílie – jih
Asie a Tichomoří Východní Asie, Jihovýchodní Asie
Austrálie Austrálie – východ, Austrálie – jihovýchod

Omezení indexu

Prostředek Bezplatný Základní 1 S1 S2 S3 S3 HD L1 L2
Maximální počet indexů 3 5 nebo 15 50 200 200 1 000 na oddíl nebo 3 000 na službu 10 10
Maximální počet jednoduchých polí na index 2 1000 100 1000 1000 1000 1000 1000 1000
Maximální rozměry na vektorové pole 3072 3072 3072 3072 3072 3072 3072 3072
Maximální počet složitých kolekcí na index 40 40 40 40 40 40 40 40
Maximální počet prvků ve všech složitých kolekcích na dokument 3 3000 3000 3000 3000 3000 3000 3000 3000
Maximální hloubka složitých polí 10 10 10 10 10 10 10 10
Maximální počet návrhy na index 1 1 1 1 1 1 1 1
Maximální bodovací profily na index 100 100 100 100 100 100 100 100
Maximální počet funkcí na profil 8 8 8 8 8 8 8 8
Maximální velikost indexu 4 N/A 1,92 TB 2,4 TB 100 GB N/A

1 Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) u indexů. Úroveň Basic je jediná úroveň s nižším limitem 100 polí na index.

2 Horní limit polí zahrnuje pole první úrovně i vnořené podpole v komplexní kolekci. Pokud například index obsahuje 15 polí a má dvě komplexní kolekce s pěti dílčími poli, počet polí indexu je 25. Indexy s velmi velkou kolekcí polí můžou být pomalé. Omezte pole a atributy jenom na ty, které potřebujete, a spusťte indexování a test dotazů, abyste měli jistotu, že je výkon přijatelný.

3 Horní limit existuje pro prvky, protože s velkým počtem z nich výrazně zvyšuje úložiště požadované pro váš index. Prvek komplexní kolekce je definován jako člen této kolekce. Předpokládejme například, že hotelový dokument se složitou kolekcí Rooms je každý pokoj v kolekci Rooms považován za prvek. Během indexování může modul indexování bezpečně zpracovat maximálně 3 000 prvků v celém dokumentu. Tento limit byl zaveden a api-version=2019-05-06 vztahuje se pouze na složité kolekce, a ne na kolekce řetězců nebo na složitá pole.

4 Na většině úrovní je maximální velikost indexu všechna dostupná úložiště ve vyhledávací službě. Pro S2, S3 a S3 HD je maximální velikost libovolného indexu číslo uvedené v tabulce. Platí pro vyhledávací služby vytvořené po 3. dubnu 2024.

Pokud se vaše služba zřídí v výkonnějším clusteru, může dojít k určité variantě maximálních limitů. Zde uvedené limity představují společný jmenovatel. Indexy vytvořené podle výše uvedených specifikací jsou přenositelné napříč ekvivalentními úrovněmi služby v libovolné oblasti.

Omezení dokumentů

Pro vyhledávací služby Basic, S1, S2, S3, L1 a L2 můžete mít přibližně 24 miliard dokumentů na index. Pro S3 HD je limit 2 miliardy dokumentů na index. Každá instance komplexní kolekce se počítá jako samostatný dokument z hlediska těchto limitů.

Omezení velikosti dokumentu na volání rozhraní API

Maximální velikost dokumentu při volání rozhraní API indexu je přibližně 16 megabajtů.

Velikost dokumentu je ve skutečnosti limitem velikosti textu požadavku rozhraní API indexu. Vzhledem k tomu, že do rozhraní API indexu najednou můžete předat dávku více dokumentů, limit velikosti realisticky závisí na tom, kolik dokumentů je v dávce. V případě dávky s jedním dokumentem je maximální velikost dokumentu 16 MB json.

Při odhadu velikosti dokumentu nezapomeňte vzít v úvahu pouze pole, která může vyhledávací služba využívat. Z výpočtů by se měla vynechat jakákoli binární nebo obrazová data ve zdrojových dokumentech.

Omezení velikosti vektorových indexů

Když indexujete dokumenty s vektorovými poli, Azure AI Search vytvoří interní vektorové indexy pomocí parametrů algoritmu, které zadáte. Velikost těchto vektorových indexů je omezena pamětí vyhrazenou pro vektorové vyhledávání pro vrstvu vaší služby (nebo SKU).

Služba vynucuje kvótu velikosti vektorového indexu pro každý oddíl ve vyhledávací službě. Každý další oddíl zvyšuje dostupnou kvótu velikosti vektorového indexu. Tato kvóta je pevný limit, který zajistí, že vaše služba zůstane v pořádku, což znamená, že další pokusy o indexování po překročení limitu způsobí selhání. Jakmile uvolníte dostupnou kvótu, můžete obnovit indexování odstraněním některých vektorových dokumentů nebo vertikálním navýšením kapacity v oddílech.

Tabulka popisuje kvótu velikosti vektorového indexu na oddíl napříč úrovněmi služby. Kontext zahrnuje:

  • Omezení úložiště oddílů pro každou úroveň, která se tady opakuje pro kontext.
  • Množství každého oddílu (v GB) dostupného pro vektorové indexy (vytvořené při přidání vektorových polí do indexu).
  • Přibližný počet vkládání (hodnoty s plovoucí desetinou čárkou) na oddíl.

Pomocí statistiky služby GET můžete načíst kvótu velikosti vektorového indexu nebo zkontrolovat stránku Indexy nebo kartu Využití na webu Azure Portal.

Limity vektorů se liší podle data a úrovně vytvoření služby. Pokud chcete zkontrolovat věk vyhledávací služby a získat další informace o vektorových indexech, přečtěte si téma Velikost vektorového indexu a udržování v mezích limitů.

Omezení vektorů pro služby vytvořené po 3. dubnu 2024 v podporovaných oblastech

Nejvyšší limity vektorů jsou k dispozici pro vyhledávací služby vytvořené po 3. dubnu 2024 v podporované oblasti.

Úroveň Kvóta úložiště (GB) Kvóta vektorů na oddíl (GB) Přibližně plovoucí hodnoty na oddíl (za předpokladu režie 15 % )
Basic 15 5 1,100 milionů
S1 160 35 8,200 milionů
S2 350 100 23 500 milionů
S3 700 200 47 000 milionů
L1 1000 12 2 800 milionů
L2 2 000 36 8,400 milionů

Všimněte si, že limity L1 a L2 se v zavedení ze 3. dubna nezměnily.

Omezení vektorů pro služby vytvořené od 1. července 2023 do 3. dubna 2024

Následující omezení se vztahují na nové služby vytvořené od 1. července do 3. dubna 2024 s výjimkou následujících oblastí, které mají původní limity před 1. červencem 2023:

  • Německo – středozápad
  • Západ Indie
  • Střední Katar

Všechny ostatní oblasti mají tato omezení:

Úroveň Kvóta úložiště (GB) Kvóta vektorů na oddíl (GB) Přibližně plovoucí hodnoty na oddíl (za předpokladu režie 15 % )
Basic 2 0 235 milionů
S1 25 3 700 milionů
S2 100 12 2 800 milionů
S3 200 36 8,400 milionů
L1 1000 12 2 800 milionů
L2 2 000 36 8,400 milionů

Vektorové limity pro služby vytvořené před 1. červencem 2023

Úroveň Kvóta úložiště (GB) Kvóta vektorů na oddíl (GB) Přibližně plovoucí hodnoty na oddíl (za předpokladu režie 15 % )
Basic 2 0.5 115 milionů
S1 25 0 235 milionů
S2 100 6 1,400 milionů
S3 200 12 2 800 milionů
L1 1000 12 2 800 milionů
L2 2 000 36 8,400 milionů

Omezení indexeru

Existují limity maximální doby běhu, které zajišťují rovnováhu a stabilitu v rámci služby, ale větší datové sady můžou vyžadovat více času na indexování, než je povolené maximum. Pokud se úloha indexování nemůže dokončit v maximální povolené době, zkuste ji spustit podle plánu. Plánovač sleduje stav indexování. Pokud je naplánovaná úloha indexování z nějakého důvodu přerušena, může indexer vyzvednout místo, kde naposledy skončil při dalším naplánovaném spuštění.

Prostředek Zdarma 1 Základní 2 S1 S2 S3 S3 HD 3 L1 L2
Maximální počet indexerů 3 5 nebo 15 50 200 200 10 10
Maximální počet zdrojů dat 3 5 nebo 15 50 200 200 10 10
Maximální počet dovedností 4 3 5 nebo 15 50 200 200 10 10
Maximální zatížení indexování na volání 10 000 dokumentů Omezeno pouze maximálním počtem dokumentů Omezeno pouze maximálním počtem dokumentů Omezeno pouze maximálním počtem dokumentů Omezeno pouze maximálním počtem dokumentů Bez omezení Bez omezení
Minimální plán 5 minut 5 minut 5 minut 5 minut 5 minut 5 minut 5 minut 5 minut
Maximální doba běhu 5 1–3 minuty 2 nebo 24 hodin 2 nebo 24 hodin 2 nebo 24 hodin 2 nebo 24 hodin 2 nebo 24 hodin 2 nebo 24 hodin
Maximální doba běhu pro indexery se sadou dovedností 6 3–10 minut 2 hodiny 2 hodiny 2 hodiny 2 hodiny 2 hodiny 2 hodiny
Indexer objektů blob: maximální velikost objektu blob, MB 16 16 128 256 256 256 256
Indexer objektů blob: maximální počet znaků obsahu extrahovaného z objektu blob 32,000 64,000 4 miliony 8 milionů 16 milionů 4 miliony 4 miliony

1 bezplatné služby mají maximální dobu provádění indexeru 3 minuty pro zdroje objektů blob a 1 minutu pro všechny ostatní zdroje dat. Vyvolání indexeru je jednou za 180 sekund. Pro indexování AI, které volá služby Azure AI, jsou bezplatné služby omezené na 20 bezplatných transakcí na indexer za den, kde je transakce definována jako dokument, který úspěšně prochází kanálem rozšiřování (tip: Můžete resetovat indexer a resetovat jeho počet).

2 Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) u indexerů, zdrojů dat a sad dovedností.

3 Služby S3 HD nezahrnují podporu indexeru.

4 Maximálně 30 dovedností na sadu dovedností.

5 Týkající se maximální doby trvání indexerů 2 nebo 24 hodin: 2hodinový maximum je nejběžnější a je to, co byste měli naplánovat. 24hodinový limit pochází ze starší implementace indexeru. Pokud máte neplánované indexery, které běží nepřetržitě po dobu 24 hodin, je to proto, že tyto indexery nešlo migrovat do novější infrastruktury. Obecně platí, že pro úlohy indexování, které se nedají dokončit do dvou hodin, umístěte indexer do 2hodinového plánu. Po dokončení prvního 2hodinového intervalu indexer převezme místo, kde skončil při spuštění dalšího 2hodinového intervalu.

6 Provádění sady dovedností a zejména analýza obrázků jsou výpočetně náročné a spotřebovávají nepřiměřeně velké množství dostupného výpočetního výkonu. Doba běhu pro tyto úlohy byla zkrácena, aby ostatní úlohy ve frontě získaly větší příležitost ke spuštění.

Poznámka:

Jak je uvedeno v limitech indexů, indexery také vynucují horní limit 3000 prvků ve všech složitých kolekcích na dokument počínaje nejnovější verzí rozhraní GA API, která podporuje komplexní typy (2019-05-06). To znamená, že pokud jste indexer vytvořili s předchozí verzí rozhraní API, nebudete pod tímto limitem. Aby se zachovala maximální kompatibilita, indexer vytvořený s předchozí verzí rozhraní API a potom aktualizovaný verzí 2019-05-06 rozhraní API nebo novějším, bude stále vyloučen z limitů. Zákazníci by měli vědět o nepříznivém dopadu na velmi rozsáhlé komplexní kolekce (jak jsme uvedli dříve) a důrazně doporučujeme vytvářet nové indexery s nejnovější verzí rozhraní GA API.

Indexery mají přístup k dalším prostředkům Azure přes privátní koncové body spravované přes rozhraní API prostředku sdíleného privátního propojení. Tato část popisuje omezení spojená s touto funkcí.

Prostředek Bezplatný Basic S1 S2 S3 S3 HD L1 L2
Podpora indexeru privátního koncového bodu No Ano Ano Ano Ano Ne Ano Yes
Podpora privátních koncových bodů pro indexery se sadoudovedností 1 No No No Ano Ano Ne Ano Yes
Maximální počet privátních koncových bodů 10 nebo 30 100 400 400 20 20
Maximální počet různých typůprostředků 2 4 7 15 15 4 4

1 Obohacení umělé inteligence a analýza obrázků jsou výpočetně náročné a spotřebovávají nepřiměřeně velké množství dostupného výpočetního výkonu. Z tohoto důvodu jsou privátní připojení zakázaná na nižších úrovních, aby se zajistil výkon a stabilita samotné vyhledávací služby.

2 Počet různých typů prostředků se vypočítá jako počet jedinečných groupId hodnot používaných ve všech prostředcích sdíleného privátního propojení pro danou vyhledávací službu bez ohledu na stav prostředku.

Omezení synonym

Maximální počet map synonym se liší podle úrovně. Každé pravidlo může mít až 20 rozšíření, kde rozšíření je ekvivalentní termín. Například s ohledem na "kočku", spojení s "kočička", "feline" a "felis" (rod pro kočky) by se spočítalo jako 3 rozšíření.

Prostředek Bezplatný Basic S1 S2 S3 S3-HD L1 L2
Maximální počet map synonym 3 3 5 10 20 20 10 10
Maximální počet pravidel na mapu 5000 20 000 20 000 20 000 20 000 20 000 20 000 20 000

Omezení aliasů indexu

Maximální počet aliasů indexu se liší podle úrovně. Ve všech úrovních je maximální počet aliasů dvojnásobný maximální povolený počet indexů.

Prostředek Bezplatný Basic S1 S2 S3 S3-HD L1 L2
Maximální počet aliasů 6 10 nebo 30 100 400 400 2000 na oddíl nebo 6000 na službu 20 20

Omezení dat (rozšiřování AI)

Kanál rozšiřování AI, který volá prostředek azure AI Language pro rozpoznávání entit, propojení entit, extrakci klíčových frází, analýzu mínění, rozpoznávání jazyka a detekci osobních informací, podléhá omezením dat. Maximální velikost záznamu by měla být 50 000 znaků měřená String.Lengthhodnotou . Pokud potřebujete data před odesláním do analyzátoru mínění rozdělit, použijte dovednost Rozdělení textu.

Omezení omezování

Požadavky rozhraní API jsou omezené, protože systém přistupuje ke špičce kapacity. Omezování se chová jinak pro různá rozhraní API. Rozhraní API dotazů (vyhledávání, návrhy, automatické dokončování) a indexování rozhraní API dynamicky omezují na základě zatížení služby. Rozhraní API indexu a rozhraní API operací služby mají omezení statické rychlosti požadavků.

Omezení požadavků na statickou rychlost pro operace související s indexem:

  • Indexy seznamu (GET /indexy): 3 za sekundu za jednotku hledání
  • Získání indexu (GET /indexes/myindex): 10 za sekundu za jednotku hledání
  • Vytvoření indexu (POST /indexy): 12 za minutu za jednotku hledání
  • Vytvoření nebo aktualizace indexu (PUT /indexes/myindex): 6 za sekundu za jednotku vyhledávání
  • Odstranit index (DELETE /indexes/myindex): 12 za minutu za jednotku hledání

Omezení požadavků na statickou rychlost pro operace související se službou:

  • Statistika služby (GET /servicestats): 4 za sekundu za jednotku vyhledávání

Limity požadavků rozhraní API

  • Maximálně 16 MB na požadavek 1
  • Maximální délka adresy URL 8 kB
  • Maximálně 1 000 dokumentů na dávku nahrávání, slučování nebo odstraňování indexů
  • Maximálně 32 polí v klauzuli $orderby
  • Maximálně 100 000 znaků ve vyhledávací klauzuli
  • Maximální počet klauzulí v search (výrazy oddělené operátorem AND nebo OR) je 1024.
  • Maximální velikost hledaného termínu je 32 766 bajtů (32 kB minus 2 bajty) zakódovaného textu UTF-8
  • Maximální velikost hledaného termínu je 1 000 znaků pro hledání předpon a hledání regulárních výrazů.
  • Vyhledávání pomocí zástupných znaků a hledání regulárních výrazů je omezeno na maximálně 1 000 stavů při zpracování lucene.

1 Ve službě Azure AI Search platí, že text požadavku podléhá hornímu limitu 16 MB a ukládá praktický limit obsahu jednotlivých polí nebo kolekcí, které nejsou jinak omezeny teoretickými limity (další informace o složení a omezeních polí najdete v tématu Podporované datové typy ).

Omezení velikosti a složení dotazu existují, protože nevázané dotazy můžou vaši vyhledávací službu synchronizovat. Tyto dotazy se obvykle vytvářejí prostřednictvím kódu programu. Pokud vaše aplikace generuje vyhledávací dotazy prostřednictvím kódu programu, doporučujeme ho navrhnout tak, aby negenerovala dotazy s nevázanou velikostí.

Limity odpovědí rozhraní API

  • Maximálně 1 000 dokumentů vrácených na stránku výsledků hledání
  • Maximálně 100 návrhů vrácených na požadavek rozhraní API pro návrhy

Limity klíčů rozhraní API

Klíče rozhraní API se používají k ověřování služby. Existují dva typy. Správa klíče jsou zadány v hlavičce požadavku a udělují službě úplný přístup pro čtení i zápis. Klíče dotazů jsou určené jen pro čtení, zadané na adrese URL a obvykle se distribuují do klientských aplikací.

  • Maximálně 2 klíče správce na službu
  • Maximálně 50 klíčů dotazů na službu