Limity služeb ve službě Azure AI Search

Článek
04/07/2024

Maximální limity úložiště, úloh a množství indexů a dalších objektů závisí na tom, jestli vytváříte Azure AI Search na cenových úrovních Free, Basic, Standard nebo Storage Optimized .

Free je víceklientová sdílená služba, která je součástí vašeho předplatného Azure.
Basic poskytuje vyhrazené výpočetní prostředky pro produkční úlohy v menším měřítku, ale sdílí určitou síťovou infrastrukturu s jinými tenanty.
Standard běží na vyhrazených počítačích s větší kapacitou úložiště a zpracování na všech úrovních. Standard má čtyři úrovně: S1, S2, S3 a S3 HD. S3 High Density (S3 HD) je navržen pro víceklientskou architekturu a velké množství malých indexů (3 000 indexů na službu). S3 HD neposkytuje funkci indexeru a příjem dat musí používat rozhraní API, která nasdílí data ze zdroje do indexu.
Optimalizováno pro úložiště běží na vyhrazených počítačích s větší celkovou velikostí úložiště, šířkou pásma úložiště a pamětí než standard. Tato úroveň cílí na velké pomalé indexy. Optimalizované úložiště má dvě úrovně: L1 a L2.

Omezení předplatného

Můžete vytvořit více fakturovatelných vyhledávacích služeb (Basic a vyšší), až do maximálního počtu služeb povolených na každé úrovni. Můžete například vytvořit až 16 služeb na úrovni Basic a dalších 16 služeb na úrovni S1 v rámci stejného předplatného. Další informace o úrovních najdete v tématu Volba úrovně (nebo skladové položky) pro Azure AI Search.

Maximální limity služeb je možné na vyžádání zvýšit. Pokud potřebujete více služeb ve stejném předplatném, vytvořte žádost o podporu.

Prostředek	Zdarma ¹	Basic	S1	S2	S3	S3 HD	L1	L2
Maximální počet služeb	0	16	16	8	6	6	6	6
Maximální počet jednotek vyhledávání (SU)²	–	3 SU	36 SU	36 SU	36 SU	36 SU	36 SU	36 SU

¹ Můžete mít jednu bezplatnou vyhledávací službu pro každé předplatné Azure. Úroveň Free je založená na infrastruktuře sdílené s ostatními zákazníky. Vzhledem k tomu, že hardware není vyhrazený, vertikální navýšení kapacity se nepodporuje a úložiště je omezené na 50 MB.

² Jednotky vyhledávání (SU) jsou fakturační jednotky přidělené jako replikanebo oddíl. Potřebujete obojí. Další informace o kombinacích SU najdete v tématu Odhad a správa kapacity vyhledávací služby.

Omezení služby

Search omezení pro úložiště, oddíly a repliky se liší podle data vytvoření služby s vyššími limity pro novější služby v podporovaných oblastech.

Vyhledávací služba podléhá maximálnímu limitu úložiště (velikost oddílu vynásobené počtem oddílů) nebo pevným limitem maximálního počtu indexů nebo indexerů podle toho, co nastane dříve.

Smlouvy o úrovni služeb (SLA) se vztahují na fakturovatelné služby, které mají dvě nebo více replik pro úlohy dotazů nebo tři nebo více replik pro úlohy dotazů a indexování. Počet oddílů není důležitým aspektem smlouvy SLA. Další informace najdete v tématu Spolehlivost ve službě Azure AI Search.

Bezplatné služby nemají pevné oddíly ani repliky a sdílejí prostředky s dalšími předplatiteli.

Před 3. dubna 2024

Prostředek	Bezplatný	Basic	S1	S2	S3	S3 HD	L1	L2
Smlouva o úrovni služeb (SLA)	No	Ano	Ano	Ano	Ano	Ano	Ano	Yes
Úložiště (velikost oddílu)	50 MB	2 GB	25 GB	100 GB	200 GB	200 GB	1 TB	2 TB
Oddíly	–	0	12	12	12	3	12	12
Repliky	–	3	12	12	12	12	12	12

Po 3. dubnu 2024

Nové služby vytvořené po 3. dubnu 2024:

Úroveň Basic může mít až tři oddíly a tři repliky a celkem devět jednotek vyhledávání (SU).
Basic, S1, S2, S3 mají více úložiště na oddíl, od 3 do 7krát více v závislosti na úrovni.
Vaše nová vyhledávací služba musí být v podporované oblasti, aby získala dodatečnou kapacitu pro úrovně Basic a další.

V současné době neexistuje žádný místní upgrade. Měli byste vytvořit novou vyhledávací službu , která bude těžit z dodatečného úložiště.

Prostředek	Bezplatný	Basic	S1	S2	S3	S3 HD	L1	L2
Smlouva o úrovni služeb (SLA)	No	Ano	Ano	Ano	Ano	Ano	Ano	Yes
Úložiště (velikost oddílu)	50 MB	15 GB	160 GB	350 GB	700 GB	700 GB	1 TB	2 TB
Oddíly	–	3	12	12	12	3	12	12
Repliky	–	3	12	12	12	12	12	12

Podporované oblasti s vyššími limity úložiště

Služby vytvořené po 3. dubnu 2024 musí být v jedné z následujících oblastí, aby bylo možné získat dodatečné úložiště. Podívejte se na oznámení v části Co je nového ve službě Azure AI Search pro rozšíření do jiných oblastí.

Země	Oblasti poskytující dodatečnou kapacitu na oddíl
USA	USA – východ, USA – východ 2, USA – střed, USA – středosever, USA – středojiž, USA – západ, USA – západ 2, USA – západ 3, USA – středozápad
Spojené království	Velká Británie – jih, Velká Británie – západ
Spojené arabské emiráty	Spojené arabské emiráty – sever
Švýcarsko	Švýcarsko – západ
Švédsko	Švédsko – střed
Polsko	Polsko – střed
Norsko	Norsko – východ
Korea	Korea – střed, Korea – jih
Japonsko	Japonsko – východ, Japonsko – západ
Itálie	Itálie – sever
Indie	Indie – střed, Jio India – západ
Francie	Francie – střed
Evropa	Severní Evropa
Kanada	Kanada – střed, Kanada – východ
Bazil	Brazílie – jih
Asie a Tichomoří	Východní Asie, Jihovýchodní Asie
Austrálie	Austrálie – východ, Austrálie – jihovýchod

Omezení indexu

Prostředek	Bezplatný	Základní ¹	S1	S2	S3	S3 HD	L1	L2
Maximální počet indexů	3	5 nebo 15	50	200	200	1 000 na oddíl nebo 3 000 na službu	10	10
Maximální počet jednoduchých polí na index ²	1000	100	1000	1000	1000	1000	1000	1000
Maximální rozměry na vektorové pole	3072	3072	3072	3072	3072	3072	3072	3072
Maximální počet složitých kolekcí na index	40	40	40	40	40	40	40	40
Maximální počet prvků ve všech složitých kolekcích na dokument ³	3000	3000	3000	3000	3000	3000	3000	3000
Maximální hloubka složitých polí	10	10	10	10	10	10	10	10
Maximální počet návrhy na index	1	1	1	1	1	1	1	1
Maximální bodovací profily na index	100	100	100	100	100	100	100	100
Maximální počet funkcí na profil	8	8	8	8	8	8	8	8
Maximální velikost indexu ⁴	–	–	N/A	1,92 TB	2,4 TB	100 GB	–	N/A

¹ Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) u indexů. Úroveň Basic je jediná úroveň s nižším limitem 100 polí na index.

² Horní limit polí zahrnuje pole první úrovně i vnořené podpole v komplexní kolekci. Pokud například index obsahuje 15 polí a má dvě komplexní kolekce s pěti dílčími poli, počet polí indexu je 25. Indexy s velmi velkou kolekcí polí můžou být pomalé. Omezte pole a atributy jenom na ty, které potřebujete, a spusťte indexování a test dotazů, abyste měli jistotu, že je výkon přijatelný.

³ Horní limit existuje pro prvky, protože s velkým počtem z nich výrazně zvyšuje úložiště požadované pro váš index. Prvek komplexní kolekce je definován jako člen této kolekce. Předpokládejme například, že hotelový dokument se složitou kolekcí Rooms je každý pokoj v kolekci Rooms považován za prvek. Během indexování může modul indexování bezpečně zpracovat maximálně 3 000 prvků v celém dokumentu. Tento limit byl zaveden a api-version=2019-05-06 vztahuje se pouze na složité kolekce, a ne na kolekce řetězců nebo na složitá pole.

⁴ Na většině úrovní je maximální velikost indexu všechna dostupná úložiště ve vyhledávací službě. Pro S2, S3 a S3 HD je maximální velikost libovolného indexu číslo uvedené v tabulce. Platí pro vyhledávací služby vytvořené po 3. dubnu 2024.

Pokud se vaše služba zřídí v výkonnějším clusteru, může dojít k určité variantě maximálních limitů. Zde uvedené limity představují společný jmenovatel. Indexy vytvořené podle výše uvedených specifikací jsou přenositelné napříč ekvivalentními úrovněmi služby v libovolné oblasti.

Omezení dokumentů

Pro vyhledávací služby Basic, S1, S2, S3, L1 a L2 můžete mít přibližně 24 miliard dokumentů na index. Pro S3 HD je limit 2 miliardy dokumentů na index. Každá instance komplexní kolekce se počítá jako samostatný dokument z hlediska těchto limitů.

Omezení velikosti dokumentu na volání rozhraní API

Maximální velikost dokumentu při volání rozhraní API indexu je přibližně 16 megabajtů.

Velikost dokumentu je ve skutečnosti limitem velikosti textu požadavku rozhraní API indexu. Vzhledem k tomu, že do rozhraní API indexu najednou můžete předat dávku více dokumentů, limit velikosti realisticky závisí na tom, kolik dokumentů je v dávce. V případě dávky s jedním dokumentem je maximální velikost dokumentu 16 MB json.

Při odhadu velikosti dokumentu nezapomeňte vzít v úvahu pouze pole, která může vyhledávací služba využívat. Z výpočtů by se měla vynechat jakákoli binární nebo obrazová data ve zdrojových dokumentech.

Omezení velikosti vektorových indexů

Když indexujete dokumenty s vektorovými poli, Azure AI Search vytvoří interní vektorové indexy pomocí parametrů algoritmu, které zadáte. Velikost těchto vektorových indexů je omezena pamětí vyhrazenou pro vektorové vyhledávání pro vrstvu vaší služby (nebo SKU).

Služba vynucuje kvótu velikosti vektorového indexu pro každý oddíl ve vyhledávací službě. Každý další oddíl zvyšuje dostupnou kvótu velikosti vektorového indexu. Tato kvóta je pevný limit, který zajistí, že vaše služba zůstane v pořádku, což znamená, že další pokusy o indexování po překročení limitu způsobí selhání. Jakmile uvolníte dostupnou kvótu, můžete obnovit indexování odstraněním některých vektorových dokumentů nebo vertikálním navýšením kapacity v oddílech.

Tabulka popisuje kvótu velikosti vektorového indexu na oddíl napříč úrovněmi služby. Kontext zahrnuje:

Omezení úložiště oddílů pro každou úroveň, která se tady opakuje pro kontext.
Množství každého oddílu (v GB) dostupného pro vektorové indexy (vytvořené při přidání vektorových polí do indexu).
Přibližný počet vkládání (hodnoty s plovoucí desetinou čárkou) na oddíl.

Pomocí statistiky služby GET můžete načíst kvótu velikosti vektorového indexu nebo zkontrolovat stránku Indexy nebo kartu Využití na webu Azure Portal.

Limity vektorů se liší podle data a úrovně vytvoření služby. Pokud chcete zkontrolovat věk vyhledávací služby a získat další informace o vektorových indexech, přečtěte si téma Velikost vektorového indexu a udržování v mezích limitů.

Omezení vektorů pro služby vytvořené po 3. dubnu 2024 v podporovaných oblastech

Nejvyšší limity vektorů jsou k dispozici pro vyhledávací služby vytvořené po 3. dubnu 2024 v podporované oblasti.

Úroveň	Kvóta úložiště (GB)	Kvóta vektorů na oddíl (GB)	Přibližně plovoucí hodnoty na oddíl (za předpokladu režie 15 % )
Basic	15	5	1,100 milionů
S1	160	35	8,200 milionů
S2	350	100	23 500 milionů
S3	700	200	47 000 milionů
L1	1000	12	2 800 milionů
L2	2 000	36	8,400 milionů

Všimněte si, že limity L1 a L2 se v zavedení ze 3. dubna nezměnily.

Omezení vektorů pro služby vytvořené od 1. července 2023 do 3. dubna 2024

Následující omezení se vztahují na nové služby vytvořené od 1. července do 3. dubna 2024 s výjimkou následujících oblastí, které mají původní limity před 1. červencem 2023:

Německo – středozápad
Západ Indie
Střední Katar

Všechny ostatní oblasti mají tato omezení:

Úroveň	Kvóta úložiště (GB)	Kvóta vektorů na oddíl (GB)	Přibližně plovoucí hodnoty na oddíl (za předpokladu režie 15 % )
Basic	2	0	235 milionů
S1	25	3	700 milionů
S2	100	12	2 800 milionů
S3	200	36	8,400 milionů
L1	1000	12	2 800 milionů
L2	2 000	36	8,400 milionů

Vektorové limity pro služby vytvořené před 1. červencem 2023

Úroveň	Kvóta úložiště (GB)	Kvóta vektorů na oddíl (GB)	Přibližně plovoucí hodnoty na oddíl (za předpokladu režie 15 % )
Basic	2	0.5	115 milionů
S1	25	0	235 milionů
S2	100	6	1,400 milionů
S3	200	12	2 800 milionů
L1	1000	12	2 800 milionů
L2	2 000	36	8,400 milionů

Omezení indexeru

Existují limity maximální doby běhu, které zajišťují rovnováhu a stabilitu v rámci služby, ale větší datové sady můžou vyžadovat více času na indexování, než je povolené maximum. Pokud se úloha indexování nemůže dokončit v maximální povolené době, zkuste ji spustit podle plánu. Plánovač sleduje stav indexování. Pokud je naplánovaná úloha indexování z nějakého důvodu přerušena, může indexer vyzvednout místo, kde naposledy skončil při dalším naplánovaném spuštění.

Prostředek	Zdarma ¹	Základní ²	S1	S2	S3	S3 HD ³	L1	L2
Maximální počet indexerů	3	5 nebo 15	50	200	200	–	10	10
Maximální počet zdrojů dat	3	5 nebo 15	50	200	200	–	10	10
Maximální počet dovedností ⁴	3	5 nebo 15	50	200	200	–	10	10
Maximální zatížení indexování na volání	10 000 dokumentů	Omezeno pouze maximálním počtem dokumentů	Omezeno pouze maximálním počtem dokumentů	Omezeno pouze maximálním počtem dokumentů	Omezeno pouze maximálním počtem dokumentů	–	Bez omezení	Bez omezení
Minimální plán	5 minut	5 minut	5 minut	5 minut	5 minut	5 minut	5 minut	5 minut
Maximální doba ^{běhu 5}	1–3 minuty	2 nebo 24 hodin	2 nebo 24 hodin	2 nebo 24 hodin	2 nebo 24 hodin	–	2 nebo 24 hodin	2 nebo 24 hodin
Maximální doba běhu pro indexery se sadou ^{dovedností 6}	3–10 minut	2 hodiny	2 hodiny	2 hodiny	2 hodiny	–	2 hodiny	2 hodiny
Indexer objektů blob: maximální velikost objektu blob, MB	16	16	128	256	256	–	256	256
Indexer objektů blob: maximální počet znaků obsahu extrahovaného z objektu blob	32,000	64,000	4 miliony	8 milionů	16 milionů	–	4 miliony	4 miliony

¹ bezplatné služby mají maximální dobu provádění indexeru 3 minuty pro zdroje objektů blob a 1 minutu pro všechny ostatní zdroje dat. Vyvolání indexeru je jednou za 180 sekund. Pro indexování AI, které volá služby Azure AI, jsou bezplatné služby omezené na 20 bezplatných transakcí na indexer za den, kde je transakce definována jako dokument, který úspěšně prochází kanálem rozšiřování (tip: Můžete resetovat indexer a resetovat jeho počet).

² Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) u indexerů, zdrojů dat a sad dovedností.

³ Služby S3 HD nezahrnují podporu indexeru.

⁴ Maximálně 30 dovedností na sadu dovedností.

⁵ Týkající se maximální doby trvání indexerů 2 nebo 24 hodin: 2hodinový maximum je nejběžnější a je to, co byste měli naplánovat. 24hodinový limit pochází ze starší implementace indexeru. Pokud máte neplánované indexery, které běží nepřetržitě po dobu 24 hodin, je to proto, že tyto indexery nešlo migrovat do novější infrastruktury. Obecně platí, že pro úlohy indexování, které se nedají dokončit do dvou hodin, umístěte indexer do 2hodinového plánu. Po dokončení prvního 2hodinového intervalu indexer převezme místo, kde skončil při spuštění dalšího 2hodinového intervalu.

⁶ Provádění sady dovedností a zejména analýza obrázků jsou výpočetně náročné a spotřebovávají nepřiměřeně velké množství dostupného výpočetního výkonu. Doba běhu pro tyto úlohy byla zkrácena, aby ostatní úlohy ve frontě získaly větší příležitost ke spuštění.

Poznámka:

Jak je uvedeno v limitech indexů, indexery také vynucují horní limit 3000 prvků ve všech složitých kolekcích na dokument počínaje nejnovější verzí rozhraní GA API, která podporuje komplexní typy (2019-05-06). To znamená, že pokud jste indexer vytvořili s předchozí verzí rozhraní API, nebudete pod tímto limitem. Aby se zachovala maximální kompatibilita, indexer vytvořený s předchozí verzí rozhraní API a potom aktualizovaný verzí 2019-05-06 rozhraní API nebo novějším, bude stále vyloučen z limitů. Zákazníci by měli vědět o nepříznivém dopadu na velmi rozsáhlé komplexní kolekce (jak jsme uvedli dříve) a důrazně doporučujeme vytvářet nové indexery s nejnovější verzí rozhraní GA API.

Limity prostředků sdíleného privátního propojení

Indexery mají přístup k dalším prostředkům Azure přes privátní koncové body spravované přes rozhraní API prostředku sdíleného privátního propojení. Tato část popisuje omezení spojená s touto funkcí.

Prostředek	Bezplatný	Basic	S1	S2	S3	S3 HD	L1	L2
Podpora indexeru privátního koncového bodu	No	Ano	Ano	Ano	Ano	Ne	Ano	Yes
Podpora privátních koncových bodů pro indexery se sadou^{dovedností 1}	No	No	No	Ano	Ano	Ne	Ano	Yes
Maximální počet privátních koncových bodů	–	10 nebo 30	100	400	400	–	20	20
Maximální počet různých typů^{prostředků 2}	–	4	7	15	15	–	4	4

¹ Obohacení umělé inteligence a analýza obrázků jsou výpočetně náročné a spotřebovávají nepřiměřeně velké množství dostupného výpočetního výkonu. Z tohoto důvodu jsou privátní připojení zakázaná na nižších úrovních, aby se zajistil výkon a stabilita samotné vyhledávací služby.

² Počet různých typů prostředků se vypočítá jako počet jedinečných groupId hodnot používaných ve všech prostředcích sdíleného privátního propojení pro danou vyhledávací službu bez ohledu na stav prostředku.

Omezení synonym

Maximální počet map synonym se liší podle úrovně. Každé pravidlo může mít až 20 rozšíření, kde rozšíření je ekvivalentní termín. Například s ohledem na "kočku", spojení s "kočička", "feline" a "felis" (rod pro kočky) by se spočítalo jako 3 rozšíření.

Prostředek	Bezplatný	Basic	S1	S2	S3	S3-HD	L1	L2
Maximální počet map synonym	3	3	5	10	20	20	10	10
Maximální počet pravidel na mapu	5000	20 000	20 000	20 000	20 000	20 000	20 000	20 000

Omezení aliasů indexu

Maximální počet aliasů indexu se liší podle úrovně. Ve všech úrovních je maximální počet aliasů dvojnásobný maximální povolený počet indexů.

Prostředek	Bezplatný	Basic	S1	S2	S3	S3-HD	L1	L2
Maximální počet aliasů	6	10 nebo 30	100	400	400	2000 na oddíl nebo 6000 na službu	20	20

Omezení dat (rozšiřování AI)

Kanál rozšiřování AI, který volá prostředek azure AI Language pro rozpoznávání entit, propojení entit, extrakci klíčových frází, analýzu mínění, rozpoznávání jazyka a detekci osobních informací, podléhá omezením dat. Maximální velikost záznamu by měla být 50 000 znaků měřená String.Lengthhodnotou . Pokud potřebujete data před odesláním do analyzátoru mínění rozdělit, použijte dovednost Rozdělení textu.

Omezení omezování

Požadavky rozhraní API jsou omezené, protože systém přistupuje ke špičce kapacity. Omezování se chová jinak pro různá rozhraní API. Rozhraní API dotazů (vyhledávání, návrhy, automatické dokončování) a indexování rozhraní API dynamicky omezují na základě zatížení služby. Rozhraní API indexu a rozhraní API operací služby mají omezení statické rychlosti požadavků.

Omezení požadavků na statickou rychlost pro operace související s indexem:

Indexy seznamu (GET /indexy): 3 za sekundu za jednotku hledání
Získání indexu (GET /indexes/myindex): 10 za sekundu za jednotku hledání
Vytvoření indexu (POST /indexy): 12 za minutu za jednotku hledání
Vytvoření nebo aktualizace indexu (PUT /indexes/myindex): 6 za sekundu za jednotku vyhledávání
Odstranit index (DELETE /indexes/myindex): 12 za minutu za jednotku hledání

Omezení požadavků na statickou rychlost pro operace související se službou:

Statistika služby (GET /servicestats): 4 za sekundu za jednotku vyhledávání

Limity požadavků rozhraní API

Maximálně 16 MB na požadavek ¹
Maximální délka adresy URL 8 kB
Maximálně 1 000 dokumentů na dávku nahrávání, slučování nebo odstraňování indexů
Maximálně 32 polí v klauzuli $orderby
Maximálně 100 000 znaků ve vyhledávací klauzuli
Maximální počet klauzulí v search (výrazy oddělené operátorem AND nebo OR) je 1024.
Maximální velikost hledaného termínu je 32 766 bajtů (32 kB minus 2 bajty) zakódovaného textu UTF-8
Maximální velikost hledaného termínu je 1 000 znaků pro hledání předpon a hledání regulárních výrazů.
Vyhledávání pomocí zástupných znaků a hledání regulárních výrazů je omezeno na maximálně 1 000 stavů při zpracování lucene.

¹ Ve službě Azure AI Search platí, že text požadavku podléhá hornímu limitu 16 MB a ukládá praktický limit obsahu jednotlivých polí nebo kolekcí, které nejsou jinak omezeny teoretickými limity (další informace o složení a omezeních polí najdete v tématu Podporované datové typy ).

Omezení velikosti a složení dotazu existují, protože nevázané dotazy můžou vaši vyhledávací službu synchronizovat. Tyto dotazy se obvykle vytvářejí prostřednictvím kódu programu. Pokud vaše aplikace generuje vyhledávací dotazy prostřednictvím kódu programu, doporučujeme ho navrhnout tak, aby negenerovala dotazy s nevázanou velikostí.

Limity odpovědí rozhraní API

Maximálně 1 000 dokumentů vrácených na stránku výsledků hledání
Maximálně 100 návrhů vrácených na požadavek rozhraní API pro návrhy

Limity klíčů rozhraní API

Klíče rozhraní API se používají k ověřování služby. Existují dva typy. Správa klíče jsou zadány v hlavičce požadavku a udělují službě úplný přístup pro čtení i zápis. Klíče dotazů jsou určené jen pro čtení, zadané na adrese URL a obvykle se distribuují do klientských aplikací.

Maximálně 2 klíče správce na službu
Maximálně 50 klíčů dotazů na službu