Limites de serviço na Pesquisa de IA do Azure

Artigo
04/07/2024

Os limites máximos de armazenamento, cargas de trabalho e quantidades de índices e outros objetos dependem da criação do Azure AI Search nos níveis de preços Gratuito, Básico, Standard ou Otimizado para Armazenamento .

Free é um serviço compartilhado multilocatário que vem com sua assinatura do Azure.
O Basic fornece recursos de computação dedicados para cargas de trabalho de produção em menor escala, mas compartilha alguma infraestrutura de rede com outros locatários.
O padrão é executado em máquinas dedicadas com mais capacidade de armazenamento e processamento em todos os níveis. O padrão vem em quatro níveis: S1, S2, S3 e S3 HD. O S3 High Density (S3 HD) foi projetado para multilocação e grandes quantidades de pequenos índices (3.000 índices por serviço). O S3 HD não fornece o recurso de indexador e a ingestão de dados deve usar APIs que enviam dados da fonte para o índice.
O Storage Optimized é executado em máquinas dedicadas com mais armazenamento total, largura de banda de armazenamento e memória do que o Standard. Esta camada tem como alvo índices grandes e de mudança lenta. O Storage Optimized vem em dois níveis: L1 e L2.

Limites da subscrição

Você pode criar vários serviços de pesquisa faturáveis (básicos e superiores), até o número máximo de serviços permitidos em cada nível. Por exemplo, você pode criar até 16 serviços na camada Basic e outros 16 serviços na camada S1 dentro da mesma assinatura. Para obter mais informações sobre camadas, consulte Escolher uma camada (ou SKU) para o Azure AI Search.

Os limites máximos de serviço podem ser aumentados mediante solicitação. Se você precisar de mais serviços dentro da mesma assinatura, registre uma solicitação de suporte.

Recurso	Grátis ¹	Básica	S1	S2	S3	S3 HD	L1	L2
Serviços máximos	1	16	16	8	6	6	6	6
Máximo de unidades de pesquisa (SU)²	N/A	3 SU	36 SU	36 SU	36 SU	36 SU	36 SU	36 SU

1 Você pode ter um serviço de pesquisa gratuito por assinatura do Azure. O nível gratuito é baseado na infraestrutura compartilhada com outros clientes. Como o hardware não é dedicado, a expansão não é suportada e o armazenamento é limitado a 50 MB.

2 As unidades de pesquisa (SU) são unidades de faturação, alocadas como uma réplica ou uma partição. Você precisa de ambos. Para saber mais sobre combinações de SU, consulte Estimar e gerenciar a capacidade de um serviço de pesquisa.

Limites de serviço

Os limites de serviço de pesquisa para armazenamento, partições e réplicas variam de acordo com a data de criação do serviço, com limites mais altos para serviços mais recentes em regiões suportadas.

Um serviço de pesquisa está sujeito a um limite máximo de armazenamento (tamanho da partição multiplicado pelo número de partições) ou a um limite rígido do número máximo de índices ou indexadores, o que ocorrer primeiro.

Os contratos de nível de serviço (SLAs) aplicam-se a serviços faturáveis com duas ou mais réplicas para cargas de trabalho de consulta ou três ou mais réplicas para cargas de trabalho de consulta e indexação. O número de partições não é uma consideração de SLA. Para obter mais informações, consulte Confiabilidade na Pesquisa de IA do Azure.

Os serviços gratuitos não têm partições ou réplicas fixas e partilham recursos com outros subscritores.

Antes de 3 de abril de 2024

Recurso	Gratuito	Básica	S1	S2	S3	S3 HD	L1	L2
Contrato de nível de serviço (SLA)	Não	Sim	Sim	Sim	Sim	Sim	Sim	Sim
Armazenamento (tamanho da partição)	50 MB	2 GB	25 GB	100 GB	200 GB	200 GB	1 TB	2 TB
Partições	N/A	1	12	12	12	3	12	12
Réplicas	N/A	3	12	12	12	12	12	12

Depois de 3 de abril de 2024

Para novos serviços criados após 3 de abril de 2024:

A camada básica pode ter até três partições e três réplicas, e um total de nove unidades de pesquisa (SU).
Basic, S1, S2, S3 têm mais armazenamento por partição, variando de 3 a 7 vezes mais, dependendo da camada.
Seu novo serviço de pesquisa deve estar em uma região suportada para obter a capacidade extra para Basic e outras camadas.

Atualmente, não há nenhuma atualização in-loco. Você deve criar um novo serviço de pesquisa para se beneficiar do armazenamento extra.

Recurso	Gratuito	Básica	S1	S2	S3	S3 HD	L1	L2
Contrato de nível de serviço (SLA)	Não	Sim	Sim	Sim	Sim	Sim	Sim	Sim
Armazenamento (tamanho da partição)	50 MB	15 GB	160 GB	350 GB	700 GB	700 GB	1 TB	2 TB
Partições	N/A	3	12	12	12	3	12	12
Réplicas	N/A	3	12	12	12	12	12	12

Regiões suportadas com limites de armazenamento mais elevados

Os serviços criados após 3 de abril de 2024 devem estar em uma das seguintes regiões para obter o armazenamento extra. Fique atento aos anúncios em Novidades na Pesquisa de IA do Azure para expansão para outras regiões.

País	Regiões que fornecem capacidade extra por partição
Estados Unidos	Leste dos EUA, Leste dos EUA 2, Centro dos EUA, Centro-Norte dos EUA, Centro-Sul dos EUA, Oeste dos EUA, Oeste dos EUA 2, Oeste dos EUA 3, Centro-Oeste dos EUA
Reino Unido	Sul do Reino Unido, Oeste do Reino Unido
Emirados Árabes Unidos	Norte dos Emirados Árabes Unidos
Suíça	Suíça Oeste
Suécia	Suécia Central
Polónia	Polónia Central
Noruega	Leste da Noruega
Coreia do Sul	Coreia Central, Coreia do Sul
Japão	Leste do Japão, Oeste do Japão
Itália	Itália Norte
Índia	Índia Central, Jio India West
França	França Central
Europa	Norte da Europa
Canadá	Canadá Central, Leste do Canadá
Bazil	Brasil Sul
Ásia-Pacífico	Ásia Oriental, Sudeste Asiático
Austrália	Austrália Leste, Austrália Sudeste

Limites de índice

Recurso	Gratuito	Básico ¹	S1	S2	S3	S3 HD	L1	L2
Índices máximos	3	5 ou 15	50	200	200	1000 por partição ou 3000 por serviço	10	10
Máximo de campos simples por índice ²	1000	100	1000	1000	1000	1000	1000	1000
Dimensões máximas por campo vetorial	3072	3072	3072	3072	3072	3072	3072	3072
Máximo de coleções complexas por índice	40	40	40	40	40	40	40	40
Máximo de elementos em todas as coleções complexas por documento ³	3000	3000	3000	3000	3000	3000	3000	3000
Profundidade máxima de campos complexos	10	10	10	10	10	10	10	10
Máximo de sugestões por índice	1	1	1	1	1	1	1	1
Perfis de pontuação máxima por índice	100	100	100	100	100	100	100	100
Máximo de funções por perfil	8	8	8	8	8	8	8	8
Tamanho máximo do índice ⁴	N/A	N/D	N/A	1,92 TB	2.4 TB	100 GB	N/A	N/A

1 Os serviços básicos criados antes de dezembro de 2017 têm limites mais baixos (5 em vez de 15) nos índices. A camada básica é a única camada com um limite inferior de 100 campos por índice.

2 O limite superior de campos inclui campos de primeiro nível e subcampos aninhados em uma coleção complexa. Por exemplo, se um índice contiver 15 campos e tiver duas coleções complexas com cinco subcampos cada, a contagem de campos do índice será 25. Os índices com uma coleção de campos muito grande podem ser lentos. Limite campos e atributos apenas àqueles de que você precisa e execute indexação e teste de consulta para garantir que o desempenho seja aceitável.

3 Existe um limite superior para elementos porque ter um grande número deles aumenta significativamente o armazenamento necessário para o seu índice. Um elemento de uma coleção complexa é definido como um membro dessa coleção. Por exemplo, suponha que um documento de Hotel com uma coleção de quartos complexos, cada quarto na coleção Rooms é considerado um elemento. Durante a indexação, o mecanismo de indexação pode processar com segurança um máximo de 3.000 elementos no documento como um todo. Esse limite foi introduzido e api-version=2019-05-06 se aplica apenas a coleções complexas, e não a coleções de cadeia de caracteres ou campos complexos.

4 Na maioria dos níveis, o tamanho máximo do índice é todo o armazenamento disponível no seu serviço de pesquisa. Para S2, S3 e S3 HD, o tamanho máximo de qualquer índice é o número fornecido na tabela. Aplica-se a serviços de pesquisa criados após 3 de abril de 2024.

Você pode encontrar alguma variação nos limites máximos se o serviço for provisionado em um cluster mais poderoso. Os limites aqui representam o denominador comum. Os índices criados de acordo com as especificações acima são portáteis em níveis de serviço equivalentes em qualquer região.

Limites de documentos

Você pode ter aproximadamente 24 bilhões de documentos por índice nos serviços de pesquisa Basic, S1, S2, S3, L1 e L2. Para o S3 HD, o limite é de 2 bilhões de documentos por índice. Cada instância de uma coleção complexa conta como um documento separado em termos desses limites.

Limites de tamanho de documento por chamada de API

O tamanho máximo do documento ao chamar uma API de índice é de aproximadamente 16 megabytes.

O tamanho do documento é, na verdade, um limite no tamanho do corpo da solicitação da API de índice. Como você pode passar um lote de vários documentos para a API de índice de uma só vez, o limite de tamanho depende realisticamente de quantos documentos estão no lote. Para um lote com um único documento, o tamanho máximo do documento é de 16 MB de JSON.

Ao estimar o tamanho do documento, lembre-se de considerar apenas os campos que podem ser consumidos por um serviço de pesquisa. Quaisquer dados binários ou de imagem em documentos de origem devem ser omitidos dos seus cálculos.

Limites de tamanho do índice vetorial

Quando você indexa documentos com campos vetoriais, o Azure AI Search constrói índices vetoriais internos usando os parâmetros de algoritmo fornecidos. O tamanho desses índices vetoriais é restrito pela memória reservada para a pesquisa vetorial para a camada (ou SKU) do seu serviço.

O serviço impõe uma cota de tamanho de índice vetorial para cada partição em seu serviço de pesquisa. Cada partição extra aumenta a cota de tamanho do índice vetorial disponível. Essa cota é um limite rígido para garantir que seu serviço permaneça íntegro, o que significa que novas tentativas de indexação quando o limite é excedido resultam em falha. Você pode retomar a indexação depois de liberar a cota disponível excluindo alguns documentos vetoriais ou aumentando a escala em partições.

A tabela descreve a cota de tamanho do índice vetorial por partição nas camadas de serviço. Para contextualizar, inclui:

Limites de armazenamento de partição para cada camada, repetidos aqui para contexto.
Quantidade de cada partição (em GB) disponível para índices vetoriais (criados quando você adiciona campos vetoriais a um índice).
Número aproximado de incorporações (valores de ponto flutuante) por partição.

Use as Estatísticas do Serviço GET para recuperar sua cota de tamanho de índice vetorial ou revise a página Índices ou a guia Uso no portal do Azure.

Os limites vetoriais variam de acordo com a data de criação do serviço e a camada. Para verificar a idade do seu serviço de pesquisa e saber mais sobre índices vetoriais, consulte Tamanho do índice vetorial e permanecer abaixo dos limites.

Limites vetoriais em serviços criados após 3 de abril de 2024 em regiões suportadas

Os limites vetoriais mais altos estão disponíveis em serviços de pesquisa criados após 3 de abril de 2024 em uma região compatível.

Escalão de serviço	Quota de armazenamento (GB)	Cota vetorial por partição (GB)	Flutuações aprox. por partição (assumindo 15% de despesas gerais)
Básica	15	5	1.100 milhões
S1	160	35	8.200 milhões
S2	350	100	23.500 milhões
S3	700	200	47.000 milhões
L1	1,000	12	2.800 milhões
L2	2.000	36	8.400 milhões

Observe que os limites L1 e L2 permanecem inalterados na distribuição de 3 de abril.

Limites vetoriais em serviços criados entre 1º de julho de 2023 e 3 de abril de 2024

Os seguintes limites aplicavam-se aos novos serviços criados entre 1 de julho e 3 de abril de 2024, exceto para as seguintes regiões, que têm os limites originais anteriores a 1 de julho de 2023:

Alemanha Centro-Oeste
Oeste da Índia
Catar Central

Todas as outras regiões têm estes limites:

Escalão de serviço	Quota de armazenamento (GB)	Cota vetorial por partição (GB)	Flutuações aprox. por partição (assumindo 15% de despesas gerais)
Básica	2	1	235 milhões
S1	25	3	700 milhões
S2	100	12	2.800 milhões
S3	200	36	8.400 milhões
L1	1,000	12	2.800 milhões
L2	2.000	36	8.400 milhões

Limites vetoriais em serviços criados antes de 1º de julho de 2023

Escalão de serviço	Quota de armazenamento (GB)	Cota vetorial por partição (GB)	Flutuações aprox. por partição (assumindo 15% de despesas gerais)
Básica	2	0.5	115 milhões
S1	25	1	235 milhões
S2	100	6	1.400 milhões
S3	200	12	2.800 milhões
L1	1,000	12	2.800 milhões
L2	2.000	36	8.400 milhões

Limites do indexador

Os tempos de execução máximos existem para proporcionar equilíbrio e estabilidade ao serviço como um todo, mas conjuntos de dados maiores podem precisar de mais tempo de indexação do que o máximo permite. Se um trabalho de indexação não puder ser concluído dentro do tempo máximo permitido, tente executá-lo em um cronograma. O agendador acompanha o status da indexação. Se um trabalho de indexação agendado for interrompido por qualquer motivo, o indexador poderá continuar de onde parou pela última vez na próxima execução agendada.

Recurso	Grátis ¹	Básico ²	S1	S2	S3	S3 HD ³	L1	L2
Indexadores máximos	3	5 ou 15	50	200	200	N/A	10	10
Origens de dados máximas	3	5 ou 15	50	200	200	N/A	10	10
Máximo de ^{habilidades 4}	3	5 ou 15	50	200	200	N/A	10	10
Carga máxima de indexação por invocação	10 000 documentos	Limitado apenas por um máximo de documentos	Limitado apenas por um máximo de documentos	Limitado apenas por um máximo de documentos	Limitado apenas por um máximo de documentos	N/A	Sem limite	Sem limite
Horário mínimo	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos
Tempo ^{máximo de execução 5}	1-3 minutos	2 ou 24 horas	2 ou 24 horas	2 ou 24 horas	2 ou 24 horas	N/A	2 ou 24 horas	2 ou 24 horas
Tempo máximo de execução para indexadores com um conjunto ^{de habilidades 6}	3-10 minutos	Duas horas	Duas horas	Duas horas	Duas horas	N/A	Duas horas	Duas horas
Indexador de blob: tamanho máximo de blob, MB	16	16	128	256	256	N/A	256	256
Indexador de Blob: máximo de caracteres de conteúdo extraído de um blob	32,000	64,000	4 milhões	8 milhões	16 milhões	N/A	4 milhões	4 milhões

1 Os serviços gratuitos têm um tempo máximo de execução do indexador de 3 minutos para fontes de blob e 1 minuto para todas as outras fontes de dados. A invocação do indexador é feita uma vez a cada 180 segundos. Para indexação de IA que chama os serviços de IA do Azure, os serviços gratuitos são limitados a 20 transações gratuitas por indexador por dia, em que uma transação é definida como um documento que passa com êxito pelo pipeline de enriquecimento (dica: você pode redefinir um indexador para redefinir sua contagem).

2 Os serviços básicos criados antes de dezembro de 2017 têm limites mais baixos (5 em vez de 15) para indexadores, fontes de dados e conjuntos de competências.

3 Os serviços S3 HD não incluem suporte a indexadores.

4 Máximo de 30 competências por conjunto de competências.

5 Em relação à duração máxima de 2 ou 24 horas para indexadores: um máximo de 2 horas é o mais comum e é o que você deve planejar. O limite de 24 horas é de uma implementação de indexador mais antiga. Se você tiver indexadores não agendados que são executados continuamente por 24 horas, é porque esses indexadores não puderam ser migrados para a infraestrutura mais recente. Como regra geral, para indexar trabalhos que não podem ser concluídos dentro de duas horas, coloque o indexador em um cronograma de 2 horas. Quando o primeiro intervalo de 2 horas é concluído, o indexador continua de onde parou ao iniciar o próximo intervalo de 2 horas.

6 A execução do conjunto de competências, e a análise de imagens em particular, são computacionalmente intensivas e consomem quantidades desproporcionadas de poder de processamento disponível. O tempo de execução dessas cargas de trabalho foi reduzido para dar a outros trabalhos na fila mais oportunidade de execução.

Nota

Conforme indicado nos limites do índice, os indexadores também aplicarão o limite superior de 3000 elementos em todas as coleções complexas por documento, começando com a versão mais recente da API do GA que suporta tipos complexos (2019-05-06) em diante. Isso significa que, se você criou seu indexador com uma versão anterior da API, não estará sujeito a esse limite. Para preservar a compatibilidade máxima, um indexador que foi criado com uma versão anterior da API e, em seguida, atualizado com uma versão 2019-05-06 da API ou posterior, ainda será excluído dos limites. Os clientes devem estar cientes do impacto adverso de ter coleções complexas muito grandes (como dito anteriormente) e é altamente recomendável criar novos indexadores com a versão mais recente da API GA.

Limites de recursos de links privados compartilhados

Os indexadores podem aceder a outros recursos do Azure através de pontos de extremidade privados geridos através da API de recurso de ligação privada partilhada. Esta seção descreve os limites associados a esse recurso.

Recurso	Gratuito	Básica	S1	S2	S3	S3 HD	L1	L2
Suporte a indexador de ponto de extremidade privado	Não	Sim	Sim	Sim	Sim	No	Sim	Sim
Suporte de endpoint privado para indexadores com um conjunto^{de habilidades 1}	No	No	No	Sim	Sim	No	Sim	Sim
Máximo de pontos finais privados	N/A	10 ou 30	100	400	400	N/A	20	20
Máximo de tipos^{de recursos distintos 2}	N/A	4	7	15	15	N/A	4	4

1 O enriquecimento da IA e a análise de imagens são computacionalmente intensivos e consomem quantidades desproporcionadas de poder de processamento disponível. Por esse motivo, as conexões privadas são desativadas em níveis mais baixos para garantir o desempenho e a estabilidade do próprio serviço de pesquisa.

2 O número de tipos de recursos distintos é calculado como o número de valores únicos groupId usados em todos os recursos de link privado compartilhado para um determinado serviço de pesquisa, independentemente do status do recurso.

Limites de sinónimos

O número máximo de mapas de sinónimos varia consoante o nível. Cada regra pode ter até 20 expansões, onde uma expansão é um termo equivalente. Por exemplo, dado "gato", a associação com "gatinho", "felino" e "felis" (o gênero para gatos) contaria como 3 expansões.

Recurso	Gratuito	Básica	S1	S2	S3	S3-HD	L1	L2
Mapas de sinónimos máximos	3	3	5	10	20	20	10	10
Número máximo de regras por mapa	5000	20 000	20 000	20 000	20 000	20 000	20 000	20 000

Limites de alias de índice

O número máximo de aliases de índice varia de acordo com a camada. Em todas as camadas, o número máximo de aliases é o dobro do número máximo de índices permitidos.

Recurso	Gratuito	Básica	S1	S2	S3	S3-HD	L1	L2
Aliases máximos	6	10 ou 30	100	400	400	2000 por partição ou 6000 por serviço	20	20

Limites de dados (enriquecimento de IA)

Um pipeline de enriquecimento de IA que faz chamadas para um recurso da Linguagem de IA do Azure para reconhecimento de entidade, vinculação de entidade, extração de frases-chave, análise de sentimento, deteção de idioma e deteção de informações pessoais está sujeito a limites de dados. O tamanho máximo de um registo deve ser de 50 000 carateres, medido por String.Length. Se você precisar dividir seus dados antes de enviá-los para o analisador de sentimento, use a habilidade Divisão de texto.

Limites de limitação

As solicitações de API são limitadas à medida que o sistema se aproxima da capacidade máxima. A limitação se comporta de forma diferente para APIs diferentes. As APIs de consulta (Pesquisa/Sugestão/Preenchimento automático) e as APIs de indexação são limitadas dinamicamente com base na carga no serviço. As APIs de índice e a API de operações de serviço têm limites de taxa de solicitação estática.

Limites de solicitação de taxa estática para operações relacionadas a um índice:

Listar índices (GET /indexes): 3 por segundo por unidade de pesquisa
Obter índice (GET /indexes/myindex): 10 por segundo por unidade de pesquisa
Criar índice (POST /indexes): 12 por minuto por unidade de pesquisa
Criar ou atualizar índice (PUT /indexes/myindex): 6 por segundo por unidade de pesquisa
Excluir índice (DELETE /indexes/myindex): 12 por minuto por unidade de pesquisa

Limites de solicitação de taxa estática para operações relacionadas a um serviço:

Estatísticas de serviço (GET /servicestats): 4 por segundo por unidade de pesquisa

Limites de solicitação de API

Máximo de 16 MB por pedido ¹
Comprimento máximo do URL de 8 KB
Máximo de 1.000 documentos por lote de uploads, mesclagens ou exclusões de índice
Máximo 32 campos na cláusula $orderby
Máximo de 100.000 caracteres em uma cláusula de pesquisa
O número máximo de cláusulas ( search expressões separadas por AND ou OR) é 1024
O tamanho máximo do termo de pesquisa é de 32.766 bytes (32 KB menos 2 bytes) de texto codificado UTF-8
O tamanho máximo do termo de pesquisa é de 1.000 caracteres para pesquisa de prefixo e pesquisa regex
A pesquisa curinga e a pesquisa de expressão regular são limitadas a um máximo de 1000 estados quando processadas por Lucene.

1 No Azure AI Search, o corpo de uma solicitação está sujeito a um limite superior de 16 MB, impondo um limite prático ao conteúdo de campos ou coleções individuais que não são limitados por limites teóricos (consulte Tipos de dados suportados para obter mais informações sobre composição e restrições de campos).

Existem limites no tamanho e composição da consulta porque consultas não limitadas podem desestabilizar seu serviço de pesquisa. Normalmente, essas consultas são criadas programaticamente. Se seu aplicativo gera consultas de pesquisa programaticamente, recomendamos projetá-lo de tal forma que não gere consultas de tamanho ilimitado.

Limites de resposta da API

Máximo de 1.000 documentos retornados por página de resultados da pesquisa
Máximo de 100 sugestões retornadas por solicitação de API de sugestão

Limites de chave da API

As chaves de API são usadas para autenticação de serviço. Existem dois tipos. As chaves de administrador são especificadas no cabeçalho da solicitação e concedem acesso total de leitura e gravação ao serviço. As chaves de consulta são somente leitura, especificadas na URL e normalmente distribuídas para aplicativos cliente.

Máximo de 2 chaves de administração por serviço
Máximo de 50 chaves de consulta por serviço