Gerir capacidade

Concluído

Para criar uma solução de Pesquisa de IA do Azure, você precisa criar um recurso de Pesquisa de IA do Azure em sua assinatura do Azure. Dependendo da solução específica que você pretende criar, você também pode precisar de recursos do Azure para armazenamento de dados e outros serviços de aplicativos.

Níveis de serviço e gerenciamento de capacidade

Ao criar um recurso do Azure AI Search, você deve especificar uma camada de preço. O nível de preço selecionado determina as limitações de capacidade do seu serviço de pesquisa e as opções de configuração disponíveis para você, bem como o custo do serviço. Os níveis de preços disponíveis são:

  • Livre (F). Use esta camada para explorar o serviço ou tente os tutoriais na documentação do produto.
  • Básico (B): use esta camada para soluções de pesquisa de pequena escala que incluam um máximo de 15 índices e 2 GB de dados de índice.
  • Padrão (S): use esta camada para soluções de escala empresarial. Existem várias variantes dessa camada, incluindo S, S2 e S3, que oferecem capacidade crescente em termos de índices e armazenamento, e S3HD, que é otimizado para desempenho de leitura rápida em números menores de índices.
  • Armazenamento otimizado (L): use um nível otimizado de armazenamento (L1 ou L2) quando precisar criar índices grandes, ao custo de maior latência de consulta.

Nota

É importante selecionar o nível de preço mais adequado para sua solução, pois não é possível alterá-lo posteriormente. Se você achar que a camada de preço escolhida não é mais adequada para sua solução, deverá criar um novo recurso de Pesquisa de IA do Azure e recriar todos os índices e objetos.

Réplicas e partições

Dependendo da camada de preço selecionada, você pode otimizar sua solução para escalabilidade e disponibilidade criando réplicas e partições.

  • As réplicas são instâncias do serviço de pesquisa - você pode pensar nelas como nós em um cluster. Aumentar o número de réplicas pode ajudar a garantir que haja capacidade suficiente para atender a várias solicitações de consulta simultâneas enquanto gerencia operações de indexação contínuas.

  • As partições são usadas para dividir um índice em vários locais de armazenamento, permitindo que você divida operações de E/S, como consultar ou reconstruir um índice.

A combinação de réplicas e partições configuradas determina as unidades de pesquisa usadas pela sua solução. Simplificando, o número de unidades de pesquisa é o número de réplicas multiplicado pelo número de partições (R x P = SU). Por exemplo, um recurso com quatro réplicas e três partições está usando 12 unidades de pesquisa.

Gorjeta

Você pode saber mais sobre níveis de preços e gerenciamento de capacidade na documentação do Azure AI Search.