Criar um serviço de IA do Azure Search no portal

A Pesquisa de IA do Azure é uma solução de recuperação de informações vetoriais e de texto completo para empresas e para cenários de IA tradicional e generativa.

Caso você tenha uma assinatura do Azure, incluindo uma assinatura de avaliação, crie um serviço de pesquisa gratuitamente. Os serviços gratuitos têm limitações, mas você pode concluir todos os guias de início rápido e a maioria dos tutoriais, exceto aqueles com classificação semântica (que requer um serviço faturável).

A maneira mais fácil de criar um serviço é usando o portal do Azure, que é abordado neste artigo. Você também pode usar o Azure PowerShell, a CLI do Azure, a API REST de gerenciamento, um modelo de serviço do Azure Resource Manager, um arquivo Bicep ou o Terraform.

GIF animado

Antes de começar

As propriedades de serviço a seguir são corrigidas durante o tempo de vida do serviço. Considere as implicações de uso conforme você preenche cada propriedade:

  • O nome do serviço passa a fazer parte do ponto de extremidade da URL (examine as dicas para obter nomes de serviço úteis).
  • A camada (Gratuita, Básica, Standard e assim por diante) determina as características do hardware físico subjacente e de cobrança. Alguns recursos são restritos por camadas.
  • A região do serviço pode determinar a disponibilidade de determinados cenários e de limites de armazenamento mais elevados. Se você precisar de zonas de disponibilidade, enriquecimento de IA ou mais armazenamento, crie o recurso em uma região que forneça a funcionalidade.

Assinar (gratuito ou pago)

Para tentar pesquisar gratuitamente, abra uma conta gratuita do Azure e, em seguida, crie seu serviço de pesquisa escolhendo a camada Gratuita. Você pode ter um serviço de pesquisa gratuito por assinatura do Azure. Os serviços de pesquisa gratuitos destinam-se à avaliação de curto prazo do produto para aplicativos de não produção. Se você quiser avançar com um aplicativo de produção, crie um novo serviço de pesquisa em uma camada faturável.

Como alternativa, você pode usar créditos gratuitos para experimentar serviços pagos do Azure. Com essa abordagem, você pode criar seu serviço de pesquisa no Básico ou superior para obter maior capacidade. Seu cartão de crédito nunca será cobrado, a menos que você altere explicitamente suas configurações, solicitando esse tipo de cobrança. Outra abordagem é ativar créditos do Azure em uma assinatura do Visual Studio. Todos os meses, a assinatura do Visual Studio lhe oferece créditos que podem ser usados para serviços pagos do Azure.

A pesquisa paga (ou faturável) ocorre quando você escolhe uma camada faturável (Básica ou superior) ao criar o recurso em uma assinatura faturável do Azure.

Localizar a oferta da IA do Azure Search

  1. Entre no portal do Azure.

  2. No canto superior esquerdo, selecione Criar um recurso”.

  3. Use a barra de pesquisa para localizar "IA do Azure Search".

Captura de tela da página Criar Recurso no portal.

Escolha uma assinatura

Se você tiver mais de uma assinatura, escolha uma para o serviço de pesquisa. Caso estiver implementando a criptografia gerenciada pelo cliente ou se usar outros recursos que dependam das identidades de serviço gerenciadas para acesso a dados externos, escolha a mesma assinatura usada para o Azure Key Vault ou outros serviços nos quais as identidades gerenciadas são usadas.

Definir um grupo de recursos

Um grupo de recursos é um contêiner que mantém os recursos relacionados da sua solução do Azure. Isso é útil para consolidar recursos da mesma solução, custos de monitoramento e para verificar a data de criação do serviço de pesquisa.

Captura de tela da página Criar Grupo de Recursos no portal.

Ao longo do tempo, você pode acompanhar os custos atuais e projetados por completo ou ver os preços de recursos individuais. A captura de tela a seguir mostra o tipo de informação de custo que você pode esperar ver ao combinar vários recursos em um grupo.

Captura de tela da página Gerenciamento de Custos no portal.

Dica

Os grupos de recursos simplificam a limpeza porque a exclusão de um grupo de recursos exclui tudo dentro dele.

Dê um nome ao serviço

Em Detalhes da Instância, dê um nome ao serviço no campo URL. O nome faz parte do ponto de extremidade na qual as chamadas à API são emitidas: https://your-service-name.search.windows.net. Por exemplo, caso deseje que o ponto de extremidade seja https://myservice.search.windows.net, insira myservice.

Requisitos de nome de serviço:

  • Exclusivo dentro do namespace search.windows.net
  • Entre 2 e 60 caracteres
  • Consiste em letras minúsculas, dígitos ou traços (-)
  • Não use traços nos dois primeiros caracteres ou como o último caractere único
  • Não use traços consecutivos em nenhum lugar

Dica

Se você tiver vários serviços de pesquisa, é útil incluir a região (ou localização) no nome do serviço como uma convenção de nomenclatura. Um nome como mysearchservice-westus pode poupar-lhe uma visita à página de propriedades ao decidir como combinar ou anexar recursos.

Escolha uma região

Importante

Devido à alta demanda, a Pesquisa de IA do Azure está atualmente indisponível para novas instâncias no Oeste da Europa. Se você não precisar imediatamente de classificador semântico ou de conjuntos de habilidades, escolha a Suécia Central porque ela tem a maior capacidade de data center. Caso contrário, o Norte da Europa é outra opção.

A IA do Azure Search está disponível na maioria das regiões, conforme listado na página Produtos disponíveis por região.

As regiões a seguir são altamente recomendadas porque fornecem mais armazenamento por partição, de três a sete vezes mais de acordo com a camada, com a mesma taxa de cobrança. A capacidade extra se aplica aos serviços de pesquisa criados após 3 de abril de 2024:

País/região Regiões que fornecem capacidade extra por partição
Estados Unidos Leste dos EUA​, Leste dos EUA 2, ​EUA Central, Centro-Norte dos EUA, Centro-Sul dos EUA, Oeste dos EUA, Oeste dos EUA 2, Oeste dos EUA 3, Centro-Oeste dos EUA
Reino Unido Sul do Reino Unido, Oeste do Reino Unido ​
Emirados Árabes Unidos Norte dos EAU​
Suíça Oeste da Suíça
Suécia Suécia Central​
Polônia Polônia Central​
Noruega Leste da Noruega​
Coreia do Sul Coreia Central, Sul da Coreia ​
Japão Leste do Japão, Oeste do Japão
Itália Norte da Itália​
Índia Índia Central, Oeste da Índia Jio ​
França França Central​
Europa Norte da Europa​
Canadá Canadá Central, Leste do Canadá​
Brasil Sul do Brasil​
Pacífico Asiático Leste da Ásia, Sudeste da Ásia ​
Austrália Leste da Austrália, Sudeste da Austrália​

Se você estiver usando vários serviços do Azure, colocar todos eles na mesma região minimizará ou anulará os encargos de largura de banda. Não há encargos para trocas de dados entre os serviços da mesma região.

Duas exceções notáveis podem justificar o fornecimento de serviços do Azure em regiões separadas:

  • Conexões de saída da IA do Azure Search para o Armazenamento do Azure. Você pode desejar que a pesquisa e o armazenamento estejam em regiões diferentes ao habilitar um firewall.

  • Os requisitos de BCDR (continuidade dos negócios e recuperação de desastres) ditam a criação de vários serviços de pesquisa em pares regionais. Por exemplo, se estiver operando na América do Norte, será possível escolher Leste dos EUA e Oeste dos EUA ou Centro-Norte dos EUA e Centro-Sul dos EUA para cada serviço de pesquisa.

Alguns recursos estão sujeitos a disponibilidade regional:

A página Produtos disponíveis por região indica uma presença regional comum mostrando duas marcas de seleção empilhadas. Uma combinação não disponível tem uma marca de seleção ausente. O ícone da parte do tempo indica disponibilidade futura.

Captura de tela da página de Disponibilidade Regional.

Escolha uma faixa

A Pesquisa de IA do Azure é oferecida em vários tipos de preços: Gratuito, Básico, Standard ou Otimizado para armazenamento. Cada tipo tem sua própria capacidade e limites. Há também vários recursos que dependem da camada.

Básico e Standard são as opções mais comuns para cargas de trabalho de produção, mas muitos clientes começam com o serviço Gratuito. Entre as camadas passíveis de cobrança, as principais diferenças são o tamanho e a velocidade da partição e os limites do número de objetos que você pode criar.

Captura de tela da página Selecionar um nível de preço.

Os serviços de pesquisa criados após 3 de abril de 2024 têm partições maiores e cotas de vetor mais altas.

Lembre-se de que o tipo de preço não pode ser alterado após a criação do serviço. Caso precise de um nível superior ou inferior, deverá recriar o serviço.

Criar seu serviço

Depois de fornecer as entradas necessárias, crie o serviço.

Captura de tela da página Revisar e criar o serviço.

O serviço é implantado em minutos. Monitore o progresso por meio de notificações do Azure. Considere a possibilidade de fixar o serviço no painel para facilitar o acesso no futuro.

Captura de tela da página Monitorar e fixar o serviço.

Configurar autenticação

A menos que esteja usando o portal, o acesso programático ao novo serviço exigirá o fornecimento do ponto de extremidade de URL e de uma conexão autenticada. Você pode usar ambas ou uma dessas opções:

  1. Ao configurar uma conexão programática, o ponto de extremidade do serviço de pesquisa será necessário. Na página Visão Geral, localize e copie o ponto de extremidade de URL do lado direito da página.

    Captura de tela da página Visão geral do serviço com ponto de extremidade de URL.

  2. Para definir opções de autenticação, use a página chaves. A maioria dos guias de início rápido e tutoriais usam chaves de API para simplificar, mas se você estiver configurando um serviço para cargas de trabalho de produção, considere usar funções do Azure. É possível copiar chaves desta página.

    Captura de tela da página Chaves com opções de autenticação.

Um ponto de extremidade e uma chave não são necessários para tarefas baseadas no portal. O portal já está vinculado ao recuso da IA do Azure Search com direitos de administrador. Para obter um passo a passo do portal, comece com Início Rápido: criar um índice da IA do Azure Search no portal.

Dimensione seu serviço

Depois que um serviço de pesquisa é fornecido, você pode escalá-lo para atender às suas necessidades. Em uma camada faturável, é possível escalar o serviço em duas dimensões: réplicas e partições. Para o serviço gratuito, a escala vertical não está disponível e a configuração de réplica e de partição não é oferecida.

Partições permitem que o serviço armazene e pesquise mais documentos.

Réplicas permitem que o serviço lide com uma carga maior de consultas de pesquisa.

A adição de recursos aumenta sua fatura mensal. A calculadora de preços pode ajudá-lo a entender as implicações de cobrança de adição de recursos. Lembre-se de que você pode ajustar os recursos com base na carga. Por exemplo, você pode aumentar os recursos para criar um índice inicial completo e reduzir recursos posteriormente para um nível mais adequado para indexação incremental.

  1. Vá até a folha de serviço de pesquisa no Portal do Azure.
  2. No painel de navegação esquerdo, selecione Configurações>Escala.
  3. Use a barra deslizante para adicionar recursos de qualquer tipo.

Captura de tela da página de escala.

Quando adicionar um segundo serviço

A maioria dos clientes usa apenas um serviço provisionado em uma camada suficiente para a carga esperada. Um serviço pode hospedar vários índices, sujeito aos limites máximos na camada selecionada, com cada índice isolado do outro. Na IA do Azure Search, as solicitações podem ser direcionadas somente para um índice, minimizando a possibilidade de recuperação de dados acidental ou intencional de outros índices no mesmo serviço.

Embora a maioria dos clientes use apenas um serviço, a redundância de serviço poderá ser necessária se os requisitos operacionais incluírem o seguinte:

Observação

Na IA do Azure Search, não é possível segregar operações de indexação e de consulta, por isso você nunca criará vários serviços para cargas de trabalho segregadas. Um índice sempre é consultado no serviço em que foi criado (não é possível criar um índice em um serviço e copiá-lo para outro).

Um segundo serviço não é necessário para alta disponibilidade. A alta disponibilidade para consultas é obtida ao usar duas ou mais réplicas no mesmo serviço. Atualizações de réplica são sequenciais, o que significa que, pelo menos, uma está operacional quando uma atualização de serviço é distribuída. Para obter mais informações sobre tempo de atividade, consulte Contratos de Nível de Serviço.

Adicionar serviços à assinatura

A IA do Azure Search restringe o número de recursos que você pode criar inicialmente em uma assinatura. Se você esgotar seu limite máximo, abra uma solicitação de suporte para adicionar mais serviços de pesquisa.

  1. Entre no portal do Azure e localize o serviço de pesquisa.

  2. No painel de navegação à esquerda, role para baixo e selecione Suporte e Solução de Problemas. Essa experiência é fluida, e as opções e os avisos podem variar um pouco dependendo das suas informações.

  3. Em Como podemos ajudar?, digite cota e selecione Ir.

  4. Você deverá ver os Limites de serviço e assinatura (cotas) como uma opção. Selecione-a e, em seguida, Avançar.

    Captura de tela das opções para aumentar um limite de assinatura.

  5. Siga as instruções para selecionar a assinatura e o recurso para os quais você deseja aumentar o limite.

  6. Selecione Criar um tíquete de suporte.

    Captura de tela do botão criar tíquete de suporte.

  7. Selecione a assinatura e defina o tipo de cota como Pesquisa de IA do Azure e, em seguida, selecione Avançar.

  8. Em Detalhes do problema, selecione Inserir detalhes.

  9. Em Detalhes da cota, especifique o local, a camada e a nova cota. Nenhum dos valores pode estar vazio. A cota deve estar entre 0 e 100 e deve ser maior do que a cota atual. Por exemplo, o número máximo de serviços Básicos é 16, portanto, sua solicitação de cota deve ser maior que 16.

    Captura de tela da página de detalhes da cota.

  10. Selecione Salvar e continuar.

  11. Forneça mais informações, como informações de contato, que são necessárias para registrar a solicitação e selecione Avançar.

  12. Em Examinar + criar, selecione Criar.

Próximas etapas

Depois de provisionar um serviço, continue no portal para criar seu primeiro índice.

Deseja otimizar e reduzir seus gastos com a nuvem?