Carregar dados em um índice de pesquisa no Azure AI Search

Este artigo explica como importar, atualizar e gerenciar conteúdo em um índice de pesquisa predefinido. No Azure AI Search, um índice de pesquisa é criado primeiro, com a importação de dados seguindo como uma segunda etapa. A exceção são o assistente de importação de dados e os pipelines de indexador, que criam e carregam um índice em um fluxo de trabalho.

Um serviço de pesquisa importa e indexa texto e vetores em JSON, usados em cenários de pesquisa de texto completo, pesquisa vetorial, pesquisa híbrida e mineração de conhecimento. O conteúdo de texto pode ser obtido a partir de campos alfanuméricos na fonte de dados externa, metadados úteis em cenários de pesquisa ou conteúdo enriquecido criado por um conjunto de habilidades (as habilidades podem extrair ou inferir descrições textuais de imagens e conteúdo não estruturado). O conteúdo vetorial é vetorizado usando um modelo de incorporação externo ou vetorização integrada (visualização).

Uma vez que os dados são indexados, as estruturas de dados físicas do índice são bloqueadas. Para obter orientação sobre o que pode e o que não pode ser alterado, consulte Soltar e reconstruir um índice.

A indexação não é um processo em segundo plano. Um serviço de pesquisa equilibrará as cargas de trabalho de indexação e consulta, mas se a latência da consulta for muito alta, você poderá adicionar capacidade ou identificar períodos de baixa atividade de consulta para carregar um índice.

Carregar documentos

Um serviço de pesquisa aceita documentos JSON que estão em conformidade com o esquema de índice.

Você mesmo pode preparar esses documentos, mas se o conteúdo residir em uma fonte de dados suportada, a execução de um indexador ou do assistente Importar dados pode automatizar a recuperação de documentos, a serialização JSON e a indexação.

No portal do Azure, use os assistentes de Importação de Dados para criar e carregar índices em um fluxo de trabalho contínuo. Se quiser carregar um índice existente, escolha uma abordagem alternativa.

  1. Inicie sessão no portal do Azure com a sua conta do Azure.

  2. Encontre seu serviço de pesquisa e, na página Visão geral, selecione Importar dados ou Importar e vetorizar dados na barra de comandos para criar e preencher um índice de pesquisa. Você pode seguir estes links para revisar o fluxo de trabalho: Guia de início rápido: criar um índice de pesquisa do Azure AI e Guia de início rápido: vetorização integrada (visualização).

    Screenshot of the Import data command

Se os indexadores já estiverem definidos, você poderá redefinir e executar um indexador no portal do Azure, o que será útil se você estiver adicionando campos incrementalmente. A redefinição força o indexador a começar de novo, pegando todos os campos de todos os documentos de origem.

Eliminar documentos órfãos

O Azure AI Search dá suporte a operações no nível do documento para que você possa pesquisar, atualizar e excluir um documento específico isoladamente. O exemplo a seguir mostra como excluir um documento. Num serviço de pesquisa, os documentos não estão relacionados, pelo que a eliminação de um não terá impacto no resto do índice.

  1. Identifique qual campo é a chave do documento. No portal, é possível visualizar os campos de cada índice. As chaves de documento são campos de cadeia de caracteres e são indicadas com um ícone de chave para facilitar a sua localização.

  2. Verifique os valores do campo chave do documento: search=*&$select=HotelId. Uma cadeia de caracteres simples é simples, mas se o índice usa um campo codificado em base 64 ou se os documentos de pesquisa foram gerados a partir de uma parsingMode configuração, você pode estar trabalhando com valores com os quais não está familiarizado.

  3. Procure o documento para verificar o valor do ID do documento e para rever o seu conteúdo antes de o eliminar. Especifique a chave ou ID do documento na solicitação. Os exemplos a seguir ilustram uma cadeia de caracteres simples para o índice de exemplo Hotels e uma cadeia de caracteres codificada em base 64 para a chave metadata_storage_path do índice cog-search-demo.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Exclua o documento para removê-lo do índice de pesquisa.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Consulte também