Pesquisar um índice

Concluído

Depois de criar e preencher um índice, você pode consultá-lo para pesquisar informações no conteúdo do documento indexado. Embora você possa recuperar entradas de índice com base na correspondência simples de valores de campo, a maioria das soluções de pesquisa usa semântica de pesquisa de texto completo para consultar um índice.

A pesquisa de texto completo descreve soluções de pesquisa que analisam o conteúdo do documento baseado em texto para localizar termos de consulta. As consultas de pesquisa de texto completo no Azure AI Search são baseadas na sintaxe de consulta Lucene , que fornece um conjunto avançado de operações de consulta para pesquisar, filtrar e classificar dados em índices. O Azure AI Search suporta duas variantes da sintaxe Lucene:

  • Simples - Uma sintaxe intuitiva que facilita a realização de pesquisas básicas que correspondem a termos de consulta literais enviados por um usuário.
  • Full - Uma sintaxe estendida que suporta filtragem complexa, expressões regulares e outras consultas mais sofisticadas.

Os aplicativos cliente enviam consultas para o Azure AI Search especificando uma expressão de pesquisa junto com outros parâmetros que determinam como a expressão é avaliada e os resultados retornados. Alguns parâmetros comuns enviados com uma consulta incluem:

  • search - Uma expressão de pesquisa que inclui os termos a serem encontrados.
  • queryType - A sintaxe Lucene a ser avaliada (simples ou completa).
  • searchFields - Os campos de índice a serem pesquisados.
  • select - Os campos a incluir nos resultados.
  • searchMode - Critérios para incluir resultados com base em vários termos de pesquisa. Por exemplo, suponha que você procure por um hotel confortável. Um valor searchMode de Any retorna documentos que contêm "confortável", "hotel" ou ambos, enquanto um valor searchMode de All restringe os resultados a documentos que contêm "confortável" e "hotel".

O processamento de consultas consiste em quatro etapas:

  1. Análise de consultas. A expressão de pesquisa é avaliada e reconstruída como uma árvore de subconsultas apropriadas. As subconsultas podem incluir consultas de termos (encontrar palavras individuais específicas na expressão de pesquisa - por exemplo, hotel), consultas de frases (encontrar frases de vários termos especificadas entre aspas na expressão de pesquisa - por exemplo, "estacionamento gratuito") e consultas de prefixo (encontrar termos com um prefixo especificado - por exemplo, air*, que corresponderia a vias aéreas, ar condicionado e aeroporto).
  2. Análise lexical - Os termos de consulta são analisados e refinados com base em regras linguísticas. Por exemplo, o texto é convertido em minúsculas e palavras paradas não essenciais (como "o", "a", "é" e assim por diante) são removidas. Em seguida, as palavras são convertidas em sua forma raiz (por exemplo, "confortável" pode ser simplificado para "conforto") e palavras compostas são divididas em seus termos constituintes.
  3. Recuperação de documentos - Os termos de consulta são comparados com os termos indexados e o conjunto de documentos correspondentes é identificado.
  4. Pontuação - Uma pontuação de relevância é atribuída a cada resultado com base em um cálculo de frequência de termo / frequência de documento inverso (TF/IDF).

Nota

Para obter mais informações sobre como consultar um índice e detalhes sobre sintaxe simples e completa, consulte Tipos de consulta e composição no Azure AI Search na documentação do Azure AI Search.