Escolher um armazenamento de dados de pesquisa no Azure

Este artigo compara as opções de tecnologia de armazenamentos de dados de pesquisa no Azure. Um armazenamento de dados de pesquisa é usado para criar e armazenar índices especializados a fim de executar pesquisas em texto de forma livre. O texto indexado pode residir em um armazenamento de dados separado, como um armazenamento de blobs. Um aplicativo envia uma consulta para o armazenamento de dados de pesquisa e o resultado é uma lista de documentos correspondentes. Para obter mais informações sobre esse cenário, consulte Processando texto de forma livre para pesquisa.

Quais são as opções disponíveis ao escolher um armazenamento de dados de pesquisa?

No Azure, todos os seguintes armazenamentos de dados atendem aos requisitos básicos de pesquisa em dados de texto de forma livre, fornecendo um índice de pesquisa:

Principais critérios de seleção

Para cenários de pesquisa, comece escolhendo o armazenamento de dados de pesquisa apropriado para suas necessidades, respondendo a essas perguntas:

  • Você deseja ter um serviço gerenciado em vez de gerenciar seus próprios servidores?

  • Você pode especificar o esquema de índice em tempo de design? Caso contrário, escolha uma opção que dá suporte a esquemas atualizáveis.

  • Você precisa de um índice somente para a pesquisa de texto completo ou também precisa de agregação rápida de dados numéricos e outras análises? Caso precise de funcionalidade além da pesquisa de texto completo, considere as opções que dão suporte à análise adicional.

  • Você precisa de um índice de pesquisa para a análise de logs, com suporte para a coleta de log, agregação e visualizações em dados indexados? Nesse caso, considere o uso do Elasticsearch, que faz parte de uma pilha de análise de logs.

  • Você precisa indexar dados em formatos de documentos comuns, como PDF, Word, PowerPoint e Excel? Em caso afirmativo, escolha uma opção que fornece indexadores de documento.

  • O banco de dados tem necessidades específicas de segurança? Em caso afirmativo, considere os recursos de segurança listados abaixo.

Matriz de funcionalidades

As tabelas a seguir resumem as principais diferenças em funcionalidades.

Funcionalidades gerais

Recurso Cognitive Search Elasticsearch Banco de Dados SQL
É um serviço gerenciado Sim Não Sim
REST API Sim Sim Não
Programação .NET, Java, Python, JavaScript Java T-SQL
Indexadores de documento para tipos de arquivo comuns (PDF, DOCX, TXT e assim por diante) Sim Não Não

Funcionalidade de capacidade de gerenciamento

Recurso Cognitive Search Elasticsearch Banco de Dados SQL
Esquema atualizável Sim Sim Yes
Dá suporte à expansão Sim Sim Não

Funcionalidades de carga de trabalho analítica

Recurso Cognitive Search Elasticsearch Banco de Dados SQL
Dá suporte à análise além da pesquisa de texto completo Não Sim Yes
Parte de uma pilha de análise de logs Não Sim (ELK) Não
Dá suporte à pesquisa semântica Sim (encontrar apenas documentos semelhantes) Sim Yes

Funcionalidades de segurança

Recurso Cognitive Search Elasticsearch Banco de Dados SQL
Segurança em nível de linha Parcial (exige que a consulta de aplicativo filtre por ID de grupo) Parcial (exige que a consulta de aplicativo filtre por ID de grupo) Sim
Transparent Data Encryption Não No Sim
Restringir o acesso a endereços IP específicos Sim Sim Yes
Restringir o acesso para permitir apenas o acesso da rede virtual Sim Sim Yes
Autenticação do Active Directory (autenticação integrada) Não No Sim

Colaboradores

Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.

Autor principal:

Próximas etapas