O que é o Azure Cognitive Search?What is Azure Cognitive Search?

Azure Cognitive Searchéum serviço de pesquisa em nuvem que fornece apis e ferramentas para construir uma rica experiência de pesquisa sobre conteúdo privado, heterogéneo em aplicações web, móveis e empresariais.Azure Cognitive Search (formerly known as "Azure Search") is a cloud search service that gives developers APIs and tools for building a rich search experience over private, heterogeneous content in web, mobile, and enterprise applications.

A pesquisa é fundamental para qualquer app que suria conteúdo para os utilizadores, com cenários comuns, incluindo pesquisa de catálogo ou documento, pesquisa de sites de e-commerce ou mineração de conhecimento para a ciência dos dados.Search is foundational to any app that surfaces content to users, with common scenarios including catalog or document search, e-commerce site search, or knowledge mining for data science. As APIs e a arquitetura da Pesquisa Cognitiva simplificam a tarefa de adicionar uma sofisticada recuperação de informação a qualquer solução.The APIs and architecture of Cognitive Search simplify the task of adding sophisticated information retrieval to any solution.

Um serviço de pesquisa tem os seguintes componentes:A search service has the following components:

  • Pesquisar o motor para pesquisa completa de textoSearch engine for full text search
  • Armazenamento persistente de conteúdo indexado de propriedade do utilizadorPersistent storage of user-owned indexed content
  • APIs para indexação e consulta de conteúdosAPIs for indexing and querying content
  • Enriquecimentos opcionais baseados em IA,criando conteúdo pesmável a partir de imagens, texto cru e não estruturado, ficheiros de aplicaçõesOptional AI-based enrichments, creating searchable content out of images, raw unstructured text, application files
  • Integração opcional com outros serviços Azure para dados, machine learning/IA, monitorização e segurançaOptional integration with other Azure services for data, machine learning/AI, monitoring, and security
  • Implementação opcional de pesquisa semântica (pré-visualização) para uma maior relevânciaOptional implementation of semantic search (preview) for improved relevance

Em termos arquitetónicos, um serviço de pesquisa situa-se entre as lojas de dados externos que contêm os seus dados não indexados, e a sua aplicação de cliente que envia pedidos de consulta para um índice de pesquisa e trata a resposta.Architecturally, a search service sits in between the external data stores that contain your un-indexed data, and your client app that sends query requests to a search index and handles the response.

Arquitetura de Pesquisa Cognitiva AzureAzure Cognitive Search architecture

Externamente, a pesquisa pode integrar-se com outros serviços Azure sob a forma de indexantes que automatizam a ingestão/recuperação de dados a partir de fontes de dados Azure, e skillsets que incorporam IA consumível dos Serviços Cognitivos, tais como análise de imagem e texto, ou IA personalizada que você cria em Azure Machine Learning ou embrulhe dentro de Funções Azure.Externally, search can integrate with other Azure services in the form of indexers that automate data ingestion/retrieval from Azure data sources, and skillsets that incorporate consumable AI from Cognitive Services, such as image and text analysis, or custom AI that you create in Azure Machine Learning or wrap inside Azure Functions.

Dentro de um serviço de pesquisaInside a search service

No próprio serviço de pesquisa, as duas cargas de trabalho primárias estão a indexar e a consultar.On the search service itself, the two primary workloads are indexing and querying.

  • Indexar é um processo de admissão que carrega o conteúdo para o seu serviço de pesquisa e o torna pes pespável.Indexing is an intake process that loads content into to your search service and makes it searchable. Internamente, o texto de entrada é processado em fichas e armazenado em índices invertidos para digitalizações rápidas.Internally, inbound text is processed into tokens and stored in inverted indexes for fast scans. Pode fazer o upload de qualquer texto que esteja na forma de documentos JSON.You can upload any text that is in the form of JSON documents.

    Além disso, se o seu conteúdo inclui ficheiros mistos, tem a opção de adicionar enriquecimento de IA através de habilidades cognitivas.Additionally, if your content includes mixed files, you have the option of adding AI enrichment through cognitive skills. O enriquecimento de IA pode extrair texto incorporado em ficheiros de aplicações, e também inferir texto e estrutura a partir de ficheiros não-texto, analisando o conteúdo.AI enrichment can extract text embedded in application files, and also infer text and structure from non-text files by analyzing the content.

    As competências que fornecem a análise são predefinidas da Microsoft, ou habilidades personalizadas que cria.The skills providing the analysis are predefined ones from Microsoft, or custom skills that you create. As análises e transformações subsequentes podem resultar em novas informações e estruturas que anteriormente não existiam, proporcionando alta utilidade para muitos cenários de pesquisa e mineração de conhecimento.The subsequent analysis and transformations can result in new information and structures that did not previously exist, providing high utility for many search and knowledge mining scenarios.

  • A consulta pode ocorrer uma vez que um índice é preenchido com texto pesmável, quando a sua aplicação do cliente envia pedidos de consulta para um serviço de pesquisa e lida com respostas.Querying can happen once an index is populated with searchable text, when your client app sends query requests to a search service and handles responses. Toda a execução de consultas é sobre um índice de pesquisa que você cria, possui e armazena no seu serviço.All query execution is over a search index that you create, own, and store in your service. Na sua aplicação cliente, a experiência de pesquisa é definida usando APIs da Azure Cognitive Search, e pode incluir afinação de relevância, afinação automática, correspondência de sinónimo, correspondência fuzzy, correspondência de padrões, filtro e classificação.In your client app, the search experience is defined using APIs from Azure Cognitive Search, and can include relevance tuning, autocomplete, synonym matching, fuzzy matching, pattern matching, filter, and sort.

A funcionalidade é exposta através de uma simples REST API ou .NET SDK que dissimula a complexidade inerente da obtenção de informações.Functionality is exposed through a simple REST API or .NET SDK that masks the inherent complexity of information retrieval. Também pode utilizar o portal Azure para a administração de serviços e gestão de conteúdos, com ferramentas para prototipagem e consulta dos seus índices e skillsets.You can also use the Azure portal for service administration and content management, with tools for prototyping and querying your indexes and skillsets. Por o serviço executar na cloud, as infraestruturas e disponibilidade são geridas pela Microsoft.Because the service runs in the cloud, infrastructure and availability are managed by Microsoft.

A Azure Cognitive Search é adequada para os seguintes cenários de aplicação:Azure Cognitive Search is well suited for the following application scenarios:

  • Consolidar o conteúdo heterogéneo num índice de pesquisa definido pelo utilizador.Consolidate heterogeneous content into a private, user-defined search index.

  • Implementar facilmente funcionalidades relacionadas com a pesquisa: afinação de relevância, navegação frontal, filtros (incluindo pesquisa geo-espacial), mapeamento de sinónimo e preconização automática.Easily implement search-related features: relevance tuning, faceted navigation, filters (including geo-spatial search), synonym mapping, and autocomplete.

  • Transforme grandes ficheiros de texto ou imagem indiferenciados, ou ficheiros de aplicação armazenados no armazenamento de Azure Blob ou Na Cosmos DB, em documentos JSON pesjáveis.Transform large undifferentiated text or image files, or application files stored in Azure Blob storage or Cosmos DB, into searchable JSON documents. Isto é conseguido durante o índice através de habilidades cognitivas que adicionam processamento externo.This is achieved during index through cognitive skills that add external processing.

  • Adicione análise de texto linguística ou personalizada.Add linguistic or custom text analysis. Se tiver conteúdo não inglês, o Azure Cognitive Search suporta tanto os analisadores de Lucene como os processadores de linguagem natural da Microsoft.If you have non-English content, Azure Cognitive Search supports both Lucene analyzers and Microsoft's natural language processors. Também pode configurar analisadores para obter o processamento especializado de conteúdo bruto, como filtrar diacríticos, ou reconhecer e preservar padrões em cordas.You can also configure analyzers to achieve specialized processing of raw content, such as filtering out diacritics, or recognizing and preserving patterns in strings.

Para obter mais informações sobre funcionalidades específicas, consulte funcionalidades de Pesquisa Cognitiva AzureFor more information about specific functionality, see Features of Azure Cognitive Search

Como começarHow to get started

Uma exploração de ponta a ponta das funcionalidades de pesquisa do núcleo pode ser alcançada em quatro etapas:An end-to-end exploration of core search features can be achieved in four steps:

  1. Crie um serviço de pesquisa no nível gratuito partilhado ou num nível faturado para recursos dedicados utilizados apenas pelo seu serviço.Create a search service at the shared Free tier or a billable tier for dedicated resources used only by your service. Todos os quickstarts e tutoriais podem ser concluídos num serviço partilhado.All quickstarts and tutorials can be completed on a shared service.

  2. Crie um índice de pesquisa utilizando o portal REST API, .NET SDK,ou outro SDK.Create a search index using the portal, REST API, .NET SDK, or another SDK. O esquema de índice define a estrutura do conteúdo pesmável.The index schema defines the structure of searchable content.

  3. Faça upload de conteúdo usando o modelo "push" para empurrar documentos JSON de qualquer fonte, ou use o modelo "pull" (indexantes) se os seus dados de origem estiverem no Azure.Upload content using the "push" model to push JSON documents from any source, or use the "pull" model (indexers) if your source data is on Azure.

  4. Consultar um índice utilizando o Explorador de Pesquisa no portal, REST API, .NET SDK,ou outro SDK.Query an index using Search explorer in the portal, REST API, .NET SDK, or another SDK.

Para a exploração inicial, comece com o assistente de dados de Importação e uma fonte de dados Azure incorporada para criar, carregar e consultar um índice em minutos.For initial exploration, start with the Import data wizard and a built-in Azure data source to create, load, and query an index in minutes.

Para obter ajuda com soluções complexas ou personalizadas, contacte um parceiro com uma vasta experiência em tecnologia de Pesquisa Cognitiva.For help with complex or custom solutions, contact a partner with deep expertise in Cognitive Search technology.

Comparar opções de pesquisaCompare search options

Os clientes perguntam frequentemente como a Azure Cognitive Search se compara com outras soluções relacionadas com a pesquisa.Customers often ask how Azure Cognitive Search compares with other search-related solutions. A tabela seguinte resume as diferenças principais.The following table summarizes key differences.

Em comparação comCompared to Diferenças principaisKey differences
Microsoft SearchMicrosoft Search O Microsoft Search é para utilizadores autenticados microsoft 365 que precisam de consultar os conteúdos no SharePoint.Microsoft Search is for Microsoft 365 authenticated users who need to query over content in SharePoint. É oferecido como uma experiência de pesquisa pronta a usar, ativada e configurada por administradores, com a capacidade de aceitar conteúdo externo através de conectores da Microsoft e outras fontes.It's offered as a ready-to-use search experience, enabled and configured by administrators, with the ability to accept external content through connectors from Microsoft and other sources. Se isto descreve o seu cenário, então o Microsoft Search com o Microsoft 365 é uma opção atraente para explorar.If this describes your scenario, then Microsoft Search with Microsoft 365 is an attractive option to explore.

Em contraste, a Azure Cognitive Search executa consultas sobre um índice que define, povoado com dados e documentos que possui, muitas vezes de diversas fontes.In contrast, Azure Cognitive Search executes queries over an index that you define, populated with data and documents you own, often from diverse sources. A Azure Cognitive Search tem capacidades de rastreio para algumas fontes de dados Azure através de indexadores, mas você pode empurrar qualquer documento JSON que esteja em conformidade com o seu esquema de índice em um único recurso pesquisalável consolidado.Azure Cognitive Search has crawler capabilities for some Azure data sources through indexers, but you can push any JSON document that conforms to your index schema into a single, consolidated searchable resource. Também pode personalizar o pipeline de indexação para incluir machine learning e analisadores lexical.You can also customize the indexing pipeline to include machine learning and lexical analyzers. Como a Cognitive Search é construída para ser um componente plug-in em soluções maiores, pode integrar a pesquisa em quase todas as aplicações, em qualquer plataforma.Because Cognitive Search is built to be a plug-in component in larger solutions, you can integrate search into almost any app, on any platform.
BingBing A API de Pesquisa na Web do Bing procura os índices em Bing.com para os termos correspondentes ao que enviar.Bing Web Search API searches the indexes on Bing.com for matching terms you submit. Os índices são criados a partir de HTML, XML e outros conteúdos web em sites públicos.Indexes are built from HTML, XML, and other web content on public sites. Criada com base nos mesmos fundamentos, a Pesquisa Personalizada do Bing oferece a mesma tecnologia crawler para tipos de conteúdo Web, no âmbito de sites individuais.Built on the same foundation, Bing Custom Search offers the same crawler technology for web content types, scoped to individual web sites.

Na Pesquisa Cognitiva, pode definir e povoar o índice.In Cognitive Search, you can define and populate the index. Pode utilizar indexadores para rastrear dados em fontes de dados do Azure ou empurrar qualquer documento JSON em conformidade com o índice para o seu serviço de pesquisa.You can use indexers to crawl data on Azure data sources, or push any index-conforming JSON document to your search service.
Pesquisa de base de dadosDatabase search Muitas plataformas da base de dados incluem uma experiência de pesquisa incorporada.Many database platforms include a built-in search experience. O SQL Server tem pesquisa em texto completo.SQL Server has full text search. O Cosmos DB e as tecnologias semelhantes têm índices consultáveis.Cosmos DB and similar technologies have queryable indexes. Quando avaliar os produtos que combinam a pesquisa e o armazenamento, pode ser difícil determinar qual escolher.When evaluating products that combine search and storage, it can be challenging to determine which way to go. Muitas soluções utilizam ambas: DBMS para armazenamento, e Azure Cognitive Search para funcionalidades de pesquisa especializadas.Many solutions use both: DBMS for storage, and Azure Cognitive Search for specialized search features.

Em comparação com a pesquisa DBMS, a Azure Cognitive Search armazena conteúdos de fontes heterogéneas e oferece funcionalidades especializadas de processamento de texto, tais como processamento de textos conscientes da linguística (stemming, lematização, formas de palavras) em 56 idiomas.Compared to DBMS search, Azure Cognitive Search stores content from heterogeneous sources and offers specialized text processing features such as linguistic-aware text processing (stemming, lemmatization, word forms) in 56 languages. Também suporta a correção automática de palavras com erros ortográficos, sinónimos, sugestões, controlos de classificação, facetase atomização personalizada.It also supports autocorrection of misspelled words, synonyms, suggestions, scoring controls, facets, and custom tokenization. O motor de pesquisa de texto completo em Azure Cognitive Search é construído em Apache Lucene, um padrão da indústria na recuperação de informação.The full text search engine in Azure Cognitive Search is built on Apache Lucene, an industry standard in information retrieval. No entanto, embora a Azure Cognitive Search persista em dados sob a forma de um índice invertido, não é um substituto para o verdadeiro armazenamento de dados e não recomendamos a sua utilização nessa capacidade.However, while Azure Cognitive Search persists data in the form of an inverted index, it is not a replacement for true data storage and we don't recommend using it in that capacity. Para obter mais informações, veja esta mensagem no fórum.For more information, see this forum post.

A utilização de recursos é outro ponto de flexão nesta categoria.Resource utilization is another inflection point in this category. A indexação e algumas operações de consulta, muitas vezes, são intensivas em termos de computação.Indexing and some query operations are often computationally intensive. O descarregamento da pesquisa do DBMS para uma solução dedicada na cloud preserva os recursos do sistema para o processamento de transações.Offloading search from the DBMS to a dedicated solution in the cloud preserves system resources for transaction processing. Além disso, ao externalizar a pesquisa, pode facilmente ajustar o dimensionamento para corresponder ao volume de consultas.Furthermore, by externalizing search, you can easily adjust scale to match query volume.
Solução de pesquisa dedicadaDedicated search solution Partindo do princípio de que escolheu a pesquisa dedicada com funcionalidade de espetro completo, a comparação categórica final será entre as soluções no local ou um serviço cloud.Assuming you have decided on dedicated search with full spectrum functionality, a final categorical comparison is between on premises solutions or a cloud service. Muitas tecnologias de pesquisa oferecem controlo sobre os pipelines de indexação e consulta, acesso a uma sintaxe de consulta e filtragem mais rica, controlo sobre a classificação e relevância e funcionalidades para uma pesquisa inteligente e auto-direcionada.Many search technologies offer controls over indexing and query pipelines, access to richer query and filtering syntax, control over rank and relevance, and features for self-directed and intelligent search.

Um serviço cloud é a escolha certa se quiser uma solução imediata com o mínimo de custos gerais e de manutenção e com um dimensionamento ajustável.A cloud service is the right choice if you want a turn-key solution with minimal overhead and maintenance, and adjustable scale.

Dentro do paradigma da cloud, vários fornecedores oferecem funcionalidades de linha de base comparáveis, com pesquisa de texto inteiro, pesquisa geográfica e a capacidade de processar um determinado nível de ambiguidade nas entradas de pesquisa.Within the cloud paradigm, several providers offer comparable baseline features, with full-text search, geo-search, and the ability to handle a certain level of ambiguity in search inputs. Normalmente, é uma funcionalidade especializada ou a facilidade e simplicidade geral das APIs, das ferramentas e a gestão que determinam qual a melhor opção.Typically, it's a specialized feature, or the ease and overall simplicity of APIs, tools, and management that determines the best fit.

Entre os fornecedores de nuvem, o Azure Cognitive Search é o mais forte para a pesquisa completa de textos sobre lojas de conteúdos e bases de dados no Azure, para apps que dependem principalmente da pesquisa tanto para a recuperação de informações como para a navegação de conteúdos.Among cloud providers, Azure Cognitive Search is strongest for full text search workloads over content stores and databases on Azure, for apps that rely primarily on search for both information retrieval and content navigation.

As principais vantagens incluem:Key strengths include:

  • Integração de dados do Azure (crawlers) na camada de indexaçãoAzure data integration (crawlers) at the indexing layer
  • Integração de Azure Private Link para apoiar requisitos de segurança off-internetAzure Private Link integration to support off-internet security requirements
  • Integração com o processamento de IA para tornar os tipos de conteúdo insuclesiáveis por texto.Integration with AI processing to make unsearchable content types text-searchable.
  • A análise linguística e personalizada, com analisadores de pesquisa de texto completo sólidos em 56 idiomasLinguistic and custom analysis, with analyzers for solid full text search in 56 languages
  • Características críticas: linguagem de consulta rica, afinação de relevância, frontalização, autocompleto, sinónimos, geo-pesquisa e composição de resultados.Critical features: rich query language, relevance tuning, faceting, autocomplete, synonyms, geo-search, and result composition.
  • Dimensionamento, fiabilidade e disponibilidade de classe mundial do AzureAzure scale, reliability, and world-class availability

Entre os nossos clientes, aqueles que são capazes de aproveitar a mais ampla gama de funcionalidades na Azure Cognitive Search incluem catálogos online, programas de linha de negócios e aplicações de descoberta de documentos.Among our customers, those able to leverage the widest range of features in Azure Cognitive Search include online catalogs, line-of-business programs, and document discovery applications.

Assistir a este vídeoWatch this video

Neste vídeo de 15 minutos, o gestor de programas Luis Cabrera apresenta a Azure Cognitive Search.In this 15-minute video, program manager Luis Cabrera introduces Azure Cognitive Search.