Habilidades cognitivas internas para processamento de texto e imagem durante a indexação (Pesquisa Cognitiva do Azure)Built-in cognitive skills for text and image processing during indexing (Azure Cognitive Search)

Neste artigo, você aprende sobre as habilidades cognitivas fornecidas com o Azure Pesquisa Cognitiva que você pode incluir em um contenção para extrair conteúdo e estrutura.In this article, you learn about the cognitive skills provided with Azure Cognitive Search that you can include in a skillset to extract content and structure. Uma habilidade cognitiva é um módulo ou uma operação que transforma o conteúdo de alguma maneira.A cognitive skill is a module or operation that transforms content in some way. Geralmente, é um componente que extrai ou infere a estrutura e, portanto, aumenta o seu entendimento sobre os dados de entrada.Often, it is a component that extracts data or infers structure, and therefore augments our understanding of the input data. Quase sempre, a saída é baseada em texto.Almost always, the output is text-based. Um conjunto de qualificações é o conjunto de habilidades que define o enriquecimento do pipeline.A skillset is collection of skills that define the enrichment pipeline.

Observação

À medida que expandir o escopo aumentando a frequência de processamento, adicionando mais documentos ou adicionando mais algoritmos de IA, você precisará anexar um recurso de Serviços Cognitivos faturável.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. As cobranças são geradas ao chamar APIs nos Serviços Cognitivos e para a extração de imagem, como parte do estágio de quebra de documento na Pesquisa Cognitiva do Azure.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Cognitive Search. Não há encargos para extração de texto em documentos.There are no charges for text extraction from documents.

A execução de habilidades integradas é cobrada nos preços pagos conforme o uso dos Serviços Cognitivos existentes.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. O preço da extração de imagem é descrito na página de preços da Pesquisa Cognitiva do Azure.Image extraction pricing is described on the Azure Cognitive Search pricing page.

O recurso de enriquecimento incremental (versão prévia) permite que você forneça um cache que permite que o indexador seja mais eficiente na execução apenas das habilidades cognitivas necessárias se você modificar o seu Skill no futuro, economizando tempo e dinheiro.The incremental enrichment (preview) feature allows you to provide a cache that enables the indexer to be more efficient at running only the cognitive skills that are necessary if you modify your skillset in the future, saving you time and money.

Habilidades internasBuilt-in skills

Diversas habilidades são flexíveis na forma que consomem ou produzem.Several skills are flexible in what they consume or produce. Em geral, a maioria das habilidades é baseada em modelos previamente treinados, o que significa que você não pode treinar o modelo usando seus próprios dados de treinamento.In general, most skills are based on pre-trained models, which means you cannot train the model using your own training data. A tabela a seguir enumera e descreve as habilidades fornecidas pela Microsoft.The following table enumerates and describes the skills provided by Microsoft.

HabilidadeSkill DescriçãoDescription
Microsoft. Skills. Text. CustomEntityLookupSkillMicrosoft.Skills.Text.CustomEntityLookupSkill Procura texto de uma lista personalizada de palavras e frases definidas pelo usuário.Looks for text from a custom, user-defined list of words and phrases.
Microsoft.Skills.Text.KeyPhraseSkillMicrosoft.Skills.Text.KeyPhraseSkill Essa habilidade usa um modelo pré-treinado para detectar frases importantes com base no posicionamento de termos, regras linguísticas, proximidade com outros termos e o quanto o termo é incomum nos dados de origem.This skill uses a pretrained model to detect important phrases based on term placement, linguistic rules, proximity to other terms, and how unusual the term is within the source data.
Microsoft.Skills.Text.LanguageDetectionSkillMicrosoft.Skills.Text.LanguageDetectionSkill Essa habilidade usa um modelo pré-treinado para detectar o idioma usado (uma ID de idioma por documento).This skill uses a pretrained model to detect which language is used (one language ID per document). Quando vários idiomas são usados dentro do mesmo segmentos de texto, a saída é o LCID do idioma predominantemente usado.When multiple languages are used within the same text segments, the output is the LCID of the predominantly used language.
Microsoft.Skills.Text.MergeSkillMicrosoft.Skills.Text.MergeSkill Consolida o texto de uma coleção de campos em um único campo.Consolidates text from a collection of fields into a single field.
Microsoft.Skills.Text.EntityRecognitionSkillMicrosoft.Skills.Text.EntityRecognitionSkill Essa habilidade usa um modelo pré-treinado para estabelecer entidades para um conjunto fixo de categorias: pessoas, local, organização, emails, URLs, campos datetime.This skill uses a pretrained model to establish entities for a fixed set of categories: people, location, organization, emails, URLs, datetime fields.
Microsoft.Skills.Text.PIIDetectionSkillMicrosoft.Skills.Text.PIIDetectionSkill Essa habilidade usa um modelo pretreinado para extrair informações pessoais de um determinado texto.This skill uses a pretrained model to extract personal information from a given text. A habilidade também fornece várias opções para mascarar as entidades de informações pessoais detectadas no texto.The skill also gives various options for masking the detected personal information entities in the text.
Microsoft.Skills.Text.SentimentSkillMicrosoft.Skills.Text.SentimentSkill Essa habilidade usa um modelo pré-treinado para classificar um sentimento positivo ou negativo em um registro por uma base de registro.This skill uses a pretrained model to score positive or negative sentiment on a record by record basis. O valor está entre 0 e 1.The score is between 0 and 1. Pontuações neutras ocorrem para caso nulo quando o sentimento não puder ser detectado, e para o texto que é considerado neutro.Neutral scores occur for both the null case when sentiment cannot be detected, and for text that is considered neutral.
Microsoft.Skills.Text.SplitSkillMicrosoft.Skills.Text.SplitSkill Divide o texto em páginas de forma que você possa enriquecer ou aumentar o conteúdo incrementalmente.Splits text into pages so that you can enrich or augment content incrementally.
Microsoft.Skills.Text.TranslationSkillMicrosoft.Skills.Text.TranslationSkill Essa habilidade usa um modelo pretreinado para converter o texto de entrada em uma variedade de idiomas para casos de uso de normalização ou localização.This skill uses a pretrained model to translate the input text into a variety of languages for normalization or localization use cases.
Microsoft.Skills.Vision.ImageAnalysisSkillMicrosoft.Skills.Vision.ImageAnalysisSkill Essa habilidade usa um algoritmo de detecção de imagem para identificar o conteúdo de uma imagem e gerar uma descrição de texto.This skill uses an image detection algorithm to identify the content of an image and generate a text description.
Microsoft.Skills.Vision.OcrSkillMicrosoft.Skills.Vision.OcrSkill Reconhecimento de caractere óptico.Optical character recognition.
Microsoft.Skills.Util.ConditionalSkillMicrosoft.Skills.Util.ConditionalSkill Permite filtrar, atribuir um valor padrão e mesclar dados com base em uma condição.Allows filtering, assigning a default value, and merging data based on a condition.
Microsoft.Skills.Util.DocumentExtractionSkillMicrosoft.Skills.Util.DocumentExtractionSkill Extrai o conteúdo de um arquivo dentro do pipeline de enriquecimento.Extracts content from a file within the enrichment pipeline.
Microsoft.Skills.Util.ShaperSkillMicrosoft.Skills.Util.ShaperSkill Saída de mapas para um tipo complexo (um tipo de dados de multi-parte que deve ser usado para um nome completo, um endereço de várias linhas ou uma combinação do sobrenome e um identificador pessoal)Maps output to a complex type (a multi-part data type, which might be used for a full name, a multi-line address, or a combination of last name and a personal identifier.)
Microsoft.Skills.Custom.WebApiSkillMicrosoft.Skills.Custom.WebApiSkill Permite a extensibilidade de um pipeline de enriquecimento de ia fazendo uma chamada HTTP para uma API Web personalizadaAllows extensibility of an AI enrichment pipeline by making an HTTP call into a custom Web API
Microsoft. Skills. Custom. AmlSkillMicrosoft.Skills.Custom.AmlSkill Permite a extensibilidade de um pipeline de enriquecimento de ia com um modelo de Azure Machine LearningAllows extensibility of an AI enrichment pipeline with an Azure Machine Learning model

Para obter orientação sobre como criar uma habilidade personalizada, consulte como definir uma interface personalizada e um exemplo: criando uma habilidade personalizada para enriquecimento de ia.For guidance on creating a custom skill, see How to define a custom interface and Example: Creating a custom skill for AI enrichment.

Confira tambémSee also