Aptitudes cognitivas integradas para el procesamiento de texto e imagen durante la indexación (Azure Cognitive Search)Built-in cognitive skills for text and image processing during indexing (Azure Cognitive Search)

En este artículo, obtendrá información sobre las aptitudes cognitivas proporcionadas con Azure Cognitive Search que puede incluir en un conjunto de aptitudes para extraer contenido y estructura.In this article, you learn about the cognitive skills provided with Azure Cognitive Search that you can include in a skillset to extract content and structure. Una aptitud cognitiva es un módulo u operación que transforma el contenido de alguna manera.A cognitive skill is a module or operation that transforms content in some way. Normalmente es un componente que extrae datos o deduce la estructura y, por tanto, aumenta la comprensión de los datos de entrada.Often, it is a component that extracts data or infers structure, and therefore augments our understanding of the input data. Casi siempre la salida se basa en texto.Almost always, the output is text-based. Un conjunto de habilidades es una colección de habilidades que definen la canalización de enriquecimiento.A skillset is collection of skills that define the enrichment pipeline.

Nota

A medida que expanda el ámbito aumentando la frecuencia de procesamiento, agregando más documentos o agregando más algoritmos de IA, tendrá que asociar un recurso facturable de Cognitive Services.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. Los cargos se acumulan cuando se llama a las API de Cognitive Services y por la extracción de imágenes como parte de la fase de descifrado de documentos de Azure Cognitive Search.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Cognitive Search. No hay ningún cargo por la extracción de texto de documentos.There are no charges for text extraction from documents.

La ejecución de aptitudes integradas se cobra según los precios de pago por uso de Cognitive Services existentes.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. Los precios de la extracción de imágenes se describen en la página de precios de Búsqueda cognitiva de Azure.Image extraction pricing is described on the Azure Cognitive Search pricing page.

Aptitudes integradasBuilt-in skills

Hay varias habilidades que son flexibles con respecto a lo que usan o producen.Several skills are flexible in what they consume or produce. En general, la mayoría de las habilidades se basan en modelos aprendidos previamente, lo que significa que no es posible aprender el modelo con sus propios datos de aprendizaje.In general, most skills are based on pre-trained models, which means you cannot train the model using your own training data. En la tabla siguiente se enumeran y se describen las habilidades proporcionadas por Microsoft.The following table enumerates and describes the skills provided by Microsoft.

HabilidadSkill DESCRIPCIÓNDescription
Microsoft.Skills.Text.KeyPhraseSkillMicrosoft.Skills.Text.KeyPhraseSkill Esta habilidad usa un modelo aprendido previamente para detectar frases importantes en función de la colocación de términos, las reglas lingüísticas, la proximidad a otros términos y cómo de inusual es el término en los datos de origen.This skill uses a pretrained model to detect important phrases based on term placement, linguistic rules, proximity to other terms, and how unusual the term is within the source data.
Microsoft.Skills.Text.LanguageDetectionSkillMicrosoft.Skills.Text.LanguageDetectionSkill Esta habilidad usa un modelo aprendido previamente para detectar qué idioma se usa (un identificador de idioma por documento).This skill uses a pretrained model to detect which language is used (one language ID per document). Si se usan varios idiomas en los mismos segmentos de texto, la salida es el LCID del idioma más usado.When multiple languages are used within the same text segments, the output is the LCID of the predominantly used language.
Microsoft.Skills.Text.MergeSkillMicrosoft.Skills.Text.MergeSkill Consolida el texto de una colección de campos en un solo campo.Consolidates text from a collection of fields into a single field.
Microsoft.Skills.Text.EntityRecognitionSkillMicrosoft.Skills.Text.EntityRecognitionSkill Esta habilidad usa un modelo aprendido previamente para establecer las entidades de un conjunto fijo de categorías: personas, ubicación, organización, correos electrónicos, direcciones URL, campos de fecha y hora.This skill uses a pretrained model to establish entities for a fixed set of categories: people, location, organization, emails, URLs, datetime fields.
Microsoft.Skills.Text.SentimentSkillMicrosoft.Skills.Text.SentimentSkill Esta habilidad usa un modelo aprendido previamente para puntuar opiniones positivas o negativas registro a registro.This skill uses a pretrained model to score positive or negative sentiment on a record by record basis. La puntuación va de 0 a 1.The score is between 0 and 1. Se otorgan puntuaciones neutras para el caso nulo cuando no se puede detectar la opinión y para el texto que se considera neutro.Neutral scores occur for both the null case when sentiment cannot be detected, and for text that is considered neutral.
Microsoft.Skills.Text.SplitSkillMicrosoft.Skills.Text.SplitSkill Divide el texto en páginas para que se pueda enriquecer o aumentar el contenido de forma incremental.Splits text into pages so that you can enrich or augment content incrementally.
Microsoft.Skills.Text.TranslationSkillMicrosoft.Skills.Text.TranslationSkill Esta aptitud usa un modelo entrenado previamente para traducir el texto de entrada a una variedad de idiomas para los casos de uso de normalización o localización.This skill uses a pretrained model to translate the input text into a variety of languages for normalization or localization use cases.
Microsoft.Skills.Vision.ImageAnalysisSkillMicrosoft.Skills.Vision.ImageAnalysisSkill Esta habilidad usa un algoritmo de detección de imágenes para identificar el contenido de una imagen y generar una descripción de texto.This skill uses an image detection algorithm to identify the content of an image and generate a text description.
Microsoft.Skills.Vision.OcrSkillMicrosoft.Skills.Vision.OcrSkill Reconocimiento óptico de caracteres.Optical character recognition.
Microsoft.Skills.Util.ConditionalSkillMicrosoft.Skills.Util.ConditionalSkill Permite el filtrado, la asignación de un valor predeterminado y la combinación de datos según una condición.Allows filtering, assigning a default value, and merging data based on a condition.
Microsoft.Skills.Util.DocumentExtractionSkillMicrosoft.Skills.Util.DocumentExtractionSkill Extrae contenido de un archivo dentro de la canalización de enriquecimiento.Extracts content from a file within the enrichment pipeline.
Microsoft.Skills.Util.ShaperSkillMicrosoft.Skills.Util.ShaperSkill Asigna la salida a un tipo complejo (un tipo de datos de varias partes que se podría usar para un nombre completo, una dirección de varias líneas o una combinación de apellido e identificador personal).Maps output to a complex type (a multi-part data type, which might be used for a full name, a multi-line address, or a combination of last name and a personal identifier.)
Microsoft.Skills.Custom.WebApiSkillMicrosoft.Skills.Custom.WebApiSkill Permite la extensibilidad de la canalización de enriquecimiento con inteligencia artificial mediante la realización de una llamada HTTP a una API web personalizadaAllows extensibility of an AI enrichment pipeline by making an HTTP call into a custom Web API

Para ver una guía acerca de cómo crear una aptitud personalizada, consulte Cómo definir una interfaz personalizada y Ejemplo: Creación de una aptitud personalizada para el enriquecimiento con inteligencia artificial.For guidance on creating a custom skill, see How to define a custom interface and Example: Creating a custom skill for AI enrichment.

Otras referenciasSee also