Introducción a la inteligencia artificial en Azure Cognitive SearchIntroduction to AI in Azure Cognitive Search

El enriquecimiento con IA es una funcionalidad de la indexación de Azure Cognitive Search que se usa para extraer texto de imágenes, blobs y otros orígenes de datos no estructurados, enriqueciendo el contenido para facilitar la realización de búsquedas en un índice o en un almacén de conocimiento.AI enrichment is a capability of Azure Cognitive Search indexing used to extract text from images, blobs, and other unstructured data sources - enriching the content to make it more searchable in an index or knowledge store. La extracción y el enriquecimiento se implementan a través de conocimientos cognitivos adjuntados a una canalización de indexación.Extraction and enrichment are implemented through cognitive skills attached to an indexing pipeline. Las aptitudes cognitivas integradas en el servicio se dividen en estas categorías:Cognitive skills built into the service fall into these categories:

  • Las aptitudes del procesamiento de lenguaje natural incluyen reconocimiento de entidades, detección de idioma, extracción de frases clave, manipulación de texto y detección de opiniones.Natural language processing skills include entity recognition, language detection, key phrase extraction, text manipulation, and sentiment detection. Con estas aptitudes, un texto no estructurado puede asumir nuevas formas, asignado e a campos que se pueden buscar y filtrar en un índice.With these skills, unstructured text can assume new forms, mapped as searchable and filterable fields in an index.

  • Las aptitudes de procesamiento de imágenes incluyen reconocimiento óptico de caracteres (OCR) e identificación de características visuales, como detección facial, interpretación de imágenes, reconocimiento de imágenes (personas famosas y puntos de referencia) o atributos como colores o la orientación de la imagen.Image processing skills include Optical Character Recognition (OCR) and identification of visual features, such as facial detection, image interpretation, image recognition (famous people and landmarks) or attributes like colors or image orientation. Puede crear representaciones de texto del contenido de las imágenes, que se puede buscar mediante todas las funcionalidades de consulta de Azure Cognitive Search.You can create text-representations of image content, searchable using all the query capabilities of Azure Cognitive Search.

Diagrama de una canalización de enriquecimientoEnrichment pipeline diagram

Las aptitudes cognitivas de Azure Cognitive Search se basan en los modelos de aprendizaje automático previamente entrenados de Cognitive Services APIs: Computer Vision y análisis de texto.Cognitive skills in Azure Cognitive Search are based on pre-trained machine learning models in Cognitive Services APIs: Computer Vision and Text Analysis.

Tanto el lenguaje natural como el procesamiento de imágenes se aplican durante la fase de ingesta de datos, con resultados que forman parte de la composición de un documento en un índice en el que se pueden realizar búsquedas en Azure Cognitive Search.Natural language and image processing is applied during the data ingestion phase, with results becoming part of a document's composition in a searchable index in Azure Cognitive Search. Los datos se obtienen como un conjunto de datos de Azure y luego se insertan a través de una canalización de indexación mediante las aptitudes integradas que necesite.Data is sourced as an Azure data set and then pushed through an indexing pipeline using whichever built-in skills you need. La arquitectura es extensible, por lo que si las aptitudes integradas no son suficientes, puede crear y adjuntar aptitudes personalizadas para integrar el procesamiento personalizado.The architecture is extensible so if the built-in skills are not sufficient, you can create and attach custom skills to integrate custom processing. Algunos ejemplos pueden ser un módulo de entidad personalizado o un clasificador de documentos que tiene como destino un dominio específico, como finanzas, publicaciones científicas o medicina.Examples might be a custom entity module or document classifier targeting a specific domain such as finance, scientific publications, or medicine.

Nota

A medida que expanda el ámbito aumentando la frecuencia de procesamiento, agregando más documentos o agregando más algoritmos de IA, tendrá que asociar un recurso facturable de Cognitive Services.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. Los cargos se acumulan cuando se llama a las API de Cognitive Services y por la extracción de imágenes como parte de la fase de descifrado de documentos de Azure Cognitive Search.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Cognitive Search. No hay ningún cargo por la extracción de texto de documentos.There are no charges for text extraction from documents.

La ejecución de aptitudes integradas se cobra según los precios de pago por uso de Cognitive Services existentes.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. Los precios de la extracción de imágenes se describen en la página de precios de Azure Cognitive Search.Image extraction pricing is described on the Azure Cognitive Search pricing page.

Cuándo se usan las aptitudes cognitivasWhen to use cognitive skills

Considere la posibilidad de usar las aptitudes cognitivas integradas si el contenido sin procesar es texto no estructurado, contenido de imagen o contenido que requiere la detección y traducción de idiomas.You should consider using built-in cognitive skills if your raw content is unstructured text, image content, or content that needs language detection and translation. La aplicación de inteligencia artificial a través de las aptitudes cognitivos integradas puede desbloquear este contenido, lo que aumenta su valor y utilidad en las aplicaciones de ciencia de datos y búsqueda.Applying AI through the built-in cognitive skills can unlock this content, increasing its value and utility in your search and data science apps.

Además, puede considerar la posibilidad de agregar una aptitud personalizada si tiene código de código abierto, de terceros o de otro fabricante que le gustaría integrar en la canalización.Additionally, you might consider adding a custom skill if you have open-source, third-party, or first-party code that you'd like to integrate into the pipeline. Los modelos de clasificación que identifican las características destacadas de varios tipos de documento se encuentran en esta categoría, pero también se puede usar cualquier paquete que agregue valor al contenido.Classification models that identify salient characteristics of various document types fall into this category, but any package that adds value to your content could also be used.

Más información sobre las aptitudes integradasMore about built-in skills

Los conjuntos de aptitudes que se ensamblan mediante aptitudes integradas son apropiados para los siguientes escenarios de la aplicación:A skillset that's assembled using built-in skills is well suited for the following application scenarios:

  • Documentos digitalizados (JPEG) en los que desea realizar búsquedas de texto completo.Scanned documents (JPEG) that you want to make full-text searchable. Puede adjuntar una aptitud de reconocimiento óptico de caracteres (OCR) para identificar, extraer e ingerir texto de archivos JPEG.You can attach an optical character recognition (OCR) skill to identify, extract, and ingest text from JPEG files.

  • PDF con combinación de imagen y texto.PDFs with combined image and text. El texto de los archivos PDF se puede extraer durante la indexación sin el uso de los pasos del enriquecimiento, pero la adición del procesamiento de imágenes y del lenguaje natural a menudo puede producir un mejor resultado que el de una indexación estándar.Text in PDFs can be extracted during indexing without the use of enrichment steps, but the addition of image and natural language processing can often produce a better outcome than a standard indexing provides.

  • Contenido multilingüe en el que desea aplicar la detección de idioma y, posiblemente, la traducción del texto.Multi-lingual content against which you want to apply language detection and possibly text translation.

  • Documentos no estructurados o semiestructurados cuyo contenido tenga un significado o contexto inherentes que está oculto en el documento mayor.Unstructured or semi-structured documents containing content that has inherent meaning or context that is hidden in the larger document.

    Los blobs a menudo contienen un cuerpo de contenido grande que se empaqueta en un "campo" único.Blobs in particular often contain a large body of content that is packed into a singled "field". Al adjuntar aptitudes de procesamiento de imágenes y de lenguaje natural a un indizador, puede crear información que exista en el contenido sin procesar, pero que no se expone como campos distintos.By attaching image and natural language processing skills to an indexer, you can create new information that is extant in the raw content, but not otherwise surfaced as distinct fields. Algunas aptitudes cognitivas integradas listas para usar que pueden servidor de ayuda: extracción de frases clave, análisis de opiniones y reconocimiento de entidades (personas, organizaciones y ubicaciones).Some ready-to-use built-in cognitive skills that can help: key phrase extraction, sentiment analysis, and entity recognition (people, organizations, and locations).

    Además, las aptitudes integradas también se pueden usar para reestructurar el contenido mediante operaciones de división de texto, combinación y modelado de forma.Additionally, built-in skills can also be used restructure content through text split, merge, and shape operations.

Más información sobre las aptitudes personalizadasMore about custom skills

Las aptitudes personalizadas pueden admitir escenarios más complejos, como el reconocimiento de formularios o la detección de entidades personalizadas mediante un modelo que se proporciona y se encapsula en la interfaz web de aptitudes personalizadas.Custom skills can support more complex scenarios, such as recognizing forms, or custom entity detection using a model that you provide and wrap in the custom skill web interface. Entre los ejemplos de aptitudes personalizadas se incluyen Form Recognizer, la integración de Bing Entity Search API y el reconocimiento de entidades personalizadas.Several examples of custom skills include Forms Recognizer, integration of the Bing Entity Search API, and custom entity recognition.

Componentes de una canalización de enriquecimientoComponents of an enrichment pipeline

Las canalizaciones de enriquecimiento se basan en indexadores que rastrean los orígenes de datos y proporcionan un procesamiento de índices de un extremo a otro.An enrichment pipeline is based on indexers that crawl data sources and provide end-to-end index processing. Las aptitudes ahora se adjuntan a los indexadores, lo que permite interceptar y enriquecer los documentos en función del conjunto de aptitudes que defina.Skills are now attached to indexers, intercepting and enriching documents according to the skillset you define. Una vez que se indexa, puede acceder al contenido mediante solicitudes de búsqueda a través de todos los tipos de consulta compatibles con Azure Cognitive Search.Once indexed, you can access content via search requests through all query types supported by Azure Cognitive Search. Si es la primera vez que usa los indexadores, esta sección lo guiará a través de los pasos.If you are new to indexers, this section walks you through the steps.

Paso 1: Fase de conexión y descifrado de documentosStep 1: Connection and document cracking phase

Al comienzo de la canalización, hay texto no estructurado o contenido que no es de texto, como archivos JPEG de documentos escaneados e imágenes.At the start of the pipeline, you have unstructured text or non-text content (such as image and scanned document JPEG files). Los datos deben estar en un servicio de almacenamiento de datos de Azure al que un indexador puede acceder.Data must exist in an Azure data storage service that can be accessed by an indexer. Los indexadores pueden "descifrar" los documentos de origen para extraer texto de los datos de origen.Indexers can "crack" source documents to extract text from source data.

Fase de descifrado de documentosDocument cracking phase

Entre los orígenes compatibles se incluyen Azure Blob Storage, Azure Table Storage, Azure SQL Database y Azure Cosmos DB.Supported sources include Azure blob storage, Azure table storage, Azure SQL Database, and Azure Cosmos DB. El contenido basado en texto se puede extraer de estos tipos de archivo: archivos PDF, Word, PowerPoint, archivos CSV.Text-based content can be extracted from the following file types: PDFs, Word, PowerPoint, CSV files. Para ver la lista completa, consulte los formatos compatibles.For the full list, see Supported formats.

Paso 2: Fase de enriquecimiento y aptitudes cognitivasStep 2: Cognitive skills and enrichment phase

El enriquecimiento se produce a través de aptitudes cognitivas que realizan operaciones atómicas.Enrichment is through cognitive skills performing atomic operations. Por ejemplo, una vez que obtiene el contenido de texto de un archivo PDF, puede aplicar la detección de idioma del reconocimiento de entidades o la extracción de frases clave para generar campos nuevos en el índice que no están disponibles de manera nativa en el origen.For example, once you have text content from a PDF, you can apply entity recognition language detection, or key phrase extraction to produce new fields in your index that are not available natively in the source. La colección completa de aptitudes que usa en la canalización se conoce como un conjunto de aptitudes.Altogether, the collection of skills used in your pipeline is called a skillset.

Fase de enriquecimientoEnrichment phase

Un conjunto de aptitudes se basa en las aptitudes cognitivas integradas o en las aptitudes personalizadas que proporciona y conecta con el conjunto de aptitudes.A skillset is based on built-in cognitive skills or custom skills you provide and connect to the skillset. Un conjunto de aptitudes puede ser mínimo o altamente complejo y no solo determina el tipo de procesamiento, sino también el orden de las operaciones.A skillset can be minimal or highly complex, and determines not only the type of processing, but also the order of operations. Un conjunto de aptitudes más las asignaciones de campos que se definen como parte de un indexador especifica completamente la canalización de enriquecimiento.A skillset plus the field mappings defined as part of an indexer fully specifies the enrichment pipeline. Para más información sobre cómo unir todos estos elementos, consulte el artículo sobre cómo definir un conjunto de aptitudes.For more information about pulling all of these pieces together, see Define a skillset.

Internamente, la canalización genera una colección de documentos enriquecidos.Internally, the pipeline generates a collection of enriched documents. Puede decidir qué elementos de los documentos enriquecidos se deben asignar a los campos del índice de búsqueda que se pueden indexar.You can decide which parts of the enriched documents should be mapped to indexable fields in your search index. Por ejemplo, si aplicara las aptitudes de reconocimiento de entidades y de extracción de frases clave, esos campos nuevos se volverían parte del documento enriquecido y se podrían asignar a los campos del índice.For example, if you applied the key phrases extraction and the entity recognition skills, then those new fields would become part of the enriched document, and they can be mapped to fields on your index. Consulte las anotaciones para más información sobre las formaciones de entrada/salida.See Annotations to learn more about input/output formations.

Adición de un elemento knowledgeStore para guardar enriquecimientosAdd a knowledgeStore element to save enrichments

El elemento api-version=2019-05-06 de REST de Search extiende los conjuntos de aptitudes con una definición de knowledgeStore que proporciona una conexión al almacenamiento de Azure y proyecciones que describen cómo se almacenan los enriquecimientos.Search REST api-version=2019-05-06-Preview extends skillsets with a knowledgeStore definition that provides an Azure storage connection and projections that describe how the enrichments are stored.

Cuando agrega una instancia de Knowledge Store a un conjunto de aptitudes, puede proyectar una representación de sus enriquecimientos para los escenarios que no sean de búsqueda de texto completo.Adding a knowledge store to a skillset gives you the ability to project a representation of your enrichments for scenarios other than full text search. Para más información, consulte Knowledge Store (versión preliminar).For more information, see Knowledge store (preview).

Paso 3: Índice de búsqueda y acceso basado en consultaStep 3: Search index and query-based access

Al finalizar el procesamiento, obtiene un índice de búsqueda que consta de documentos enriquecidos con texto totalmente apto para búsquedas en Azure Cognitive Search.When processing is finished, you have a search index consisting of enriched documents, fully text-searchable in Azure Cognitive Search. Para acceder al contenido enriquecido que la canalización genera, los desarrolladores y usuarios consultan el índice.Querying the index is how developers and users access the enriched content generated by the pipeline.

Índice con icono de búsquedaIndex with search icon

El índice es como cualquier otro elemento que se pueda crear para Azure Cognitive Search: puede complementarlo con analizadores personalizados, invocar consultas de búsqueda aproximada, agregar la búsqueda filtrada o experimentar con perfiles de puntuación para volver a dar forma a los resultados de la búsqueda.The index is like any other you might create for Azure Cognitive Search: you can supplement with custom analyzers, invoke fuzzy search queries, add filtered search, or experiment with scoring profiles to reshape the search results.

Los índices se generan a partir de un esquema de índice que define los campos, atributos y otras construcciones adjuntas a un índice específico, como los perfiles de puntuación y las asignaciones de sinónimos.Indexes are generated from an index schema that defines the fields, attributes, and other constructs attached to a specific index, such as scoring profiles and synonym maps. Una vez que se define y rellena un índice, puede indexar de manera incremental para seleccionar documentos de origen nuevos y actualizados.Once an index is defined and populated, you can index incrementally to pick up new and updated source documents. Algunas de las determinaciones requieren recompilar completamente el índice.Certain modifications require a full rebuild. Debe usar un conjunto de datos pequeño hasta que el diseño del esquema sea estable.You should use a small data set until the schema design is stable. Para más información, consulte el artículo sobre cómo recompilar un índice.For more information, see How to rebuild an index.

Características y conceptos principalesKey features and concepts

ConceptoConcept DESCRIPCIÓNDescription VínculosLinks
Conjunto de aptitudesSkillset Recurso con nombre de nivel superior que contiene una colección de aptitudes.A top-level named resource containing a collection of skills. Un conjunto de aptitudes es la canalización de enriquecimiento.A skillset is the enrichment pipeline. Se invoca durante la indexación por parte del indexador.It is invoked during indexing by an indexer. Consulte Definición de conjuntos de aptitudesSee Define a skillset
Aptitud cognitivaCognitive skill Transformación atómica en una canalización de enriquecimiento.An atomic transformation in an enrichment pipeline. Normalmente, se trata de un componente que extrae o deduce la estructura y, por tanto, aumenta el reconocimiento de los datos de entrada.Often, it is a component that extracts or infers structure, and therefore augments your understanding of the input data. Casi siempre, la salida se basa en el texto y el procesamiento es el procesamiento de lenguaje natural o el procesamiento de imagen que extrae o genera texto a partir de entradas de imágenes.Almost always, the output is text-based and the processing is natural language processing or image processing that extracts or generates text from image inputs. La salida de una aptitud se puede asignar a un campo en un índice o usar como entrada para el enriquecimiento de nivel inferior.Output from a skill can be mapped to a field in an index, or used as an input for a downstream enrichment. Microsoft predefinida y proporciona una aptitud, o bien puede ser personalizada, es decir, el usuario puede crearla e implementarla.A skill is either predefined and provided by Microsoft, or custom: created and deployed by you. Aptitudes cognitivas integradasBuilt-in cognitive skills
Extracción de datosData extraction Aunque abarca una amplia gama de procesamientos, pero al pertenecer al enriquecimiento con inteligencia artificial, la aptitud de reconocimiento de entidades normalmente se usa para extraer los datos (una entidad) de un origen que no proporciona esa información de forma nativa.Covers a broad range of processing, but pertaining to AI enrichment, the entity recognition skill is most typically used to extract data (an entity) from a source that doesn't provide that information natively. Consulte Aptitud Reconocimiento de entidades y Aptitud Extracción de documentos (versión preliminar).See Entity Recognition Skill and Document Extraction Skill (preview)
Procesamiento de imágenesImage processing Deduce texto a partir de una imagen, como la capacidad de reconocer un punto de referencia, o bien extrae texto a partir de una imagen.Infers text from an image, such as the ability to recognize a landmark, or extracts text from an image. Algunos ejemplos comunes incluyen OCR para levantar caracteres de un archivo de documento escaneado (JPEG) o reconocer el nombre de una calle en una fotografía que incluye un letrero con el nombre.Common examples include OCR for lifting characters from a scanned document (JPEG) file, or recognizing a street name in a photograph containing a street sign. Consulte Aptitud de análisis de imágenes o Aptitud de OCRSee Image Analysis Skill or OCR Skill
Procesamiento de lenguaje naturalNatural language processing Procesamiento de texto para obtener conclusiones e información sobre entradas de texto.Text processing for insights and information about text inputs. La detección de idioma, el análisis de sentimiento y la extracción de frases clave son aptitudes que se enmarcan en el procesamiento de lenguaje natural.Language detection, sentiment analysis, and key phrase extraction are skills that fall under natural language processing. Consulte Aptitud Extracción de frases clave, Aptitud Detección de idioma, Aptitud Traducción de texto (versión preliminar), Aptitud Análisis de sentimiento.See Key Phrase Extraction Skill, Language Detection Skill, Text Translation Skill (preview), Sentiment Analysis Skill
Descifrado de documentosDocument cracking Proceso de extraer o crear contenido de texto a partir de orígenes que no son de texto durante el indexado.The process of extracting or creating text content from non-text sources during indexing. El reconocimiento óptico de caracteres (OCR) es un ejemplo pero, en general, se refiere a la funcionalidad de indexador principal cuando el indexador extrae contenido los archivos de aplicación.Optical character recognition (OCR) is an example, but generally it refers to core indexer functionality as the indexer extracts content from application files. El origen de datos que proporciona la ubicación del archivo de origen y la definición del indexador que brinda las asignaciones de campo son factores clave en el descifrado de documentos.The data source providing source file location, and the indexer definition providing field mappings, are both key factors in document cracking. Consulte Introducción a los indexadoresSee Indexers overview
FormasShaping Consolide los fragmentos de texto en una estructura más grande o, a la inversa, desglose fragmentos de texto de gran tamaño a un tamaño que se pueda administrar para un procesamiento adicional.Consolidate text fragments into a larger structure, or conversely break down larger text chunks into a manageable size for further downstream processing. Aptitud de conformador, Aptitud de combinación de texto, Aptitud de división de textoSee Shaper Skill, Text Merger Skill, Text Split Skill
Documentos enriquecidosEnriched documents Una estructura interna transitoria, generada durante el procesamiento, con el resultado final reflejado en un índice de búsqueda.A transitory internal structure, generated during processing, with final output reflected in a search index. Un conjunto de aptitudes determina qué enriquecimientos se llevan a cabo.A skillset determines which enrichments are performed. Las asignaciones de campos determinan los elementos de datos que se agregan al índice.Field mappings determine which data elements are added to the index. Opcionalmente, puede crear un almacén de conocimientos para conservar y explorar documentos enriquecidos mediante herramientas como Explorador de Storage, Power BI o cualquier otra herramienta que se conecte a Azure Blob Storage.Optionally, you can create a knowledge store to persist and explore enriched documents using tools like Storage Explorer, Power BI, or any other tool that connects to Azure Blob storage. Consulte Knowledge Store (versión preliminar)See Knowledge store (preview)
IndexerIndexer Un rastreador (crawler) que extrae datos y metadatos utilizables en búsquedas de un origen de datos externo y rellena un índice basado en las asignaciones de un campo a otro entre el índice y su origen de datos para el descifrado de documentos.A crawler that extracts searchable data and metadata from an external data source and populates an index based on field-to-field mappings between the index and your data source for document cracking. En el caso de los enriquecimientos de la inteligencia artificial, el indexador invoca un conjunto de aptitudes y contiene las asignaciones de campos que asocian la salida del enriquecimiento con los campos de destino del índice.For AI enrichments, the indexer invokes a skillset, and contains the field mappings associating enrichment output to target fields in the index. La definición del indexador contiene todas las instrucciones y referencias de las operaciones de la canalización y esta se invoca cuando se ejecuta el indexador.The indexer definition contains all of the instructions and references for pipeline operations, and the pipeline is invoked when you run the indexer. Con la configuración adicional, puede volver a usar el procesamiento existente y ejecutar solo los pasos y las aptitudes que se han modificado.With additional configuration, you can re-use existing processing and execute only those steps and skills that are changed. Consulte Indexadores e Indexación incremental (versión preliminar).See Indexers and Incremental indexing (preview).
Origen de datosData Source Un objeto que un indexador usa para conectarse a un origen de datos externo de tipos compatibles en Azure.An object used by an indexer to connect to an external data source of supported types on Azure. Consulte Introducción a los indexadoresSee Indexers overview
ÍndiceIndex Índice de búsqueda persistente en Azure Cognitive Search que se crea a partir de un esquema de índice que define el uso y estructura de los campos.A persisted search index in Azure Cognitive Search, built from an index schema that defines field structure and usage. Consulte Creación de un índice básicoSee Create a basic index
Knowledge StoreKnowledge store Una cuenta de almacenamiento en la que se puede dar forma y proyectar los documentos enriquecidos, además del índice de búsquedaA storage account where the enriched documents can be shaped and projected in addition to the search index Consulte Introducción al almacén de conocimientoSee Introduction to knowledge store
Caché de indexadorIndexer cache El indexador almacena en la caché las salidas de las aptitudes de la cuenta de almacenamiento.A storage account skill outputs are cached by the indexer. La caché permite al indexador minimizar el costo de volver a procesar un gran número de documentos cuando se edita una habilidades.The cache enables the indexeer to minimize the cost of reprocessing a large number of documents when a skillset is edited. Consulte Indexación incrementalSee Incremental indexing

¿Por dónde empiezo?Where do I start?

Paso 1: Creación de un recurso de Azure Cognitive SearchStep 1: Create an Azure Cognitive Search resource

Paso 2: Pruebe algunos Inicios rápidos y ejemplos de experiencia prácticaStep 2: Try some quickstarts and examples for hands-on experience

Para fines de aprendizaje se recomienda usar el servicio Gratis; sin embargo, el número de transacciones gratuitas se limita a 20 documentos al día.We recommend the Free service for learning purposes, however the number of free transactions is limited to 20 documents per day. Para ejecutar tanto el inicio rápido como el tutorial en un solo día, use un conjunto de archivos más pequeño (10 documentos) para que pueda adaptarlo a ambos ejercicios, o bien elimine el indexador que usó en el inicio rápido o tutorial para devolver el contador a cero.To run both the quickstart and tutorial in one day, use a smaller file set (10 documents) so that you can fit in both exercises, or delete the indexer you used in the quickstart or tutorial to rest the counter to zero.

Paso 3: Revise la APIStep 3: Review the API

Puede usar la versión api-version=2019-05-06 de REST en solicitudes o el SDK. de NET.You can use REST api-version=2019-05-06 on requests or the .NET SDK. Si explora Knowledge Store, use la API REST de la versión preliminar (api-version=2019-05-06-Preview).If you are exploring knowledge store, use the preview REST API instead (api-version=2019-05-06-Preview).

Este paso usa las API REST para crear una solución de enriquecimiento con inteligencia artificial.This step uses the REST APIs to build an AI enrichment solution. Para el enriquecimiento con inteligencia artificial solo se agregan o extienden dos API.Only two APIs are added or extended for AI enrichment. Otras API tienen la misma sintaxis que las versiones con disponibilidad general.Other APIs have the same syntax as the generally available versions.

API DE RESTREST API DESCRIPCIÓNDescription
Create Data Source (Creación de un origen de datos)Create Data Source Recurso que identifica un origen de datos externo que proporciona los datos de origen que se usan para crear documentos enriquecidos.A resource identifying an external data source providing source data used to create enriched documents.
Create Skillset (api-version=2019-05-06)Create Skillset (api-version=2019-05-06) Esta API es específica del enriquecimiento con inteligencia artificial.This API is specific to AI enrichment. Es un recurso que coordina el uso de las aptitudes integradas y las aptitudes cognitivas personalizadas que se usan en una canalización de enriquecimiento durante la indexación.It is a resource coordinating the use of built-in skills and custom cognitive skills used in an enrichment pipeline during indexing.
Crear índiceCreate Index Esquema que expresa un índice de Azure Cognitive Search.A schema expressing an Azure Cognitive Search index. Los campos del índice se asignan a los campos de los datos de origen o a los campos fabricados durante la fase de enriquecimiento (por ejemplo, un campo para los nombres de organización creado por el reconocimiento de entidades).Fields in the index map to fields in source data or to fields manufactured during the enrichment phase (for example, a field for organization names created by entity recognition).
Create Indexer (api-version=2019-05-06)Create Indexer (api-version=2019-05-06) Recurso que define los componentes usados durante la indexación, los que incluyen un origen de datos, un conjunto de aptitudes, asociaciones de campos desde el origen y estructuras de datos intermedias con el índice de destino, además del destino mismo.A resource defining components used during indexing: including a data source, a skillset, field associations from source and intermediary data structures to target index, and the index itself. La ejecución del indexador es el desencadenador del enriquecimiento y la ingesta de datos.Running the indexer is the trigger for data ingestion and enrichment. El resultado es un índice de búsqueda basado en el esquema de índice, que se rellena con datos de origen enriquecidos a través de conjuntos de aptitudes.The output is a search index based on the index schema, populated with source data, enriched through skillsets. Esta API existente se amplía para escenarios de búsqueda cognitiva con la inclusión de una propiedad de conjunto de aptitudes.This existing API is extended for cognitive search scenarios with the inclusion of a skillset property.

Lista de comprobación: Un flujo de trabajo típicoChecklist: A typical workflow

  1. Subdivida los datos de origen de Azure en un ejemplo representativo.Subset your Azure source data into a representative sample. La indexación toma tiempo, por lo que empiece con un conjunto de datos representativo y pequeño para ir compilando el índice de manera incremental a medida que la solución madura.Indexing takes time so start with a small, representative data set and then build it up incrementally as your solution matures.

  2. Cree en Azure Cognitive Search un objeto de origen de datos que proporcione una cadena de conexión para la recuperación de datos.Create a data source object in Azure Cognitive Search to provide a connection string for data retrieval.

  3. Cree un conjunto de aptitudes con pasos de enriquecimiento.Create a skillset with enrichment steps.

  4. Defina el esquema de índice.Define the index schema. La colección Fields (Campos) incluye campos de los datos de origen.The Fields collection includes fields from source data. También debe simular campos adicionales para contener valores generados para el contenido creado durante el enriquecimiento.You should also stub out additional fields to hold generated values for content created during enrichment.

  5. Defina el indexador que hace referencia al origen de datos, conjunto de aptitudes e índice.Define the indexer referencing the data source, skillset, and index.

  6. Dentro del indexador, agregue outputFieldMappings.Within the indexer, add outputFieldMappings. En esta sección, la salida se asigna desde el conjunto de aptitudes (en el paso 3) a los campos de entrada del esquema de índice (en el paso 4).This section maps output from the skillset (in step 3) to the inputs fields in the index schema (in step 4).

  7. Envíe la solicitud Create Indexer (Crear indexador) que acaba de crear (una solicitud POST con una definición de indexador en el cuerpo de la solicitud) para expresar el indexador en Azure Cognitive Search.Send Create Indexer request you just created (a POST request with an indexer definition in the request body) to express the indexer in Azure Cognitive Search. Este paso se refiere a cómo ejecuta el indexador mediante la invocación de la canalización.This step is how you run the indexer, invoking the pipeline.

  8. Ejecute consultas para evaluar los resultados y modifique el código para actualizar la configuración del indexador, el esquema o los conjuntos de aptitudes.Run queries to evaluate results and modify code to update skillsets, schema, or indexer configuration.

  9. Restablezca el indexador antes de recompilar la canalización.Reset the indexer before rebuilding the pipeline.

Para más información sobre preguntas o problemas específicos, consulte las sugerencias para solucionar problemas.For more information about specific questions or problems, see Troubleshooting tips.

Pasos siguientesNext steps