Inicio rápido: Aplicación de OCR y análisis de imágenes mediante el Asistente para importación de datos
Más información sobre cómo el enriquecimiento con inteligencia artificial en Azure Cognitive Search agrega el reconocimiento óptico de caracteres (OCR) y el análisis de imágenes para crear contenido que permita búsquedas a partir de archivos de imagen.
En este inicio rápido, ejecutará el Asistente para la importación de datos a fin de analizar el contenido visual en archivos JPG. El contenido incluye fotografías de señales. La salida es un índice que permite búsquedas y contiene leyendas, etiquetas y texto identificados mediante OCR, consultables en el portal con el Explorador de búsqueda.
Para prepararse, creará algunos recursos y cargará archivos de ejemplo antes de ejecutar el asistente.
¿Prefiere empezar con el código? Pruebe en su lugar el tutorial de .NET, el tutorial de Python o el tutorial de REST.
Requisitos previos
Antes de comenzar, tiene que cumplir los siguientes requisitos previos:
Una cuenta de Azure con una suscripción activa. Cree una cuenta gratuita.
Servicio Azure Cognitive Search. Cree un servicio o busque uno existente en su suscripción actual. Puede usar un servicio gratuito para este inicio rápido.
Una cuenta de Azure Storage con Blob Storage. Cree una cuenta de almacenamiento o busque una cuenta existente.
- Elija la misma suscripción si desea que el asistente busque la cuenta de almacenamiento y configure la conexión.
- Elija la misma región de Azure Cognitive Search para evitar cargos de ancho de banda.
- Elija el tipo de cuenta StorageV2 (de uso general V2).
Nota
En este inicio rápido también se usa Cognitive Services para la inteligencia artificial. Dado que la carga de trabajo es tan pequeña, Cognitive Services se aprovecha en segundo plano del procesamiento gratuito de hasta 20 transacciones. Esto significa que puede completar este ejercicio sin tener que crear un recurso de Cognitive Services adicional.
Configuración de los datos
En los pasos siguientes, configure un contenedor de blobs en Azure Storage para almacenar archivos de contenido heterogéneo.
Descargue los datos de ejemplo de GitHub. Hay varios conjuntos de datos. Use los archivos de la carpeta unsplash-images\jpg-signs para este inicio rápido.
Carga de datos de ejemplo en un contenedor de blobs.
- Inicie sesión en Azure Portal y busque la cuenta de almacenamiento.
- En el panel de navegación izquierdo, seleccione Contenedores.
- Cree un contenedor denominado "signs" (señales). Use el nivel de acceso público predeterminado.
- En el contenedor "signs", seleccione Cargar para cargar los archivos desde la carpeta local unsplash-images\jpg-signs.
Debería tener 10 archivos que contengan fotografías de señales.
Hay una segunda subcarpeta que incluye edificios de referencia. Si desea adjuntar una clave de Cognitive Services, también puede incluir estos archivos para ver cómo funciona el análisis de imágenes en archivos de imagen que no incluyen texto incrustado. La clave es necesaria para los trabajos que superan la asignación gratuita.
Ahora ya está preparado para continuar con el Asistente para la importación de datos.
Ejecutar el Asistente para la importación de datos
Inicie sesión en Azure Portal con su cuenta de Azure.
Busque su servicio de búsquedas y, en la página de información general, haga clic en Importar datos en la barra de comandos para configurar el enriquecimiento cognitivo en cuatro pasos.
Paso 1: Creación de un origen de datos
En Conectarse a los datos propios, seleccione Azure Blob Storage. Elija una conexión existente a la cuenta de almacenamiento y al contenedor que ha creado. Asigne un nombre al origen de datos y use los valores predeterminados para el resto.
Paso 2: Adición de aptitudes cognitivas
A continuación, configure el enriquecimiento con inteligencia artificial para invocar OCR y el análisis de imágenes.
En este inicio rápido, se usará el recurso Free de Cognitive Services. Los datos de ejemplo se componen de 19 archivos, por lo que la cobertura diaria por indexador de 20 transacciones gratis de Cognitive Services es suficiente para este inicio rápido.
En la misma página, expanda Agregar enriquecimientos y realice tres selecciones:
Habilitar OCR y combinar todo el texto en el campo merged_content.
Elija "Generar etiquetas a partir de imágenes" y "Generar leyendas a partir de imágenes".
Para el análisis de imágenes, las imágenes se separan del texto durante el descifrado de documentos. El campo "merged_content" vuelve a asociar el texto y las imágenes en la canalización de enriquecimiento con inteligencia artificial.
Paso 3: Configuración del índice
Un índice incluye el contenido en el que se pueden realizar búsquedas y el Asistente para la importación de datos puede inferir normalmente el esquema mediante el muestreo de los datos. En este paso, repase el esquema generado y revise la configuración. A continuación se ofrece el esquema predeterminado que se creó para el conjunto de datos de demostración.
En esta guía de inicio rápido, el asistente realiza un trabajo remarcable a la hora de configurar valores predeterminados razonables:
Los campos predeterminados se basan en las propiedades de los blobs existentes, además de los nuevos campos que contienen la salida de enriquecimiento (por ejemplo,
text,layoutText,imageCaption). Los tipos de datos se deducen de los metadatos y del muestreo de datos.La clave de documento predeterminada es metadata_storage_path (se ha seleccionado porque el campo contiene valores únicos).
Los atributos predeterminados son Retrievable (Recuperable) y Searchable (Permite búsquedas). El atributo Searchable (Permite búsqueda) permite buscar texto completo en un campo. El atributo Retrievable (Recuperable) indica que un valor puede aparecer en los resultados. El asistente da por supuesto que desea que estos campos se puedan recuperar y permitan búsquedas porque los creó a través de un conjunto de aptitudes.
Marcar un campo como Retrievable no significa que el campo debe esté presente en los resultados de búsqueda. Puede controlar con precisión la composición de los resultados de búsqueda si usa el parámetro de consulta $select para especificar qué campos desea incluir. En el caso de campos con mucho texto como content, el parámetro $select es la solución para moldear resultados de búsqueda fáciles de administrar para los usuarios de la aplicación, mientras se garantiza que el código de cliente tenga acceso a toda la información que necesita a través del atributo Recuperable.
Paso 4: Configuración del indexador
El indexador es un recurso de alto nivel que controla el proceso de indexación. Asimismo, especifica el nombre del origen de datos, un índice de destino y la frecuencia de ejecución. El Asistente para la importación de datos crea varios objetos y entre ellos hay siempre un indexador que se puede ejecutar repetidamente.
En la página Indizador, puede aceptar el nombre predeterminado y hacer clic en la opción de programación Una vez para ejecutarlo inmediatamente.
Haga clic en Enviar para crear y ejecutar simultáneamente el indexador.
Supervisión de estado
La indexación cognitiva de aptitudes tarda más en completarse que la indexación típica basada en texto. Para supervisar el progreso, vaya a la página de información general y seleccione la pestaña Indexadores en medio de la página.
Para comprobar los detalles sobre el estado de ejecución, seleccione un indexador de la lista.
Consulta en el Explorador de búsqueda
Después de crear un índice, puede ejecutar consultas para devolver los resultados. En el portal, use el Explorador de búsqueda del portal.
En la página del panel del servicio de búsqueda, haga clic en el Explorador de búsqueda en la barra de comandos.
Seleccione Cambiar índice en la parte superior para seleccionar el índice que haya creado.
En Cadena de consulta, escriba una cadena de búsqueda para consultar el índice, como
search=sign&searchFields=imageTags&$select=text,imageCaption,imageTags&$count=truey, a continuación, seleccione Buscar.
Los resultados se devuelven en formato JSON, que suele ser detallado y difícil de leer, especialmente si se trata de documentos de gran tamaño que se crean en los blobs de Azure. Algunas sugerencias para buscar en esta herramienta incluyen las siguientes técnicas:
Agregue
$selectpara especificar qué campos quiere incluir en los resultados de búsqueda.Anexe
searchFieldpara que la búsqueda de texto completo abarque campos específicos.Use CTRL-F para buscar en el JSON las propiedades o los términos específicos.
Las cadenas de consulta distinguen mayúsculas de minúsculas, por lo que si obtiene un mensaje de "campo desconocido", compruebe los campos o la definición de índice (JSON) para comprobar el nombre y el caso.
Limpieza de recursos
Cuando trabaje con su propia suscripción, es una buena idea al final de un proyecto identificar si todavía se necesitan los recursos que ha creado. Los recursos que se dejan en ejecución pueden costarle mucho dinero. Puede eliminar los recursos de forma individual o eliminar el grupo de recursos para eliminar todo el conjunto de recursos.
Puede encontrar y administrar recursos en el portal, mediante el vínculo Todos los recursos o Grupos de recursos en el panel de navegación izquierdo.
Si está usando un servicio gratuito, recuerde que está limitado a tres índices, indexadores y orígenes de datos. Puede eliminar elementos individuales en el portal para mantenerse por debajo del límite.
Pasos siguientes
Cognitive Search tiene otras aptitudes integradas que se pueden ejercer en el Asistente para la importación de datos. En el siguiente inicio rápido se utiliza el reconocimiento de entidades, la detección del idioma y la traducción de texto.