Reconocimiento de texto manuscrito e impresoRecognize printed and handwritten text

Computer Vision proporciona varios servicios que detectan y extraen texto manuscrito o impreso que aparece en las imágenes.Computer Vision provides a number of services that detect and extract printed or handwritten text that appears in images. Esto es útil en una variedad de escenarios, como la toma de notas, los registros médicos, seguridad y banca.This is useful in a variety of scenarios such as note taking, medical records, security, and banking. Las tres secciones siguientes detallan tres API de reconocimiento de texto diferentes, cada una optimizada para distintos casos de uso.The following three sections detail three different text recognition APIs, each optimized for different use cases.

Read APIRead API

Read API detecta el contenido de texto de una imagen con los últimos modelos de reconocimiento y convierte el texto identificado en una secuencia de caracteres legible por una máquina.The Read API detects text content in an image using our latest recognition models and converts the identified text into a machine-readable character stream. Está optimizada para imágenes con gran cantidad de texto (por ejemplo, documentos que han sido digitalizados) y para imágenes con mucho ruido visual.It's optimized for text-heavy images (such as documents that have been digitally scanned) and for images with a lot of visual noise. Determinará qué modelo de reconocimiento se usará para cada línea de texto y admite imágenes con texto escrito a mano e impreso.It will determine which recognition model to use for each line of text, supporting images with both printed and handwritten text. Read API se ejecuta de forma asincrónica porque los documentos más grandes pueden tardar varios minutos en devolver un resultado.The Read API executes asynchronously because larger documents can take several minutes to return a result.

La operación de lectura mantiene las agrupaciones de líneas originales de palabras reconocidas en la salida.The Read operation maintains the original line groupings of recognized words in its output. Cada línea incluye las coordenadas del rectángulo delimitador y cada palabra dentro de la línea también tiene sus propias coordenadas.Each line comes with bounding box coordinates, and each word within the line also has its own coordinates. Si una palabra se ha reconocido con confianza baja, dicha información se muestra también.If a word was recognized with low confidence, that information is conveyed as well. Consulte los documentos de referencia de Read API para más información.See the Read API reference docs to learn more.

Nota

Esta característica solo está disponible para texto en inglés.This feature is only available for English text.

Requisitos de imagenImage requirements

Read API funciona con imágenes que cumplan los requisitos siguientes:The Read API works with images that meet the following requirements:

  • La imagen debe estar en formato JPEG, PNG, BMP, PDF o TIFF.The image must be presented in JPEG, PNG, BMP, PDF, or TIFF format.
  • El tamaño de la imagen debe estar entre 50 x 50 y 10 000 x 10 000 píxeles.The dimensions of the image must be between 50 x 50 and 10000 x 10000 pixels. Las páginas PDF deben ser de 17 x 17 pulgadas o más pequeñas.PDF pages must be 17 x 17 inches or smaller.
  • El tamaño del archivo de la imagen debe ser menor de 20 megabytes (MB).The file size of the image must be less than 20 megabytes (MB).

LimitacionesLimitations

Si usa una suscripción gratuita, Read API solo procesará las dos primeras páginas de un documento PDF o TIFF.If you are using a free-tier subscription, the Read API will only process the first two pages of a PDF or TIFF document. Con una suscripción de pago, procesará hasta 200 páginas.With a paid subscription, it will process up to 200 pages. Tenga en cuenta también que la API detectará un máximo de 300 líneas por página.Also note that the API will detect a maximum of 300 lines per page.

OCR API (reconocimiento óptico de caracteres)OCR (optical character recognition) API

La API de reconocimiento óptico de caracteres (OCR) de Computer Vision es similar a Read API, pero se ejecuta de forma sincrónica y no está optimizada para documentos de gran tamaño.Computer Vision's optical character recognition (OCR) API is similar to the Read API, but it executes synchronously and is not optimized for large documents. Usa un modelo de reconocimiento anterior, pero funciona con más idiomas; consulte Idiomas admitidos para obtener una lista completa de los idiomas admitidos.It uses an earlier recognition model but works with more languages; see Language support for a full list of the supported languages.

Si es necesario, OCR corrige el giro del texto reconocido devolviendo el desplazamiento de rotación en grados alrededor del eje horizontal de la imagen.If necessary, OCR corrects the rotation of the recognized text by returning the rotational offset in degrees about the horizontal image axis. OCR también proporciona las coordenadas del marco de cada palabra, como se observa en la ilustración siguiente.OCR also provides the frame coordinates of each word, as seen in the following illustration.

Una imagen que se gira y su texto siendo leído y definido

Consulte los documentos de referencia de OCR para más información.See the OCR reference docs to learn more.

Requisitos de imagenImage requirements

OCR API funciona con imágenes que cumplan los requisitos siguientes:The OCR API works on images that meet the following requirements:

  • La imagen debe estar en formato JPEG, PNG, GIF o BMP.The image must be presented in JPEG, PNG, GIF, or BMP format.
  • El tamaño de la imagen de entrada debe estar entre 50 x 50 y 4200 x 4200 píxeles.The size of the input image must be between 50 x 50 and 4200 x 4200 pixels.
  • El texto de la imagen se puede girar cualquier múltiplo de 90 grados, además de un pequeño ángulo de hasta 40 grados.The text in the image can be rotated by any multiple of 90 degrees plus a small angle of up to 40 degrees.

LimitacionesLimitations

En las fotografías en las que predomina el texto, las palabras que se reconocen de forma parcial pueden producir falsos positivos.On photographs where text is dominant, false positives may come from partially recognized words. En algunas fotografías, especialmente las que no tienen texto, la precisión puede variar según el tipo de imagen.On some photographs, especially photos without any text, precision can vary depending on the type of image.

Recognize Text APIRecognize Text API

Nota

Recognize Text API está en desuso en favor de Read API.The Recognize Text API is being deprecated in favor of the Read API. Read API tiene funcionalidades similares y se ha actualizado para trabajar con archivos de varias páginas, TIFF y PDF.The Read API has similar capabilities and is updated to handle PDF, TIFF, and multi-page files.

Recognize Text API es similar a OCR, pero se ejecuta de forma asincrónica y usa modelos de reconocimiento actualizados.The Recognize Text API is similar to OCR, but it executes asynchronously and uses updated recognition models. Consulte los documentos de referencia de Recognize Text API para más información.See the Recognize Text API reference docs to learn more.

Requisitos de imagenImage requirements

Recognize Text API funciona con imágenes que cumplan los requisitos siguientes:The Recognize Text API works with images that meet the following requirements:

  • La imagen debe estar en formato JPEG, PNG o BMP.The image must be presented in JPEG, PNG, or BMP format.
  • El tamaño de la imagen debe estar entre 50 x 50 y 4200 x 4200 píxeles.The dimensions of the image must be between 50 x 50 and 4200 x 4200 pixels.
  • El tamaño de archivo de la imagen debe ser inferior a 4 megabytes (MB).The file size of the image must be less than 4 megabytes (MB).

LimitacionesLimitations

La precisión de las operaciones de reconocimiento de texto depende de la calidad de las imágenes.The accuracy of text recognition operations depends on the quality of the images. Los siguientes factores pueden provocar una lectura imprecisa:The following factors may cause an inaccurate reading:

  • Imágenes borrosas.Blurry images.
  • Texto escrito a mano o en cursiva.Handwritten or cursive text.
  • Estilos de fuente artísticos.Artistic font styles.
  • Tamaño de texto pequeño.Small text size.
  • Fondos complejos, sombras, brillo sobre el texto o distorsión de la perspectiva.Complex backgrounds, shadows, or glare over text or perspective distortion.
  • Letra mayúscula grande o falta de letras mayúsculas iniciales.Oversized or missing capital letters at the beginnings of words.
  • Texto de superíndice, subíndice o tachado.Subscript, superscript, or strikethrough text.

Pasos siguientesNext steps

Siga la guía de inicio rápido Extracción de texto impreso (OCR) para implementar el reconocimiento de texto en una sencilla aplicación de C#.Follow the Extract printed text (OCR) quickstart to implement text recognition in a simple C# app.