Что собой представляет Распознаватель документов Azure?

Распознаватель документов Azure — это облачная служба прикладного ИИ Azure, которая с помощью моделей машинного обучения извлекает пары "ключ-значение", текст и таблицы из документов. Распознаватель документов анализирует формы и документы, извлекает текст и данные, преобразует связи полей в пары "ключ-значение" и возвращает структурированные выходные данные JSON. Вы можете быстро получать точные результаты с учетом специфики содержимого, не выполняя избыточные операции вручную или продолжительную обработку и анализ данных. Распознаватель документов позволяет автоматизировать обработку данных в приложениях и рабочих процессах, совершенствовать стратегии, основанные на данных, и расширить возможности поиска документов.

Распознаватель документов использует следующие модели для простого определения, извлечения и анализа данных документа:

Модели анализа документов

  • Модель Read | Извлечение строк текста, слов, расположений и обнаруженных языков из документов и изображений.
  • Макет модели | Извлечение текста, таблиц, меток выделения и сведений о структуре из документов и изображений.
  • Модель документа общего назначения | Извлечение пар "ключ-значение", меток выделения и сущностей из документов.

Предварительно созданные модели

Настраиваемые модели

  • Настраиваемая модель | Извлечение и анализ отдельных данных и вариантов использования из форм и документов, относящихся к вашему бизнесу.
  • Составная модель | Создание коллекции настраиваемых моделей и назначение их одной модели, созданной на основе типов форм.

Какую функцию Распознавателя документов следует использовать?

Этот раздел поможет выбрать функцию, поддерживаемую Распознавателем документов версии 3.0, которую следует использовать для приложения:

Какой тип документа требуется проанализировать? Как форматируется документ? Лучшее решение
  • Форма W-2
Документ W-2 составлен из текста на языке "Английский (США)" (EN-US)?
  • Основное текстовое содержимое
Печатается ли документ на поддерживаемом языке и интересует ли вас только текст, а не таблицы, метки выделения и структура?
  • Если вы хотите извлечь только текст, используйте модель Read.
  • Если Нет, так как вам также нужны сведения о структуре, используйте модель Макета.
  • Общий структурированный документ
Является ли документ в основном структурированным и содержит ли он несколько полей и значений, которые могут не быть охвачены другими предварительно созданными моделями?
  • Накладная
Составлен ли документ счета на поддерживаемом языке?
  • Карточка квитанции
  • Визитная карточка
Ваш документ квитанции или визитной карточки состоит из текста на английском языке?
  • Удостоверение
Является ли ваше удостоверение заграничным паспортом или водительским удостоверением в США?
  • Форма или документ
Имеет ли ваша форма или документ стандартный формат, широко используемый в вашем направлении деятельности или отрасли?

Функции Распознавателя документов и параметры разработки

Служба "Распознаватель документов" версии 3.0 поддерживает перечисленные ниже функции и варианты разработки. Подробные сведения о каждой функции и справочные материалы по API доступны по ссылкам, приведенным в этой таблице.

Функция Описание Варианты разработки
🆕 Чтение Извлечение текстовых строк, слов, обнаруженных языков и рукописного стиля, если он определен.
🆕 Форма W-2 Извлечение сведений о каждом поле в форме W-2.
🆕 Модель документа общего назначения Извлечение текста, таблиц, структуры, пар "ключ-значение" и именованных сущностей.
Модель макета Извлечение из документов и форм текста, меток выбора и сведений о структуре таблиц наряду с координатами ограничивающих прямоугольников для них.

API макета обновлен до предварительно созданной модели.
Настраиваемая модель (обновлена) Извлечение и анализ данных из форм и документов, относящихся к определенным бизнес-данным и вариантам использования.
  • API настраиваемой модели версии 3.0 поддерживает обнаружение подписей для моделей настраиваемого шаблона (настраиваемой формы).

  • API настраиваемой модели версии 3.0 предлагает новый тип модели Настраиваемая нейронная или пользовательский документ для анализа неструктурированных документов.
Студия Распознавателя документов
  • Use the Application Insights REST API to build custom solutions (Использование интерфейса REST API Application Insights для создания пользовательских решений)
  • Пакет SDK для C#
  • Пакет SDK для Python
  • пакет SDK для Java
  • JavaScript
  • Модель счетов Автоматическая обработка данных и извлечение ключевой информации из счетов продажи.
    Модель квитанции (обновлена) Автоматическая обработка данных и извлечение ключевой информации из квитанций продажи.

    Модель квитанций версии 3.0 поддерживает обработку одностраничных гостиничных квитанций.
    Модель удостоверения (обновлена) Автоматизированная обработка данных и извлечение ключевой информации из заграничных паспортов и водительских удостоверений в США.

    Готовый API-интерфейс документов поддерживает извлечение данных о разрешениях, ограничениях и классах автомобилей из водительских удостоверений в США.
    Модель визитных карточек Автоматическая обработка данных и извлечение ключевой информации из визитных карточек.

    Использование документации по Распознавателю документов

    Эта документация включает статьи следующих типов:

    • Статьи с основными понятиями — здесь подробно описываются функциональность и возможности службы.
    • Краткие руководства — инструкции по началу работы и отправке запросов в службу.
    • Руководства — содержат инструкции для более специфического или специализированного использования службы.
    • Руководства — объемные статьи, в которых описываются способы использования службы в качестве компонента расширенных бизнес-решений.

    Конфиденциальность и безопасность данных

    Как и в случае со всеми другими службами Cognitive Services, разработчикам, использующим службу Распознавателя документов, следует учитывать политику корпорации Майкрософт касательно клиентских данных. См. нашу страницу Данные, конфиденциальность и безопасность для Распознавателя документов.

    Дальнейшие действия