Что собой представляет Распознаватель документов Azure?
Распознаватель документов Azure — это облачная служба прикладного ИИ Azure, которая с помощью моделей машинного обучения извлекает пары "ключ-значение", текст и таблицы из документов. Распознаватель документов анализирует формы и документы, извлекает текст и данные, преобразует связи полей в пары "ключ-значение" и возвращает структурированные выходные данные JSON. Вы можете быстро получать точные результаты с учетом специфики содержимого, не выполняя избыточные операции вручную или продолжительную обработку и анализ данных. Распознаватель документов позволяет автоматизировать обработку данных в приложениях и рабочих процессах, совершенствовать стратегии, основанные на данных, и расширить возможности поиска документов.
Распознаватель документов использует следующие модели для простого определения, извлечения и анализа данных документа:
Модели анализа документов
- Модель Read | Извлечение строк текста, слов, расположений и обнаруженных языков из документов и изображений.
- Макет модели | Извлечение текста, таблиц, меток выделения и сведений о структуре из документов и изображений.
- Модель документа общего назначения | Извлечение пар "ключ-значение", меток выделения и сущностей из документов.
Предварительно созданные модели
- Модель формы W-2 | Извлечение текста и ключевых сведений из налоговых форм W2 США.
- Модель накладной | Извлечение текста, меток выделения, таблиц, пар "ключ-значение" и ключевых сведений из накладных.
- Модель квитанции | Извлечение текста и ключевых сведений из квитанций.
- Модель удостоверения | Извлечение текста и ключевых сведений из водительских прав и заграничных паспортов.
- Модель визитной карточки | Извлечение текста и ключевых сведений из визитных карточек.
Настраиваемые модели
- Настраиваемая модель | Извлечение и анализ отдельных данных и вариантов использования из форм и документов, относящихся к вашему бизнесу.
- Составная модель | Создание коллекции настраиваемых моделей и назначение их одной модели, созданной на основе типов форм.
Какую функцию Распознавателя документов следует использовать?
Этот раздел поможет выбрать функцию, поддерживаемую Распознавателем документов версии 3.0, которую следует использовать для приложения:
| Какой тип документа требуется проанализировать? | Как форматируется документ? | Лучшее решение |
|---|---|---|
|
Документ W-2 составлен из текста на языке "Английский (США)" (EN-US)? |
|
|
Печатается ли документ на поддерживаемом языке и интересует ли вас только текст, а не таблицы, метки выделения и структура? | |
|
Является ли документ в основном структурированным и содержит ли он несколько полей и значений, которые могут не быть охвачены другими предварительно созданными моделями? |
|
|
Составлен ли документ счета на поддерживаемом языке? |
|
|
Ваш документ квитанции или визитной карточки состоит из текста на английском языке? |
|
|
Является ли ваше удостоверение заграничным паспортом или водительским удостоверением в США? |
|
|
Имеет ли ваша форма или документ стандартный формат, широко используемый в вашем направлении деятельности или отрасли? |
|
Функции Распознавателя документов и параметры разработки
- Распознаватель документов версии 3.0 (предварительная версия)
- Распознаватель документов версии 2.1 (общедоступная версия)
Служба "Распознаватель документов" версии 3.0 поддерживает перечисленные ниже функции и варианты разработки. Подробные сведения о каждой функции и справочные материалы по API доступны по ссылкам, приведенным в этой таблице.
| Функция | Описание | Варианты разработки |
|---|---|---|
| 🆕 Чтение | Извлечение текстовых строк, слов, обнаруженных языков и рукописного стиля, если он определен. |
|
| 🆕 Форма W-2 | Извлечение сведений о каждом поле в форме W-2. |
|
| 🆕 Модель документа общего назначения | Извлечение текста, таблиц, структуры, пар "ключ-значение" и именованных сущностей. |
|
| Модель макета | Извлечение из документов и форм текста, меток выбора и сведений о структуре таблиц наряду с координатами ограничивающих прямоугольников для них. API макета обновлен до предварительно созданной модели. |
|
| Настраиваемая модель (обновлена) | Извлечение и анализ данных из форм и документов, относящихся к определенным бизнес-данным и вариантам использования.
|
Студия Распознавателя документов |
| Модель счетов | Автоматическая обработка данных и извлечение ключевой информации из счетов продажи. |
|
| Модель квитанции (обновлена) | Автоматическая обработка данных и извлечение ключевой информации из квитанций продажи.Модель квитанций версии 3.0 поддерживает обработку одностраничных гостиничных квитанций. |
|
| Модель удостоверения (обновлена) | Автоматизированная обработка данных и извлечение ключевой информации из заграничных паспортов и водительских удостоверений в США.Готовый API-интерфейс документов поддерживает извлечение данных о разрешениях, ограничениях и классах автомобилей из водительских удостоверений в США. |
|
| Модель визитных карточек | Автоматическая обработка данных и извлечение ключевой информации из визитных карточек. |
|
Использование документации по Распознавателю документов
Эта документация включает статьи следующих типов:
- Статьи с основными понятиями — здесь подробно описываются функциональность и возможности службы.
- Краткие руководства — инструкции по началу работы и отправке запросов в службу.
- Руководства — содержат инструкции для более специфического или специализированного использования службы.
- Руководства — объемные статьи, в которых описываются способы использования службы в качестве компонента расширенных бизнес-решений.
Конфиденциальность и безопасность данных
Как и в случае со всеми другими службами Cognitive Services, разработчикам, использующим службу Распознавателя документов, следует учитывать политику корпорации Майкрософт касательно клиентских данных. См. нашу страницу Данные, конфиденциальность и безопасность для Распознавателя документов.
Дальнейшие действия
- Поработайте со Студией Распознавателя документов.
- Ознакомьтесь со справочной документацией по REST API, чтобы узнать больше.
- Если вы уже знакомы с предыдущей версией API, обратитесь к статье Новые возможности.