Что такое Аналитика документов Azure ИИ?

Внимание

  • Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке.
  • Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
  • Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует rest API версии 2024-02-29-preview.
  • Общедоступная предварительная версия 2024-02-29-preview в настоящее время доступна только в следующих регионах Azure:
  • Восточная часть США
  • Западная часть США2
  • Западная Европа

Это содержимое относится к:v4.0 (предварительная версия) | Предыдущие версии:синий проверка markфлажокv3.1 (GA)v3.0 (GA)синий проверка markсиний проверка markv2.1 (GA)

Это содержимое относится к:v3.1 (GA)Последняя версияфиолетовый проверка mark:v4.0 (предварительная версия) | | Предыдущие версии:флажоксиний проверка markv3.0синий проверка markверсии 2.1

Это содержимое относится к:v3.0 (GA) | Последние версии:фиолетовый проверка markv4.0 (предварительная версия)фиолетовый проверка mark3.1 | Предыдущая версия:флажоксиний проверка markv2.1

Это содержимое относится к:v2.1 Последняя версиясиний проверка mark:флажокv4.0 (предварительная версия) |

Примечание.

Распознаватель документов сейчас Аналитика документов ИИ Azure!

  • По состоянию на июль 2023 года службы искусственного интеллекта Azure охватывают все ранее известные как Cognitive Services и приложение Azure лиированные службы искусственного интеллекта.
  • Нет изменений в ценах.
  • Имена Cognitive Services и приложение Azure lied AI продолжают использоваться в выставлении счетов Azure, анализе затрат, прайс-листе и API цен.
  • Критические изменения в интерфейсах программирования приложений (API) или пакетах SDK до версии 3.1 отсутствуют. Начиная с версии 4.0 API и пакеты SDK обновляются до аналитики документов.
  • Некоторые платформы по-прежнему ожидают переименования обновления. Все упоминание Распознаватель документов или аналитики документов в нашей документации относятся к одной службе Azure.

Azure AI Document Intelligence — это облачная служба ИИ Azure, которая позволяет создавать интеллектуальные решения для обработки документов. Большие объемы данных, охватывающие широкий спектр типов данных, хранятся в формах и документах. Аналитика документов позволяет эффективно управлять скоростью сбора и обработки данных и является ключевым фактором для улучшения операций, принятия обоснованных решений на основе данных и просвещенных инноваций.

| ✔️ Модели анализа документов | ✔️ Предварительно созданные модели | ✔️ Пользовательские модели |

Модели анализа документов

Модели анализа документов позволяют извлекать текст из форм и документов и возвращать структурированное бизнес-готовое содержимое, готовое для действий, использования или разработки вашей организации.


Чтение | Извлеките печатный и рукописный
текст.


Макет | Извлечение текста, таблиц
и структуры документов.


Чтение | Извлеките печатный и рукописный
текст.


Макет | Извлечение текста, таблиц
и структуры документов.


Общий документ | Извлечение пар "текст",
"структура" и "ключ-значение".

Предварительно созданные модели

Предварительно созданные модели позволяют добавлять интеллектуальную обработку документов в приложения и потоки без необходимости обучать и создавать собственные модели.


Счет | Извлеките сведения о клиенте и поставщике.


Получение | Извлеките сведения о транзакции продаж.


Удостоверение | Извлеките сведения о проверке.


Ипотека США 1003 | Извлечение сведений о приложении кредита.


Ипотека США 1008 | Извлечение сведений о передаче кредита.


Раскрытие ипотеки США | Извлеките окончательные условия закрытия кредита.


Медицинское страхование карта | Извлеките сведения о страховании.


Контракт | Извлечение соглашений и сведений о стороне.


Кредитные и дебетовые карта | Извлечение сведений карта оплаты.


Свидетельство о браке | Извлеките сертифицированные сведения о браке.


Форма налогового налога США W-2 | Извлечение сведений о компенсации с налогом.


Форма налога США 1098 | Извлечение сведений об ипотечных интересах.


Форма налога США 1098-E | Извлечение сведений о проценте за кредит учащихся.


Форма налога США 1098-T | Извлечение квалифицированных сведений об обучении.


Форма налога США 1099 | Извлечение сведений о вариантах формы 1099.


Форма налога США 1040 | Извлечение сведений о вариантах формы 1040.


Счет | Извлеките сведения о клиенте
и поставщике.


Получение | Извлеките сведения о транзакции продаж
.


Удостоверение | Извлечение сведений об идентификации
и проверке.


Медицинское страхование карта | Извлеките сведения о медицинском страховании.


Бизнес-карта | Извлечение сведений о бизнес-контакте.


Контракт | Извлечение соглашений
и сведений о стороне.


Форма налогового налога США W-2 | Извлечение сведений о компенсации с налогом
.


Форма налога США 1098 | Извлечение сведений об ипотечных интересах.


Форма налога США 1098-E | Извлечение сведений о проценте за кредит учащихся.


Форма налога США 1098-T | Извлечение квалифицированных сведений об обучении.

Пользовательские модели

  • Пользовательские модели обучены с помощью помеченных наборов данных для извлечения отдельных данных из форм и документов, относящихся к вашим вариантам использования.
  • Изолированные настраиваемые модели можно объединять для создания составных моделей.

  • ✔️ Модели извлечения пользовательских моделей извлечения обучены извлекать помеченные поля из документов.


Пользовательский шаблон | Извлеките данные из статических макетов.


Настраиваемый нейрон | Извлеките данные из документов смешанного типа.


Пользовательский состав | Извлечение данных с помощью коллекции моделей.

  • Пользовательские классификаторы модели
    ✔️ классификации определяют типы документов перед вызовом модели извлечения.


Настраиваемый классификатор | Определите назначенные типы документов (классы)
перед вызовом модели извлечения.

Возможности надстройки

Аналитика документов поддерживает дополнительные функции, которые можно включить и отключить в зависимости от сценария извлечения документов. Для и более поздних выпусков доступны 2023-07-31 (GA) следующие возможности надстройки:

Аналитика документов поддерживает дополнительные функции, которые можно включить и отключить в зависимости от сценария извлечения документов. Для и 2023-10-31-previewболее поздних выпусков доступны2024-02-29-preview следующие возможности надстройки:

Функции анализа

Model ID Извлечение содержимого Поля запроса Абзацы Роли абзаца Метки выделения Таблицы Пары "Ключ-значение" Языки Штрихкоды Анализ документов Формулы* Шрифт стиля* Высокое разрешение*
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
предварительно созданный контракт O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
предварительно созданная кредитная карта O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(варианты) O O O O O
prebuilt-tax.us.1040(варианты) O O O O O
{ customModelName } O O O O O

✓ - Включен O - Необязательный

* - Премиум функции влечет за собой дополнительные расходы

Модели и варианты разработки

Примечание.

Следующие модели и варианты разработки документов поддерживаются службой аналитики документов версии 3.0.

Вы можете использовать аналитику документов для автоматизации обработки документов в приложениях и рабочих процессах, улучшения стратегий на основе данных и обогащения возможностей поиска документов. Используйте ссылки в таблице, чтобы узнать больше о каждой модели и просмотреть параметры разработки.

Читать

Снимок экрана: анализ модели чтения с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-read • Извлечение текста из документов.
Извлечение данных
• Оцифровка любого документа.
• Соответствие требованиям и аудит.
• Обработка рукописных заметок перед переводом.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Макет

Снимок экрана: анализ модели макета с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-layout ● Извлечение текста и сведений о макете из документов.
Извлечение данных
• Индексирование документов и извлечение по структуре.
• Анализ финансовых и медицинских отчетов.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Общий документ (устаревший в 2023-10-31-preview)

Снимок экрана: анализ модели общего документа с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
предварительно созданный документ • Извлеките пары "текст", "макет" и " ключ-значение" из документов.
Извлечение данных и полей
● Извлечение пары "ключ-значение".
• Обработка форм.
• Сбор и анализ данных опроса.
REST API Аналитики
документов

Счет

Снимок экрана: анализ модели счета с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-invoice • Извлечение ключевых сведений из счетов.
Извлечение данных и полей
• Обработка с оплатой счетов.
● Автоматическая запись налогов и отчетность.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Получение

Снимок экрана: анализ модели квитанций с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-receipt • Извлечение ключевых сведений из квитанций.
Извлечение
данных и полей— модель квитанций версии 3.0 поддерживает обработку квитанций об одностраничных отелях.
• Управление расходами.
• Анализ данных поведения потребителей.
• Программа лояльности клиентов.
• Обработка возвращаемых товаров.
● Автоматическая запись налогов и отчетность.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Удостоверение (идентификатор)

Снимок экрана: анализ модели документов удостоверений (ID) с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-idDocument • Извлеките ключевые сведения из паспортов и идентификаторов карта s.
Типы
документов● Извлечение подтверждения, ограничений и классификаций транспортных средств из лицензий водителя США.
• Ознакомься с рекомендациями по соответствию требованиям финансовых услуг клиента (KYC).
• Управление медицинскими учетными записями.
● Удостоверений проверка точек и шлюзов.
• Регистрация отеля.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма ипотеки США 1003

Снимок экрана: анализ модели документов для ипотеки США 1003 с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-mortgage.us.1003 • Извлеките ключевые сведения из 1003 приложений по кредитам.
Извлечение данных и полей
• Требования к документации по Fannie Mae и Фредди Mac. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма ипотеки США 1008

Снимок экрана: анализ модели документов для ипотеки США 1008 с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-mortgage.us.1008 • Извлеките ключевые сведения из универсальной андеррайтинга и сводки передачи.
Извлечение данных и полей
• Обработка подзаписи кредитов с использованием сводных данных. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма раскрытия ипотеки США

Снимок экрана: анализ модели модели документа о закрытии ипотеки США с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-mortgage.us.closingDisclosure • Извлеките ключевые сведения из универсальной андеррайтинга и сводки передачи.
Извлечение данных и полей
• Окончательные требования к ипотечным кредитам. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Медицинское страхование карта

Снимок экрана: анализ модели медицинского страхования карта с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-healthInsuranceCard.us • Извлечение ключевых сведений из карта медицинского страхования США.
Данные и извлечение полей
● Покрытие и проверка прав на получение прав.
— прогнозное моделирование.
• Аналитика на основе значений.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Модель контракта

Снимок экрана: извлечение модели контракта с помощью Document Intelligence Studio.

Model ID Description Варианты разработки
предварительно созданный контракт Извлеките соглашение о контракте и сведения о стороне.
Извлечение данных и полей
Document Intelligence Studio
● REST API● REST API

● ПАКЕТ SDK

для C# ● Пакет SDK для Python ● Пакет SDK

java для Java

Модель кредитной карта

Снимок экрана: анализ модели изображений с помощью Document Intelligence Studio с помощью Кредитной карта.

Model ID Description Варианты разработки
предварительно созданная кредитная карта Извлеките соглашение о контракте и сведения о стороне.
Извлечение данных и полей
Document Intelligence Studio
● REST API● REST API

● ПАКЕТ SDK

для C# ● Пакет SDK для Python ● Пакет SDK

java для Java

Модель сертификата о браке

Снимок экрана: анализ модели документов сертификата о браке с помощью Document Intelligence Studio.

Model ID Description Варианты разработки
prebuilt-marriageCertificate.us Извлеките соглашение о контракте и сведения о стороне.
Извлечение данных и полей
Document Intelligence Studio
● REST API● REST API

● ПАКЕТ SDK

для C# ● Пакет SDK для Python ● Пакет SDK

java для Java

Модель налогового налога США W-2

Снимок экрана: анализ модели W-2 с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-tax.us.W-2 • Извлечение ключевых сведений из налоговых форм IRS US W2 (год 2018-2021).
Извлечение данных и полей
● Автоматизированное управление налоговыми документами.
• Обработка заявки на ипотечный кредит.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма налога США 1098

Снимок экрана: налоговая форма US 1098, проанализированная в Студии аналитики документов.

Model ID Description Варианты разработки
prebuilt-tax.us.1098 Извлечение сведений и сведений об ипотечных интересах.
Извлечение данных и полей
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма налога США 1098-E

Снимок экрана: форма налогообложения US 1098-E, проанализированная в Студии аналитики документов.

Model ID Description Варианты разработки
prebuilt-tax.us.1098E Извлечение сведений и сведений о кредите для учащихся.
Извлечение данных и полей
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма налога США 1098-T

Снимок экрана: налоговая форма US 1098-T, проанализированная в Студии аналитики документов.

Model ID Description Варианты разработки
prebuilt-tax.us.1098T Извлеките сведения о обучении и подробные сведения.
Извлечение данных и полей
REST API Аналитики
документов

Форма налога США 1099 (и варианты)

Снимок экрана: налоговая форма US 1099, проанализированная в Студии аналитики документов.

Model ID Description Варианты разработки
prebuilt-tax.us.1099{variation} Извлеките сведения из вариантов формы 1099.
Извлечение данных и полей
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма налога США 1040

Снимок экрана: анализ модели налоговой формы в США 1040 с помощью Document Intelligence Studio.

Model ID Description Варианты разработки
prebuilt-tax.us.1040 Извлеките сведения из вариантов формы 1040.
Извлечение данных и полей
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Визитная карточка

Снимок экрана: анализ модели бизнес-карта с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-businessCard • Извлечение ключевых сведений из бизнес-карта.
Извлечение данных и полей
• Руководитель продаж и управление маркетингом. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Обзор пользовательской модели

Снимок экрана: обучение пользовательской модели с помощью Document Intelligence Studio.

О программе Description Варианты использования автоматизации Варианты разработки
Пользовательская модель Извлекает сведения из форм и документов в структурированные данные на основе модели, созданной из набора репрезентативных наборов документов для обучения. Извлеките отдельные данные из форм и документов, относящихся к вашему бизнесу и вариантам использования. Document Intelligence Studio
● REST API
● ПАКЕТ SDK
для C#

Пакет SDK для Java SDK для JavaScript ● Пакет SDK
для JavaScript для Python

Пользовательский шаблон

Снимок экрана: анализ пользовательской модели шаблона с помощью Document Intelligence Studio.

Примечание.

Чтобы обучить пользовательскую модель шаблона, задайте buildMode для свойства значение template. Дополнительные сведения см. в разделе"Обучение модели шаблона"

О программе Description Варианты использования автоматизации Варианты разработки
Пользовательская модель шаблона Пользовательская модель шаблона извлекает помеченные значения и поля из структурированных и полуструктурированных документов.
Извлеките ключевые данные из высокоструктурированных документов с определенными визуальными шаблонами или общими визуальными макетами, формами. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK для Python

sdk для Java ● Пакет SDK
java для JavaScript

Настраиваемая нейронная модель

Снимок экрана: анализ пользовательской нейронной модели с помощью Document Intelligence Studio.

Примечание.

Чтобы обучить пользовательскую нейронную модель, задайте buildMode для свойства значение neural. Дополнительные сведения см. в разделе"Обучение нейронной модели"

О программе Description Варианты использования автоматизации Варианты разработки
Пользовательская нейронная модель Пользовательская нейронная модель используется для извлечения помеченных данных из структурированных (опросов, анкет), полуструктурированных (счетов, заказов на покупку) и неструктурированных документов (контракты, письма). Извлечение текстовых данных, проверка boxes и табличных полей из структурированных и неструктурированных документов. Document Intelligence Studio
● REST API
● ПАКЕТ SDK
для C#

Пакет SDK для Java SDK для JavaScript ● Пакет SDK
для JavaScript для Python

Пользовательский состав

Снимок экрана: список составных пользовательских моделей в Document Intelligence Studio.

О программе Description Варианты использования автоматизации Варианты разработки
Создание пользовательских моделей Составная модель создается на основе коллекции настраиваемых моделей, которые назначаются одной модели, созданной из ваших типов форм. Полезно при обучении нескольких моделей и их группировке для анализа аналогичных типов форм, таких как заказы на покупку. Document Intelligence Studio
● REST API
● ПАКЕТ SDK
для C#

Пакет SDK для Java SDK для JavaScript ● Пакет SDK
для JavaScript для Python

Пользовательская модель классификации

Снимок экрана: метка пользовательской модели классификации в Document Intelligence Studio.

О программе Description Варианты использования автоматизации Варианты разработки
Модель составной классификации Пользовательские модели классификации объединяют функции макета и языка для обнаружения, идентификации и классификации документов в входном файле. • Приложение кредита упаковано с формой приложения, payslip и банковским заявлением.
• Коллекция отсканированных счетов.
REST API Аналитики
документов

Azure AI Document Intelligence — это облачная служба ИИ Azure для разработчиков для создания интеллектуальных решений для обработки документов. Аналитика документов применяет оптическое распознавание символов на основе машинного обучения (OCR) и технологии распознавания документов для извлечения текста, таблиц, структуры и пар "ключ-значение" из документов. Вы также можете пометить и обучить пользовательские модели для автоматизации извлечения данных из структурированных, полуструктурированных и неструктурированных документов. Дополнительные сведения о каждой модели см . в статьях о концепциях:

Тип модели Имя модели
Модель анализа документов Модель анализа макета
Предварительно созданные модели Модель выставления счетов: модель
квитанции● Модель
документа удостоверений (ID)

Модель бизнес-карта

Пользовательские модели Настраиваемая модель
Составная модель

Это содержимое относится к:v2.1 Последняя версиясиний проверка mark:флажокv4.0 (предварительная версия) |

Модели аналитики документов и варианты разработки

Совет

  • Для повышения качества и расширенного качества модели попробуйте в Студии аналитики документов версии 3.0.
  • Студия версии 3.0 поддерживает любую модель, обученную с помощью маркированных данных версии 2.1.
  • Подробные сведения о переходе с версии 2.1 на версию 3.0 см. в руководстве по миграции API.

Примечание.

Следующие модели и параметры разработки поддерживаются службой аналитики документов версии 2.1.

Используйте ссылки в таблице, чтобы узнать больше о каждой модели и просмотреть ссылки на API:

Модель Description Варианты разработки
Анализ макета Извлечение и анализ текста, меток выбора и таблиц и координат ограничивающего прямоугольника из форм и документов. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов
Пользовательская модель Извлечение и анализ данных из форм и документов, относящихся к определенным бизнес-данным и вариантам использования. Средство маркировки аналитики документов ● REST API
Пример средства

маркировки● Контейнер Docker аналитики документов
Модель накладных Автоматическая обработка данных и извлечение ключевой информации из счетов продажи. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов
Модель получения Автоматическая обработка данных и извлечение ключевой информации из квитанций продажи. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов
Модель документа удостоверений (ID) Автоматизированная обработка данных и извлечение ключевой информации из заграничных паспортов и водительских удостоверений в США. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов
Модель визитных карточек Автоматическая обработка данных и извлечение ключевой информации из визитных карточек. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов

Конфиденциальность и безопасность данных

Как и во всех службах ИИ, разработчики, использующие службу аналитики документов, должны учитывать политики Майкрософт по данным клиентов. Ознакомьтесь со страницей "Данные, конфиденциальность и безопасность" для аналитики документов.

Следующие шаги

  • Выберите модель аналитики документов.

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

  • Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.