Поделиться через


Какую модель следует выбрать?

Внимание

  • Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке.
  • Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
  • Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует rest API версии 2024-02-29-preview.
  • Общедоступная предварительная версия 2024-02-29-preview в настоящее время доступна только в следующих регионах Azure:
  • Восточная часть США
  • Западная часть США2
  • Западная Европа

Это содержимое относится к:v4.0 (предварительная версия) | Предыдущие версии:флажоксиний проверка markv3.1 (GA)синий проверка markv3.0 (GA)

Это содержимое относится к:v3.1 (GA) | Последняя версияфиолетовый проверка mark:v4.0 (предварительная версия) | Предыдущие версии:синий проверка markфлажокv3.0

Это содержимое относится к:v3.0 (GA) | Latest versions:флажокфиолетовый проверка markv4.0 (preview)фиолетовый проверка markv3.1

Azure AI Document Intelligence поддерживает широкий спектр моделей, позволяющих добавлять интеллектуальную обработку документов в приложения и оптимизировать рабочие процессы. Выбор правильной модели необходим для обеспечения успеха вашей организации. В этой статье мы рассмотрим доступные модели аналитики документов и укажите рекомендации по выбору оптимального решения для ваших проектов.

На следующих диаграммах принятия решений выделены функции каждой поддерживаемой модели аналитики документов версии 3.0 и вы можете выбрать лучшую модель в соответствии с потребностями и требованиями приложения.

Внимание

Обязательно проверка страницу поддержки языка для поддерживаемого текста языка и извлечения полей по компоненту.

Предварительно обученные модели анализа документов

Document type Пример Извлекаемые данные Лучшее решение
Универсальный документ. Контракт или письмо. Вы хотите в первую очередь извлечь письменные или печатные текстовые строки, слова, расположения и обнаруженные языки. Чтение модели OCR
Документ, содержащий структурную информацию. Отчет или исследование. Помимо написанного или печатного текста, необходимо извлечь структурную информацию, например таблицы, знаки выделения, абзацы, заголовки, заголовки и подзаголовок. Модель анализа макета
Структурированный или полуструктурированный документ, содержащий содержимое, отформатированное как поля (ключи) и значения. Форма или документ, который является стандартным форматом, часто используемым в вашей компании или отрасли, например кредитным приложением или опросом. Вам нужно извлечь поля и значения, включая те, которые не охватываются предварительно созданными моделями для конкретного сценария без необходимости обучения настраиваемой модели. **Модель анализа макета с включенным необязательным параметром features=keyValuePairs строки запроса **

Предварительно обученные модели для конкретных сценариев

Document type Извлекаемые данные Лучшее решение
Налоговая форма США W-2 Вы хотите извлечь ключевые сведения, такие как зарплата, заработная плата и налоги, удержанные. Модель налогового налога США W-2
Форма налога США 1098 Вы хотите извлечь сведения об ипотеке, такие как основные, точки и налог. Модель налога США 1098
Форма налога США 1098-E Вы хотите извлечь сведения о проценте для учащихся, таких как кредитор и процентная сумма. Модель налога США 1098-E
Форма налога США 1098T Вы хотите извлечь квалифицированные сведения об обучении, такие как корректировка стипендии, статус студента и информация кредитора. Модель налога США 1098-T
Форма налога США 1099(варианты) Вы хотите извлечь информацию из 1099 форм и ее вариантов (A, B, C, CAP, DIV, G, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Модель налога США 1099
Форма налога США 1040(варианты) Вы хотите извлечь сведения из 1040 форм и его вариантов (расписание 1, расписание 2, расписание 3, расписание 8812, расписание A, Расписание B, Расписание C, Расписание D, Расписание E, Расписание EIC, Расписание F, Расписание H, Расписание J, Расписание R, План SE, Расписание старший). Модель налога США 1040
Контракт (юридическое соглашение между сторонами). Вы хотите извлечь сведения о соглашении о контракте, такие как стороны, даты и интервалы. Модель контракта
Медицинское страхование карта или идентификатор медицинского страхования. Вы хотите извлечь ключевые сведения, такие как страховщик, идентификатор члена, покрытие рецептов и номер группы. Модель медицинского страхования карта
Кредитные и дебетовые карта. Вы хотите извлечь карта банка ключей, например номер карта и имя банка. Модель кредитной и дебетовой карта
Свидетельство о браке. Вы хотите извлечь ключевые сведения из сертификатов о браке. Модель сертификата о браке
Счет или инструкция по выставлению счетов. Вы хотите извлечь ключевые сведения, такие как имя клиента, адрес выставления счетов и сумма. Модель накладных
Получение, ваучер или одностраничные квитанции об отеле. Вы хотите извлечь ключевые сведения, такие как имя продавца, дата транзакции и общая сумма транзакций. Модель получения
Документ удостоверений (идентификатор), например водительская лицензия США или международный паспорт. Вы хотите извлечь ключевые сведения, такие как имя, фамилия, дата рождения, адрес и подпись. Модель документа удостоверений (ID)
Ипотека США 1003 . Вы хотите извлечь ключевые сведения из приложения универсального жилищного кредита. Модель формы 1003
Ипотека США 1008 . Вы хотите извлечь ключевые сведения из сводки по универсальному андеррайтингу и передаче. Модель формы 1008
Раскрытие ипотеки США. Вы хотите извлечь ключевые сведения из формы раскрытия ипотеки. Модель формы раскрытия ипотеки
Документы смешанного типа с структурированными, полуструктурированными и (или) неструктурированными элементами. Вам нужно извлечь пары "ключ-значение", метки выбора, таблицы, поля подписи и выбранные регионы, не извлеченные предварительно созданной моделью или моделью документов общего назначения. Пользовательская модель

Совет

  • Если вы по-прежнему не уверены, какая предварительно обученная модель используется, попробуйте использовать модель макета с включенным необязательным параметром features=keyValuePairs строки запроса.
  • Модель макета используется подсистемой чтения OCR для обнаружения страниц, таблиц, стилей, текста, строк, слов, расположений и языков.

Пользовательские модели извлечения

Обучающий набор Примеры документов Лучшее решение
Структурированные, согласованные документы со статическим макетом. Структурированные формы, такие как анкеты или приложения. Пользовательская модель шаблона
Структурированные, полуструктурированные и неструктурированные документы. • Структурированные → опросы
● Полуструктурированные → счета● Неструктурированные → буквы
Пользовательская нейронная модель
Коллекция нескольких моделей, каждая из которых обучена на документах аналогичного типа. • Поставки заказов
на покупку оборудования ● Заказы на покупку оборудования ● Заказы на покупку
мебели Все, состоящие в одной модели.
Составная настраиваемая модель

Пользовательская модель классификации

Обучающий набор Примеры документов Лучшее решение
По крайней мере два разных типа документов. Формы, письма или документы Пользовательская модель классификации

Следующие шаги