Поделиться через


Модель сертификата о браке в аналитике документов

Это содержимое относится к:флажокv4.0 (предварительная версия)флажок

Модель сертификата браков с анализом документов использует мощные возможности оптического распознавания символов (OCR) для анализа и извлечения ключевых полей из сертификатов о браке. Сертификаты о браке могут быть различными форматами и качеством, включая захваченные телефоном изображения, сканированные документы и цифровые PDF-файлы. API анализирует текст документа; извлекает ключевые сведения, такие как имена супругов, дата выдачи и место брака; и возвращает структурированное представление данных JSON. В настоящее время модель поддерживает форматы документов на английском языке.

Автоматическая обработка сертификатов о браке

Автоматическая обработка сертификатов о браке — это процесс извлечения ключевых полей из сертификатов о браке. Исторически процесс анализа сертификата брака достигается вручную и, следовательно, очень много времени. Точное извлечение ключевых данных из сертификатов о браке обычно является первым и одним из наиболее важных шагов в процессе автоматизации сертификатов браков.

Варианты разработки

Аналитика документов версии 4.0 (2024-02-29-preview) поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
prebuilt-marriageCertificate.us Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-marriageCertificate.us

Требования к входным данным

  • Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.

  • Поддерживаемые форматы файлов:

    Модель PDF Изображение:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) и HTML
    Читать
    Макет ✔ (2024-02-29-preview, 2023-10-31-preview)
    Документ общего назначения
    Готовое
    Настраиваемая функция извлечения
    Настраиваемая классификация ✔ (2024-02-29-preview)
  • В файлах формата PDF и TIFF обрабатывается до 2000 страниц (с подпиской уровня "Бесплатный" обрабатываются только первые две страницы).

  • Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ бесплатного уровня (F0).

  • Изображения должны иметь размеры в пределах от 50 x 50 до 10 000 x 10 000 пикселей.

  • Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.

  • Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту о 8точке в 150 точек на дюйм (DPI).

  • Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.

    • Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1G-МБ для нейронной модели.

    • Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1GB не более 10 000 страниц.

Попробуйте извлечь данные документа о сертификате о браке

Чтобы узнать, как работает извлечение данных для службы сертификата о браке карта, вам потребуется следующее:

  • Подписка Azure — ее можно создать бесплатно.

  • Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.

Снимок экрана: расположение ключей и конечной точки на портале Azure.

Document Intelligence Studio

  1. На домашней странице Document Intelligence Studio выберите сертификат о браке.

  2. Вы можете проанализировать примеры сертификатов о браке или отправить собственные файлы.

  3. Нажмите кнопку "Выполнить анализ", а при необходимости настройте параметры анализа:

    Снимок экрана: кнопки

Поддерживаемые языки и языковые стандарты

См . страницу предварительно созданных моделей для полного списка поддерживаемых языков.

Извлечение полей

Ниже приведены поля, извлеченные из сертификата брака в выходном ответе JSON.

Имя. Тип Описание Пример результата
Spouse1FirstName Строка Имя супруга 1 Уэсли
Spouse1MiddleName Строка Имя супруга 1 M.
Spouse1LastName Строка Фамилия супруга 1 Перри
Spouse1Age Целое Возраст супруга 1 26
Spouse1BirthDate Дата Дата рождения супруга 1 16 ноября 1997 г.
Spouse1Address Адрес Адрес супруга 1 4292 Дон Джексон Лейн, Блумфилд Тауншип, Мичиган 48302
Spouse1BirthPlace Строка Место рождения супруга 1 Мичиган
Spouse2FirstName Строка Имя супруга 2 Бет
Spouse2MiddleName Строка Фамилия супруга 2 R.
Spouse2LastName Строка Фамилия супруга 2 Mason
Spouse2Age Целое Возраст супруга 2 23
Spouse2BirthDate Дата Дата рождения супруга 2 22 июля 2000 г.
Spouse2Address Адрес Адрес супруга 2 2671 Комфорт суд, Мэдисон, Висконсин 53704
Spouse2BirthPlace Строка Место рождения супруга 2 Висконсин
DocumentNumber Строка Номер документа 01976/202
IssueDate Дата Дата выдачи сертификата 10 октября 2023 г.
IssuePlace Строка Место выдачи сертификата 2398 Эхо-Лейн, Хэтингс, Мичиган 49058
MarriageDate Дата Дата брака 10 октября 2023 г.
MarriagePlace Строка Место брака 105 Угольная улица, Галлоуэй, Висконсин 54432

Пары сертификата о браке и элементы строки, извлеченные в формате JSON, находятся в documentResults разделе выходных данных JSON.

Следующие шаги

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.