Модель карта аналитики документов
Это содержимое относится к:v4.0 (предварительная версия)
Модель карта аналитики документов использует мощные возможности оптического распознавания символов (OCR) для анализа и извлечения ключевых полей из кредитных и дебетовых карта. Кредитные карта и дебетовые карта могут иметь различные форматы и качество, включая изображения, захваченные телефоном, сканированные документы и цифровые PDF-файлы. API анализирует текст документа; извлекает ключевые сведения, такие как номер карты, выдача банка и дата окончания срока действия; и возвращает структурированное представление данных JSON. В настоящее время модель поддерживает форматы документов на английском языке.
Автоматическая обработка карта
Автоматическая обработка карта кредитной и дебетовой карта — это процесс извлечения ключевых полей из банковских карта. Исторически процесс анализа банка карта достигается вручную и, следовательно, очень много времени. Точное извлечение ключевых данных из банковских карта s обычно является первым и одним из наиболее важных шагов в процессе автоматизации контрактов.
Варианты разработки
Аналитика документов версии 4.0 (2024-02-29-preview) поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель контракта | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
предварительно созданная кредитная карта |
Требования к входным данным
Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.
Поддерживаемые форматы файлов:
Модель PDF Изображение:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) и HTMLЧитать ✔ ✔ ✔ Макет ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Документ общего назначения ✔ ✔ Готовое ✔ ✔ Настраиваемая функция извлечения ✔ ✔ Настраиваемая классификация ✔ ✔ ✔ (2024-02-29-preview) В файлах формата PDF и TIFF обрабатывается до 2000 страниц (с подпиской уровня "Бесплатный" обрабатываются только первые две страницы).
Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ бесплатного уровня (F0).
Изображения должны иметь размеры в пределах от 50 x 50 до 10 000 x 10 000 пикселей.
Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.
Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту о
8
точке в 150 точек на дюйм (DPI).Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.
Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1G-МБ для нейронной модели.
Для обучения пользовательской модели классификации общий размер обучающих данных составляет
1GB
не более 10 000 страниц.
Попробуйте извлечь данные из кредитной карта
Чтобы узнать, как работает извлечение данных для службы кредитной и дебетовой карта, вам потребуется следующее:
Подписка Azure — ее можно создать бесплатно.
Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (
F0
), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.
Document Intelligence Studio
На домашней странице Document Intelligence Studio выберите кредитную или дебетовую карту.
Вы можете проанализировать примеры налоговых документов или отправить собственные файлы.
Нажмите кнопку "Выполнить анализ ", а при необходимости настройте параметры анализа:
Поддерживаемые языки и языковые стандарты
См . страницу предварительно созданных моделей для полного списка поддерживаемых языков.
Извлечение полей
Ниже приведены поля, извлеченные из контракта в ответе выходных данных JSON.
Имя. | Тип | Описание | Пример результата |
---|---|---|---|
CardNumber | Строка | Уникальный идентификатор карта | 4275 0000 0000 0000 |
Выдающий банк | Строка | Имя банка, выдавшего карта | Woodgrove Bank |
PaymentNetwork | Строка | Сеть оплаты, обрабатывающая транзакцию карта | VISA |
CardHolderName | Строка | Имя человека, которому принадлежит карта | ДЖОН СМИТ |
CardHolderCompanyName | Строка | Имя компании, с которым связана карта | Contoso, Ltd. |
ValidDate | Дата | Допустимый из даты | 01/16 |
ExpirationDate | Дата | Срок действия | 01/19 |
CardVerificationValue | Строка | Значение проверки карты (CVV) | 764 |
CustomerService Телефон Numbers | Массив | Список номеров поддержки | +1 (555) 123-4567 |
Банковские карта пары "ключ-значение" и извлеченные элементы строки находятся в documentResults
разделе выходных данных JSON.
Следующие шаги
Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.