Apa itu Kecerdasan Dokumen Azure AI?

Penting

  • Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif.
  • Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
  • Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-02-29-preview.
  • Pratinjau publik versi 2024-02-29-preview saat ini hanya tersedia di wilayah Azure berikut:
  • US Timur
  • US Barat2
  • Eropa Barat

Konten ini berlaku untuk:tanda centangv4.0 (pratinjau) | Versi sebelumnya:tanda centang biruv3.1 (GA)tanda centang biruv3.0 (GA)tanda centang biruv2.1 (GA)

Konten ini berlaku untuk:tanda centangv3.1 (GA) | Versi terbaru:tanda centang unguv4.0 (pratinjau) | Versi sebelumnya:tanda centang biruv3.0tanda centang biruv2.1

Konten ini berlaku untuk:tanda centangv3.0 (GA) | Versi terbaru:tanda centang unguv4.0 (pratinjau)tanda centang unguv3.1 | Versi sebelumnya:tanda centang biruv2.1

Konten ini berlaku untuk:tanda centangv2.1 | Versi terbaru:tanda centang biruv4.0 (pratinjau)

Catatan

Form Recognizer sekarang menjadi Kecerdasan Dokumen Azure AI!

  • Pada Juli 2023, layanan Azure AI mencakup semua yang sebelumnya dikenal sebagai Cognitive Services dan Azure Applied AI Services.
  • Tidak ada perubahan pada harga.
  • Nama Cognitive Services dan Azure Applied AI terus digunakan dalam tagihan Azure, analisis biaya, daftar harga, dan API harga.
  • Tidak ada perubahan mencolok pada antarmuka pemrograman aplikasi (API) atau SDK sebelum dan termasuk v3.1. Mulai dari v4.0, API dan SDK diperbarui ke Kecerdasan Dokumen.
  • Beberapa platform masih menunggu pembaruan penggantian nama. Semua penyebutan Form Recognizer atau Kecerdasan Dokumen dalam dokumentasi kami mengacu pada layanan Azure yang sama.

Azure AI Document Intelligence adalah layanan Azure AI berbasis cloud yang memungkinkan Anda membangun solusi pemrosesan dokumen cerdas. Sejumlah besar data, mencakup berbagai jenis data, disimpan dalam bentuk dan dokumen. Kecerdasan Dokumen memungkinkan Anda mengelola kecepatan pengumpulan dan pemrosesan data secara efektif dan merupakan kunci untuk meningkatkan operasi, keputusan berbasis data yang diinformasikan, dan inovasi yang tercerahkan.

| ✔️ Model analisis dokumen | ✔️ Model bawaan | ✔️ Model kustom |

Model analisis dokumen

Model analisis dokumen memungkinkan ekstraksi teks dari formulir dan dokumen dan mengembalikan konten siap bisnis terstruktur yang siap untuk tindakan, penggunaan, atau kemajuan organisasi Anda.


Baca | Ekstrak teks cetak
dan tulisan tangan.


Tata Letak | Ekstrak teks, tabel,
dan struktur dokumen.


Baca | Ekstrak teks cetak
dan tulisan tangan.


Tata Letak | Ekstrak teks, tabel,
dan struktur dokumen.


Dokumen umum | Ekstrak pasangan teks,
struktur, dan nilai kunci.

Model bawaan

Model bawaan memungkinkan Anda menambahkan pemrosesan dokumen cerdas ke aplikasi dan alur Anda tanpa harus melatih dan membangun model Anda sendiri.


Faktur | Ekstrak detail pelanggan
dan vendor.


Tanda terima | Ekstrak detail transaksi penjualan
.


Identitas | Ekstrak detail identifikasi
dan verifikasi.


1003 EULA | Ekstrak detail hipotek.


Formulir 1008 | Ekstrak detail hipotek.


Pengungkapan Penutup | Ekstrak detail hipotek.


Kartu Asuransi Kesehatan | Ekstrak detail asuransi kesehatan
.


Kontrak | Ekstrak perjanjian
dan detail pihak.


Kartu Kredit/Debit | Ekstrak informasi dari kartu bank.


Surat Nikah | Ekstrak informasi dari sertifikat Pernikahan.


Formulir W-2 Pajak AS | Ekstrak detail kompensasi kena
pajak.


Formulir Pajak AS 1098 | Ekstrak detail bunga hipotek.


Formulir Pajak AS 1098-E | Ekstrak detail bunga pinjaman siswa.


Formulir Pajak AS 1098-T | Ekstrak detail biaya kuliah yang memenuhi syarat.


Formulir Pajak AS 1099 | Ekstrak informasi dari variasi formulir 1099.


Formulir Pajak AS 1040 | Ekstrak informasi dari variasi formulir 1040.


Faktur | Ekstrak detail pelanggan
dan vendor.


Tanda terima | Ekstrak detail transaksi penjualan
.


Identitas | Ekstrak detail identifikasi
dan verifikasi.


Kartu Asuransi Kesehatan | Ekstrak detail asuransi kesehatan.


Kartu nama | Ekstrak detail kontak bisnis.


Kontrak | Ekstrak perjanjian
dan detail pihak.


Formulir W-2 Pajak AS | Ekstrak detail kompensasi kena
pajak.


Formulir Pajak AS 1098 | Ekstrak detail bunga hipotek.


Formulir Pajak AS 1098-E | Ekstrak detail bunga pinjaman siswa.


Formulir Pajak AS 1098-T | Ekstrak detail biaya kuliah yang memenuhi syarat.

Model kustom

  • Model kustom dilatih menggunakan himpunan data berlabel Anda untuk mengekstrak data yang berbeda dari formulir dan dokumen, khusus untuk kasus penggunaan Anda.
  • Model kustom mandiri dapat digabungkan untuk membuat model yang disusun.
  • Model
    ✔️ ekstraksi Model ekstraksi kustom dilatih untuk mengekstrak bidang berlabel dari dokumen.


Templat kustom | Ekstrak data dari tata letak statis.


Neural kustom | Ekstrak data dari dokumen tipe campuran.


Kustom terdiri | Ekstrak data menggunakan kumpulan model.

  • Pengklasifikasi kustom model
    ✔️ klasifikasi mengidentifikasi jenis dokumen sebelum memanggil model ekstraksi.


Penggollong kustom | Identifikasi jenis dokumen yang ditunjuk (kelas)
sebelum memanggil model ekstraksi.

Kemampuan add-on

Kecerdasan Dokumen mendukung fitur opsional yang dapat diaktifkan dan dinonaktifkan tergantung pada skenario ekstraksi dokumen. Kemampuan add-on berikut tersedia untuk 2023-07-31 (GA) rilis dan yang lebih baru:

Kecerdasan Dokumen mendukung fitur opsional yang dapat diaktifkan dan dinonaktifkan tergantung pada skenario ekstraksi dokumen. Kemampuan add-on berikut ini tersedia untuk2024-02-29-preview, 2023-10-31-preview, dan rilis yang lebih baru:

Fitur analisis

ID Model Ekstraksi Konten Bidang kueri Paragraf Peran Paragraf Tanda Pilihan Tabel Pasangan Kunci-Nilai Bahasa Barcode Analisis Dokumen Rumus* Font Gaya* Resolusi Tinggi*
baca bawaan O O O O O
prebuilt-layout O O O O O
dokumen-bawaan O O O O O
prebuilt-businessCard
kontrak bawaan O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
Faktur Bawaan O O O O O O
tanda terima bawaan O O O O O
prebuilt-marriageCertificate.us O O O O O
kartu kredit bawaan O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(variasi) O O O O O
prebuilt-tax.us.1040(variasi) O O O O O
{ customModelName } O O O O O

✓ - Diaktifkan
O - Opsional
* - Fitur premium dikenakan biaya tambahan

Opsi model dan pengembangan

Catatan

Model pemahaman dokumen dan opsi pengembangan berikut didukung oleh layanan Kecerdasan Dokumen v3.0.

Anda dapat menggunakan Kecerdasan Dokumen untuk mengotomatiskan pemrosesan dokumen dalam aplikasi dan alur kerja, meningkatkan strategi berbasis data, dan memperkaya kemampuan pencarian dokumen. Gunakan tautan dalam tabel untuk mempelajari selengkapnya tentang setiap model dan menelusuri opsi pengembangan.

Read

Cuplikan layar Analisis model Baca menggunakan Studio Kecerdasan Dokumen.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
baca bawaan ● Ekstrak teks dari dokumen.
Ekstraksi data
● Mendigitalkan dokumen apa pun.
● Kepatuhan dan audit.
● Memproses catatan tulisan tangan sebelum terjemahan.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Tata letak

Cuplikan layar analisis model tata letak menggunakan Document Intelligence Studio.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
prebuilt-layout ● Ekstrak informasi teks dan tata letak dari dokumen.
Ekstraksi data
● Pengindeksan dan pengambilan dokumen berdasarkan struktur.
● Analisis laporan keuangan dan medis.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Dokumen umum (tidak digunakan lagi dalam pratinjau 2023-10-31)

Cuplikan layar analisis model Dokumen Umum menggunakan Document Intelligence Studio.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
dokumen bawaan ● Ekstrak pasangan teks, tata letak, dan kunci-nilai dari dokumen.
Ekstraksi data dan bidang
● Ekstraksi pasangan kunci-nilai.
● Pemrosesan formulir.
● Pengumpulan dan analisis data survei.
Document Intelligence Studio
REST API

Faktur

Cuplikan layar analisis model Faktur menggunakan Studio Kecerdasan Dokumen.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
Faktur Bawaan ● Ekstrak informasi utama dari faktur.
Ekstraksi data dan bidang
● Pemrosesan utang akun.
● Perekaman dan pelaporan pajak otomatis.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Tanda Terima

Cuplikan layar analisis model Tanda Terima menggunakan Studio Kecerdasan Dokumen.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
tanda terima bawaan ● Ekstrak informasi utama dari tanda terima.
Data dan ekstraksi
bidang● Model tanda terima v3.0 mendukung pemrosesan tanda terima hotel satu halaman.
● Manajemen pengeluaran.
● Analisis data perilaku konsumen.
● Program loyalitas pelanggan.
● Pemrosesan kembali barang dagangan.
● Perekaman dan pelaporan pajak otomatis.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Identitas (ID)

Cuplikan layar analisis model Dokumen Identitas (ID) menggunakan Document Intelligence Studio.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
prebuilt-idDocument ● Ekstrak informasi kunci dari paspor dan KTP.
Jenis
dokumen● Ekstrak dukungan, pembatasan, dan klasifikasi kendaraan dari SIM AS.
● Ketahui kepatuhan pedoman layanan keuangan pelanggan Anda (KYC).
● Manajemen akun medis.
● Titik pemeriksaan identitas dan gateway.
● Pendaftaran hotel.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Kartu asuransi kesehatan

Cuplikan layar analisis model kartu asuransi Kesehatan menggunakan Document Intelligence Studio.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
prebuilt-healthInsuranceCard.us ● Ekstrak informasi utama dari kartu asuransi kesehatan AS.
Ekstraksi data dan bidang
● Verifikasi cakupan dan kelayakan.
● Pemodelan prediktif.
● Analitik berbasis nilai.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Model kontrak

Cuplikan layar ekstraksi model Kontrak menggunakan Document Intelligence Studio.

ID Model Deskripsi Opsi pengembangan
kontrak bawaan Ekstrak perjanjian kontrak dan detail pihak. Document Intelligence Studio
REST API

Model W-2 Pajak AS

Cuplikan layar analisis model W-2 menggunakan Document Intelligence Studio.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
prebuilt-tax.us.W-2 ● Ekstrak informasi utama dari formulir pajak IRS US W2 (tahun 2018-2021).
Ekstraksi data dan bidang
● Manajemen dokumen pajak otomatis.
● Pemrosesan pengajuan pinjaman KPR.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Formulir pajak AS 1098

Cuplikan layar formulir pajak US 1098 yang dianalisis di Document Intelligence Studio.

ID Model Deskripsi Opsi pengembangan
prebuilt-tax.us.1098 Ekstrak informasi dan detail bunga hipotek. Document Intelligence Studio
REST API

Formulir pajak AS 1098-E

Cuplikan layar formulir pajak US 1098-E yang dianalisis di Studio Kecerdasan Dokumen.

ID Model Deskripsi Opsi pengembangan
prebuilt-tax.us.1098E Ekstrak informasi dan detail pinjaman siswa. Document Intelligence Studio
REST API

Formulir 1098-T pajak AS

Cuplikan layar formulir pajak US 1098-T yang dianalisis di Studio Kecerdasan Dokumen.

ID Model Deskripsi Opsi pengembangan
prebuilt-tax.us.1098T Ekstrak informasi dan detail biaya kuliah. Document Intelligence Studio
REST API

Formulir pajak AS 1099 (dan Variasi)

Cuplikan layar formulir pajak US 1099 yang dianalisis di Document Intelligence Studio.

ID Model Deskripsi Opsi pengembangan
prebuilt-tax.us.1099(Variasi) Ekstrak informasi dari variasi bentuk 1099. Document Intelligence Studio
REST API

Kartu nama

Cuplikan layar analisis model kartu nama menggunakan Document Intelligence Studio.

ID Model Deskripsi Kasus penggunaan automasi Opsi pengembangan
prebuilt-businessCard ● Ekstrak informasi utama dari kartu nama.
Ekstraksi data dan bidang
● Prospek penjualan dan manajemen pemasaran. Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Gambaran umum model kustom

Cuplikan layar pelatihan Model kustom menggunakan Studio Kecerdasan Dokumen.

Tentang Deskripsi Kasus penggunaan automasi Opsi pengembangan
Model kustom Mengekstrak informasi dari formulir dan dokumen ke dalam data terstruktur berdasarkan model yang dibuat dari serangkaian kumpulan dokumen pelatihan perwakilan. Ekstrak data yang berbeda dari formulir dan dokumen khusus untuk kasus bisnis dan penggunaan Anda. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Templat kustom

Cuplikan layar analisis model Templat Kustom menggunakan Document Intelligence Studio.

Catatan

Untuk melatih model templat kustom, atur properti ke buildModetemplate. Untuk informasi selengkapnya, lihatMelatih model templat

Tentang Deskripsi Kasus penggunaan automasi Opsi pengembangan
Model Templat Kustom Model templat kustom mengekstrak nilai dan bidang berlabel dari dokumen terstruktur dan semi terstruktur.
Ekstrak data kunci dari dokumen yang sangat terstruktur dengan templat visual yang ditentukan atau tata letak visual umum, formulir. Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

Neural kustom

Cuplikan layar analisis model Neural Kustom menggunakan Document Intelligence Studio.

Catatan

Untuk melatih model neural kustom, atur properti ke buildModeneural. Untuk informasi selengkapnya, lihatMelatih model neural

Tentang Deskripsi Kasus penggunaan automasi Opsi pengembangan
Model Neural Kustom Model neural kustom digunakan untuk mengekstrak data berlabel dari terstruktur (survei, kuesioner), semi-terstruktur (faktur, pesanan pembelian), dan dokumen yang tidak terstruktur (kontrak, surat). Ekstrak data teks, kotak centang, dan bidang tabular dari dokumen terstruktur dan tidak terstruktur. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Kustom terdiri

Cuplikan layar daftar Model kustom yang Terdiri di Studio Kecerdasan Dokumen.

Tentang Deskripsi Kasus penggunaan automasi Opsi pengembangan
Model kustom yang terdiri Model yang disusun dibuat dengan mengambil koleksi model khusus dan menetapkannya ke satu model yang mencakup jenis formulir Anda. Berguna saat Anda melatih beberapa model dan ingin mengelompokkannya untuk menganalisis jenis formulir serupa seperti pesanan pembelian. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Model klasifikasi kustom

{alt-teks}

Tentang Deskripsi Kasus penggunaan automasi Opsi pengembangan
Model klasifikasi yang terdiri Model klasifikasi kustom menggabungkan fitur tata letak dan bahasa untuk mendeteksi, mengidentifikasi, dan mengklasifikasikan dokumen dalam file input. ● Aplikasi pinjaman yang dibungkus berisi formulir aplikasi, payslip, dan, laporan bank.
● Kumpulan faktur yang dipindai.
Document Intelligence Studio
REST API

Azure AI Document Intelligence adalah layanan Azure AI berbasis cloud bagi pengembang untuk membangun solusi pemrosesan dokumen cerdas. Kecerdasan Dokumen menerapkan pengenalan karakter optik berbasis pembelajaran mesin (OCR) dan teknologi pemahaman dokumen untuk mengekstrak pasangan teks, tabel, struktur, dan nilai kunci dari dokumen. Anda juga dapat memberi label dan melatih model kustom untuk mengotomatiskan ekstraksi data dari dokumen terstruktur, semi terstruktur, dan tidak terstruktur. Untuk mempelajari selengkapnya tentang setiap model, lihat artikel Konsep:

Jenis model Nama model
Model analisis dokumen Model analisis tata letak
Model bawaan Model
faktur● Model
tanda terima● Model
dokumen identitas (ID) ● Model kartu nama
Model kustom Model kustom
Model yang disusun

Konten ini berlaku untuk:tanda centangv2.1 | Versi terbaru:tanda centang biruv4.0 (pratinjau)

Model dan opsi pengembangan Kecerdasan Dokumen

Tip

  • Untuk pengalaman yang ditingkatkan dan kualitas model tingkat lanjut, coba Document Intelligence v3.0 Studio.
  • Studio v3.0 mendukung model apa pun yang dilatih dengan data berlabel v2.1.
  • Anda dapat mengacu ke panduan migrasi API untuk mendapatkan detail informasi tentang migrasi dari v2.1 ke v3.0.

Catatan

Model dan opsi pengembangan berikut didukung oleh layanan Kecerdasan Dokumen v2.1.

Gunakan tautan dalam tabel untuk mempelajari selengkapnya tentang setiap model dan menelusuri referensi API:

Model Deskripsi Opsi pengembangan
Analisis tata letak Ekstraksi dan analisis teks, tanda seleksi, tabel, dan koordinat kotak pembatas, dari formulir dan dokumen. Alat
pelabelan Kecerdasan Dokumen● REST API
SDK
pustaka klien● Kontainer Docker Kecerdasan Dokumen
Model kustom Ekstraksi dan analisis data dari formulir dan dokumen khusus untuk data bisnis dan kasus penggunaan tertentu. Alat
pelabelan Kecerdasan Dokumen● REST API
Alat
Pelabelan Sampel● Kontainer Docker Kecerdasan Dokumen
Model faktur Pemrosesan data otomatis dan ekstraksi informasi kunci dari faktur penjualan. Alat
pelabelan Kecerdasan Dokumen● REST API
SDK
pustaka klien● Kontainer Docker Kecerdasan Dokumen
Model tanda terima Pemrosesan data otomatis dan ekstraksi informasi kunci dari tanda terima penjualan. Alat
pelabelan Kecerdasan Dokumen● REST API
SDK
pustaka klien● Kontainer Docker Kecerdasan Dokumen
Model dokumen identitas (ID) Pemrosesan data otomatis dan ekstraksi informasi kunci dari SIM dan paspor internasional AS. Alat
pelabelan Kecerdasan Dokumen● REST API
SDK
pustaka klien● Kontainer Docker Kecerdasan Dokumen
Model kartu nama Pemrosesan data otomatis dan ekstraksi informasi kunci dari kartu nama. Alat
pelabelan Kecerdasan Dokumen● REST API
SDK
pustaka klien● Kontainer Docker Kecerdasan Dokumen

Privasi dan keamanan data

Seperti semua layanan AI, pengembang yang menggunakan layanan Kecerdasan Dokumen harus mengetahui kebijakan Microsoft pada data pelanggan. Lihat halaman Data, privasi, dan keamanan kami untuk Kecerdasan Dokumen.

Langkah berikutnya

  • Pilih model Kecerdasan Dokumen.

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan alat Pelabelan Sampel Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.