Menyusun model kustom v3.0 | Pratinjau
Catatan
Panduan cara ini mereferensikan Form Recognizer v3.0 (pratinjau). Untuk menggunakan Form Recognizer v2.1 (GA), lihat Menyusun model kustom v2.1.
Model yang disusun dibuat dengan mengambil koleksi model kustom dan menetapkannya ke satu model yang mencakup jenis formulir Anda. Anda dapat menetapkan hingga 100 model kustom terlatih ke satu ID model tersusun. Ketika dokumen diserahkan ke model yang disusun, layanan melakukan langkah klasifikasi untuk memutuskan model kustom mana yang secara akurat mewakili formulir yang disajikan untuk analisis. Model tersusun berguna ketika Anda telah melatih beberapa model dan ingin mengelompokkannya untuk menganalisis jenis bentuk yang serupa. Misalnya, model yang Anda buat mungkin menyertakan model khusus yang dilatih untuk menganalisis pesanan pembelian pasokan, peralatan, dan furnitur Anda. Alih-alih secara manual mencoba memilih model yang sesuai, Anda dapat menggunakan model yang disusun untuk menentukan model kustom yang sesuai untuk setiap analisis dan ekstraksi.
Untuk mempelajari selengkapnya, lihat Menyusun model kustom.
Pada artikel ini, Anda akan mempelajari cara membuat dan menggunakan model kustom yang disusun untuk menganalisis formulir dan dokumen Anda.
Prasyarat
Sebelum memulai, Anda akan memerlukan hal-hal berikut:
Langganan Azure. Anda dapat membuat langganan Azure gratis.
Instans Form Recognizer. Setelah Anda memiliki langganan Azure Anda, buat sumber daya Form Recognizer di portal Microsoft Azure untuk mendapatkan kunci dan titik akhir Anda. Jika Anda memiliki Form Recognizer yang sudah ada, langsung buka halaman sumber daya. Untuk mencoba layanan, Anda dapat menggunakan tingkat harga gratis (F0), lalu meningkatkannya ke tingkat berbayar untuk produksi.
Setelah sumber daya disebarkan, pilih Buka sumber daya.
Salin nilai Kunci dan Titik Akhir dari portal Microsoft Azure dan tempelkan di lokasi yang nyaman, seperti Microsoft Notepad. Anda akan memerlukan kunci dan titik akhir sumber daya yang Anda buat untuk menghubungkan aplikasi ke API Form Recognizer.
Tip
Untuk informasi selengkapnya, lihat membuat sumber Form Recognizer.
Akun Azure storage. Jika Anda tidak tahu cara membuat akun penyimpanan Azure, ikuti mulai cepat Azure Storage untuk portal Azure. Untuk mencoba layanan, Anda dapat menggunakan tingkat harga gratis (F0), lalu meningkatkannya ke tingkat berbayar untuk produksi.
Membuat model kustom Anda
Pertama, Anda harus membuat satu set model kustom untuk dibuat. Anda dapat menggunakan Form Recognizer Studio, REST API, atau SDK pustaka klien. Langkah langkahnya adalah sebagai berikut:
- Kumpulkan himpunan data pelatihan Anda
- Upload himpunan pelatihan Anda ke penyimpanan blob Azure
- Latih model kustom Anda
Mengumpulkan himpunan data pelatihan Anda
Membangun model kustom dimulai dengan membuat himpunan data pelatihan Anda. Anda akan memerlukan minimal lima formulir lengkap dengan jenis yang sama untuk himpunan data sampel Anda. Formulir tersebut dapat dari berbagai jenis file dan berisi teks serta tulisan tangan. Formulir Anda harus memenuhi persyaratan input untuk Form Recognizer.
Tip
Ikuti tips tambahan ini untuk lebih mengoptimalkan himpunan data Anda untuk pelatihan:
- Jika memungkinkan, gunakan dokumen PDF berbasis teks daripada dokumen berbasis gambar. PDF yang dipindai ditangani sebagai gambar.
- Untuk formulir yang diisi, gunakan contoh yang semua bidangnya telah terisi.
- Gunakan formulir dengan nilai berbeda di setiap bidang.
- Jika gambar formulir Anda memiliki kualitas yang lebih rendah, gunakan kumpulan data yang lebih besar (10-15 gambar, misalnya).
Lihat Membuat kumpulan data pelatihan untuk kiat tentang cara mengumpulkan dokumen pelatihan Anda.
Mengunggah himpunan data pelatihan Anda
Saat mengumpulkan sekumpulan dokumen pelatihan, Anda harus mengunggah data pelatihan ke kontainer penyimpanan blob Azure.
Jika Anda ingin menggunakan data berlabel manual, Anda juga harus mengunggah file .labels.json dan .ocr.json yang sesuai dengan dokumen pelatihan Anda.
Melatih model kustom Anda
Saat Anda melatih model Anda dengan data berlabel, model menggunakan pembelajaran yang diawasi untuk mengekstrak nilai-nilai yang diminati, menggunakan formulir berlabel yang Anda berikan. Metode ini menghasilkan model yang berperforma lebih baik dan dapat menghasilkan model yang bekerja dengan bentuk kompleks atau formulir yang berisi nilai tanpa kunci.
Form Recognizer menggunakan API model tata letak bawaan untuk mempelajari ukuran dan posisi elemen teks cetak dan tulisan tangan yang diharapkan dan mengekstrak tabel. Kemudian menggunakan label yang ditentukan pengguna untuk mempelajari asosiasi kunci/nilai dan tabel dalam dokumen. Kami menyarankan agar Anda menggunakan lima formulir berlabel manual dengan jenis yang sama (struktur yang sama) untuk memulai dengan pelatihan model baru. Kemudian, tambahkan lebih banyak data berlabel, sesuai kebutuhan, untuk meningkatkan akurasi model. Azure Form Recognizer mengaktifkan pelatihan model untuk mengekstrak pasangan nilai kunci dan tabel menggunakan kemampuan pembelajaran yang diawasi.
Untuk membuat model kustom, Anda mulai dengan mengonfigurasi proyek Anda:
Dari beranda Studio, pilih Buat baru dari kartu model Kustom.
Gunakan perintah ➕ Buat proyek untuk memulai wizard konfigurasi proyek baru.
Masukkan detail proyek, pilih langganan dan sumber daya Azure, dan kontainer penyimpanan Azure Blob yang berisi data Anda.
Tinjau dan kirimkan pengaturan Anda untuk membuat proyek.
Saat membuat model kustom, Anda mungkin perlu mengekstrak kumpulan data dari dokumen Anda. Koleksi mungkin muncul salah satu dari dua format. Menggunakan tabel sebagai pola visual:
Jumlah dinamis atau variabel nilai (baris) untuk set bidang (kolom) tertentu
Kumpulan nilai tertentu untuk set bidang (kolom) tertentu (kolom dan/atau baris)
Membuat model yang disusun
Catatan
Operasi create compose model hanya tersedia untuk model kustom yang dilatih dengan label. Mencoba menyusun model yang tidak berlabel akan menghasilkan kesalahan.
Dengan operasi buat penyusunan model, Anda dapat menetapkan hingga 100 model kustom yang dilatih ke satu ID model. Saat menganalisis dokumen dengan model yang disusun, Form Recognizer pertama-tama mengklasifikasikan formulir yang Anda kirimkan, lalu memilih model penetapan pencocokan terbaik, dan mengembalikan hasil untuk model tersebut. Operasi ini berguna jika formulir masuk menjadi bagian dari salah satu templat.
Setelah proses pelatihan berhasil diselesaikan, Anda dapat mulai membangun model yang disusun. Berikut adalah langkah-langkah untuk membuat dan menggunakan model yang disusun:
- Kumpulkan ID model kustom Anda
- Kelola model kustom Anda
- Analisis dokumen
- Mengelola model yang telah Anda susun
Kumpulkan ID model Anda
Saat Anda melatih model menggunakan Form Recognizer Studio, ID model terletak di menu model di bawah proyek:
Mengelola model kustom Anda
Pilih proyek model kustom.
Di proyek, pilih item menu
Models.Dari daftar model yang dihasilkan, pilih model yang ingin Anda tulis.
Pilih tombol Susun dari pojok kiri atas.
Di jendela pop-up, beri nama model baru yang Anda susun, dan pilih Susun.
Setelah operasi selesai, model baru yang Anda susun akan muncul dalam daftar.
Setelah model siap, gunakan perintah Uji untuk memvalidasinya dengan dokumen pengujian Anda dan amati hasilnya.
Analisis dokumen
Operasi Analisis formulir kustom mengharuskan Anda memberikan modelID dalam panggilan ke Form Recognizer. Anda harus memberikan ID model yang disusun untuk modelID parameter dalam aplikasi Anda.
Mengelola model yang telah Anda susun
Anda dapat mengelola model kustom Anda sepanjang siklus hidup:
- Menguji dan memvalidasi dokumen baru.
- Unduh model Anda untuk digunakan dalam aplikasi Anda.
- Hapus model Anda saat siklus hidupnya selesai.
Langkah berikutnya
Coba salah satu mulai cepat Form Recognizer kami:


