Menyusun model kustom v3.0 | Pratinjau

Catatan

Panduan cara ini mereferensikan Form Recognizer v3.0 (pratinjau). Untuk menggunakan Form Recognizer v2.1 (GA), lihat Menyusun model kustom v2.1.

Model yang disusun dibuat dengan mengambil koleksi model kustom dan menetapkannya ke satu model yang mencakup jenis formulir Anda. Anda dapat menetapkan hingga 100 model kustom terlatih ke satu ID model tersusun. Ketika dokumen diserahkan ke model yang disusun, layanan melakukan langkah klasifikasi untuk memutuskan model kustom mana yang secara akurat mewakili formulir yang disajikan untuk analisis. Model tersusun berguna ketika Anda telah melatih beberapa model dan ingin mengelompokkannya untuk menganalisis jenis bentuk yang serupa. Misalnya, model yang Anda buat mungkin menyertakan model khusus yang dilatih untuk menganalisis pesanan pembelian pasokan, peralatan, dan furnitur Anda. Alih-alih secara manual mencoba memilih model yang sesuai, Anda dapat menggunakan model yang disusun untuk menentukan model kustom yang sesuai untuk setiap analisis dan ekstraksi.

Untuk mempelajari selengkapnya, lihat Menyusun model kustom.

Pada artikel ini, Anda akan mempelajari cara membuat dan menggunakan model kustom yang disusun untuk menganalisis formulir dan dokumen Anda.

Prasyarat

Sebelum memulai, Anda akan memerlukan hal-hal berikut:

  • Langganan Azure. Anda dapat membuat langganan Azure gratis.

  • Instans Form Recognizer. Setelah Anda memiliki langganan Azure Anda, buat sumber daya Form Recognizer di portal Microsoft Azure untuk mendapatkan kunci dan titik akhir Anda. Jika Anda memiliki Form Recognizer yang sudah ada, langsung buka halaman sumber daya. Untuk mencoba layanan, Anda dapat menggunakan tingkat harga gratis (F0), lalu meningkatkannya ke tingkat berbayar untuk produksi.

    1. Setelah sumber daya disebarkan, pilih Buka sumber daya.

    2. Salin nilai Kunci dan Titik Akhir dari portal Microsoft Azure dan tempelkan di lokasi yang nyaman, seperti Microsoft Notepad. Anda akan memerlukan kunci dan titik akhir sumber daya yang Anda buat untuk menghubungkan aplikasi ke API Form Recognizer.

    Foto diam yang menunjukkan cara mengakses kunci sumber daya dan URL titik akhir.

    Tip

    Untuk informasi selengkapnya, lihat membuat sumber Form Recognizer.

  • Akun Azure storage. Jika Anda tidak tahu cara membuat akun penyimpanan Azure, ikuti mulai cepat Azure Storage untuk portal Azure. Untuk mencoba layanan, Anda dapat menggunakan tingkat harga gratis (F0), lalu meningkatkannya ke tingkat berbayar untuk produksi.

Membuat model kustom Anda

Pertama, Anda harus membuat satu set model kustom untuk dibuat. Anda dapat menggunakan Form Recognizer Studio, REST API, atau SDK pustaka klien. Langkah langkahnya adalah sebagai berikut:

Mengumpulkan himpunan data pelatihan Anda

Membangun model kustom dimulai dengan membuat himpunan data pelatihan Anda. Anda akan memerlukan minimal lima formulir lengkap dengan jenis yang sama untuk himpunan data sampel Anda. Formulir tersebut dapat dari berbagai jenis file dan berisi teks serta tulisan tangan. Formulir Anda harus memenuhi persyaratan input untuk Form Recognizer.

Tip

Ikuti tips tambahan ini untuk lebih mengoptimalkan himpunan data Anda untuk pelatihan:

  • Jika memungkinkan, gunakan dokumen PDF berbasis teks daripada dokumen berbasis gambar. PDF yang dipindai ditangani sebagai gambar.
  • Untuk formulir yang diisi, gunakan contoh yang semua bidangnya telah terisi.
  • Gunakan formulir dengan nilai berbeda di setiap bidang.
  • Jika gambar formulir Anda memiliki kualitas yang lebih rendah, gunakan kumpulan data yang lebih besar (10-15 gambar, misalnya).

Lihat Membuat kumpulan data pelatihan untuk kiat tentang cara mengumpulkan dokumen pelatihan Anda.

Mengunggah himpunan data pelatihan Anda

Saat mengumpulkan sekumpulan dokumen pelatihan, Anda harus mengunggah data pelatihan ke kontainer penyimpanan blob Azure.

Jika Anda ingin menggunakan data berlabel manual, Anda juga harus mengunggah file .labels.json dan .ocr.json yang sesuai dengan dokumen pelatihan Anda.

Melatih model kustom Anda

Saat Anda melatih model Anda dengan data berlabel, model menggunakan pembelajaran yang diawasi untuk mengekstrak nilai-nilai yang diminati, menggunakan formulir berlabel yang Anda berikan. Metode ini menghasilkan model yang berperforma lebih baik dan dapat menghasilkan model yang bekerja dengan bentuk kompleks atau formulir yang berisi nilai tanpa kunci.

Form Recognizer menggunakan API model tata letak bawaan untuk mempelajari ukuran dan posisi elemen teks cetak dan tulisan tangan yang diharapkan dan mengekstrak tabel. Kemudian menggunakan label yang ditentukan pengguna untuk mempelajari asosiasi kunci/nilai dan tabel dalam dokumen. Kami menyarankan agar Anda menggunakan lima formulir berlabel manual dengan jenis yang sama (struktur yang sama) untuk memulai dengan pelatihan model baru. Kemudian, tambahkan lebih banyak data berlabel, sesuai kebutuhan, untuk meningkatkan akurasi model. Azure Form Recognizer mengaktifkan pelatihan model untuk mengekstrak pasangan nilai kunci dan tabel menggunakan kemampuan pembelajaran yang diawasi.

Untuk membuat model kustom, Anda mulai dengan mengonfigurasi proyek Anda:

  1. Dari beranda Studio, pilih Buat baru dari kartu model Kustom.

  2. Gunakan perintah ➕ Buat proyek untuk memulai wizard konfigurasi proyek baru.

  3. Masukkan detail proyek, pilih langganan dan sumber daya Azure, dan kontainer penyimpanan Azure Blob yang berisi data Anda.

  4. Tinjau dan kirimkan pengaturan Anda untuk membuat proyek.

Animasi yang menunjukkan membuat proyek kustom di Studio Form Recognizer.

Saat membuat model kustom, Anda mungkin perlu mengekstrak kumpulan data dari dokumen Anda. Koleksi mungkin muncul salah satu dari dua format. Menggunakan tabel sebagai pola visual:

  • Jumlah dinamis atau variabel nilai (baris) untuk set bidang (kolom) tertentu

  • Kumpulan nilai tertentu untuk set bidang (kolom) tertentu (kolom dan/atau baris)

Lihat Form Recognizer Studio: pelabelan sebagai tabel

Membuat model yang disusun

Catatan

Operasi create compose model hanya tersedia untuk model kustom yang dilatih dengan label. Mencoba menyusun model yang tidak berlabel akan menghasilkan kesalahan.

Dengan operasi buat penyusunan model, Anda dapat menetapkan hingga 100 model kustom yang dilatih ke satu ID model. Saat menganalisis dokumen dengan model yang disusun, Form Recognizer pertama-tama mengklasifikasikan formulir yang Anda kirimkan, lalu memilih model penetapan pencocokan terbaik, dan mengembalikan hasil untuk model tersebut. Operasi ini berguna jika formulir masuk menjadi bagian dari salah satu templat.

Setelah proses pelatihan berhasil diselesaikan, Anda dapat mulai membangun model yang disusun. Berikut adalah langkah-langkah untuk membuat dan menggunakan model yang disusun:

Kumpulkan ID model Anda

Saat Anda melatih model menggunakan Form Recognizer Studio, ID model terletak di menu model di bawah proyek:

Cuplikan layar: jendela konfigurasi model di Form Recognizer Studio.

Mengelola model kustom Anda

  1. Pilih proyek model kustom.

  2. Di proyek, pilih item menu Models.

  3. Dari daftar model yang dihasilkan, pilih model yang ingin Anda tulis.

  4. Pilih tombol Susun dari pojok kiri atas.

  5. Di jendela pop-up, beri nama model baru yang Anda susun, dan pilih Susun.

  6. Setelah operasi selesai, model baru yang Anda susun akan muncul dalam daftar.

  7. Setelah model siap, gunakan perintah Uji untuk memvalidasinya dengan dokumen pengujian Anda dan amati hasilnya.

Analisis dokumen

Operasi Analisis formulir kustom mengharuskan Anda memberikan modelID dalam panggilan ke Form Recognizer. Anda harus memberikan ID model yang disusun untuk modelID parameter dalam aplikasi Anda.

Cuplikan layar ID model yang disusun di Studio Form Recognizer.

Mengelola model yang telah Anda susun

Anda dapat mengelola model kustom Anda sepanjang siklus hidup:

  • Menguji dan memvalidasi dokumen baru.
  • Unduh model Anda untuk digunakan dalam aplikasi Anda.
  • Hapus model Anda saat siklus hidupnya selesai.

Cuplikan layar model yang disusun di Studio Form Recognizer

Langkah berikutnya

Coba salah satu mulai cepat Form Recognizer kami:

C#