Bagikan melalui


Sebelum membuat model klasifikasi kategori

Sebelum Anda membuat model klasifikasi kategori, pastikan data Anda masuk Microsoft Dataverse dan terstruktur dalam format yang benar.

Prasyarat

  • Model ini mengharuskan data pelatihan tersedia dalam tabel Dataverse . Dukungan untuk data dari sumber eksternal saat ini tidak tersedia.

  • Pastikan administrator telah menetapkan peran keamanan dengan hak istimewa Baca untuk tabel yang memiliki data pelatihan.

  • Pastikan Anda memiliki izin yang sesuai untuk membuat tabel di lingkungan Anda Power Platform . Anda dapat menggunakan peran keamanan bawaan Penyesuai Sistem atau Administrator Sistem.

Bahasa yang didukung

AI Builder Klasifikasi kategori mendukung bahasa berikut. Jika Anda mencoba mengklasifikasikan teks dalam bahasa lain, model Anda mungkin tidak berfungsi dengan benar.

  • Bahasa Inggris
  • Bahasa Prancis
  • Bahasa Jerman
  • Bahasa Italia
  • Bahasa Spanyol
  • Bahasa Portugis

Persiapan data

Data pelatihan yang Dataverse digunakan untuk melatih model dari tabel harus sesuai dengan yang berikut:

  • Simpan teks dan tag sebagai dua kolom dalam tabel yang sama. Setiap baris harus memiliki data di kolom Teks .

  • Anda dapat memberikan satu atau beberapa tag ke data di baris yang sama di kolom Teks . Anda juga dapat membiarkan kolom Tag kosong.

  • Jika Anda telah mengidentifikasi beberapa tag dalam sampel teks, berikan tag sebagai teks terbatas di bidang Tag . Saat ini, karakter koma (,), titik koma (;), dan tab adalah pemisah yang didukung.

    SMS Tag
    Kamar bersih dan tenang yang bagus dengan sarapan gratis untuk dibawa pulang Ruang makan
    Kamar kecil tapi diatur dengan baik yang nyaman Ruang
    Saya suka pemandangan dari lantai 13 (tidak ada)
  • Pastikan untuk memiliki minimal 10 sampel teks yang berbeda untuk setiap tag yang akan diekstraksi. Tag dengan kurang dari 10 sampel tidak akan dilatih. Dalam contoh sebelumnya, seharusnya ada minimal 10 baris masing-masing yang telah ditandai dengan tag Makan dan Kamar .

  • Jika Ruang telah ditandai dalam kurang dari 10 baris dalam data, data tersebut akan diabaikan. Model tidak akan dilatih untuk mengategorikan data untuk tag tersebut.

  • Untuk setiap tag yang digunakan, berikan minimal 10 sampel teks yang tidak digunakan.

    SMS Tag
    Kamar bersih dan tenang dengan sarapan gratis Ruang
    Kamar kecil tapi diatur dengan baik yang nyaman Ruang
    (tidak ada) Ruang

    Jika semua baris dalam tabel ditandai ke Ruang, dan tidak ada baris—atau kurang dari 10 baris—yang telah ditandai ke label lain, model akan gagal dalam proses pelatihan.

  • Tabel harus memiliki setidaknya dua tag, dan masing-masing harus memiliki 10 sampel teks.

  • Anda dapat menentukan hingga 200 tag berbeda. Setiap tag adalah kategori yang akan diidentifikasi dan diekstraksi dari teks yang diberikan.

  • Setiap sampel data teks harus memiliki kurang dari 5.000 karakter.

Jika Anda tidak memiliki data pelatihan dan ingin mencoba AI Builder klasifikasi kategori, ikuti petunjuk ini untuk menggunakan data sampel.

Contoh format data pelatihan

Bagian ini memberikan contoh format data pelatihan dalam Dataverse tabel.

Kolom Tipe data Ukuran
Komentar SMS 3,000
Tag SMS 100



Komentar Tag
Selama saya tinggal, saya benar-benar diabaikan. Staf gagal menangkap saya
bercita-cita dan memiliki ISK. Saya juga menderita pneumonia.
Perhatian
Saya terlihat segera setelah tiba setiap kali dan semua staf, perawat, dokter,
Dan ahli anestesi sangat membantu. Tampaknya ada rasa kerja tim yang baik.
Staf, Check-in
Peralatan itu tampak mutakhir. Asisten perawat / perawatan kesehatan tampak
Cukup peduli.
Fasilitas, Staf

Catatan

Jika Anda tidak memiliki data pelatihan sendiri dan ingin mencoba AI Builder klasifikasi kategori, Anda dapat memulai dengan mengunduh data sampel untuk model klasifikasi kategori. Informasi selengkapnya: Menggunakan data sampel untuk melakukan klasifikasi kategori

Mengimpor data Anda ke Dataverse

Karena data pelatihan untuk model klasifikasi kategori harus tersedia sebagai Dataverse tabel, mari kita mulai dengan menyiapkan data dalam Dataverse tabel.

Dataverse Termasuk serangkaian konektor yang kuat untuk membantu Anda mengimpor data dari banyak sumber. Informasi selengkapnya: Menambahkan data ke tabel dengan Microsoft Dataverse menggunakan Power Query.

Sebagai contoh, mari kita lihat cara mengimpor data pelatihan dari buku kerja Excel. Contoh ini menggunakan file yang berisi apa yang diperlihatkan dalam tabel berikut.

Id Tag SMS
1 Makan malam Sarapan agak merepotkan.
2 Ruang makan Kamar bersih dan tenang yang bagus dengan sarapan gratis untuk dibawa pulang.
3 Kamar, Makan, Lokasi Staf yang kami tangani sangat ramah dan membantu. Lorong dan kamar kami bersih dan nyaman. Sarapan (termasuk) adalah muffin dan bagel.
4 Lokasi, Tempat Makan Daerah sekitarnya penuh dengan bar dan restoran. 
5 Service Staf sangat hormat.

Dalam contoh, tag dipisahkan dengan koma (,). Sebagai alternatif, Anda dapat menggunakan karakter titik koma (;) atau tab.

  1. Masuk ke Power Apps.

  2. Pilih lingkungan tempat Anda ingin bekerja.

    Cuplikan layar memilih lingkungan Anda.

  3. Pilih>Tabel Data.

  4. Pilih tabel Anda. Jika Anda belum memiliki tabel, ikuti langkah-langkah dalam Membuat tabel kustom.

  5. Pilih Data>Dapatkan data>Dapatkan data dari Excel dari pita tabel yang dipilih.

    Cuplikan layar memperlihatkan Dapatkan data dari Excel.

  6. Pada layar Impor data , pilih file Excel yang memiliki data yang dirujuk di bagian Contoh format data pelatihan sebelumnya di topik ini, lalu pilih Unggah.

    Cuplikan layar mengunggah file Excel.

  7. Untuk meninjau pemetaan bidang di Pemetaan kolom untuk Kategori Teks layar, pilih Petakan Kolom.

    Cuplikan layar memperlihatkan pemetaan kolom untuk kategori teks.

    Sisi kiri mencantumkan semua kolom yang ditentukan dalam tabel. Daftar dropdown di sebelah kanan menunjukkan kolom yang tersedia di file Excel.

    Petakan kolom Tag, Teks, dan Id dari Excel ke kolom masing-masing dalam tabel.

  8. Setelah Anda memetakan kolom, kembali ke langkah impor dengan memilih Simpan perubahan di sudut kanan atas.

    Cuplikan layar menyimpan perubahan Anda.

  9. Setelah Anda melihat status Pemetaan berhasil, mulailah proses impor dengan memilih Impor di sudut kanan atas.

    Cuplikan layar memulai proses impor dengan memilih tombol Impor.

  10. Proses impor mungkin memerlukan waktu beberapa menit, bergantung pada volume data yang diimpor. Setelah beberapa menit, refresh tab Data tabel untuk menemukan semua rekaman yang diimpor dari file Excel.

Anda sekarang siap untuk melanjutkan ke langkah berikutnya.

Langkah selanjutnya

Membuat model klasifikasi kategori