Pengujian batch dengan satu set contoh ungkapan

Penting

LUIS akan dihentikan pada 1 Oktober 2025 dan mulai 1 April 2023 Anda tidak akan dapat membuat sumber daya LUIS baru. Sebaiknya migrasikan aplikasi LUIS Anda ke pemahaman bahasa percakapan untuk mendapatkan manfaat dari dukungan produk berkelanjutan dan kemampuan multibahasa.

Pengujian batch memvalidasi versi terlatih aktif Anda untuk mengukur akurasi prediksinya. Pengujian batch membantu Anda melihat keakuratan setiap niat dan entitas dalam versi aktif Anda. Tinjau hasil pengujian batch untuk mengambil tindakan yang tepat guna meningkatkan akurasi, seperti menambahkan lebih banyak contoh ungkapan ke niat jika aplikasi Anda seringkali gagal mengidentifikasi maksud yang benar atau memberi label entitas dalam ungkapan.

Mengelompokkan data untuk pengujian batch

Penting bahwa ungkapan yang digunakan untuk pengujian batch adalah hal yang baru untuk LUIS. Jika Anda memiliki kumpulan data ungkapan, bagilah ungkapan menjadi tiga kumpulan: contoh ungkapan yang ditambahkan ke niat, ungkapan yang diterima dari titik akhir yang dipublikasikan, dan ungkapan yang digunakan untuk menguji LUIS setelah dilatih.

File JSON batch yang Anda gunakan harus menyertakan ungkapan dengan entitas pembelajaran mesin tingkat atas yang diberi label termasuk posisi awal dan akhir. Ungkapan tidak boleh menjadi bagian dari contoh yang sudah ada di aplikasi. Itu harus berupa ungkapan yang ingin Anda prediksi secara positif untuk niat dan entitas.

Anda dapat memisahkan pengujian menurut niat dan/atau entitas atau memiliki semua pengujian (hingga 1000 ungkapan) dalam file yang sama.

Kesalahan umum mengimpor batch

Jika Anda mengalami kesalahan saat mengunggah file batch ke LUIS, periksa masalah umum berikut:

  • Lebih dari 1.000 ungkapan dalam file batch
  • Objek JSON ungkapan yang tidak memiliki properti entitas. Properti ini bisa menjadi array kosong.
  • Kata-kata berlabel dalam beberapa entitas
  • Label entitas dimulai atau diakhiri pada spasi.

Memperbaiki kesalahan batch

Jika ada kesalahan dalam pengujian batch, Anda bisa menambahkan lebih banyak ungkapan ke niat, dan/atau memberi label lebih banyak ungkapan dengan entitas untuk membantu LUIS membuat diskriminasi di antara niat. Jika Anda telah menambahkan ungkapan, dan melabelinya, dan masih mendapatkan kesalahan prediksi dalam pengujian batch, pertimbangkan untuk menambahkan fitur daftar frasa dengan kosakata khusus domain untuk membantu LUIS belajar lebih cepat.

Pengujian batch menggunakan portal LUIS

Mengimpor dan melatih aplikasi contoh

Mengimpor aplikasi yang pengambil pesanan pizza seperti 1 pepperoni pizza on thin crust.

  1. Unduh dan simpan file JSON aplikasi.

  2. Masuk ke Portal LUIS, dan pilih Langganan dan Sumber daya penulisan untuk melihat aplikasi yang ditetapkan ke sumber daya penulisan tersebut.

  3. Pilih panah di samping Aplikasi baru dan klik Impor sebagai JSON untuk mengimpor JSON ke aplikasi baru. Beri nama aplikasi Pizza app.

  4. Pilih Latih di pojok kanan atas navigasi untuk melatih aplikasi.

Peran dalam pengujian batch

Perhatian

Peran entitas tidak didukung dalam pengujian batch.

File uji batch

Contoh JSON menyertakan satu ungkapan dengan entitas berlabel untuk mengilustrasikan seperti apa file pengujian. Dalam pengujian Anda sendiri, Anda harus memiliki banyak ungkapan dengan niat yang benar dan entitas pembelajaran mesin yang diberi label.

  1. Buat pizza-with-machine-learned-entity-test.json dalam editor teks atau unduh.

  2. Dalam file batch berformat JSON, tambahkan ungkapan dengan Niat yang ingin Anda prediksi dalam pengujian.

    [
        {
            "text": "I want to pick up 1 cheese pizza",
            "intent": "ModifyOrder",
            "entities": [
                {
                    "entity": "Order",
                    "startPos": 18,
                    "endPos": 31
                },
                {
                    "entity": "ToppingList",
                    "startPos": 20,
                    "endPos": 25
                }
            ]
        }
    ]
    

Jalankan batch

  1. Pilih Uji di bar navigasi atas.

  2. Pilih Panel pengujian batch di panel sisi kanan.

    Tautan Pengujian Batch

  3. Pilih Impor. Pada kotak dialog yang muncul, pilih Pilih File dan cari file JSON dengan format JSON yang benar yang berisi tidak lebih dari 1.000 ungkapan untuk diuji.

    Kesalahan impor dilaporkan dalam bilah pemberitahuan merah di bagian atas browser. Saat impor memiliki kesalahan, himpunan data tidak akan dibuat. Untuk informasi selengkapnya, lihat Kesalahan umum.

  4. Pilih lokasi file dari file pizza-with-machine-learned-entity-test.json.

  5. Beri nama himpunan data pizza test dan pilih Selesai.

  6. Pilih tombol Jalankan.

  7. Setelah uji batch selesai, Anda dapat melihat kolom berikut:

    Kolom Deskripsi
    Provinsi Status pengujian. Melihat hasil hanya terlihat setelah pengujian selesai.
    Nama Nama yang Anda berikan untuk pengujian.
    Ukuran Jumlah pengujian dalam file uji ini.
    Terakhir Dijalankan Tanggal terakhir menjalankan file uji batch ini.
    Hasil terakhir Jumlah prediksi yang berhasil dalam pengujian.
  8. Untuk melihat hasil pengujian yang terperinci, pilih Lihat hasil.

    Tip

    • Memilih Unduh akan mengunduh file yang sama dengan yang Anda unggah.
    • Jika Anda melihat uji batch gagal, setidaknya satu niat ungkapan tidak cocok dengan prediksi.

Tinjau hasil batch untuk niat

Untuk meninjau hasil uji batch, pilih Lihat hasil. Hasil tes menunjukkan secara grafis bagaimana ungkapan tes diprediksi terhadap versi aktif.

Bagan batch menampilkan empat kuadran hasil. Di sebelah kanan bagan ada filter. Filter berisi niat dan entitas. Saat Anda memilih bagian bagan atau titik di dalam bagan, ungkapan terkait ditampilkan di bawah bagan.

Saat mengarahkan kursor ke bagan, roda mouse dapat memperbesar atau memperkecil tampilan di bagan. Ini berguna ketika ada banyak titik pada bagan yang dikelompokkan bersama.

Bagan berada di empat kuadran, dengan dua bagian ditampilkan dengan warna merah.

  1. Pilih niat ModifyOrder dalam daftar filter. Ungkapan tersebut diprediksi sebagai True Positive yang berarti ungkapan tersebut berhasil sesuai dengan prediksi positifnya yang tercantum dalam file batch.

    Ucapan berhasil mencocokkan prediksi positifnya

    Tanda centang hijau di daftar filter juga menunjukkan keberhasilan pengujian untuk setiap niat. Semua niat lainnya dicantumkan dengan skor positif 1/1 karena ungkapan diuji terhadap setiap maksud, sebagai uji negatif untuk maksud apa pun yang tidak tercantum dalam uji batch.

  2. Pilih niat Konfirmasi. Niat ini tidak tercantum dalam uji batch sehingga ini adalah uji negatif dari ungkapan yang tercantum dalam uji batch.

    Ucapan berhasil diprediksi negatif untuk niat yang tidak terdaftar dalam file batch

    Uji negatif berhasil, seperti yang dicatat dengan teks hijau di filter, dan kisi-kisi.

Tinjau hasil uji batch untuk entitas

Entitas ModifyOrder, sebagai entitas mesin dengan subentitas, ditampilkan jika entitas tingkat atas cocok dan bagaimana subentitas diprediksi.

  1. Pilih entitas ModifyOrder di daftar filter, lalu pilih lingkaran di kisi.

  2. Prediksi entitas ditampilkan di bawah diagram. Layar mencakup garis solid untuk prediksi yang sesuai dengan ekspektasi dan garis putus-putus untuk prediksi yang tidak sesuai dengan ekspektasi.

    Induk entitas berhasil diprediksi dalam file batch

Memfilter hasil bagan

Untuk memfilter bagan menurut niat atau entitas tertentu, pilih niat atau entitas di panel pemfilteran sisi kanan. Titik data dan pembaruan distribusinya dalam grafik sesuai dengan pilihan Anda.

Hasil Uji Batch yang Divisualisasikan

Contoh hasil bagan

Bagan di portal LUIS, Anda dapat melakukan tindakan berikut:

Menampilkan data ungkapan titik tunggal

Pada diagram, arahkan kursor ke titik data untuk melihat skor kepastian prediksinya. Pilih titik data untuk mengambil ungkapan yang sesuai dalam daftar ungkapan di bagian bawah halaman.

Ungkapan yang dipilih

Menampilkan data bagian

Pada bagan empat bagian, pilih nama bagian, seperti Positif Palsu di kanan atas bagan. Di bawah bagan, semua ungkapan di bagian itu ditampilkan di bawah bagan dalam daftar.

Ungkapan yang dipilih menurut bagian

Pada gambar sebelumnya, ungkapan switch on diberi label dengan maksud TurnAllOn, tetapi menerima prediksi dari niat Tidak Ada. Ini merupakan indikasi bahwa niat TurnAllOn membutuhkan lebih banyak contoh ungkapan untuk membuat prediksi yang diharapkan.

Dua bagian grafik berwarna merah menunjukkan ungkapan yang tidak sesuai dengan prediksi yang diharapkan. Ini menunjukkan ungkapan yang LUIS membutuhkan lebih banyak pelatihan.

Dua bagian grafik berwarna hijau memang cocok dengan prediksi yang diharapkan.

Langkah berikutnya

Jika pengujian menunjukkan bahwa aplikasi LUIS Anda tidak mengenali niat dan entitas yang benar, Anda dapat bekerja untuk meningkatkan performa aplikasi LUIS Anda dengan melabeli lebih banyak ungkapan atau menambahkan fitur.