Mulai Cepat: Menyusun detektor objek dengan situs web Custom Vision

Dalam mulai cepat ini, Anda akan mempelajari cara menggunakan situs web Custom Vision untuk membuat, melatih, dan menguji model pendeteksi objek. Setelah membuat model, Anda dapat mengujinya dengan gambar baru dan akhirnya mengintegrasikannya ke dalam aplikasi pengenalan gambar Anda sendiri.

Jika Anda tidak memiliki langganan Azure, buat akun gratis sebelum Anda memulai.

Prasyarat

  • Satu kumpulan gambar untuk melatih model detektor Anda. Anda dapat menggunakan kumpulan gambar sampel di GitHub. Atau, Anda dapat memilih gambar Anda sendiri menggunakan tips di bawah ini.

Buat sumber daya Custom Vision

Untuk menggunakan Layanan Tampilan Kustom, Anda harus membuat sumber daya Pelatihan dan Prediksi Tampilan Kustom di Azure. Untuk melakukannya di portal Microsoft Azure, isi jendela dialog di halaman Buat Visi Kustom untuk membuat sumber daya Pelatihan dan Prediksi.

Membuat proyek baru

Di browser web Anda, navigasikan ke halaman web Custom Visiondan pilih Masuk. Masuk dengan akun yang sama dengan yang Anda gunakan untuk masuk ke portal Microsoft Azure.

Gambar halaman masuk

  1. Untuk membuat proyek pertama Anda, pilih Proyek Baru. Kotak dialog Buat proyek baru akan muncul.

    Kotak dialog proyek baru memiliki bidang untuk nama, deskripsi, dan domain.

  2. Masukkan nama dan deskripsi untuk proyek. Pilih Grup Sumber Daya. Jika akun masuk Anda terkait dengan akun Azure, dropdown Grup Sumber Daya akan menampilkan semua Grup Sumber Daya Azure Anda yang menyertakan Sumber Daya Layanan Custom Vision.

    Catatan

    Jika tidak ada grup sumber daya yang tersedia, harap konfirmasikan bahwa Anda telah masuk customvision.ai dengan akun yang sama seperti yang Anda gunakan untuk masuk ke portal Microsoft Azure. Juga, harap konfirmasikan bahwa Anda telah memilih "Direktori" yang sama di situs web Custom Vision sebagai direktori di portal Microsoft Azure tempat sumber daya Custom Vision Anda berada. Di kedua situs, Anda dapat memilih direktori Anda dari menu akun drop-down di sudut kanan atas layar.

  3. Pilih Deteksi Objek di bawah Jenis Proyek.

  4. Selanjutnya, pilih salah satu domain yang tersedia. Setiap domain mengoptimalkan detektor untuk jenis gambar tertentu, seperti yang dijelaskan dalam tabel berikut ini. Anda akan dapat mengubah domain nanti jika Anda mau.

    Domain Tujuan
    Umum Dioptimalkan untuk berbagai tugas deteksi objek. Jika tidak ada domain lain yang sesuai, atau Anda tidak yakin domain mana yang akan dipilih, pilih domain Generik.
    Logo Dioptimalkan untuk menemukan logo merek dalam gambar.
    Produk di rak Dioptimalkan untuk mendeteksi dan mengklasifikasikan produk di rak.
    Domain ringkas Dioptimalkan untuk batasan klasifikasi real time pada perangkat seluler. Model yang dihasilkan oleh domain ringkas dapat diekspor untuk berjalan secara lokal.
  5. Terakhir, pilih Buat proyek.

Pilih gambar pelatihan

Seminimal mungkin, sebaiknya gunakan setidaknya 30 gambar per tag dalam set latihan awal. Anda juga ingin mengumpulkan beberapa gambar tambahan untuk menguji model Anda setelah dilatih.

Untuk melatih model Anda secara efektif, gunakan gambar dengan variasi visual. Pilih gambar yang bervariasi menurut:

  • sudut kamera
  • pencahayaan
  • latar belakang
  • gaya visual
  • subjek individu/kelompok
  • ukuran
  • jenis

Selain itu, pastikan semua gambar latihan Anda memenuhi kriteria berikut:

  • Format .jpg, .png, .bmp, atau .gif
  • tidak lebih besar dari ukuran 6 MB (4 MB untuk gambar prediksi)
  • tidak kurang dari 256 piksel di tepi terpendek; setiap gambar yang lebih pendek dari ini akan secara otomatis ditingkatkan oleh Custom Vision Service

Catatan

Apakah Anda memerlukan serangkaian gambar yang lebih luas untuk menyelesaikan latihan Anda? Trove, proyek Microsoft Garage, memungkinkan Anda mengumpulkan dan membeli serangkaian gambar untuk tujuan pelatihan. Setelah mengumpulkan gambar, Anda dapat mengunduhnya lalu mengimpornya ke proyek Custom Vision dengan cara yang biasa. Kunjungi halaman Trove untuk mempelajari lebih lanjut.

Mengunggah dan menandai gambar

Di bagian ini, Anda akan mengunggah dan menandai gambar secara manual untuk membantu melatih detektor.

  1. Untuk menambahkan gambar, pilih Tambahkan gambar lalu pilih Telusuri file lokal. Pilih Buka untuk mengunggah gambar.

    Kontrol tambahkan gambar ditampilkan di kiri atas, dan sebagai tombol di tengah bawah.

  2. Anda akan melihat gambar yang diunggah di bagian Untagged di UI. Langkah selanjutnya adalah menandai objek yang Anda inginkan untuk dikenali secara manual. Klik gambar pertama untuk membuka jendela dialog tagging.

    Gambar diunggah, di bagian Tidak Di-tag

  3. Klik dan seret persegi panjang di sekitar objek di gambar Anda. Lalu, masukkan nama tag baru dengan tombol + , atau pilih tag yang sudah ada dari daftar drop-down. Penting untuk menge-tag setiap contoh objek yang ingin Anda deteksi, karena detektor menggunakan area latar belakang yang tidak di-tag sebagai contoh negatif dalam pelatihan. Bila Anda sudah selesai menge-tag, klik panah di sebelah kanan untuk menyimpan tag Anda dan beralih ke gambar berikutnya.

    Menandai objek dengan pilihan persegi panjang

Untuk mengunggah kumpulan gambar lain, kembali ke bagian atas bagian ini dan ulangi langkah-langkahnya.

Latih detektor

Untuk melatih model detektor, pilih tombol Latih. Detektor menggunakan semua gambar saat ini dan tag mereka untuk membuat model yang mengidentifikasi setiap objek yang di-tag.

Tombol latih di kanan atas toolbar header halaman web

Proses pelatihan ini hanya akan memakan waktu beberapa menit. Selama waktu ini, informasi tentang proses pelatihan ditampilkan di tab Performa.

Jendela browser dengan dialog pelatihan di bagian utama

Mengevaluasi detektor

Setelah pelatihan selesai, performa model dihitung dan ditampilkan. Layanan Custom Vision menggunakan gambar yang Anda kirimkan untuk pelatihan untuk menghitung presisi, pengenalan, dan rata-rata presisi. Presisi dan pengenalan adalah dua pengukuran yang berbeda dari efektivitas detektor:

  • Presisi menunjukkan pecahan klasifikasi yang diidentifikasi yang benar. Misalnya, jika model mengidentifikasi 100 gambar sebagai anjing, dan 99 di antaranya sebenarnya adalah anjing, maka presisinya adalah 99%.
  • Pengenalan menunjukkan pecahan klasifikasi aktual yang diidentifikasi dengan benar. Misalnya, jika sebenarnya ada 100 gambar apel, dan model mengidentifikasi 80 sebagai apel, pengenalan akan menjadi 80%.
  • Rata-rata presisi adalah nilai rata-rata presisi rata-rata (AP). AP adalah area di bawah kurva presisi/pengenalan (presisi diplot terhadap pengenalan untuk setiap prediksi yang dibuat).

Hasil pelatihan menunjukkan presisi dan pengenalan keseluruhan, dan rata-rata presisi.

Ambang probabilitas

Perhatikan penggeser Ambang Batas Probabilitas di panel kiri tab Kinerja. Ini adalah tingkat kepercayaan yang harus dimiliki prediksi agar dianggap benar (untuk tujuan menghitung presisi dan pengenalan).

Ketika Anda menafsirkan panggilan prediksi dengan ambang batas probabilitas yang tinggi, panggilan cenderung mengembalikan hasil dengan presisi tinggi dengan mengorbankan pengenalan—klasifikasi yang terdeteksi benar, tetapi banyak yang tetap tidak terdeteksi. Ambang probabilitas rendah melakukan sebaliknya—sebagian besar klasifikasi aktual terdeteksi, tetapi ada lebih banyak false positive dalam set itu. Dengan mengingat hal ini, Anda harus menetapkan ambang batas probabilitas sesuai dengan kebutuhan spesifik proyek Anda. Kemudian, ketika Anda menerima hasil prediksi di sisi klien, Anda harus menggunakan nilai ambang batas probabilitas yang sama seperti yang Anda gunakan di sini.

Ambang tumpang tindih

Penggeser Ambang Batas Tumpang Tindih berkaitan dengan seberapa benar prediksi objek harus dianggap "benar" dalam pelatihan. Ini mengatur tumpang tindih minimum yang diperbolehkan antara kotak batas objek yang diprediksi dan kotak batas yang dimasukkan pengguna yang sebenarnya. Jika kotak batas tidak tumpang tindih ke tingkat ini, prediksi tidak akan dianggap benar.

Mengelola perulangan pelatihan

Setiap kali Anda melatih detektor, Anda membuat perulangan baru dengan metrik performa yang diperbarui sendiri. Anda bisa menampilkan semua iterasi Anda di panel kiri tab Performa. Di panel kiri Anda juga akan menemukan tombol Hapus, yang bisa Anda gunakan untuk menghapus perulangan jika sudah usang. Saat Anda menghapus perulangan, Anda menghapus gambar apa pun yang secara unik terkait dengannya.

Lihat Menggunakan model Anda dengan API prediksi untuk mempelajari cara mengakses model terlatih Anda secara terprogram.

Langkah berikutnya

Dalam mulai cepat ini, Anda belajar cara membuat dan melatih model detektor gambar menggunakan situs web Custom Vision. Selanjutnya, dapatkan informasi lebih lanjut tentang proses berulang untuk meningkatkan model Anda.