Klasifikasi AutoML

Artikel
07/31/2023

Artikel ini menjelaskan komponen dalam perancang Azure Machine Learning.

Gunakan komponen ini untuk membuat model pembelajaran mesin yang didasarkan pada Klasifikasi AutoML.

Cara mengonfigurasi

Komponen ini membuat model klasifikasi pada data tabular.

Model ini memerlukan himpunan data pelatihan. Validasi dan himpunan data pengujian bersifat opsional.

AutoML membuat sejumlah alur secara paralel yang mencoba algoritma dan parameter yang berbeda untuk model Anda. Layanan ini berulang melalui algoritma ML yang dipasangkan dengan pilihan fitur, setiap perulangan menghasilkan model dengan skor pelatihan. Anda dapat memilih metrik yang Anda inginkan untuk dioptimalkan oleh model. Semakin baik skor untuk metrik yang dipilih, semakin baik model dianggap "sesuai" data Anda. Anda dapat menentukan kriteria keluar untuk eksperimen. Kriteria keluar akan menjadi model dengan skor pelatihan tertentu yang Anda inginkan untuk ditemukan AutoML. Ini akan berhenti setelah mencapai kriteria keluar yang ditentukan. Komponen ini kemudian akan menghasilkan model terbaik yang telah dihasilkan di akhir eksekusi untuk himpunan data Anda.

Tambahkan komponen Klasifikasi AutoML ke alur Anda.
Tentukan Kolom Target yang Ingin Anda keluarkan modelnya
Untuk klasifikasi, Anda juga dapat mengaktifkan pembelajaran mendalam.

Jika pembelajaran mendalam diaktifkan, validasi terbatas pada train_validation terpisah.

(Opsional) Tampilan pengaturan konfigurasi tambahan: setelan tambahan yang dapat Anda gunakan untuk mengontrol pekerjaan pelatihan dengan lebih baik. Jika tidak, pengaturan default diterapkan berdasarkan pilihan eksperimen dan data.

Konfigurasi tambahan	Deskripsi
Metrik utama	Metrik utama yang digunakan untuk mencetak model Anda. Pelajari selengkapnya tentang metrik model.
Model debug melalui dasbor AI yang Bertanggung Jawab	Buat dasbor AI yang Bertanggung Jawab untuk melakukan penilaian holistik dan penelusuran kesalahan model terbaik yang direkomendasikan. Ini termasuk wawasan seperti penjelasan model, penjelajah kewajaran dan performa, penjelajah data, dan analisis kesalahan model. Pelajari selengkapnya tentang cara membuat dasbor AI yang Bertanggung Jawab.
Algoritma yang diblokir	Pilih algoritme yang ingin Anda kecualikan dari pekerjaan pelatihan. Mengizinkan algoritma hanya tersedia untuk eksperimen SDK. Lihat algoritma yang didukung untuk setiap jenis tugas.
Kriteria keluar	Ketika salah satu kriteria ini terpenuhi, pekerjaan pelatihan dihentikan. Waktu kerja pelatihan (jam kerja) : Berapa lama untuk memungkinkan pekerjaan pelatihan berjalan. Ambang skor metrik: Skor metrik minimum untuk semua alur. Ini memastikan bahwa jika Anda memiliki metrik target yang ditentukan yang ingin Anda jangkau, Anda tidak menghabiskan lebih banyak waktu untuk pekerjaan pelatihan daripada yang diperlukan.
Konkurensi	maks iterasi bersamaan: Jumlah maksimum alur (iterasi) untuk diuji dalam pekerjaan pelatihan. Pekerjaan tidak akan berjalan lebih dari jumlah iterasi yang ditentukan. Pelajari selengkapnya tentang cara ML otomatis melakukan beberapa turunan pekerjaan pada kluster.

Formulir Validasi dan uji [Opsional] memungkinkan Anda melakukan hal berikut.
1. Tentukan jenis validasi yang akan digunakan untuk pekerjaan pelatihan Anda.
2. Sediakan himpunan data pengujian (pratinjau) untuk mengevaluasi model yang direkomendasikan yang dihasilkan ML otomatis untuk Anda di akhir eksperimen. Ketika Anda memberikan data uji, pekerjaan uji secara otomatis dipicu pada akhir eksperimen Anda. Pekerjaan uji ini hanya pekerjaan pada model terbaik yang direkomendasikan oleh ML otomatis.
  
  Penting
  
  Menyediakan himpunan data pengujian untuk mengevaluasi model yang dihasilkan adalah fitur pratinjau. Kemampuan ini adalah fitur pratinjau eksperimental, dan dapat berubah sewaktu-waktu.
  - Data uji dianggap terpisah dari pelatihan dan validasi sehingga tidak membiaskan hasil pekerjaan uji model yang direkomendasikan. Pelajari selengkapnya tentang bias selama validasi model.
  - Anda dapat memberikan himpunan data pengujian Anda sendiri atau memilih untuk menggunakan persentase dari himpunan data pelatihan Anda. Data uji harus dalam bentuk Azure Machine Learning TabularDataset.
  - Skema himpunan data pengujian harus sesuai dengan impunan data pelatihan. Kolom target bersifat opsional, tetapi jika tidak ada kolom target yang ditunjukkan tidak ada metrik pengujian yang akan dihitung.
  - Himpunan data pengujian tidak boleh sama dengan himpunan data pelatihan atau himpunan data validasi.

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.

Klasifikasi AutoML

Cara mengonfigurasi

Langkah berikutnya

Sumber Daya Tambahan: