Mengotomatiskan pelatihan model dengan CLI ML.NET

CLI ML.NET mengotomatiskan pembuatan model untuk pengembang .NET.

Untuk menggunakan API ML.NET dengan sendirinya, (tanpa ML.NET AutoML CLI) Anda perlu memilih pelatih (implementasi algoritma pembelajaran mesin untuk tugas tertentu), dan kumpulan transformasi data (rekayasa fitur) untuk diterapkan ke data Anda. Alur optimal akan bervariasi untuk setiap himpunan data dan memilih algoritma optimal dari semua pilihan yang ditambahkan ke kompleksitas. Bahkan lebih lanjut, setiap algoritma memiliki satu set hiperparameter untuk disetel. Oleh karena itu, Anda dapat menghabiskan berpekanan dan kadang-kadang berbulan-bulan pada pengoptimalan model pembelajaran mesin mencoba menemukan kombinasi terbaik dari rekayasa fitur, algoritma pembelajaran, dan hiperparameter.

CLI ML.NET menyederhanakan proses ini menggunakan pembelajaran mesin otomatis (AutoML).

Catatan

Artikel ini mengacu pada ML.NET CLI dan ML.NET AutoML, yang saat ini dalam Pratinjau, dan materi mungkin dapat berubah.

Apa itu antarmuka baris perintah (CLI) ML.NET?

CLI ML.NET adalah alat .NET. Setelah diinstal, Anda memberinya tugas pembelajaran mesin dan himpunan data pelatihan, dan menghasilkan model ML.NET, serta kode C# untuk dijalankan untuk menggunakan model di aplikasi Anda.

Seperti yang ditunjukkan pada gambar berikut, mudah untuk menghasilkan model ML.NET berkualitas tinggi (model serial .zip file) ditambah sampel kode C# untuk menjalankan/menilai model tersebut. Selain itu, kode C# untuk membuat/melatih model tersebut juga dihasilkan, sehingga Anda dapat meneliti dan melakukan iterasi pada algoritma dan pengaturan yang digunakan untuk yang menghasilkan "model terbaik".

Mesin AutoML bekerja di dalam CLI ML.NET

Anda dapat menghasilkan aset tersebut dari himpunan data Anda sendiri tanpa pengkodan sendiri, sehingga juga meningkatkan produktivitas Anda bahkan jika Anda sudah tahu ML.NET.

Saat ini, Tugas ML yang didukung oleh CLI ML.NET adalah:

  • classification
  • regresi
  • rekomendasi
  • klasifikasi gambar
  • Peramalan
  • kereta api

CLI ML.NET dapat diinstal berdasarkan sistem operasi Anda dan arsitekturnya dengan perintah berikut:

dotnet tool install --global mlnet-<OS>-<ARCH>

Misalnya, Windows versi x64 dapat diinstal dengan:

dotnet tool install --global mlnet-win-x64

Untuk informasi selengkapnya, lihat panduan cara Menginstal CLI ML.NET.

Contoh penggunaan (skenario klasifikasi):

mlnet classification --dataset "yelp_labelled.txt" --label-col 1 --has-header false --train-time 10

ML.NET klasifikasi dari baris perintah

Anda dapat menjalankannya dengan cara yang sama pada Windows PowerShell, macOS/Linux bash, atau Windows CMD. Namun, penyelesaian otomatis tabular (saran parameter) tidak akan berfungsi pada Windows CMD.

Aset output yang dihasilkan

Perintah tugas ML di CLI menghasilkan aset berikut di folder output:

  • Model serial .zip ("model terbaik") yang siap digunakan untuk menjalankan prediksi.
  • Solusi C# dengan:
    • Kode C# untuk menjalankan/menilai model yang dihasilkan (untuk membuat prediksi di aplikasi pengguna akhir Anda dengan model tersebut).
    • Kode C# dengan kode pelatihan yang digunakan untuk menghasilkan model tersebut (untuk tujuan pembelajaran atau pelatihan ulang model).
  • File log dengan informasi semua iterasi/sapuan di beberapa algoritma yang dievaluasi, termasuk konfigurasi/alur terperinci mereka.

Dua aset pertama dapat langsung digunakan di aplikasi pengguna akhir Anda (misalnya, ASP.NET aplikasi web Core, layanan, dan aplikasi desktop) untuk membuat prediksi dengan model ML yang dihasilkan tersebut.

Aset ketiga, kode pelatihan, menunjukkan kepada Anda apa ML.NET kode API yang digunakan oleh CLI untuk melatih model yang dihasilkan, sehingga Anda dapat melatih kembali model Anda dan menyelidiki dan mengulangi pelatih/algoritma dan hiperparameter tertentu yang dipilih oleh CLI dan AutoML di bawah sampul.

Memahami kualitas model

Saat Anda membuat 'model terbaik' dengan alat CLI, Anda akan melihat metrik berkualitas (seperti akurasi dan R-Squared) yang sesuai untuk tugas ML yang Anda targetkan.

Di sini metrik tersebut diringkas dikelompokkan menurut tugas ML sehingga Anda dapat memahami kualitas 'model terbaik' yang dibuat secara otomatis.

Metrik untuk model Klasifikasi

Gambar berikut menampilkan daftar metrik klasifikasi untuk lima model teratas yang ditemukan oleh CLI:

Metrik klasifikasi untuk lima model teratas

Akurasi adalah metrik populer untuk masalah klasifikasi, namun akurasi tidak selalu merupakan metrik terbaik untuk memilih model terbaik dari seperti yang dijelaskan dalam referensi berikut. Ada kasus di mana Anda perlu mengevaluasi kualitas model Anda dengan metrik tambahan.

Untuk menjelajahi dan memahami metrik yang dihasilkan oleh CLI, lihat Metrik evaluasi untuk klasifikasi.

Metrik untuk model Regresi dan Rekomendasi

Model regresi cocok dengan data dengan baik jika perbedaan antara nilai yang diamati dan nilai model yang diprediksi kecil dan tidak bias. Regresi dapat dievaluasi dengan metrik tertentu.

Anda akan melihat daftar metrik serupa untuk lima model kualitas teratas yang ditemukan oleh CLI, kecuali dalam hal ini, lima besar terkait dengan tugas ML regresi:

Metrik regresi untuk lima model teratas

Untuk menjelajahi dan memahami metrik yang dihasilkan oleh CLI, lihat Metrik evaluasi untuk regresi.

Lihat juga