Apa itu komponen Azure Machine Learning?

BERLAKU UNTUK:Ekstensi ml Azure CLI v2 (saat ini)Python SDK azure-ai-ml v2 (saat ini)

Komponen Azure Machine Learning adalah bagian kode mandiri yang melakukan satu langkah dalam alur pembelajaran mesin. Komponen dianalogikan dengan fungsi - ini memiliki nama, input, output, dan isi. Komponen adalah blok penyusun alur Azure Machine Learning.

Komponen terdiri dari tiga bagian:

  • Metadata: nama, display_name, versi, jenis, dll.
  • Antarmuka: spesifikasi input/output (nama, jenis, deskripsi, nilai default, dll.).
  • Perintah, Kode & Lingkungan: perintah, kode, dan lingkungan yang diperlukan untuk menjalankan komponen.

Diagram of what a component looks like and how it looks in a pipeline. In addition to screenshots of a component in the CLI, SDK, and portal UI.

Mengapa saya harus menggunakan komponen?

Ini adalah praktik rekayasa yang baik untuk membangun alur pembelajaran mesin untuk membagi tugas pembelajaran mesin lengkap menjadi alur kerja multi-langkah. Sehingga, semua orang dapat mengerjakan langkah tertentu secara independen. Dalam Azure Machine Learning, komponen mewakili satu langkah yang dapat digunakan kembali dalam alur. Komponen dirancang untuk membantu meningkatkan produktivitas pembuatan alur. Secara khusus, komponen menawarkan:

  • Antarmuka yang terdefinisi dengan baik: Komponen memerlukan antarmuka yang terdefinisi dengan baik (input dan output). Antarmuka memungkinkan pengguna membangun langkah-langkah dan menghubungkan langkah-langkah dengan mudah. Antarmuka juga menyembunyikan logika kompleks dari suatu langkah dan menghapus beban memahami bagaimana langkah tersebut diterapkan.

  • Bagikan dan gunakan kembali: Sebagai blok penyusun alur, komponen dapat dengan mudah dibagikan dan digunakan kembali di seluruh alur, ruang kerja, dan langganan. Komponen yang dibangun oleh satu tim dapat ditemukan dan digunakan oleh tim lain.

  • Kontrol versi: Komponen diversikan. Produsen komponen dapat terus meningkatkan komponen dan menerbitkan versi baru. Konsumen dapat menggunakan versi komponen tertentu dalam alur mereka. Hal ini memberi mereka kompatibilitas dan reproduktifitas.

Unit yang dapat diuji: Komponen adalah bagian kode mandiri. Sangat mudah untuk menulis pengujian unit untuk komponen.

Komponen dan Alur

Alur pembelajaran mesin adalah alur kerja untuk tugas pembelajaran mesin penuh. Komponen adalah blok penyusun alur pembelajaran mesin. Saat Anda memikirkan komponen, komponen tersebut harus berada dalam konteks alur.

Untuk membangun komponen, hal pertama adalah menentukan alur pembelajaran mesin. Hal ini memerlukan pemecahan tugas pembelajaran mesin penuh menjadi alur kerja multi-langkah. Setiap langkah adalah komponen. Misalnya, mempertimbangkan tugas pembelajaran mesin sederhana menggunakan data historis untuk melatih model prakiraan penjualan, Anda mungkin ingin membangun alur kerja berurutan dengan pemrosesan data, pelatihan model, dan langkah-langkah evaluasi model. Untuk tugas yang kompleks, Anda mungkin ingin memecah lebih lanjut. Misalnya, pisahkan satu langkah pemrosesan data tunggal menjadi penyerapan data, pembersihan data, pra-pemrosesan data, dan langkah-langkah rekayasa fitur.

Setelah langkah-langkah dalam alur kerja ditentukan, hal berikutnya adalah menentukan bagaimana setiap langkah tersambung dalam alur. Misalnya, untuk menyambungkan langkah pemrosesan data dan langkah pelatihan model, Anda mungkin ingin menentukan komponen pemrosesan data untuk menghasilkan folder yang berisi data yang diproses. Komponen pelatihan mengambil folder sebagai input dan menghasilkan folder yang berisi model terlatih. Definisi input dan output ini akan menjadi bagian dari definisi antarmuka komponen Anda.

Sekarang, saatnya mengembangkan kode untuk menjalankan langkah. Anda dapat menggunakan bahasa pilihan Anda (python, R, dll.). Kode harus dapat dijalankan oleh perintah shell. Selama pengembangan, Anda mungkin ingin menambahkan beberapa input untuk mengontrol bagaimana langkah ini akan dijalankan. Misalnya, untuk langkah pelatihan, Anda mungkin ingin menambahkan tingkat pembelajaran, jumlah epoch sebagai input untuk mengontrol pelatihan. Input tambahan ini ditambah input dan output yang diperlukan untuk tersambung dengan langkah-langkah lain adalah antarmuka komponen. Argumen perintah shell digunakan untuk meneruskan input dan output ke kode. Lingkungan untuk menjalankan perintah dan kode perlu ditentukan. Lingkungan bisa menjadi lingkungan Azure Pembelajaran Mesin yang dikumpulkan, gambar docker, atau lingkungan conda.

Terakhir, Anda dapat mengemas semuanya termasuk kode, cmd, lingkungan, input, output, metadata bersama-sama ke dalam komponen. Kemudian sambungkan komponen-komponen ini bersama-sama untuk membangun alur kerja pembelajaran mesin Anda. Satu komponen dapat digunakan dalam beberapa alur.

Untuk mempelajari selengkapnya tentang cara membangun komponen, lihat:

Langkah berikutnya