Komponen Edit Metadata

Artikel ini menjelaskan komponen yang disertakan dalam perancang Azure Machine Learning.

Gunakan komponen Edit Metadata untuk mengubah metadata yang terkait dengan kolom dalam himpunan data. Nilai dan jenis data dari himpunan data akan berubah setelah penggunaan komponen Edit Metadata.

Perubahan metadata umum mungkin meliputi:

  • Memperlakukan kolom Boolean atau numerik sebagai nilai kategoris.

  • Menunjukkan kolom mana yang berisi label kelas atau berisi nilai yang ingin Anda kategorikan atau prediksi.

  • Menandai kolom sebagai fitur.

  • Mengubah nilai tanggal/waktu menjadi nilai numerik atau sebaliknya.

  • Mengganti nama kolom.

Gunakan Edit Metadata kapan saja Anda perlu mengubah definisi kolom, biasanya untuk memenuhi persyaratan komponen downstream. Misalnya, beberapa komponen hanya berfungsi dengan jenis data tertentu atau memerlukan bendera pada kolom, seperti IsFeature atau IsCategorical.

Setelah melakukan operasi yang diperlukan, Anda dapat mengatur ulang metadata ke keadaan semula.

Mengonfigurasi Edit Metadata

  1. Di perancang Azure Machine Learning, tambahkan komponen Edit Metadata ke alur Anda dan hubungkan himpunan data yang ingin diperbarui. Anda dapat menemukan komponen dalam kategori Transformasi Data.

  2. Klik Edit kolom di panel kanan komponen dan pilih kolom atau kumpulan kolom yang akan digunakan. Anda bisa memilih kolom satu per satu menurut nama atau indeks, atau Anda bisa memilih grup kolom menurut jenis.

  3. Pilih opsi Jenis data jika Anda perlu menetapkan jenis data yang berbeda ke kolom yang dipilih. Anda mungkin perlu mengubah jenis data untuk operasi tertentu. Misalnya, jika himpunan data sumber Anda memiliki angka yang ditangani sebagai teks, Anda harus mengubahnya menjadi jenis data numerik sebelum menggunakan operasi matematika.

    • Jenis data yang didukung adalah Untai, Bilangan bulat, Ganda, Boolean, dan TanggalWaktu.

    • Jika Anda memilih beberapa kolom, Anda harus menerapkan perubahan metadata ke semua kolom yang dipilih. Misalnya, Anda memilih dua atau tiga kolom numerik. Anda dapat mengubah semuanya menjadi jenis data untai dan mengganti namanya dalam satu operasi. Namun, Anda tidak bisa mengubah satu kolom menjadi jenis data untai dan kolom lain dari float menjadi bilangan bulat.

    • Jika Anda tidak menentukan jenis data baru, metadata kolom tidak berubah.

    • Jenis kolom dan nilai akan berubah setelah Anda melakukan operasi Edit Metadata. Anda dapat memulihkan jenis data asli kapan saja dengan menggunakan Edit Metadata untuk mereset jenis data kolom.

    Catatan

    Format TanggalWaktu mengikuti format tanggalwaktu bawaan Python.
    Jika Anda mengubah jenis angka apa pun menjadi jenis TanggalWaktu, biarkan bidang Format TanggalWaktu kosong. Saat ini tidak dimungkinkan untuk menentukan format data target.

  4. Pilih opsi Kategoris untuk menentukan bahwa nilai dalam kolom yang dipilih harus diperlakukan sebagai kategori.

    Misalnya, Anda mungkin memiliki kolom yang berisi angka 0, 1, dan 2, tetapi perhatikan bahwa angka tersebut sebenarnya berarti "Smoker", "Non-Smoker", dan "Tidak diketahui". Dalam hal ini, dengan menandai kolom sebagai kategorikal, Anda memastikan bahwa nilai hanya digunakan untuk mengelompokkan data dan bukan dalam penghitungan numerik.

  5. Gunakan opsi Bidang jika Anda ingin mengubah cara Azure Machine Learning menggunakan data dalam model.

    • Fitur: Gunakan opsi ini untuk menandai kolom sebagai fitur dalam komponen yang hanya beroperasi pada kolom fitur. Secara default, semua kolom awalnya diperlakukan sebagai fitur.

    • Label: Gunakan opsi ini untuk menandai label, yang juga dikenal sebagai atribut atau variabel target yang dapat diprediksi. Banyak komponen mengharuskan ada satu kolom label dalam himpunan data.

      Dalam banyak kasus, Azure Machine Learning dapat menyimpulkan bahwa kolom berisi label kelas. Dengan mengatur metadata ini, Anda dapat memastikan bahwa kolom diidentifikasi dengan benar. Pengaturan opsi ini tidak mengubah nilai data. Ini hanya mengubah cara beberapa algoritma pembelajaran mesin menangani data.

    Tip

    Apakah Anda memiliki data yang tidak sesuai dengan kategori ini? Misalnya, himpunan data Anda mungkin berisi nilai seperti pengidentifikasi unik yang tidak berguna sebagai variabel. Terkadang ID tersebut dapat menyebabkan masalah ketika digunakan dalam model.

    Untungnya, Azure Machine Learning menyimpan semua data Anda, sehingga Anda tidak perlu menghapus kolom tersebut dari himpunan data. Jika Anda perlu melakukan operasi pada beberapa kumpulan kolom khusus, hapus saja semua kolom lainnya untuk sementara dengan menggunakan komponen Pilih Kolom di Himpunan Data. Nanti Anda dapat menggabungkan kembali kolom-kolom tersebut ke dalam himpunan data dengan menggunakan komponen Tambahkan Kolom.

  6. Gunakan opsi berikut untuk menghapus pilihan sebelumnya dan memulihkan metadata ke nilai default.

    • Fitur hapus: Gunakan opsi ini untuk menghapus bendera fitur.

      Semua kolom awalnya diperlakukan sebagai fitur. Untuk komponen yang melakukan operasi matematika, Anda mungkin perlu menggunakan opsi ini untuk mencegah kolom numerik diperlakukan sebagai variabel.

    • Hapus label: Gunakan opsi ini untuk menghapus metadata label dari kolom yang ditentukan.

    • Hapus skor: Gunakan opsi ini untuk menghapus metadata skor dari kolom yang ditentukan.

      Saat ini Anda tidak dapat menandai kolom secara eksplisit sebagai skor di Azure Machine Learning. Namun, beberapa operasi mengakibatkan kolom ditandai sebagai skor secara internal. Selain itu, komponen R kustom mungkin menampilkan nilai skor.

  7. Untuk Nama kolom baru, masukkan nama baru dari satu kolom atau beberapa kolom yang dipilih.

    • Nama kolom hanya bisa menggunakan karakter yang didukung oleh pengodean UTF-8. Untai kosong, null, atau nama yang seluruhnya terdiri dari spasi tidak diperbolehkan.

    • Untuk mengganti nama beberapa kolom, masukkan nama sebagai daftar yang dipisahkan koma dalam urutan indeks kolom.

    • Semua kolom yang dipilih harus diganti namanya. Anda tidak bisa mengabaikan atau melompati kolom.

  8. Kirim alurnya.

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.