Pilih Kolom di komponen Himpunan Data

Artikel ini menjelaskan komponen dalam perancang Azure Machine Learning.

Gunakan komponen ini untuk memilih subset kolom untuk digunakan dalam operasi hilir. Komponen tidak secara fisik menghapus kolom dari himpunan data sumber; sebagai gantinya, ini membuat subset kolom seperti tampilan database atau proyeksi.

Komponen ini berguna saat Anda perlu membatasi kolom yang tersedia untuk operasi downstream atau jika Anda ingin mengurangi ukuran himpunan data dengan menghapus kolom yang tidak dibutuhkan.

Kolom dalam himpunan data adalah output dalam urutan yang sama seperti dalam data asli, bahkan jika Anda menentukannya dalam urutan yang berbeda.

Cara penggunaan

Komponen ini tidak memiliki parameter. Anda menggunakan pemilih kolom untuk memilih kolom untuk disertakan atau dikecualikan.

Memilih kolom menurut nama

Ada beberapa opsi dalam komponen untuk memilih kolom menurut nama:

  • Memfilter dan mencari

    Klik opsi MENURUT NAMA.

    Jika Anda telah menyambungkan himpunan data yang sudah diisi, daftar kolom yang tersedia akan muncul. Jika tidak ada kolom yang muncul, Anda mungkin perlu menjalankan komponen upstream untuk melihat daftar kolom.

    Untuk memfilter daftar, ketik di kotak pencarian. Misalnya, jika Anda mengetikkan huruf w dalam kotak pencarian, daftar akan difilter untuk memperlihatkan nama kolom yang berisi huruf w.

    Pilih kolom dan klik tombol panah kanan untuk memindahkan kolom yang dipilih ke daftar di panel kanan.

    • Untuk memilih rentang nama kolom berkelanjutan, tekan Shift + Klik.
    • Untuk menambahkan kolom individual ke pilihan, tekan Ctrl + Klik.

    Klik tombol tanda centang untuk menyimpan dan menutup.

  • Menggunakan nama bersama dengan aturan lain

    Klik opsi DENGAN ATURAN.

    Pilih aturan, seperti memperlihatkan kolom jenis data tertentu.

    Lalu, klik kolom individual dari jenis tersebut menurut nama untuk menambahkannya ke daftar pilihan.

  • Mengetikkan atau menempelkan daftar nama kolom yang dipisahkan koma

    Jika himpunan data Anda lebar, mungkin lebih mudah untuk menggunakan indeks atau membuat daftar nama daripada memilih kolom satu per satu. Dengan asumsi Anda telah menyiapkan daftar terlebih dahulu:

    1. Klik opsi DENGAN ATURAN.
    2. Pilih Tidak ada kolom, pilih Sertakan, lalu klik di dalam kotak teks dengan tanda seru merah.
    3. Tempel atau ketik daftar nama kolom yang dipisahkan koma dari nama kolom yang divalidasi sebelumnya. Anda tidak dapat menyimpan komponen jika kolom memiliki nama yang tidak valid, jadi pastikan untuk memeriksa nama sebelumnya.

    Anda juga dapat menggunakan metode ini untuk menentukan daftar kolom menggunakan nilai indeksnya.

Memilih menurut jenis

Jika Anda menggunakan opsi DENGAN ATURAN, Anda bisa menerapkan beberapa kondisi pada pilihan kolom. Misalnya, Anda mungkin hanya perlu mendapatkan kolom fitur dari jenis data numerik.

Opsi MULAI DENGAN menentukan titik awal Anda dan penting untuk memahami hasilnya.

  • Jika Anda memilih opsi SEMUA KOLOM, semua kolom akan ditambahkan ke daftar. Kemudian, Anda harus menggunakan opsi Kecualikan untuk menghapus kolom yang memenuhi kondisi tertentu.

    Misalnya, Anda mungkin mulai dengan semua kolom lalu menghapus kolom menurut nama atau menurut jenis.

  • Jika Anda memilih opsi TANPA KOLOM, daftar kolom akan kosong. Anda kemudian menentukan kondisi untuk menambahkan kolom ke daftar.

    Jika Anda menerapkan beberapa aturan, setiap kondisi berupa penambahan. Misalnya, Anda mulai tanpa kolom, lalu menambahkan aturan untuk mendapatkan semua kolom numerik. Dalam Himpunan data harga mobil, yang menghasilkan 16 kolom. Kemudian, Anda mengeklik tanda + untuk menambahkan kondisi baru dan pilih Sertakan semua fitur. Himpunan data yang dihasilkan mencakup semua kolom numerik, ditambah semua kolom fitur, termasuk beberapa kolom fitur untai (karakter).

Memilih menurut indeks kolom

Indeks kolom mengacu pada urutan kolom dalam himpunan data asli.

  • Kolom dijumlahkan secara berurutan mulai dari 1.
  • Untuk mendapatkan rentang kolom, gunakan tanda hubung.
  • Spesifikasi terbuka seperti 1- atau -3 tidak diperbolehkan.
  • Nilai indeks (atau nama kolom) duplikat tidak diperbolehkan dan mungkin akan mengakibatkan kesalahan.

Misalnya, dengan asumsi himpunan data Anda memiliki setidaknya delapan kolom, Anda dapat menempelkan salah satu contoh berikut untuk menampilkan beberapa kolom yang tidak berdekatan:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

contoh akhir tidak mengakibatkan kesalahan; namun, ia menampilkan intans tunggal kolom 4.

Mengubah urutan kolom

Opsi Perbolehkan duplikat dan pertahankan urutan kolom dalam pilihan dimulai dengan daftar kosong dan menambahkan kolom yang Anda tentukan menurut nama atau menurut indeks. Tidak seperti opsi lain, yang selalu menampilkan kolom dalam "urutan alami", opsi ini menghasilkan kolom dalam urutan sesuai nama atau daftar yang Anda beri.

Misalnya, dalam himpunan data dengan kolom Col1, Col2, Col3, dan Col4, Anda dapat membalikkan urutan kolom dan tidak menyertakan kolom 2 dengan menentukan salah satu daftar berikut:

  • Col4, Col3, Col1
  • 4,3,1

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.