Komponen Masukkan Data Secara Manual

Artikel ini menjelaskan komponen dalam perancang Azure Machine Learning.

Gunakan komponen Masukkan Data Secara Manual untuk membuat himpunan data kecil dengan mengetik nilai. Himpunan data bisa memiliki beberapa kolom.

Komponen ini dapat membantu dalam skenario seperti:

  • Menghasilkan sekumpulan kecil nilai untuk pengujian.
  • Membuat daftar singkat label.
  • Mengetik daftar nama kolom untuk disisipkan dalam himpunan data.

Buat himpunan data

  1. Tambahkan komponen Masukkan Data Secara Manual ke alur Anda. Anda dapat menemukan komponen ini dalam kategori Input dan Output Data dalam Azure Machine Learning.

  2. Untuk DataFormat, pilih salah satu opsi berikut. Opsi ini menentukan bagaimana data yang Anda berikan harus diurai. Persyaratan untuk setiap format sangat berbeda, jadi pastikan untuk membaca topik terkait.

    • ARFF: Format file hubungan atribut yang digunakan oleh Weka.
    • CSV: Format nilai yang dipisahkan koma. Untuk informasi selengkapnya, lihat Mengonversi ke CSV.
    • SVMLight: Format yang digunakan oleh Vowpal Wabbit dan kerangka kerja pembelajaran mesin lainnya.
    • TSV: Format nilai yang dipisahkan tab.

    Jika Anda memilih format dan tidak menyediakan data yang memenuhi spesifikasi format, maka akan terjadi kesalahan runtime.

  3. Klik di dalam kotak teks Data untuk mulai memasukkan data. Format berikut memerlukan perhatian khusus:

    • CSV: Untuk membuat beberapa kolom, tempelkan di teks yang dipisahkan koma, atau ketik beberapa kolom dengan menggunakan koma antar bidang.

      Jika Anda memilih opsi HasHeader, Anda bisa menggunakan baris pertama nilai sebagai judul kolom.

      Jika Anda membatalkan pilihan opsi ini, nama kolom (Col1, Col2, dan seterusnya) akan digunakan. Anda bisa menambahkan atau mengubah nama kolom nanti dengan menggunakan Edit Metadata.

    • TSV: Untuk membuat beberapa kolom, tempelkan di teks yang dipisahkan tab, atau ketik beberapa kolom dengan menggunakan tab antar bidang.

      Jika Anda memilih opsi HasHeader, Anda bisa menggunakan baris pertama nilai sebagai judul kolom.

      Jika Anda membatalkan pilihan opsi ini, nama kolom (Col1, Col2, dan seterusnya) akan digunakan. Anda bisa menambahkan atau mengubah nama kolom nanti dengan menggunakan Edit Metadata.

    • ARFF: Tempel dalam file format ARFF yang ada. Jika Anda mengetik nilai secara langsung, pastikan untuk menambahkan header opsional dan bidang atribut yang diperlukan di awal data.

      Misalnya, baris header dan atribut berikut dapat ditambahkan ke daftar sederhana. Judul kolom akan SampleText. Perhatikan bahwa jenis Untai tidak didukung.

      % Title: SampleText.ARFF  
      % Source: Enter Data component  
      @ATTRIBUTE SampleText NUMERIC  
      @DATA  
      \<type first data row here>  
      
    • SVMLight: Ketik atau tempelkan nilai dengan menggunakan format SVMLight.

      Misalnya, sampel berikut menunjukkan beberapa baris pertama dari himpunan data Donor Darah, dalam format SVMLight:

      # features are [Recency], [Frequency], [Monetary], [Time]  
      1 1:2 2:50 3:12500 4:98   
      1 1:0 2:13 3:3250 4:28   
      

      Saat Anda menjalankan komponen Masukkan Data Secara Manual, baris-baris ini dikonversi ke himpunan data kolom dan nilai indeks sebagai berikut:

      Col1 Col2 Col3 Col4 Label
      0.00016 0.004 0.999961 0.00784 1
      0 0.004 0.999955 0.008615 1
  4. Pilih tombol Enter setelah setiap baris, untuk memulai baris baru.

    Jika Anda memilih Enter beberapa kali untuk menambahkan beberapa baris kosong berikutnya, baris kosong akan dihapus atau dipangkas.

    Jika Anda membuat baris dengan nilai yang hilang, Anda selalu bisa memfilternya nanti.

  5. Hubungkan port output ke komponen lain, dan jalankan alur.

    Untuk melihat himpunan data, klik kanan komponen dan pilih Visualisasikan.

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.