Verileri El ile Girme

Değer yazarak küçük veri kümelerini girmeyi ve düzenlemenizi sunar

Kategori: veri dönüştürme/işleme

Not

Için geçerlidir: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgili. Benzer sürükle ve bırak modülleri bir tasarımcıya Azure Machine Learning eklendi. İki sürümü karşılaştıran bu makalede daha fazla bilgi bulabilirsiniz.

Modüle genel bakış

Bu makalede, değer yazarak küçük bir veri kümesi oluşturmak için Azure Machine Learning Studio (klasik) ' de verileri el Ile gir modülünün nasıl kullanılacağı açıklanır. Veri kümesinde birden çok sütun olabilir.

Bu modül bunlar gibi senaryolarda yararlı olabilir:

  • Test için küçük bir değer kümesi oluşturma

  • Etiketlerin kısa bir listesini oluşturma

  • Matematik işleminde kullanılacak değerleri girme işlemi

  • Farklı değerleri Değiştir içinde kullanılacak değiştirme değerlerini belirtme

  • Bir veri kümesine eklenecek sütun adlarının listesini yazma

Verileri el Ile girme

  1. Veri gir modülünü denemenize el ile ekleyin. Bu modülü, veri girişi ve çıkış kategorisinde Azure Machine Learning Studio (klasik) bulabilirsiniz.

  2. DataFormat için aşağıdaki seçeneklerden birini seçin. Bu seçenekler, sağladığınız verilerin nasıl ayrıştırılaceğini belirlemektir. Her biçimin gereksinimleri önemli ölçüde farklılık gösterir, bu nedenle ilgili konuları okuduğunuzdan emin olun.

    • Arff. WEKA tarafından kullanılan öznitelik ilişkisi dosya biçimi. Daha fazla bilgi için bkz. ARFF 'e dönüştürme.

    • CSV. Virgülle ayrılmış değerler biçimi. Daha fazla bilgi için bkz. CSV 'ye dönüştürme.

    • Svmlight. Vowpal Wabbit ve diğer makine öğrenimi çerçeveleri tarafından kullanılan bir biçim. Daha fazla bilgi için bkz. SVMLight 'e dönüştürme.

    • TSV. Sekmeyle ayrılmış değerler biçimi. Daha fazla bilgi için bkz. TSV 'e dönüştürme.

    Bir biçim seçer ve biçim belirtimlerini karşılayan veriler sağlamazsanız, bir çalışma zamanı hatası oluşur.

  3. Veri girmeye başlamak için veri metin kutusunun içine tıklayın. Aşağıdaki biçimler özel dikkat gerektirir:

    • CSV: birden çok sütun oluşturmak için, virgülle ayrılmış metinde yapıştırın veya alanlar arasında virgül kullanarak birden çok sütun yazın.

      HasHeader seçeneğini belirlerseniz, ilk değer satırını sütun başlığı olarak kullanabilirsiniz.

      Bu seçeneğin işaretini kaldırırsanız, sütünadı, col2 vb. sütunları kullanılır. Daha sonra, verileri Düzenle' i kullanarak sütun adlarını ekleyebilir veya değiştirebilirsiniz.

    • TSV: birden çok sütun oluşturmak için sekmeyle ayrılmış metin içine yapıştırın veya alanlar arasındaki sekmeleri kullanarak birden çok sütun yazın.

      HasHeader seçeneğini belirlerseniz, ilk değer satırını sütun başlığı olarak kullanabilirsiniz.

      Bu seçeneğin işaretini kaldırırsanız, sütünadı, col2 vb. sütunları kullanılır. Daha sonra, verileri Düzenle' i kullanarak sütun adlarını ekleyebilir veya değiştirebilirsiniz.

    • Arff: varolan bir arff biçim dosyasını yapıştırın. Değerleri doğrudan yazıyorsanız, verilerin başlangıcında isteğe bağlı üstbilgiyi ve gerekli öznitelik alanlarını eklediğinizden emin olun.

      Örneğin, aşağıdaki üst bilgi ve öznitelik satırları basit bir listeye eklenebilir. Sütun başlığı şöyle olacaktır SampleText .

      % Title: SampleText.ARFF  
      % Source: Enter Data module  
      @ATTRIBUTE SampleText STRING  
      @DATA  
      \<type first data row here>  
      
    • Svmlight: svmlight biçimini kullanarak değerleri yazın veya yapıştırın.

      Örneğin, aşağıdaki örnek, kanlı olarak şu biçimde olan kan bağış veri kümesinin ilk birkaç satırını temsil eder:

      # features are [Recency], [Frequency], [Monetary], [Time]  
      1 1:2 2:50 3:12500 4:98   
      1 1:0 2:13 3:3250 4:28   
      

      Verileri el Ile gir modülünü çalıştırdığınızda, bu satırlar sütun ve dizin değerlerinin veri kümesine aşağıdaki şekilde dönüştürülür:

      Süt1 Süt2 Col3 Col4 Etiketler
      0,00016 0,004 0,999961 0,00784 1
      0 0,004 0,999955 0,008615 1
  4. Her satırdan sonra ENTER tuşuna basarak yeni bir satır başlatın.

    Son satırdan sonra ENTER tuşuna bastığınızdan emin olun.

    Birden çok kez daha fazla boş satır eklemek için ENTER tuşuna basarsanız, son boş satır atılır, ancak diğer boş satırlar eksik değerler olarak değerlendirilir.

    Eksik değerleri olan satırlar oluşturursanız, bunları her zaman daha sonra filtreleyebilirsiniz.

  5. Modüle sağ tıklayın ve verileri ayrıştırmak ve veri kümesi olarak çalışma alanınıza yüklemek için Seçileni Çalıştır ' ı seçin.

    Veri kümesini görüntülemek için çıkış bağlantı noktasına tıklayın ve Görselleştir' i seçin.

Örnekler

Bu modülün makine öğreniminde nasıl kullanıldığı hakkında örnekler için Azure yapay zeka Galerisibakın:

  • Veri yükleme örneği: ucı Machine Learning deposundan verileri alır ve ardından sütun adları oluşturmak Için verileri el ile girin . Ayrıca, girilen satırları veri kümesiyle birleştirmek için kullanabileceğiniz örnek R kodu da sağlanır.

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

  • Kaydettiğiniz biçim ne olursa olsun, girdiğiniz veriler, denemeleri içinde kullanılmak üzere örtük olarak veri kümesi (veri tablosu) biçimine dönüştürülür. Ancak, veri kümesi olarak kaydet seçeneğini açıkça seçmediğiniz sürece veriler kayıtlı veri kümesi olarak kalıcı olmaz.

    Veri gir içindeki verileri veri kümesi olarak el ile kaydetmezseniz, oturumu sonlandırdığınızda çalışma alanı önbelleğinden kaldırılır. Ancak, yeniden denemeyi çalıştırarak verileri kullanılabilir hale getirebilirsiniz.

  • Verileri farklı bir veri kümesiyle El Ile girerek Birleşik veri kümesinin aynı ada sahip iki sütunu olamaz. Yinelenen sütun adları varsa, sütun adlarının benzersiz olması için sağ veri kümesinden sütuna bir sayısal sonek eklenir.

    Örneğin, TestData sütununu Içeren el ile veri girmesinin iki örneğine sahip olduğunu ve bunları birleştirmek için sütun Ekle modülünü kullandığınızı varsayalım. Veri gir 'in sol örneğindeki sütun TestData olarak kalır ve veri gir doğru örneğindeki sütun TestData (2) olarak yeniden adlandırılacaktır.

Ayrıca bkz.

Veri girişi ve çıkışı
A-Z modül listesi