Veri kümesine dönüştürme

Veri girişini Microsoft Azure Machine Learning tarafından kullanılan iç veri kümesi biçimine dönüştürür

Kategori: veri biçimi dönüştürmeleri

Not

Uygulama hedefi: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgilidir. Benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısına eklenmiştir. Bu makalede iki sürümü karşılaştırandaha fazla bilgi edinin.

Modüle genel bakış

Bu makalede, bir deneme için ihtiyaç duyduğunuz tüm verileri Studio (klasik) tarafından kullanılan dahili biçime dönüştürmek için Azure Machine Learning Studio (klasik) ' de veri kümesine dönüştürme modülünün nasıl kullanılacağı açıklanır.

Veri üzerinde herhangi bir işlem yapıldığında Azure Machine Learning örtük olarak verileri yerel veri kümesi biçimine dönüştürdüğünden, dönüştürme çoğu durumda gerekli değildir.

Ancak, veri kümesinde bir dizi normalleştirme veya temizleme işlemi gerçekleştirdiyseniz ve değişikliklerin daha denemeleri bir şekilde kullanıldığından emin olmak istiyorsanız veri kümesi biçimine veri kaydedilmesi önerilir.

Not

Veri kümesine dönüştürme yalnızca verilerin biçimini değiştirir ve çalışma alanındaki verilerin yeni bir kopyasını kaydetmez. Veri kümesini kaydetmek için, çıkış bağlantı noktasına çift tıklayın, veri kümesi olarak kaydet' i seçin ve yeni bir ad yazın.

Veri kümesine dönüştürme kullanma

Veri kümesine Dönüştürkullanmadan önce veri kümesini hazırlamak Için meta verileri Düzenle modülünü kullanmanızı öneririz. Sütun adları ekleyebilir veya değiştirebilir, veri türlerini ayarlayabilir ve benzeri bir şekilde yapabilirsiniz.

  1. Veri kümesine dönüştürme modülünü denemenize ekleyin. Bu modülü, Azure Machine Learning Studio (klasik) içindeki veri biçimi dönüştürmeleri kategorisinde bulabilirsiniz.

  2. Veri kümesini çıkaran herhangi bir modüle bağlayın.

    Veriler tablosal olduğu sürece, veri kümesine dönüştürebilirsiniz. Bu, verileri Içeri aktarkullanılarak yüklenen verileri, verileri el ile girkullanılarak oluşturulan verileri, Özel modüllerde kodla oluşturulan verileri, Özel modüllerde kod tarafından oluşturulan verileri, dönüştürme uygulakullanılarak veya SQL dönüşümü uygulamakullanılarak oluşturulan veya değiştirilen veri kümelerini içerir.

  3. Eylem açılan listesinde, veri kümesini kaydetmeden önce verilerde herhangi bir temizlik yapmak istediğinizi belirtin:

    • Hiçbiri: verileri olduğu gibi kullanın.

    • Setmissingvalue: eksik bir değer olduğu her yerde veri kümesine eklenen bir yer tutucu belirtin. Varsayılan yer tutucu, soru işareti karakteridir (?), ancak farklı bir değer yazmak için özel eksik değer seçeneğini kullanabilirsiniz.

    • Replacevalues: başka bir tam değer ile değiştirilmeleri için tek bir tam değer belirtmek için bu seçeneği kullanın. Örneğin, veriniz obs eksik değerler için yer tutucu olarak kullanılan dizeyi içeriyorsa, bu seçenekleri kullanarak özel bir değiştirme işlemi belirtebilirsiniz:

      1. Değiştirme 'yi özel olarak ayarla

      2. Özel değer için bulmak istediğiniz değeri yazın. Bu durumda, yazmanız gerekir obs .

      3. Yeni değer için, özgün dizeyi ile değiştirilecek yeni değeri yazın. Bu durumda, şunu yazabilirsiniz ?

    Replacevalues işleminin yalnızca tam eşleşmeler için geçerli olduğunu unutmayın. Örneğin, bu dizeler etkilenmemelidir: obs. , obsolete .

    • Sparseoutput: veri kümesinin seyrek olduğunu gösterir. Seyrek bir veri vektörü oluşturarak eksik değerlerin seyrek veri dağıtımını etkilememesini sağlayabilirsiniz. Bu seçeneği belirledikten sonra eksik değerlerin ve sıfır değerlerin nasıl işleneceğini belirtmeniz gerekir.

    Sıfır dışında bir değeri kaldırmak için, Kaldır seçeneğine tıklayın ve kaldırılacak tek bir değer yazın. Eksik değerleri kaldırabilir veya vektörden silinecek özel bir değer ayarlayabilirsiniz. Yalnızca tam eşleşmeler kaldırılacak. Örneğin, x değeri kaldır metin kutusuna yazarsanız, satır xx etkilenmez.

    Varsayılan olarak, sıfırları kaldır seçeneği olarak ayarlanır True . Bu, seyrek sütun oluşturulduğunda tüm sıfır değerlerinin kaldırıldığı anlamına gelir.

  4. Denemeyi çalıştırın veya veri kümesine Dönüştür modülüne sağ tıklayıp Seçileni Çalıştır' ı seçin.

Sonuçlar

  • Elde edilen veri kümesini yeni bir adla kaydetmek için, veri kümesine Dönüştür çıktısına sağ tıklayın ve veri kümesi olarak kaydet' i seçin.

Örnekler

Veri kümesi modülünün Azure yapay zeka Galerisinasıl kullanıldığı hakkında örnekleri görebilirsiniz:

  • CRM örneği: paylaşılan bir veri kümesinden okur ve veri kümesinin bir kopyasını yerel çalışma alanına kaydeder.

  • Uçuş gecikmesi örneği:, daha sonra denemeleri için kullanabilmeniz için eksik değerleri değiştirerek temizlenen bir veri kümesini kaydeder.

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

  • Giriş olarak bir veri kümesi alan tüm modüller CSV, TSV veya ARFF biçimlerinde de veri alabilir. Herhangi bir modül kodu yürütülmeden önce girişlerin ön işlemesi gerçekleştirilir ve bu, girişte veri kümesine Dönüştür modülüne çalıştırmaya eşdeğerdir.

  • SVMLight biçiminden DataSet 'e dönüştüremezsiniz.

  • Özel bir değiştirme işlemi belirtirken, arama ve değiştirme işlemi tüm değerler için geçerlidir; kısmi eşleştirmelere izin verilmiyor. Örneğin, 3 ' ü bir-1 veya 33 ile değiştirebilirsiniz, ancak 3 35 gibi iki basamaklı bir sayı içinde bir 3 ' ü değiştiremezsiniz.

  • Özel değiştirme işlemleri için, sütunun geçerli veri türüyle uyumlu olmayan herhangi bir karakter değiştirme olarak kullanırsanız değiştirme işlemi sessizce başarısız olur.

  • Seyrek kullanılan ve eksik değerlere sahip sayısal verileri kullanan verileri kaydetmeniz gerekiyorsa, iç, Studio (klasik) Math.NET sayısal kitaplığındaki bir sınıf olan bir SparseVector kullanarak seyrek dizileri destekler. Sıfırlardan oluşan ve eksik değerleri olan verilerinizi hazırlayın ve sonra da Sparseoutput bağımsız değişkenleriyle veri kümesine Dönüştür ' ü ve Sıfırla = doğru öğesini kaldırın .

Beklenen girişler

Ad Tür Description
Veri kümesi Veri tablosu Giriş veri kümesi

Modül parametreleri

Name Aralık Tür Varsayılan Açıklama
Eylem Liste Action yöntemi Yok Giriş veri kümesine uygulanacak eylem

Çıktı

Ad Tür Description
Sonuç veri kümesi Veri tablosu Çıkış veri kümesi

Ayrıca bkz.

Veri biçimi dönüştürmeleri
A-Z modül listesi