Veri kümesine dönüştürme

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Veri girişini Microsoft Machine Learning tarafından kullanılan iç Veri Kümesi biçimine Machine Learning

Kategori: Veri Biçimi Dönüştürmeleri

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, deneme için ihtiyacınız olan tüm verileri Studio (klasik) tarafından kullanılan iç biçime dönüştürmek için Machine Learning Studio'da (klasik) Veri Kümesine Dönüştürme modülünün nasıl kullanacağız açıklanmıştır.

Veriler üzerinde herhangi bir işlem gerçekleştiriliyorsa, Machine Learning, verileri yerel veri kümesi biçimine örtülü olarak dönüştürene kadar dönüştürme çoğu durumda gerekli değildir.

Ancak, bir veri kümesi üzerinde bir tür normalleştirme veya temizleme işlemi yaptıysanız ve değişikliklerin başka denemelerde kullanılması için veri kümesi biçimine kaydetmeniz önerilir.

Not

Veri Kümesine Dönüştürme yalnızca verilerin biçimini değiştirir ve verilerin yeni bir kopyasını çalışma alanına kaydetmez. Veri kümesi kaydetmek için çıkış bağlantı noktasına çift tıklayın, Veri kümesi olarak kaydet'i seçin ve yeni bir ad yazın.

Veri Kümesine Dönüştür'leri kullanma

Veri Kümesine Dönüştürme'yi kullanmadan önce veri kümelerini hazırlamak için Meta Verileri Düzenle modülünü kullanmanizi öneririz. Sütun adları ekleyebilir veya değiştirebilir, veri türlerini ayarlayabilir ve benzeri.

  1. Denemenize Veri Kümesine Dönüştürme modülünü ekleyin. Bu modülü Machine Learning Studio'daki (klasik) Veri Biçimi Dönüştürmeleri kategorisinde bulabilirsiniz.

  2. Bağlan bir veri kümesi çıkışına sahip herhangi bir modüle dürebilirsiniz.

    Veriler tablosal olduğu sürece veri kümesine dönüştürebilirsiniz. Buna Verileri İçeri Aktar kullanılarak yüklenen veriler, Verileri El ile Girme kullanılarak oluşturulan veriler, özel modüllerde kod tarafından oluşturulan veriler, Dönüştürme Uygula kullanılarak dönüştürülen veri kümeleri veya Veri Dönüştürmeyi Uygula kullanılarak oluşturulan veya değiştirilen veri kümeleri SQL içerir.

  3. Eylem açılan listesinde, veri kümesi kaydetmeden önce veriler üzerinde temizleme yapmak istediğinize işaret ediyorsanız:

    • Hiçbiri: Verileri olduğu gibi kullanın.

    • SetMissingValue: Eksik değer nerede olursa olsun veri kümesine eklenen bir yer tutucu belirtin. Varsayılan yer tutucu soru işareti karakteridir (?), ancak farklı bir değer oluşturmak için Özel eksik değer seçeneğini kullanabilirsiniz.

    • ReplaceValues: Başka herhangi bir tam değerle değiştirilene tek bir tam değer belirtmek için bu seçeneği kullanın. Örneğin, verilerinizin eksik değerler için obs yer tutucu olarak kullanılan dizeyi içerdiğini varsayarak şu seçenekleri kullanarak özel bir değiştirme işlemi belirtebilirsiniz:

      1. Değiştir'i Özel olarak ayarlayın

      2. Özel değer için bulmak istediğiniz değeri yazın. Bu durumda, yazın obs.

      3. Yeni değer için özgün dizenin yerine yeni değeri yazın. Bu durumda, ?

    ReplaceValues işlemi yalnızca tam eşleşmeler için geçerlidir. Örneğin, bu dizeler etkilenmez: obs., obsolete.

    • SparseOutput: Veri kümesi seyrek olduğunu gösterir. Seyrek bir veri vektörü oluşturarak, eksik değerlerin seyrek veri dağıtımını etkilemey olduğundan emin olabilirsiniz. Bu seçeneği belirttikten sonra eksik değerlerin ve sıfır değerlerinin nasıl iş gerektiğini belirtebilirsiniz.

    Sıfır dışında bir değeri kaldırmak için Kaldır seçeneğine tıklayın ve kaldır için tek bir değer yazın. Eksik değerleri kaldırabilir veya vektörden silmek için özel bir değer oluşturabilirsiniz. Yalnızca tam eşleşmeler kaldırılır. Örneğin, Değeri kaldır x metin kutusuna yazmanız , satır xx etkilenmez.

    Varsayılan olarak Sıfırları kaldır seçeneği olarak Trueayarlanır. Bu, seyrek sütun oluşturulduğunda tüm sıfır değerlerinin kaldırıldığı anlamına gelir.

  4. Denemeyi çalıştırın veya Veri Kümesine Dönüştür modülüne sağ tıklayın ve Seçili çalıştır'ı seçin.

Sonuçlar

  • Sonuçta elde edilen veri kümelerini yeni bir adla kaydetmek için Veri Kümesine Dönüştür çıkışına sağ tıklayın ve Veri Kümesi Olarak Kaydet'i seçin.

Örnekler

Veri Kümesine Dönüştürme modülünün aşağıdaki örneklerde nasıl Azure Yapay Zeka Galerisi:

  • CRM örneği: Paylaşılan bir veri kümesinden okur ve veri kümesi kopyasını yerel çalışma alanına kaydeder.

  • Uçuş Gecikmesi örneği: Eksik değerleri değiştirerek temizlenen bir veri kümesi kaydeder, böylece bunu gelecekteki denemelerde kullanabilirsiniz.

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

  • Girdi olarak veri kümesi alan tüm modüller CSV, TSV veya ARFF biçimlerinde de veri alsa da. Herhangi bir modül kodu yürütülmeden önce girişlerin ön işlemesi gerçekleştirilir. Bu, girişte Veri Kümesine Dönüştürme modülünü çalıştırmaya eşdeğerdir.

  • SVMLight biçiminden veri kümesine dönüştüresiniz.

  • Özel bir değiştirme işlemi belirtirken, arama ve değiştirme işlemi tam değerlere uygulanır; kısmi eşleşmelere izin verilmez. Örneğin, bir 3'ü -1 veya 33 ile değiştirebilirsiniz, ancak 35 gibi iki basamaklı bir sayı içinde 3'ü değiştirilemez.

  • Özel değiştirme işlemleri için, sütunun geçerli veri türüne uymayan herhangi bir karakteri değiştirirken kullanırsanız değiştirme sessizce başarısız olur.

  • Seyrek ve eksik değerler içeren sayısal verileri kaydetmeye ihtiyacınız varsa, Studio (klasik), Math.NET sayısal kitaplığındaki bir sınıf olan SparseVector kullanarak seyrek dizileri destekler. Sıfır kullanan ve eksik değerleri olan verilerinizi hazırlayın ve ardından SparseOutput ve Remove Zeros = TRUE bağımsız değişkenleriyle Veri Kümesine Dönüştür'leri kullanın.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri Tablosu Giriş veri kümesi

Modül parametreleri

Name Aralık Tür Varsayılan Açıklama
Eylem Liste Eylem Yöntemi Hiçbiri Giriş veri kümesine uygulanacak eylem

Çıktı

Ad Tür Description
Sonuç veri kümesi Veri Tablosu Çıktı veri kümesi

Ayrıca bkz.

Veri Biçimi Dönüştürmeleri
A-Z Modül Listesi