Meta Verileri Düzenle bileşeni

Bu makalede Azure Machine Learning tasarımcısında bulunan bir bileşen açıklanmaktadır.

Veri kümesindeki sütunlarla ilişkili meta verileri değiştirmek için Meta Verileri Düzenle bileşenini kullanın. Veri kümesinin değeri ve veri türü, Meta Verileri Düzenle bileşeni kullanıldıktan sonra değişir.

Tipik meta veri değişiklikleri şunları içerebilir:

  • Boole sütunlarını veya sayısal sütunları kategorik değerler olarak ele alma.

  • Hangi sütunun sınıf etiketini içerdiğini veya kategorilere ayırmak veya tahmin etmek istediğiniz değerleri içerdiğini belirtir.

  • Sütunları özellik olarak işaretleme.

  • Tarih/saat değerlerini sayısal değerlere (veya tam tersi) değiştirme.

  • Sütunları yeniden adlandırma.

Bir sütunun tanımını değiştirmeniz gerektiğinde, genellikle aşağı akış bileşeni gereksinimlerini karşılamak için Meta Verileri Düzenle'yi kullanın. Örneğin, bazı bileşenler yalnızca belirli veri türleriyle çalışır veya sütunlarda veya IsCategoricalgibi IsFeature bayraklar gerektirir.

Gerekli işlemi gerçekleştirdikten sonra meta verileri özgün durumuna sıfırlayabilirsiniz.

Meta Verileri Düzenle'yi yapılandırma

  1. Azure Machine Learning tasarımcısında meta verileri düzenle bileşenini işlem hattınıza ekleyin ve güncelleştirmek istediğiniz veri kümesini bağlayın. Bileşeni Veri Dönüştürme kategorisinde bulabilirsiniz.

  2. Bileşenin sağ panelinde Sütunu düzenle'ye tıklayın ve üzerinde çalışacak sütunu veya sütun kümesini seçin. Sütunları ada veya dizine göre tek tek seçebilir veya türe göre bir sütun grubu seçebilirsiniz.

  3. Seçili sütunlara farklı bir veri türü atamanız gerekiyorsa Veri türü seçeneğini belirleyin. Belirli işlemler için veri türünü değiştirmeniz gerekebilir. Örneğin, kaynak veri kümenizde metin olarak işlenen sayılar varsa, matematik işlemlerini kullanmadan önce bunları sayısal bir veri türüyle değiştirmeniz gerekir.

    • Desteklenen veri türleri String, Integer, Double, Boolean ve DateTime'dır.

    • Birden çok sütun seçerseniz, meta veri değişikliklerini seçili tüm sütunlara uygulamanız gerekir. Örneğin, iki veya üç sayısal sütun seçtiğinizi varsayalım. Bunların tümünü bir dize veri türüne dönüştürebilir ve tek bir işlemle yeniden adlandırabilirsiniz. Ancak, bir sütunu dize veri türüne, başka bir sütunu da float türünden tamsayıya değiştiremezsiniz.

    • Yeni bir veri türü belirtmezseniz, sütun meta verileri değişmez.

    • Siz Meta Verileri Düzenle işlemini gerçekleştirdikten sonra sütun türü ve değerleri değişir. Sütun veri türünü sıfırlamak için Meta Verileri Düzenle'yi kullanarak istediğiniz zaman özgün veri türünü kurtarabilirsiniz.

    Not

    DateTime Biçimi, Python'ın yerleşik tarih saat biçimini izler.
    Herhangi bir sayı türünü DateTime türü olarak değiştirirseniz , DateTime Biçimi alanını boş bırakın. Şu anda hedef veri biçimini belirtmek mümkün değildir.

  4. Seçili sütunlardaki değerlerin kategori olarak değerlendirilmesini belirtmek için Kategorik seçeneğini belirleyin.

    Örneğin, 0, 1 ve 2 sayılarını içeren bir sütuna sahip olabilirsiniz, ancak sayıların aslında "Sigara İçen", "Sigara İçmeyen" ve "Bilinmiyor" anlamına geldiğini biliyorsunuz. Bu durumda, sütunu kategorik olarak işaretleyerek değerlerin sayısal hesaplamalarda değil yalnızca verileri gruplandırmak için kullanıldığından emin olursunuz.

  5. Azure Machine Learning'in modeldeki verileri kullanma biçimini değiştirmek istiyorsanız Alanlar seçeneğini kullanın.

    • Özellik: Bir sütunu yalnızca özellik sütunlarında çalışan bileşenlerde özellik olarak işaretlemek için bu seçeneği kullanın. Varsayılan olarak, tüm sütunlar başlangıçta özellik olarak değerlendirilir.

    • Etiket: Tahmin edilebilir öznitelik veya hedef değişken olarak da bilinen etiketi işaretlemek için bu seçeneği kullanın. Birçok bileşen, veri kümesinde tam olarak bir etiket sütunu bulunmasını gerektirir.

      Çoğu durumda Azure Machine Learning, bir sütunun sınıf etiketi içerdiğini çıkarsar. Bu meta verileri ayarlayarak sütunun doğru şekilde tanımlandığından emin olabilirsiniz. Bu seçeneğin ayarlanması veri değerlerini değiştirmez. Yalnızca bazı makine öğrenmesi algoritmalarının verileri işleme şeklini değiştirir.

    İpucu

    Bu kategorilere uymayan verileriniz var mı? Örneğin, veri kümeniz değişken olarak yararlı olmayan benzersiz tanımlayıcılar gibi değerler içerebilir. Bazen bu tür kimlikler modelde kullanıldığında sorunlara neden olabilir.

    Neyse ki Azure Machine Learning tüm verilerinizi saklar, böylece bu tür sütunları veri kümesinden silmeniz gerekmez. Bazı özel sütun kümelerinde işlem gerçekleştirmeniz gerektiğinde, Veri Kümesindeki Sütunları Seç bileşenini kullanarak diğer tüm sütunları geçici olarak kaldırmanız yeterlidir. Daha sonra Sütun Ekle bileşenini kullanarak sütunları veri kümesiyle birleştirebilirsiniz.

  6. Önceki seçimleri temizlemek ve meta verileri varsayılan değerlere geri yüklemek için aşağıdaki seçenekleri kullanın.

    • Özelliği temizle: Özellik bayrağını kaldırmak için bu seçeneği kullanın.

      Tüm sütunlar başlangıçta özellik olarak değerlendirilir. Matematiksel işlemler gerçekleştiren bileşenlerde, sayısal sütunların değişken olarak değerlendirilmesini önlemek için bu seçeneği kullanmanız gerekebilir.

    • Etiketi temizle: Etiket meta verilerini belirtilen sütundan kaldırmak için bu seçeneği kullanın.

    • Puanı temizle: Puan meta verilerini belirtilen sütundan kaldırmak için bu seçeneği kullanın.

      Şu anda Azure Machine Learning'de bir sütunu açıkça puan olarak işaretleyemezsiniz. Ancak bazı işlemler, bir sütunun dahili olarak puan olarak işaretlenmesini gerektirir. Ayrıca, özel bir R bileşeni puan değerlerinin çıkışını verebilir.

  7. Yeni sütun adları için, seçili sütunun veya sütunların yeni adını girin.

    • Sütun adları yalnızca UTF-8 kodlaması tarafından desteklenen karakterleri kullanabilir. Tamamen boşluklardan oluşan boş dizelere, null'lara veya adlara izin verilmez.

    • Birden çok sütunu yeniden adlandırmak için, adları sütun dizinlerine göre virgülle ayrılmış liste olarak girin.

    • Tüm seçili sütunlar yeniden adlandırılmalıdır. Sütunları atlayamaz veya atlayamazsınız.

  8. İşlem hattını gönderin.

Sonraki adımlar

Azure Machine Learning'in kullanabileceği bileşenler kümesine bakın.