Kategorik değerleri gruplandırma

Birden çok kategorideki verileri yeni bir kategoriye gruplandırır

Kategori: veri dönüştürme/işleme

Not

Uygulama hedefi: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgilidir. Benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısına eklenmiştir. Bu makalede iki sürümü karşılaştırandaha fazla bilgi edinin.

Modüle genel bakış

Bu makalede, bir yerinde arama tablosu oluşturmak için Azure Machine Learning Studio (klasik) ' de Grup kategorik değerleri modülünün nasıl kullanılacağı açıklanır.

Kategorik değerlerini gruplandırmak için tipik kullanım, birden fazla dize değerini tek bir yeni düzey halinde birleştirkullanmaktır. Örneğin, bir bölgede tek bir bölgesel koda bireysel posta kodları atayabilir veya bir kategoride birden çok ürünü gruplayabilirsiniz.

Bu modülü kullanmak için, kullanmak istediğiniz arama değerlerini yazın ve varolan değerleri değiştirme değerlerine eşleyin. Yalnızca kategorik sütunlar için, etiket veya özellik olarak belirlenmiş sütunlarda değil, gruplar oluşturabilirsiniz.

Yeni bir düzeye açıkça eşlenmemiş herhangi bir sütun değeri varsayılan düzeye atanır. Örneğin, tek tek posta kodlarını eşleştirmediyseniz, bu kodlar, bilinmeyen değerler için bir düzey olarak gruplandırılarak, bilinmiyor olarak ad verebilir.

Not

Varsayılan düzey de dahil olmak üzere en fazla 20 yeni düzey oluşturulabilir. Daha fazla değere ihtiyacınız varsa veya eşlemeleri dinamik olarak tanımlamanız gerekiyorsa, yürütme r betik modülünde özel r betiği kullanmanızı öneririz. Ya da SQL deyimlerini Uygula dönüştürme modülünde SQL deyimlerini kullanın.

Grup kategorik değerlerini kullanma

Önceden var olan değerlerin ve yeni kategorilerin listesini hazırlamanızı öneririz. Her kategori için, yeni bir kategori adı ve kategoriye dahil etmek için bir virgülle ayrılmış değerler listesi hazırlamanız gerekir.

  1. Bir Grup kategorik değerleri modülünü denemenize ekleyin. Modülü veri dönüştürme, düzenleme altında bulabilirsiniz.

  2. Dönüştürmek istediğiniz değerlere sahip bir veri kümesini bağlayın.

  3. Kategori değerleri grubunun Özellikler bölmesinde, azaltmak istediğiniz düzeyleri Içeren sütunu seçmek için sütun seçiciyi kullanın.

    • Başlat ' a tıklamalı ve başlamak IÇIN hiçbir sütun olmamalıdır ve sonra sütunları ada göre eklemeniz önerilir. Aksi takdirde, bir hataya önde gelen çok sayıda sütun aday olarak eklenebilir.

    • Sütun, kategorik bir sütun olmalıdır. Değilse, verileri Düzenle yukarı akış ekleyin ve sütun türünü değiştirin.

    • Dize değiştirme işleminin uygulanmadığı herhangi bir sütun girişi listesinden kaldırmayı unutmayın.

  4. Çıkış modu için, yalnızca yeni düzeylerin çıkışını mi almak istediğinizi belirtin ya da değişiklikleri yan yana olacak şekilde özgün sütunu görmek için ekleyin.

    Varsayılan olarak, Resultonly yalnızca yeni değerleri gösterir. InPlace seçeneği, mevcut sütun değerlerinin yerine yeni düzeyler koyar.

  5. Varsayılan düzey adı için, açıkça eşlenmemiş tüm değerler için değiştirme olarak kullanılacak bir dize değeri yazın. "Bilinmeyen" veya "varsayılan" gibi bir şey kullanabilirsiniz.

    Not

    Bu varsayılan düzey değer, eşleştirilenemeyen tüm değerlere uygulanır. Yanlışlıkla eşlemek istemediğiniz sütunları eklediyseniz, değer sütunlardaki tüm değerlere uygulanır. Bu nedenle, sütun seçiminin işlemeden önce doğru olduğundan emin olun.

  6. Yeni düzey sayısı için, eşlenmemiş değerler için varsayılan düzey dahil olmak üzere, toplam yeni kategori (düzey) sayısını belirten bir sayı yazın.

  7. Yeni düzey 1 ' ın adı için ilk kategori için yeni grup adını sağlayın.

  8. Hemen sonraki metin kutusunda, yeni düzey 1 ' e eşlenecek eski düzeylerin virgülle ayrılmış listesi, yeni düzeye eşlemek için tüm değerlerin ayrıntılı bir listesini yazın veya yapıştırın. Joker karakterlere ve normal ifadelere izin verilmez.

  9. Yeni düzey adlar yazmak ve yeni düzeye eşlenmesi gereken değerleri yazmak veya yapıştırmak için devam edin.

    Değer listenizi çalışırken ayrı bir dosyaya kaydetmenizi öneririz. Düzeylerin sayısını değiştirirseniz, daha önce yazdığınız tüm dizeler kaldırılır ve baştan başlamanız gerekir.

    Ancak, daha önce kaydedilmiş bir modülü düzenliyorsanız, özgün ayarlara döndürebilirsiniz.

  10. Denemeyi çalıştırın.

Sonuçlar

Sonuçları görüntülemek için, Grup kategorik değerleri modülünü sağ tıklatın, sonuçlar veri kümesi' ni seçin ve Görselleştir' i tıklatın.

Örnekler

Machine Learning 'in eylemde örnekleri için Azure yapay zeka Galerisibakın.

Ayrıca, Azure Machine Learning Studio (klasik) ' de sunulan otomobil fiyat veri kümesi gibi, kolayca gruplandırılabilen bazı dize değişkenlerine sahip küçük bir veri kümesi kullanarak kendiniz için de bu modülü deneyebilirsiniz.

Otomobillerin sayısını kullanarak, oto Mobil Fiyat veri kümesindeki arabaları motor boyutuna göre gruplandırmak istediğinizi varsayalım. Birçok farklı motor boyutu yerine, "büyük", "küçük" ve "diğer" yeni düzeylerini şöyle oluşturacaksınız:

  • Büyük altyapılar: altı silindir veya daha büyük
  • Küçük altyapılar: iki veya dört silindir
  • Diğer: başka her şey
  1. Veri kümesi modülüne Select sütunları ekleyin ve yalnızca num-of-cylinders sütunu seçin.
  2. Meta veri düzenleme modülünü ekleyin ve num-of-cylinders sütunu kategorik olarak değiştirin.
  3. Grup kategorik değerleri modülünü ekleyin ve değiştirilmiş veri kümesini bağlayın.
  4. Varsayılan düzey adı için yazın other . Bu düzey için değer sağlamanız gerekmez.
  5. Yeni düzey 1 ' ın adı için yazın big . Düzey 1 ' e eşlenecek eski düzeyler listesinde yapıştırın six, eight, twelve .
  6. Yeni düzey 2 ' nin adı için yazın small . Eşlenen değerler için içine yapıştırın two, four .
  7. Denemeyi çalıştırın.
  8. Sonuçları görselleştirerek , özgün veri kümesinin, ve gibi bazı tek altyapı boyutlarına sahip olduğunu fark etmiş olursunuz five three . Bu gibi tüm öğeler other düzeyiyle eşlenir.

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

  • "" Adına sahip olan sütun, <columnname> izin verilen bir kategoride değil "hata iletisiyle karşılaşabilirsiniz."

    Bu ileti, seçtiğiniz sütunun kategorik bir sütun olmadığını gösterir. Categorical Meta verileri Düzenle' yi kullanarak sütunu olarak işaretleyebilir veya uygun kategori değerlerini içeren farklı bir sütun seçebilirsiniz.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri tablosu Gruba veri

Modül parametreleri

Name Aralık Tür Varsayılan Description
Seçili sütunlar herhangi biri ColumnSelection CategoricalAll Gruplandırılacak sütunları seçin.
Çıkış modu herhangi biri Çıktı ResultOnly Kategori etiketlerinin nasıl çıkış olması gerektiğini belirtin.
Varsayılan düzey adı herhangi biri Dize Eşleme eşleşmezse kullanılacak varsayılan düzeyi belirtin.
Yeni düzey sayısı Liste Grup sayısı Varsayılan düzey dahil olmak üzere değerler gruplandırıldıktan sonraki düzey sayısını belirtin.

Çıktı

Ad Tür Description
Sonuç veri kümesi Veri tablosu Gruplanmış veriler

Ayrıca bkz.

İşleme
Veri dönüştürme
A-Z modül listesi