Gösterge Değerlerine dönüştürme

Sütunlardaki kategorik değerlerini gösterge değerlerine dönüştürür

Kategori: veri dönüştürme/işleme

Not

Için geçerlidir: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgili. Benzer sürükle ve bırak modülleri bir tasarımcıya Azure Machine Learning eklendi. İki sürümü karşılaştıran bu makalede daha fazla bilgi bulabilirsiniz.

Modüle genel bakış

Bu makalede, Azure Machine Learning Studio (klasik) ' de gösterge değerlerini dönüştürme modülünün nasıl kullanılacağı açıklanır. Bu modülün amacı, kategorik değerlerini içeren sütunları bir makine öğrenimi modelinde özellikler olarak daha kolay kullanılabilecek bir dizi ikili gösterge sütununa dönüştürmelidir.

Gösterge değerlerine dönüştürme yapılandırma

  1. Gösterge değerlerini Dönüştür modülüne Azure Machine Learning denemenize ekleyin ve bunu dönüştürmek istediğiniz sütunları içeren veri kümesine bağlayın. Bu modülü, veri dönüştürmeleri altında, düzenleme kategorisinde bulabilirsiniz.

  2. Sütun seçiciyi kullanarak bir veya daha fazla kategorik sütun seçin.

    Seçtiğiniz sütunların kategorik olduğundan emin olmak için, Deneyinizdeki gösterge değerlerine dönüştürmeden önce meta verileri Düzenle ' yi kullanın, hedef sütunu kategorik olarak işaretleyin.

  3. Yalnızca yeni Boole sütunlarının çıktısını almak istiyorsanız kategorik sütunların üzerine yaz seçeneğini belirleyin.

    Bu seçenek varsayılan olarak kapalıdır ve bu, kaynak olan kategorik sütununu ilgili gösterge sütunları ile birlikte görmenizi sağlar.

    İpucu

    Üzerine yazma seçeneğini belirlerseniz, kaynak sütun aslında silinmez veya değiştirilmez. Bunun yerine, yeni sütunlar oluşturulur ve çıkış veri kümesinde sunulur ve kaynak sütunu çalışma alanında kullanılabilir kalır. Özgün verileri görmeniz gerekirse, kaynak sütunu yeniden eklemek için istediğiniz zaman sütun Ekle modülünü kullanabilirsiniz.

  4. Denemeyi çalıştırın.

Sonuçlar

Örneğin, bir sunucunun yüksek, orta veya düşük bir hataya sahip olup olmadığını gösteren puanlar içeren bir sütununuz olduğunu varsayalım.

Sunucu KIMLIĞI Başarısızlık puanı
10301 Düşük
10302 Orta
10303 Yüksek

Gösterge değerlerine Dönüştüruyguladığınızda, etiketlerin tek sütunu, Boole değerleri içeren birden çok sütuna dönüştürülür:

Sunucu KIMLIĞI Başarısızlık puanı-düşük Başarısızlık puanı-orta Başarısızlık puanı-yüksek
10301 1 0 0
10302 0 1 0
10303 0 0 1

Dönüştürmenin nasıl çalıştığı aşağıda verilmiştir:

  • Riski açıklayan başarısızlık puanı sütununda yalnızca üç olası değer vardır (yüksek, orta ve düşük) ve eksik değer yoktur. Bu nedenle, tam olarak üç yeni sütun oluşturulur.

  • Yeni gösterge sütunları, bu model kullanılarak kaynak sütunun sütun başlıklarına ve değerlerine göre adlandırılır: <source column>- <data value> .

  • Tek bir gösterge sütunu olarak 1 ve diğer tüm gösterge sütunlarında 0 olmalıdır. Bunun nedeni, her sunucunun yalnızca bir risk derecelendirmesi olabilir.

Artık üç gösterge sütununu özellik olarak kullanabilir ve farklı risk düzeyiyle ilişkili diğer özelliklerle bağıntılarını çözümleyebilirsiniz.

Örnekler

Bu modülün nasıl kullanıldığına ilişkin örnekleri görmek için Azure yapay zeka Galerisibakın:

  • Breakst kanseri algılama: hastalar, hasta ID numaralarına göre gruplar halinde gruplandırılır ve sonra, hasta 'in hangi gruba ait olduğunu işaretlemek için gösterge değerleri kullanılır. Daha sonra, grup göstergeleri Puanlama modelleri sırasında kullanılır.

  • Doğrudan pazarlama: olasılıkların matematik işlemini Uygula' yı kullanarak bir sabitle karşılaştırılır ve puanın üzerinde mi yoksa altında mı olduğunu belirten Evet/Hayır değerleri yeni gösterge sütunlarında açılıp açılmadığını gösterir.

  • Ağ üzerinden yetkisiz giriş algılama: günlük verileri Azure depolama 'dan yüklenir. Sınıf değişkeni (örneğin, bir saldırı bir rootkit veya arabellek taşması), kategorik bir sütuna dönüştürülüp birden çok gösterge değerine genişletildiğini açıklar.

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

Kullanım ipuçları

  • Yalnızca kategorik olarak işaretlenen sütunlar gösterge sütunlarına dönüştürülebilir. Bu hatayı görürseniz, seçtiğiniz sütunlardan birinin kategorik olmaması olasıdır:

    Hata 0056: adı olan sütun <column name> izin verilen bir kategoride değil.

    Varsayılan olarak, dize sütunlarının çoğu dize özellikleri olarak işlenir, bu nedenle onları düzenleme meta verilerinikullanarak açıkça kategorik olarak işaretlemeniz gerekir.

  • En az bir kategorik sütun seçmezseniz bir hata görüntülenir.

  • Gösterge sütunlarına dönüştürebileceğiniz sütun sayısı için bir sınır yoktur. Ancak, her bir değer sütunu birden çok gösterge sütunu sağlayabildiğinden, tek seferde yalnızca birkaç sütunu dönüştürüp gözden geçirmek isteyebilirsiniz.

  • Sütun eksik değerler içeriyorsa, eksik kategori için bu adla ayrı bir gösterge sütunu oluşturulur: <source column> -eksik

  • Gösterge değerlerine dönüştürdüğünüz sütun sayı içeriyorsa, bunların diğer özellik sütunları gibi kategorik olarak işaretlenmesi gerekir. Bunu yaptıktan sonra, sayılar ayrık değerler olarak değerlendirilir. Örneğin, yaklaşık olarak 25 ile 30 arasında değişen bir sayısal sütununuz varsa, her ayrık değer için yeni bir gösterge sütunu oluşturulur:

    Marka Highway MPG-25 Highway MPG-26 Highway MPG-27 Highway MPG-28 Highway MPG-29 Highway MPG-30
    Alfa Romeo 0 0 0 0 0 1

    Çok sayıda gösterge sütunu almayı önlemek için, ilk olarak sütundaki değer sayısını kontrol etmenizi ve verileri uygun şekilde yeniden boyutlandırmanızı öneririz.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri tablosu Kategorik sütunları olan veri kümesi

Modül parametreleri

Name Aralık Tür Varsayılan Description
Dönüştürülecek kategorik sütunlar Herhangi bir ColumnSelection Gösterge matrislerini dönüştürmek için kategorik sütunları seçin.
Kategorik sütunların üzerine yaz Herhangi bir Boole yanlış Doğru ise, seçili kategorik sütunların üzerine yazın; Aksi takdirde, sonuçta elde edilen gösterge matrislerini veri kümesine ekleyin.

Çıktı

Ad Tür Description
Sonuç veri kümesi Veri tablosu Kategorik sütunları olan ve gösterge matrislerinin dönüştürüldüğü veri kümesi.

Ayrıca bkz.

İşleme
Veri dönüştürme
A-Z modül listesi