Sayım tablosu parametrelerini değiştir

Sayımlardan özellik oluşturmak için kullanılan parametreleri değiştirir

Kategori: sayımlar Ile öğrenme

Not

Için geçerlidir: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgili. Benzer sürükle ve bırak modülleri bir tasarımcıya Azure Machine Learning eklendi. İki sürümü karşılaştıran bu makalede daha fazla bilgi bulabilirsiniz.

Modüle genel bakış

Bu makalede, bir sayı tablosundan özelliklerin oluşturulma biçimini değiştirmek için Azure Machine Learning Studio (klasik) ' de Sayım tablosu parametrelerini değiştirme modülünün nasıl kullanılacağı açıklanır.

Genel olarak, sayı tabanlı özellikler oluşturmak için, bir veri kümesini işlemek ve bir sayma tablosu oluşturmak üzere derleme sayım dönüşümü kullanın ve bu sayım tablosundan yeni bir özellik kümesi oluşturun.

Ancak, zaten bir Count tablosu oluşturduysanız, Count verilerinin işlenme tanımını düzenlemek için Count tablo parametrelerini değiştirme modülünü kullanabilirsiniz. Bu, veri kümesini yeniden analiz etmenize gerek kalmadan, mevcut verileri temel alan sayı tabanlı farklı istatistikler kümesi oluşturmanızı sağlar.

Değiştirme sayısı parametrelerini yapılandırma

  1. Değiştirmek istediğiniz dönüştürmeyi, dönüşümler grubunda bulun ve denemenize ekleyin.

    Daha önce bir Count dönüşümü oluşturmuş bir deneme çalıştırmanız gerekir.

    • Kaydedilmiş bir dönüştürmeyi değiştirmek için: dönüşümleri, dönüşümler grubunda bulun ve denemenize ekleyin.

    • Aynı deneme içinde oluşturulan bir sayı dönüşümünü değiştirmek için: dönüşüm kaydedilmiyorsa, ancak geçerli deneyde çıkış olarak kullanılabiliyorsa (örneğin, derleme sayım dönüştürme modülünün çıkışını kontrol edin), modülleri bağlayarak doğrudan kullanabilirsiniz.

  2. Sayım tablosu parametrelerini değiştirme modülünü ekleyin ve dönüştürmeyi giriş olarak bağlayın.

  3. Sayım tablosu parametrelerini değiştir modülünün Özellikler bölmesinde çöp kutusu eşiği olarak kullanılacak bir değer yazın.

    Bu değer, sayıların kullanılamı için her özellik değeri için bulun gereken en az oluşum sayısını belirtir. Değerin sıklığı çöp kutusu eşiğinden küçükse, değer-etiket çifti ayrık öğe olarak sayılmaz; bunun yerine, eşik değerinden daha düşük sayımlara sahip tüm öğeler tek bir "çöp kutusu" içine yerleştirilir.

    Küçük bir veri kümesi kullanıyorsanız ve aynı verileri sayıyor ve eğitıyorsanız iyi bir başlangıç değeri 1'tir.

  4. Ek önceki sahte örnekler için, ek sahte örneklerin sayısını belirten bir sayı yazın. Bu örnekleri sağlamak zorunda değildir; sahte örnekler, önceki dağıtıma göre oluşturulur.

  5. Laplacian gürültü ölçeği için, Laplacian dağıtımından örnek alınan kirliliğin tanıtımı için kullanılan ölçeği temsil eden pozitif bir kayan nokta değeri yazın. Bir ölçek değeri ayar her zaman kabul edilebilir bir gürültü düzeyi modele dahil edilir, bu nedenle model verilerde yer alan ve olmayan değerlerden etkilenme olasılığı daha düşük olur.

  6. Çıkış özellikleri dahil içinde, dönüştürmeye dahil etmek için sayı tabanlı özellikler oluştururken kullanmak üzere yöntemi seçin.

    • CountsOnly: Sayıları kullanarak özellikler oluşturun.

    • LogOddsOnly: Oran oranının günlüğünü kullanarak özellikler oluşturun.

    • BothCountsAndLogOdds: Hem sayımları hem de günlük olasılıklarını kullanarak özellikler oluşturun.

  7. Özellik oluştururken çıkışta bayrağı geçersiz kılmak için Sütunu geri IsBackOff al seçeneğini belirleyin. Bu seçeneği tercih ederseniz sütunda önemli sayı değerleri yoksa bile sayı tabanlı özellikler oluşturulur.

  8. Denemeyi çalıştırın. İsterseniz Tablo Parametrelerini Değiştir çıkışını yeni bir dönüşüm olarak kaydedebilirsiniz.

Örnekler

Bu modülün nasıl olduğunu görmek için aşağıdaki Azure Yapay Zeka Galerisi:

  • Sayılarla Öğrenme: İkiliSınıflandırma: İkili sınıflandırma modeli için kategorik değer sütunlarından özellik oluşturmak için öğrenmeyi sayımlar modülleriyle birlikte kullanmayı gösterir.

  • Sayımlar Ile öğrenme: NYC TAXI verileri içeren çok sınıflı sınıflandırma: örnek, genel olarak kullanılabilir NYC TAXI veri kümesinde birden çok Lass sınıflandırması gerçekleştirmek için, sayımlarla öğrenme modülleriyle nasıl kullanılacağını gösterir. Örnek, bu sorunu modellemek için çok Lass lojistik regresyon öğrenici kullanır.

  • Sayımlar Ile öğrenme: NYC TAXI verileri Ile ikili sınıflandırma: genel olarak kullanılabilir NYC TAXI veri kümesinde ikili sınıflandırma gerçekleştirmek için sayımlarla öğrenme modülleriyle nasıl kullanılacağını gösterir. Örnek, bu sorunu modellemek için iki sınıflı bir lojistik regresyon öğrenici kullanır.

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

Laplacıa gürültü ölçeği parametresini ayarlarsanız aynı veri kümesini saymak ve eğilmesi istatistiksel olarak güvenlidir.

Beklenen girişler

Ad Tür Description
Dönüştürme sayılıyor Iransform arabirimi Uygulanacak sayım dönüşümü

Modül parametreleri

Ad Tür Aralık İsteğe Bağlı Varsayılan Description
Çöp kutusu eşiği Float >= 0.0 f Gerekli 10.0 f Sütun değerinin çöp kutusu 'nda kullanılması gereken eşik
Diğer önceki sözde örnekler Float >= 0.0 f Gerekli 42.0 f Önceki dağıtımların dahil edilmesini izleyen ek sahte örnekler
Laplacian gürültü ölçeği Float >=0.0f Gerekli 0,0f Gürültünün örneklendir olduğu Laplacian dağılımının ölçeği
Çıkış özellikleri şunlardır: OutputFeatureType Gerekli BothCountsAndLogOdds Çıkış için özellikler
Geri kapatma sütununu yoksay Boole Gerekli yanlış Çıkışta IsBackOff sütununu yoksayıp yoksaymamak

Çıkışlar

Ad Tür Description
Değiştirilen dönüştürme ITransform arabirimi Değiştirilen dönüşüm

Özel durumlar

Özel durum Description
Hata 0003 Bir veya daha fazla giriş null veya boşsa özel durum oluşur.
Hata 0086 Bir sayma dönüştürmesi geçersiz olduğunda özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning kodları.

API özel durumlarının listesi için bkz. Machine Learning REST API Kodları.

Ayrıca bkz.

Sayılarla Öğrenme