Veri kümesindeki Sütunları seçme

Bir işlemde bir veri kümesine dahil etmek veya bu veri kümesinden dışlamak için sütunları seçer

Kategori: Veri Dönüştürme / Düzenleme

Not

Için geçerlidir: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgili. Benzer sürükle ve bırak modülleri bir tasarımcıya Azure Machine Learning eklendi. İki sürümü karşılaştıran bu makalede daha fazla bilgi bulabilirsiniz.

Modüle genel bakış

Bu makalede, aşağı akış işlemlerinde kullanmak üzere sütunların bir alt kümesini seçmek için Azure Machine Learning Studio'daki (klasik) Veri Kümesinde Sütunları Seçme modülünün nasıl kullanımı açıklanmıştır. Modül, sütunları kaynak veri kümesinden fiziksel olarak kaldırmaz; bunun yerine, veritabanı görünümüne veya projeksiyona çok benzer bir sütun alt kümesi oluşturur.

Bu modül özellikle aşağı akış işlemi için kullanılabilir sütunları sınırlamak veya gereksiz sütunları kaldırarak veri kümesi boyutunu azaltmak istediğiniz zaman kullanışlıdır.

Veri kümesinde yer alan sütunlar, özgün verilerde olduğu gibi, bunları farklı bir sırada belirtebilirsiniz.

Veri Kümesinde Sütunları Seçme'yi kullanma

Bu modülün parametresi yoktur. Dahil veya hariç tutulacak sütunları seçmek için sütun seçiciyi kullanırsınız.

Sütunları ad ile seçme

Modülde sütunları adla seçmeye göre birden çok seçenek vardır:

  • Filtreleme ve arama

    ADI GÖRE seçeneğine tıklayın.

    Önceden doldurulmuş bir veri kümesi bağladıysanız kullanılabilir sütunların listesi görüntü gerekir. Hiçbir sütun görünmüyorsa, sütun listesini görüntülemek için yukarı akış modüllerini çalıştırması gerekir.

    Listeyi filtrelemek için arama kutusuna yazın. Örneğin, arama kutusuna harfini yazıyorsanız, liste harfini içeren sütun w adlarını gösterecek şekilde filtrelenmiş w olur.

    Sütunlar ' ı seçin ve sağ taraftaki bölmedeki seçili sütunları listeye taşımak için sağ ok düğmesine tıklayın.

    • Sürekli sütun adları aralığını seçmek için SHIFT + tıklama tuşlarına basın.
    • Seçime ayrı sütunlar eklemek için CTRL + tıklama tuşlarına basın.

    Kaydetmek ve kapatmak için onay işareti düğmesine tıklayın.

  • Diğer kurallarla birlikte adları kullanın

    Kurallar ile seçeneğine tıklayın.

    Belirli bir veri türünün sütunlarını gösterme gibi bir kural seçin.

    Ardından, seçim listesine eklemek için bu türden tek tek sütunları ada göre seçin.

  • Sütun adlarının virgülle ayrılmış bir listesini yazın veya yapıştırın

    Veri kümeniz çok genişse, sütunları tek tek seçmek yerine dizinleri veya oluşturulmuş ad listesini kullanmak daha kolay olabilir. Listeyi önceden hazırladığınıza varsayılarak:

    1. Kurallar ile seçeneğine tıklayın.
    2. Sütun yok' u seçin, Ekle' yi seçin ve sonra kırmızı ünlem işaretiyle metin kutusunun içine tıklayın.
    3. Önceden doğrulanan sütun adlarının virgülle ayrılmış bir listesini içine yapıştırın veya yazın. Herhangi bir sütunda geçersiz bir ad varsa modülü kaydedemezsiniz, bu nedenle adları önceden denetlediğinizden emin olun.

    Bu yöntemi, dizin değerlerini kullanarak sütunların bir listesini belirtmek için de kullanabilirsiniz. Sütun dizinleri ile çalışma hakkında ipuçları için örnekler bölümüne bakın.

Türe göre seçin

WıTH Rules seçeneğini kullanırsanız, sütun seçimlerinde birden çok koşul uygulayabilirsiniz. Örneğin, bir sayısal veri türünün yalnızca özellik sütunlarını almanız gerekebilir.

BEGIN WITH seçeneği başlangıç noktanızı belirler ve sonuçları anlamak için çok önemlidir.

  • TÜM SÜTUNLAR seçeneğini gösterirseniz, tüm sütunlar listeye eklenir. Ardından, belirli koşulları karşılamaya uygun sütunları kaldırmak için Dışla seçeneğini kullanmelisiniz.

    Örneğin, tüm sütunlarla başlayabilir ve ardından sütunları adına veya türe göre kaldırabilirsiniz.

  • SÜTUN YOK seçeneğini tercih ettiyseniz sütun listesi boş olarak başlar. Ardından listeye sütun eklemek için koşulları belirtirsiniz.

    Birden çok kural uygulasanız, her koşul eklenebilir olur. Örneğin, hiç sütunla başlamayı ve ardından tüm sayısal sütunları almak için bir kural ekleyebilirsiniz. Automobile price veri kümesinde 16 sütun bulunur. Ardından, yeni bir koşul + eklemek için işaretine tıklar ve Tüm özellikleri ekle'yi seçersiniz. Sonuçta elde edilen veri kümesi tüm sayısal sütunların yanı sıra bazı dize özellik sütunları da dahil olmak üzere tüm özellik sütunlarını içerir.

Sütun dizinine göre seçme

Sütun dizini, özgün veri kümesi içindeki sütunun sırasına başvurur.

  • Sütunlar 1'den başlayarak sırayla numaralandı.
  • Bir sütun aralığı almak için kısa çizgi kullanın.
  • veya gibi açık sona sahip 1- -3 belirtimlere izin verilmez.
  • Yinelenen dizin değerlerine (veya sütun adlarına) izin verilmez ve bir hataya neden olabilir.

Örneğin, veri kümenizin en az sekiz sütunu olduğunu varsayarak aşağıdaki örneklerden herhangi birini yapıştırarak bitişik olmayan birden çok sütun getirebilirsiniz:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

Son örnek bir hatayla sonuçlanmaz; ancak sütunun tek bir örneğini 4 döndürür.

Sütun dizinleriyle çalışma hakkında ek ipuçları için Örnekler bölümüne bakın.

Sütunların sırasını değiştir

Seçimdeki yinelenen öğelere Izin ver ve sütun sırasını koru seçeneği boş bir listeyle başlar ve ad ya da dizine göre belirttiğiniz sütunları ekler. Sütunları her zaman "doğal sırasıyla" döndüren diğer seçeneklerin aksine, bu seçenek sütunları ad veya listeettiğiniz sırada çıkarır.

Örneğin, Sütun1, Col2, Col3 ve col4 sütunlarına sahip bir veri kümesinde aşağıdaki listelerden birini belirterek sütunların sırasını ters çevirebilirsiniz ve sütun 2 ' yi dışarıda bırakabilirsiniz:

  • Col4, Col3, Col1
  • 4,3,1

Örnekler

Veri kümesinde sütunları seç' in nasıl kullanılacağına ilişkin örnekler için, bkz. model galerisindeBu örnek denemeleri.

Sütun seçimi için genel senaryolar

Aşağıdaki örneklerde, kullanıcıların Machine Learning 'de veri kümesinde Select sütunları uygulaması için bazı tipik yollar açıklanır ve sütunların nasıl seçiminde ilgili bazı ipuçları verilmektedir:

  • Bir matematik işlemini tüm sayısal sütunlara uygulayabilmem için veri kümesinden metin sütunları kaldırmak istiyorum.

    Birçok işlem, veri kümesinde yalnızca sayısal sütunların bulunmasını gerektirir. Metni dışlayarak ve kategorik sütunları hariç bırakarak hataya neden olabilecek sütunları geçici olarak kaldırabilirsiniz (ayrık kategorileri temsil eden sayılar).

    1. Sütun seçiciyi Başlat seçeneğine tıklayın.

    2. Ile Başla için Tüm sütunlar'ı seçin.

    3. Dışla seçeneğini belirleyin, sütun türünü ve ardından Dize'yi seçin.

    4. Yeni bir koşul eklemek için artı işaretine (+) tıklayın.

    5. Dışla seçeneğini belirleyin, sütun türünü seçin ve ardından Kategorik seçeneğini belirleyin.

  • Özellik seçimini yalnızca kategorik özellik sütunlarına uygulamam gerekiyor.

    Benzer türde sütunları ayırmaya ihtiyacınız varsa birden çok koşullar uygulayabilirsiniz. Örneğin, özellikler kategorik veya sayısal olabilir, ancak bazı özellik seçim modülleri sayısal olmayan alanlara izin vermez, bu nedenle önce özellikleri almak ve ardından yalnızca sayısal özellikleri almak için bir koşul eklemeniz gerekir.

    1. Sütun seçiciyi başlat'a tıklayın.

    2. Başlangıç için Sütun yok'a tıklayın.

    3. Dahil Seç seçeneğini belirleyin ve tüm özellikleri seçin.

    4. Yeni bir koşul eklemek için artı işaretine (+) tıklayın.

    5. Dahil'i seçin, sütun türünü ve ardından Kategorik'i seçin.

  • Farklı sayısal sütunlara farklı bir normalleştirme işlemi uygulamam gerekiyor.

    Matematik işlemlerini uygulamadan önce, tamsayıları kayan nokta sayılarından vb. ayırmaya ihtiyacınız olabilir. Bunu yapmak için veri türlerini kullanın ve birden çok koşullar uygulama.

    1. Sütun seçiciyi başlat'a tıklayın.

    2. Başlangıç için Sütun yok'a tıklayın.

    3. Dahil'i seçin, sütun türünü ve ardından Sayısal'ı seçin.

    4. Yeni koşul eklemek için artı işaretine (+) tıklayın.

    5. Dahil'i seçin, sütun türünü seçin ve ardından aşağı akış işlemiyle uyumsuz sayısal türü seçin.

  • Seçici kullanılarak seçebileceğiniz çok fazla sütun var.

    Genellikle, bir veri kümesini içeri aktardıktan sonra, modelleme için gerekli olmayan çok sayıda sütun olduğunu fark edersiniz. Bununla birlikte, bunları daha sonra çıktı için ya da diğer durumları belirlemek üzere saklamak istiyorsunuz. Bu, veri kümesini iki parçaya bölerek (meta veriler ve modelleme için kullanılan sütunlar) ve daha sonra sütunları Ekle' yi kullanarak sütunları gerektiği gibi yeniden birleştirirseniz yapabilirsiniz.

    1. Sütun seçiciyi Başlat seçeneğine tıklayın.

    2. Başlangıç Için sütun yok' u seçin.

    3. Dahil et seçeneğini belirleyin, sütun türü' nü seçin ve ardından özellik' i seçin.

    4. Yeni bir koşul eklemek için artı işaretine (+) tıklayın.

    5. Dahil et seçeneğini belirleyin, sütun türü' nü seçin ve etiket' i seçin.

    6. Bu adımları tekrarlayın, ancak tüm sütunlarla başlayın ve ardından yalnızca meta verilerin bir veri kümesini oluşturmak için özellik ve etiket sütunlarını dışlayın.

  • İhtiyacım olan sütunlar için dizin değerlerini bilmiyorum.

    Veri kümenizde yalnızca birkaç sütun varsa, ilk 100 satırı görmek ve sonra hangi sütunun dizin 1, 2 vs. olduğunu anlamak için Görselleştir seçeneğini kullanabilirsiniz.

    • Azure Machine Learning dizinler 1 ' de başlar, bu nedenle ilk sütun her zaman 1 ' dir.

    • Son sütunun dizinini almak için, sütun seçicideki iki sütun listesine bakın: KULLANILABILIR sütunlar ve SEÇILI sütunlar. Sütun listesinin altındaki gri çubuk her listedeki sütun sayısını görüntüler. Bu nedenle, 24 sütun varsa ve iki sütun seçilirse, toplam 26 sütun vardır ve son sütunun dizini 26 ' dır.

    Veri kümenizin şemasını ayıklamak için başka bir seçenek de, Dizin numaralarına sahip sütun adlarını almak için R betiği Yürüt modülünü kullanmaktır.

    1. Veri kümenizi R betiği Yürüt modülüne bağlayın.

    2. Modülünde, sütun adlarını çıkarmak için aşağıdakine benzer bir komut dosyası yazın. İle başlayan satır, myindex dizinleri sırasıyla temsil eden bir dizi oluşturur.

      dataset1 <- maml.mapInputPort(1) # class: data.frame
      mycolnames <-names(dataset1);
      myindex <- seq(from = 1, to = length(mycolnames), by=1);
      outdata <- as.data.frame(cbind(myindex, mycolnames));
      maml.mapOutputPort("outdata"); 
      

    Automobile price veri kümesi sonuçları

    myindex mycolnames
    1 symboling
    2 normalleştirilmiş kayıplar
    3 make

Teknik notlar

İlişkisel veritabanları hakkında bilgi sahibiysiniz, bu modül verilerin bir projeksiyonu oluşturur; bu nedenle özgün adı, Proje Sütunları. Veritabanı açısından projeksiyon Transact-SQL veya LINQ deyimi gibi tablo biçimindeki verileri giriş olarak alan ve ilgili bir çıktı üreten bir işlevdir.

İlişkisel cebirde projeksiyon, öznitelik adları kümesi olarak yazılan birli işlemdir. Projeksiyon sonucu, diğer özniteliklerin atılmış olduğu bu özniteliklerin kümesidir.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri Tablosu Giriş veri kümesi

Modül parametreleri

Name Aralık Tür Varsayılan Description
Sütun seçme herhangi biri ColumnSelection Proje veri kümesinde tutmak istediğiniz sütunları seçin.

Çıkışlar

Ad Tür Description
Sonuç veri kümesi Veri Tablosu Çıktı veri kümesi

Özel durumlar

Özel durum Description
Hata 0001 Veri kümesinde belirtilen bir veya daha fazla sütun bulunamasa özel durum oluşur.
Hata 0003 Bir veya daha fazla giriş veri kümesi null veya boşsa bir özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.

API özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.

Ayrıca bkz.

İşleme