Göreli ifade kullanarak veri kümesini bölme

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bu makalede Machine Learning Studio'nun Verileri Bölme modülünde (klasik) Göreli İfade Bölme seçeneğinin nasıl kullanılacağı açıklanmaktadır. Bu seçenek, bir veri kümesini sayısal bir ifade kullanarak eğitim ve test veri kümelerine bölmeniz gerektiğinde yararlıdır. Örnek:

  • Yaş 40 ile 40 yaş veya daha küçük
  • Test puanı 60 veya daha yüksek ve 60'tan küçük
  • 1 ile diğer tüm değerlerin derece değeri karşılaştırması

Not

Şunlar için geçerlidir: Yalnızca Machine Learning Studio (klasik)

Benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısında da kullanılabilir.

Verilerinizi bölmek için, verilerinizde tek bir sayısal sütun seçer ve her satırı değerlendirirken kullanılacak bir ifade tanımlarsınız. Göreli ifade sütun adını, değeri ve büyüktür ve küçüktür, eşittir ve eşit değil gibi bir işleci içermelidir.

Bu seçenek veri kümesini iki gruba ayırır.

Makine öğrenmesi denemeleri için veri bölümleme hakkında genel bilgi için bkz. Verileri Bölme ve Bölümleme ve Bölme.

Verileri Bölme modülündeki diğer seçenekler:

Veri kümesini bölmek için göreli ifade kullanma

  1. Verileri Bölme modülünü Stuio'daki denemenize ekleyin ve bölmek istediğiniz veri kümesine giriş olarak bağlayın.

  2. Bölme modu için göreli ifade bölme'yi seçin.

  3. İlişkisel ifade metin kutusuna, tek bir sütuna sayısal karşılaştırma işlemi gerçekleştiren bir ifade yazın:

    • Sütun, tarih/saat veri türleri de dahil olmak üzere herhangi bir sayısal veri türünün sayılarını içerir.

    • İfade en fazla bir sütun adına başvurabilir.

    • AND işlemi için ve karakterini (&) ve OR işlemi için kanal karakterini (|) kullanın.

    • Aşağıdaki işleçler desteklenir: <, >, <=, >=, ==, !=

    • ve )kullanarak ( işlemleri gruplandıramazsınız.

    Fikirler için Örnekler bölümüne bakın.

  4. Denemeyi çalıştırın veya modüle sağ tıklayıp Seçili çalıştır'ı seçin.

    İfade, veri kümesini iki satır kümesine böler: koşulu karşılayan değerlere sahip satırlar ve kalan tüm satırlar.

    Ek bölme işlemleri gerçekleştirmeniz gerekiyorsa, *Verileri Bölme'nin ikinci bir örneğini ekleyebilir veya SQL Dönüşümü Uygulama modülünü kullanarak bir CASE deyimi tanımlayabilirsiniz.

Relatve ifade örnekleri

Aşağıdaki örneklerde, Verileri Bölme modülündeki Göreli İfade seçeneğini kullanarak bir veri kümesinin nasıl bölündüğü gösterilmektedir:

Takvim yıllarını kullanma

Yaygın bir senaryo, bir veri kümesini yıllara bölmektir. Aşağıdaki ifade, sütundaki Year değerlerin değerinden 2010büyük olduğu tüm satırları seçer.

\"Year" > 2010

Tarih ifadesi, veri sütununa dahil edilen tüm tarih bölümlerini hesaba almalıdır ve veri sütunundaki tarihlerin biçimi tutarlı olmalıdır.

Örneğin, biçimini mmddyyyykullanan bir tarih sütununda ifade aşağıdakine benzer olmalıdır:

\"Date" > 1/1/2010

Sütun dizinlerini kullanma

Aşağıdaki ifade, veri kümesinin ilk sütunundaki 30'a eşit veya 30'a eşit olmayan ancak 20'ye eşit olmayan tüm satırları seçmek için sütun dizinini nasıl kullanabileceğinizi gösterir.

(\0)<=30 & !=20

Birden çok bölme kullanan zaman değerleri üzerinde bileşik işlem

Çok uzun süre çalışan sorguları gruplandırmak için günlük verileri tablosunu bölmek istediğinizi varsayalım. 1 dakikadan fazla çalıştırdığınız sorguları almak için sütununda Elapsedaşağıdaki göreli ifadeyi kullanabilirsiniz.

\"Elapsed" >00:01:00

Yanıt süreleri bir dakikadan fazla ama 30 saniyeden uzun olan sorguları almak için sağ taraftaki çıkışa başka bir Veri Bölme örneği ekleyin ve aşağıdaki gibi bir ifade kullanın:

\"Elapsed" <:00:01:00 & >00:00:30

Veri kümesini tarih değerlerinde bölme

Aşağıdaki göreli ifade, sütunundaki dt1tarih değerlerini kullanarak veri kümesini böler.

\"dt1" > 10-08-2015

Tarihi 10-08-2015'ten büyük olan satırlar ilk (sol) çıkış veri kümesine eklenir.

10-08-2015 veya önceki bir tarihe sahip satırlar ikinci (sağ) çıkış veri kümesine eklenir.

Teknik notlar

Bu bölüm uygulama ayrıntılarını, ipuçlarını ve sık sorulan soruların yanıtlarını içerir.

Kısıtlamalar

Bir veri kümesindeki göreli ifadeler için aşağıdaki kısıtlamalar geçerlidir:

  • Göreli ifadeler yalnızca sayısal veri türlerine ve tarih/saat veri türlerine uygulanabilir.
  • Göreli ifadeler en fazla bir sütun adına başvurabilir.
  • AND işlemi için ve karakterini (&) ve OR işlemi için kanal karakterini (|) kullanın.
  • Göreli ifadeler için aşağıdaki işleçlere izin verilir: <, >, <=, >=, , ==, !=
  • Parantezlerle gruplandırma işlemleri desteklenmez.

Ayrıca bkz.

Örnek ve Bölme
Bölüm ve Örnek