Ordinal Regresyon

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bir ordinal regresyon modeli oluşturur

Kategori: Machine Learning / Modeli Başlatma / Regresyon

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, sıralı değerleri tahmin etmek için kullanılmaktadır bir regresyon modeli oluşturmak için Machine Learning Studio'da (klasik) Sıra Regresyon modülünün nasıl kullanımı açıklanmıştır.

Bazı dereceli değerler örnekleri:

  • Kullanıcının 1-5 ölçeğinde tercih ettiği markaları yakalayan anket yanıtları
  • Yarışta sonerlerin sırası
  • Dereceli arama sonuçlarında URL'ler

Ordinal regresyon hakkında daha fazla bilgi

Etiket veya hedef sütunda sayı olduğunda sıra regresyon kullanılır, ancak sayılar sayısal ölçüm yerine bir derecelendirmeyi veya sırayı temsil ediyordur.

Sıra numaralarını tahmin etmek için sürekli bir ölçek üzerinde sayıların değerlerini tahmin etmekten farklı bir algoritma gerekir çünkü derece sıralamasını temsil etmek için atanan sayılar iç ölçeke sahip değildir.

Örneğin öğrencilerin test puanlarını tahmin etmek için standart bir regresyon modeli kullanabilirsiniz çünkü öğrencilerin test puanları sürekli ölçülür ve ölçülebilir. Ancak sınıf sıralamalarını tahmin etmek için sıra regresyon modeli kullan gerekir.

Bu algoritmanın ardındaki araştırma hakkında daha fazla bilgi için bu makaleye (indirilebilir PDF) bakın: https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Ordinal Regresyon'ları yapılandırma

Bu modülde derecelendirme sorunu bir dizi ilgili sınıflandırma sorunu olarak çözülmektedir. Bu nedenle algoritma, her derece için bir ikili model kullanarak bir dizi genişletilmiş eğitim örneği oluşturur ve bu genişletilmiş kümeye göre eğiter. Bu işlem işlem olarak pahalı olabilir.

  1. Studio'da (klasik) denemenize Ordinal Regresyon Modeli modülünü ekleyin. Bu modülü Regresyon kategorisindeki Machine Learning - Başlataltında bulabilirsiniz.

  2. İkili sınıflandırmayı destekleyen bir modül ekleyin ve modeli yapılandırabilirsiniz. Sınıflandırma kategorisinde birkaç iki sınıflı modül vardır.

  3. Bağlan sınıflandırma modelini Sıra Regresyon Modeli modülüne giriş olarak kullanın.

  4. Ordinal Regresyon Modelinde ek parametreler gerekli değildir; algoritma, bir derecelendirme sorununu çözmek için en etkili parametrelerle önceden yapılandırılmıştır.

  5. Bağlan veri kümesi ve Modeli Eğit modülü.

  6. Modeli Eğit modülünde sıralama değerlerini içeren sütunu seçin.

    Sıralama değerleri sayısal değerler olmalıdır, ancak bir diziyi temsil etmeleri sürece tamsayı veya pozitif sayı olması gerekmeyecektir.

    İşleme amacıyla, derecelerin sırası 1 ile K arasında olduğu varsayılır; burada 1 en düşük derece, K ise en yüksek derecedir. Ancak Modeli Eğitme modülü, ölçeğinizin semantiği tersine çevrilse bile kullanılabilir.

    Örneğin, ilk ankette en yüksek puan 1, en düşük puan ise 5 ise modelin işlemesini etkilemez.

  7. Denemeyi çalıştırın.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Tahminde bulunurken eğitilen modeli yeni verilerle birlikte Modeli Puanla modülüne bağlamanız gerekir.

  • Etiketli bir veri kümesinde çapraz doğrulama gerçekleştirmek için, eğitilmemiş modeli Modeli ÇaprazDoğrula'ya bağlama.

Örnekler

Makine öğrenmesinde ordinal regresyonu nasıl kullandığına yönelik örnekler için bkz . Azure Yapay Zeka Galerisi.

  • Tahmine Dayalı Bakım - C. Adım: Bu örnekte, değerin hata sınıflandırması önem derecelerini yansıtdığı varsayımını temel alan bir sınıflandırma modeline göre değerleri sıralamak için Sıra Regresyon kullanılır.

Teknik notlar

Bu öğrenicide kullanılan sıra regresyon algoritması, Genişletilmiş İkili Sınıflandırmaya Göre Sıra Regresyon başlıklı yazıda açıklandığı gibi genişletilmiş ikili sınıflandırma tarafından, NIPS 2006'da Ling Li ve Hsuan-Tien Lin tarafından uygulanır.

Giriş verileriyle ilgili kısıtlamalar

Herhangi bir sayısal sütunu sıra regresyon modelinin hedefi olarak kullanabilirsiniz, ancak uygulamada yalnızca bir sıralamayı veya derecelendirmeyi temsil eden verileri kullanabilirsiniz.

Dereceler arasındaki aralıkların bilinmiyor olduğu varsayılır ve aralığın boyutu model için önemli değildir; ancak model, derece sırasının sayıların doğal sıralamalarını takip eder.

Modelin kendisi belirli bir ölçek için herhangi bir anlam atamaz. Başka bir deyişle, 1'in iyi bir derece, 10'ların en kötü olduğu ve başka bir modelde 10'ların istenen derece, 1'in ise en kötü olduğunu varsayan bir model oluşturabilirsiniz.

Derecelendirme algoritması

Eğitim kümesi (X,Y), x giriş vektörlerinden ve y etiketlerinden oluşur. Etiketler sırasıyla 1 ile k arasında sıralamaları temsil eder: 1,2, ... , K. Derecelerin 1 en düşük veya en kötü derece, K ise en iyi veya en yüksek derece olacak şekilde sıralı olduğu varsayılır.

Algoritmanın crux değeri, verilen X ve Y etiketlerinin genişletilmiş örnekleri kullanmak üzere değiştirilmesi ve ardından ordinal regresyon sorununu çözmek için ikili sınıflandırıcının kullanımıdır. İkili sınıflandırıcı, "Sıralama r'den büyük mü?" sorusuna evet/hayır yanıtı verecek şekilde eğitildi

Örneğin, eğitim kümesinde her durumda K-1 genişletilmiş örnekleri vardır ve gözlemlenen en yüksek derece K'dır. Genişletilmiş özellikler, bir K-1 x K-1 kimlik matrisinin ith satırı tüm i giriş özelliklerine ek olarak oluşturulur. Etiketlerin sıralaması r ise ilk r-1 satırları için +1, geri kalanı ise -1 olarak verilir.

Örnek hesaplamalar

Nasıl çalıştığını göstermek için, x1'in derecesi 3 olan ve gözlemlenen en yüksek sıralamanın 5 olduğu eğitim özelliği olması gerekir. Bu özelle ilgili genişletilmiş örnekler aşağıdaki gibidir:

Case (Olay) Test etme Sonuçta elde edilen etiket
X11000 Derece 1'den büyük mü? Evet; bu nedenle +1
X10100 Derece 2'den büyük mü? Evet; bu nedenle +1
X10010 Derece 3'den büyük mü? Hayır; bu nedenle ek özellik yok
X10001 Derece 4'den büyük mü? Hayır; bu nedenle ek özellik yok

Beklenen girişler

Ad Tür Description
Eğitilmemiş ikili sınıflandırma modeli ILearner arabirimi Eğitilmemiş ikili sınıflandırma modeli

Çıkışlar

Ad Tür Description
Eğitilmemiş model ILearner arabirimi Eğitilmemiş bir ordinal regresyon modeli

Ayrıca bkz.

Regresyon