Machine Learning Studio'da model sonuçlarını yorumlama (klasik)

Makale
11/29/2017

ŞUNUN IÇIN GEÇERLIDIR: Bu bir onay işaretidir ve bu da bu makalenin Machine Learning Studio (klasik) için geçerli olduğu anlamına gelir. Machine Learning Studio (klasik) Bu bir X'tir ve bu da bu makalenin Azure Machine Learning için geçerli olmadığı anlamına gelir. Azure Machine Learning

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning'e taşıma hakkındaki bilgilere bakın.
Azure Machine Learning hakkında daha fazla bilgi edinin

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bu konuda, Machine Learning Studio'da (klasik) tahmin sonuçlarını görselleştirme ve yorumlama açıklanmaktadır. Bir modeli eğitip üzerine tahminler yaptıktan ("modeli puanladıktan") sonra, tahmin sonucunu anlamanız ve yorumlamanız gerekir.

Machine Learning Studio'da (klasik) dört büyük makine öğrenmesi modeli türü vardır:

Sınıflandırma
Kümeleme
Regresyon
Önerilen sistemler

Bu modellerin üzerinde tahmin için kullanılan modüller şunlardır:

Sınıflandırma ve regresyon için PuanLama Modeli modülü
Kümeleme için Kümeler modülüne atama
Öneri sistemleri için Score Matchbox Recommender

ML Studio'da (klasik) algoritmalarınızı iyileştirmek için parametreleri seçmeyi öğrenin.

Modellerinizi değerlendirmeyi öğrenmek için bkz. Model performansını değerlendirme.

ML Studio'yu (klasik) yeni kullanıyorsanız basit bir deneme oluşturmayı öğrenin.

Sınıflandırma

Sınıflandırma sorunlarının iki alt kategorisi vardır:

Yalnızca iki sınıfla ilgili sorunlar (iki sınıflı veya ikili sınıflandırma)
İkiden fazla sınıfla ilgili sorunlar (çok sınıflı sınıflandırma)

Machine Learning Studio 'nun (klasik) bu sınıflandırma türlerinin her biriyle başa çıkmak için farklı modülleri vardır, ancak tahmin sonuçlarını yorumlama yöntemleri benzerdir.

İki sınıflı sınıflandırma

Örnek deneme

İki sınıflı sınıflandırma probleminin bir örneği, iris çiçeklerinin sınıflandırılmasıdır. Görev, iris çiçeklerini özelliklerine göre sınıflandırmaktır. Machine Learning Studio'da (klasik) sağlanan Iris veri kümesi, yalnızca iki çiçek türünün (sınıf 0 ve 1) örneklerini içeren popüler Iris veri kümesinin bir alt kümesidir. Her çiçek için dört özellik vardır (sepal uzunluğu, sepal genişliği, taçyaprağı uzunluğu ve taçyaprağı genişliği).

iris denemesinin ekran görüntüsü

Şekil 1. Iris iki sınıflı sınıflandırma sorunu denemesi

Şekil 1'de gösterildiği gibi bu sorunu çözmek için bir deneme gerçekleştirildi. İki sınıflık bir artırılmış karar ağacı modeli eğitildi ve puanlandı. Şimdi Modeli Puanlama modülünün çıkış bağlantı noktasına ve ardından Görselleştir'e tıklayarak modeli puanlama modülünden tahmin sonuçlarını görselleştirebilirsiniz.

Model modülünü puanla

Bu, Şekil 2'de gösterildiği gibi puanlama sonuçlarını getirir.

iris iki sınıflı sınıflandırma denemesinin sonuçları

Şekil 2. İki sınıflı sınıflandırmada puan modeli sonucunu görselleştirme

Sonuç yorumlama

Sonuçlar tablosunda altı sütun vardır. Soldaki dört sütun dört özellik içerir. Doğru iki sütun olan Puanlanmış Etiketler ve Puanlanmış Olasılıklar, tahmin sonuçlarıdır. Puanlanmış Olasılıklar sütunu, bir çiçeğin pozitif sınıfa ait olma olasılığını gösterir (Sınıf 1). Örneğin, sütundaki ilk sayı (0,028571), ilk çiçeğin Sınıf 1'e ait olma olasılığının 0,028571 olduğu anlamına gelir. Puanlanan Etiketler sütunu her çiçek için tahmin edilen sınıfı gösterir. Bu, Puanlanan Olasılıklar sütununu temel alır. Bir çiçeğin puanlanmış olasılığı 0,5'ten büyükse, Sınıf 1 olarak tahmin edilir. Aksi takdirde, Sınıf 0 olarak tahmin edilir.

Web hizmeti yayını

Tahmin sonuçları anlaşılıp değerlendirildikten sonra deneme bir web hizmeti olarak yayımlanabilir, böylece bunu çeşitli uygulamalarda dağıtabilir ve herhangi bir yeni iris çiçeğinde sınıf tahminleri elde etmek için çağırabilirsiniz. Eğitim denemesini puanlama denemesine dönüştürmeyi ve web hizmeti olarak yayımlamayı öğrenmek için bkz . Öğretici 3: Kredi riski modelini dağıtma. Bu yordam, Şekil 3'te gösterildiği gibi bir puanlama denemesi sağlar.

Puanlama denemesinin ekran görüntüsü

Şekil 3. İki sınıflı iris sınıflandırma sorunu denemesini puanlama

Şimdi web hizmeti için giriş ve çıkışı ayarlamanız gerekir. Giriş, Iris çiçek özellikleri girişi olan Modeli Puanla'nın doğru giriş bağlantı noktasıdır. Çıkışın seçimi, tahmin edilen sınıfla (puanlanan etiket), puanlanmış olasılıkla mı yoksa her ikisiyle mi ilgilendiğinize bağlıdır. Bu örnekte, her ikisini de ilgilendiğiniz varsayılır. İstediğiniz çıkış sütunlarını seçmek için Veri kümesindeki Sütunları Seçme modülünü kullanın. Veri kümesinde Sütunları Seç'e tıklayın, Sütun seçiciyi başlat'a tıklayın ve Puanlanmış Etiketler ve Puanlanmış Olasılıklar'ı seçin. Veri kümesindeki Sütunları Seç'in çıkış bağlantı noktasını ayarladıktan ve yeniden çalıştırdıktan sonra, WEB HİzMETİ YAYIMLA'ya tıklayarak puanlama denemesini web hizmeti olarak yayımlamaya hazır olmanız gerekir. Son deneme Şekil 4'e benzer.

iris iki sınıflı sınıflandırma denemesi

Şekil 4. İki sınıflı bir iris sınıflandırma sorununun son puanlama denemesi

Web hizmetini çalıştırdıktan ve bir test örneğinin bazı özellik değerlerini girdikten sonra sonuç iki sayı döndürür. İlk sayı puanlanan etiket, ikinci sayı ise puanlanmış olasılıktır. Bu çiçek, 0,9655 olasılığıyla Sınıf 1 olarak tahmin edilir.

Test yorumlama puan modeli

Test sonuçlarını puanlama

Şekil 5. iris iki sınıflı sınıflandırmanın web hizmeti sonucu

Çok sınıflı sınıflandırma

Örnek deneme

Bu denemede, çok sınıflı sınıflandırma örneği olarak bir harf tanıma görevi gerçekleştirirsiniz. Sınıflandırıcı, el ile yazılan görüntülerden ayıklanan bazı el yazısı öznitelik değerlerini temel alarak belirli bir %28class%29 harfini tahmin etmeye çalışır.

Harf tanıma örneği

Eğitim verilerinde elle yazılmış mektup görüntülerinden ayıklanan 16 özellik vardır. 26 harf 26 sınıfımızı oluşturuyor. Şekil 6'da harf tanıma için çok sınıflı sınıflandırma modelini eğitecek ve test veri kümesinde aynı özellik kümesi üzerinde tahminde bulunan bir deneme gösterilmektedir.

Harf tanıma çok sınıflı sınıflandırma denemesi

Şekil 6. Harf tanıma çok sınıflı sınıflandırma sorunu denemesi

Modeli Puanlama modülünün çıkış bağlantı noktasına ve ardından Görselleştir'e tıklayarak Modeli Puanlama modülündeki sonuçları görselleştirdiğinizde, şekil 7'de gösterildiği gibi içeriği görmeniz gerekir.

Model sonuçlarını puanla

Şekil 7. Puan modelinin sonuçlarını çok sınıflı sınıflandırmayla görselleştirme

Sonuç yorumlama

Soldaki 16 sütun, test kümesinin özellik değerlerini temsil eder. "XX" Sınıfı için Puanlanmış Olasılıklar gibi adlara sahip sütunlar, iki sınıflı örnekteki Puanlanmış Olasılıklar sütununa benzer. Karşılık gelen girişin belirli bir sınıfa denk gelme olasılığını gösterir. Örneğin, ilk giriş için 0,003571 "A", 0,000451 "B" olma olasılığı vb. vardır. Son sütun (Puanlanan Etiketler), iki sınıflı büyük/küçük harfteki Puanlanmış Etiketler ile aynıdır. İlgili girişin tahmin edilen sınıfı olarak en büyük puanlanmış olasılığı olan sınıfı seçer. Örneğin, ilk giriş için puanlanan etiket "F" olur çünkü en büyük olasılıkla "F" (0,916995).

Web hizmeti yayını

Ayrıca her giriş için puanlanan etiketi ve puanlanan etiketin olasılığını da alabilirsiniz. Temel mantık, puanlanan tüm olasılıklar arasında en büyük olasılığı bulmaktır. Bunu yapmak için R Betiği Yürütme modülünü kullanmanız gerekir. R kodu Şekil 8'de, denemenin sonucu da Şekil 9'da gösterilir.

R kodu örneği

Şekil 8. Puanlanan Etiketleri ayıklamak için R kodu ve etiketlerin ilişkili olasılıkları

Deneme sonucu

Şekil 9. Harf tanıma çok sınıflı sınıflandırma sorununun son puanlama denemesi

Web hizmetini yayımlayıp çalıştırdıktan ve bazı giriş özelliği değerlerini girdikten sonra döndürülen sonuç Şekil 10'a benzer. Ayıklanan 16 özelliğe sahip bu el yazısı harfinin 0,9715 olasılıklı bir "T" olduğu tahmin edilir.

Puan modülünü yorumlama testi

Test sonucu

Şekil 10. Çok sınıflı sınıflandırmanın web hizmeti sonucu

Regresyon

Regresyon sorunları sınıflandırma sorunlarından farklıdır. Sınıflandırma sorununda iris çiçeğinin ait olduğu sınıf gibi ayrık sınıfları tahmin etmeye çalışıyorsunuz. Ancak aşağıdaki regresyon sorunu örneğinde görebileceğiniz gibi, bir arabanın fiyatı gibi sürekli bir değişken tahmin etmeye çalışıyorsunuz.

Örnek deneme

Regresyon örneği olarak otomobil fiyat tahminini kullanın. Bir arabanın fiyatını, yapma, yakıt türü, gövde türü ve sürüş tekerleği gibi özelliklerine göre tahmin etmeye çalışıyorsunuz. Deneme Şekil 11'de gösterilmiştir.

Otomobil fiyat regresyonu denemesi

Şekil 11. Otomobil fiyat regresyonu sorunu denemesi

Modeli Puanla modülünü görselleştirerek sonuç Şekil 12'ye benzer.

Otomobil fiyat tahmini sorunu için puanlama sonuçları

Şekil 12. Otomobil fiyat tahmini sorunu için puanlama sonucu

Sonuç yorumlama

Puanlanan Etiketler, bu puanlama sonucundaki sonuç sütunudur. Sayılar her araba için tahmin edilen fiyattır.

Web hizmeti yayını

Regresyon denemesini bir web hizmetinde yayımlayabilir ve iki sınıflı sınıflandırma kullanım örneğindeki gibi otomobil fiyat tahmini için çağırabilirsiniz.

Otomobil fiyat regresyonu sorunu için puanlama denemesi

Şekil 13. Otomobil fiyat regresyonu sorununun puanlama denemesi

Web hizmeti çalıştırılırken döndürülen sonuç Şekil 14'e benzer. Bu araba için tahmin edilen fiyat 15.085,52 ABD dolarıdır.

Puanlama modülünü yorumlamayı test etme

Puanlama modülü sonuçları

Şekil 14. Otomobil fiyat regresyonu sorununun web hizmeti sonucu

Kümeleme

Örnek deneme

Şimdi kümeleme denemesi oluşturmak için Iris veri kümesini yeniden kullanalım. Burada veri kümesindeki sınıf etiketlerini yalnızca özelliklere sahip olacak ve kümeleme için kullanılabilecek şekilde filtreleyebilirsiniz. Bu iris kullanım örneğinde, eğitim işlemi sırasında iki olacak küme sayısını belirtin; bu da çiçekleri iki sınıfa kümeleyebileceğiniz anlamına gelir. Deneme Şekil 15'te gösterilmiştir.

Iris kümeleme sorunu denemesi

Şekil 15. Iris kümeleme sorunu denemesi

Kümeleme, eğitim veri kümesinin tek başına ground-truth etiketlerine sahip olmaması bakımından sınıflandırmadan farklıdır. Kümeleme, eğitim veri kümesi örneklerini ayrı kümeler halinde gruplandırıyor. Eğitim sürecinde model, özellikleri arasındaki farkları öğrenerek girişleri etiketler. Bundan sonra, eğitilen model gelecekteki girişleri daha fazla sınıflandırmak için kullanılabilir. Kümeleme sorununda ilgilendiğimiz sonucun iki bölümü vardır. birinci bölüm eğitim veri kümesini etiketlemek, ikincisi ise eğitilen modelle yeni bir veri kümesini sınıflandırmaktır.

Sonucun ilk bölümü , Kümeleme Modelini Eğit'in sol çıkış bağlantı noktasına ve ardından Görselleştir'e tıklayarak görselleştirilebilir. Görselleştirme Şekil 16'da gösterilir.

Kümeleme sonucu

Şekil 16. Eğitim veri kümesi için kümeleme sonucunu görselleştirme

Yeni girdileri eğitilen kümeleme modeliyle kümeleme olan ikinci bölümün sonucu Şekil 17'de gösterilmiştir.

Kümeleme sonucunu görselleştirme

Şekil 17. Kümeleme sonucunu yeni bir veri kümesinde görselleştirme

Sonuç yorumlama

İki parçanın sonuçları farklı deneme aşamalarından kaynaklanıyor olsa da, aynı görünür ve aynı şekilde yorumlanır. İlk dört sütun özelliklerdir. Son sütun olan Atamalar, tahmin sonucudur. Aynı sayıya atanan girişlerin aynı kümede olduğu tahmin edilir, yani benzerlikleri bir şekilde paylaşırlar (bu denemede varsayılan Öklid mesafe ölçümü kullanılır). Küme sayısını 2 olarak belirttiğiniz için Atamalar'daki girdiler 0 veya 1 olarak etiketlenir.

Web hizmeti yayını

Kümeleme denemesini bir web hizmetinde yayımlayabilir ve iki sınıflı sınıflandırma kullanım örneğindeki gibi kümeleme tahminleri için çağırabilirsiniz.

iris kümeleme sorunu için puanlama denemesi

Şekil 18. Bir iris kümeleme sorununun puanlama denemesi

Web hizmetini çalıştırdıktan sonra döndürülen sonuç Şekil 19'a benzer. Bu çiçeğin küme 0'da olduğu tahmin edilir.

Puanlama modülünü yorumlamayı test etme

Puanlama modülü sonucu

Şekil 19. İki sınıflı iris sınıflandırmasının web hizmeti sonucu

Öneren sistem

Örnek deneme

Önerilen sistemler için restoran öneri sorununu örnek olarak kullanabilirsiniz: Müşterilere derecelendirme geçmişine göre restoran önerebilirsiniz. Giriş verileri üç bölümden oluşur:

Müşterilerden restoran derecelendirmeleri
Müşteri özellik verileri
Restoran özellik verileri

Machine Learning Studio'daki (klasik) Matchbox Önerisini Eğit modülüyle yapabileceğimiz birkaç şey vardır:

Belirli bir kullanıcı ve öğe için derecelendirmeleri tahmin et
Belirli bir kullanıcıya öğe önerme
Belirli bir kullanıcıyla ilgili kullanıcıları bulma
Belirli bir öğeyle ilgili öğeleri bulma

Önerilen tahmin türü menüsündeki dört seçenekten birini belirleyerek ne yapmak istediğinizi seçebilirsiniz. Burada dört senaryoya da göz gezdirebilirsiniz.

Eşleştirme kutusu önericisi

Önerilen bir sistem için tipik bir Machine Learning Studio (klasik) denemesi Şekil 20'ye benzer. Bu önerilen sistem modüllerini kullanma hakkında bilgi için bkz. Eşleştirme kutusu önerisini eğit ve Eşleştirme kutusu önerisini puanla.

Önerilen sistem denemesi

Şekil 20. Önerilen sistem denemesi

Sonuç yorumlama

Belirli bir kullanıcı ve öğe için derecelendirmeleri tahmin et

Önerilen tahmin türü altında Derecelendirme Tahmini'ni seçerek, önerilen sistemden belirli bir kullanıcı ve öğe için derecelendirmeyi tahmin etmelerini istiyorsunuz. Puan Eşleştirme Kutusu Önericisi çıkışının görselleştirmesi Şekil 21'e benzer.

Önerilen sistemin puan sonucu -- derecelendirme tahmini

Şekil 21. Önerilen sistemin puan sonucunu görselleştirme--derecelendirme tahmini

İlk iki sütun, giriş verileri tarafından sağlanan kullanıcı öğesi çiftleridir. Üçüncü sütun, bir kullanıcının belirli bir öğe için tahmin edilen derecelendirmesidir. Örneğin, ilk satırda müşteri U1048'in restoran 135026 2 olarak derecelendireceği tahmin edilir.

Belirli bir kullanıcıya öğe önerme

Önerilen tahmin türü altında Öğe Önerisi'ni seçerek, önerilen sistemden belirli bir kullanıcıya öğe önermesini istiyorsunuz. Bu senaryoda seçebileceğiniz son parametre Önerilen öğe seçimidir. Derecelendirilmiş Öğelerden seçeneği (model değerlendirmesi için) öncelikle eğitim sürecinde model değerlendirmesi içindir. Bu tahmin aşaması için Tüm Öğelerden'i seçiyoruz. Score Matchbox Recommender çıkışının görselleştirmesi Şekil 22'ye benzer.

Önerilen sistemin puan sonucu -- öğe önerisi

Şekil 22. Önerilen sistemin puan sonucunu görselleştirme--öğe önerisi

Altı sütundan ilki, giriş verileri tarafından sağlanan öğeleri önermek için verilen kullanıcı kimliklerini temsil eder. Diğer beş sütun, kullanıcıya önerilen öğeleri azalan ilgi sırasına göre temsil ediyor. Örneğin, ilk satırda U1048 müşterisi için en çok önerilen restoran 134986 ve ardından 135018, 134975, 135021 ve 132862.

Belirli bir kullanıcıyla ilgili kullanıcıları bulma

Önerilen tahmin türü altında İlgili Kullanıcılar'ı seçerek, önerilen sistemden belirli bir kullanıcıyla ilgili kullanıcıları bulmasını istiyorsunuz. İlgili kullanıcılar, benzer tercihlere sahip olan kullanıcılardır. Bu senaryoda seçebileceğiniz son parametre İlgili kullanıcı seçimidir. Öğeleri Derecelendiren Kullanıcılardan seçeneği (model değerlendirmesi için) öncelikle eğitim sürecinde model değerlendirmesi içindir. Bu tahmin aşaması için Tüm Kullanıcılardan'ı seçin. Puan Eşleştirme Kutusu Önericisi çıkışının görselleştirmesi Şekil 23'e benzer.

Öneren sistemin --ilgili kullanıcıların sonucunu puanlayın

Şekil 23. Önerilen sistemin puan sonuçlarını görselleştirme--ilgili kullanıcılar

Altı sütunun ilki, giriş verileri tarafından sağlanan ilgili kullanıcıları bulmak için gereken belirli kullanıcı kimliklerini gösterir. Diğer beş sütun, kullanıcının tahmin edilen ilgili kullanıcılarını azalan ilgi sırasına göre depolar. Örneğin, ilk satırda U1048 müşterisi için en uygun müşteri U1051'dir ve bunu U1066, U1044, U1017 ve U1072 izler.

Belirli bir öğeyle ilgili öğeleri bulma

Önerilen tahmin türü altında İlgili Öğeler'i seçerek, önerilen sistemden belirli bir öğeyle ilgili öğeleri bulmasını istiyorsunuz. İlgili öğeler, büyük olasılıkla aynı kullanıcı tarafından beğenilecek öğelerdir. Bu senaryoda seçebileceğiniz son parametre İlgili öğe seçimidir. Derecelendirilmiş Öğelerden seçeneği (model değerlendirmesi için) öncelikle eğitim sürecinde model değerlendirmesi içindir. Bu tahmin aşaması için Tüm Öğelerden'i seçiyoruz. Puan Eşleştirme Kutusu Önericisi çıkışının görselleştirmesi Şekil 24'e benzer.

Öneren sistemin --ilgili öğelerin sonucunu puanlayın

Şekil 24. Önerilen sistemin puan sonuçlarını görselleştirme--ilgili öğeler

Altı sütunun ilki, giriş verileri tarafından sağlanan ilgili öğeleri bulmak için gereken belirli öğe kimliklerini temsil eder. Diğer beş sütunda öğenin tahmini ilgili öğeleri ilgi açısından azalan sırada depolanır. Örneğin, ilk satırda, öğe 135026 için en uygun öğe 135074 ve ardından 135035, 132875, 135055 ve 134992.

Web hizmeti yayını

Tahminleri almak için bu denemeleri web hizmetleri olarak yayımlama işlemi, dört senaryonun her birinde benzerdir. Burada örnek olarak ikinci senaryoyu (belirli bir kullanıcıya öğe önerme) ele alacağız. Diğer üçüyle aynı yordamı izleyebilirsiniz.

Eğitilen önerilen sistemi eğitilmiş bir model olarak kaydedip giriş verilerini istenen şekilde tek bir kullanıcı kimliği sütununa filtreleyerek, denemeyi Şekil 25'te olduğu gibi bağlayabilir ve bir web hizmeti olarak yayımlayabilirsiniz.

Restoran öneri sorununun puanlama deneyi

Şekil 25. Restoran öneri sorununun puanlama deneyi

Web hizmeti çalıştırılırken döndürülen sonuç Şekil 26'ya benzer. U1048 kullanıcısı için önerilen beş restoran 134986, 135018, 134975, 135021 ve 132862.

Önerilen sistem hizmeti örneği

Örnek deneme sonuçları

Şekil 26. Restoran öneri sorununun web hizmeti sonucu

Machine Learning Studio'da model sonuçlarını yorumlama (klasik)

Sınıflandırma

İki sınıflı sınıflandırma

Çok sınıflı sınıflandırma

Regresyon

Kümeleme

Öneren sistem

Ek kaynaklar