Azure Machine Learning tasarımcısı için örnek işlem hatları ve veri kümeleri

Kendi makine öğrenmesi işlem hatlarınızı oluşturmaya hızlı bir şekilde başlamak için Azure Machine Learning tasarımcısındaki yerleşik örnekleri kullanın. Azure Machine Learning tasarımcısı GitHub deposu , bazı yaygın makine öğrenmesi senaryolarını anlamanıza yardımcı olacak ayrıntılı belgeler içerir.

Önkoşullar

  • Azure aboneliği. Azure aboneliğiniz yoksa ücretsiz bir hesap oluşturun
  • Azure Machine Learning çalışma alanı

Önemli

Stüdyodaki veya tasarımcıdaki düğmeler gibi bu belgede belirtilen grafik öğeleri görmüyorsanız, çalışma alanı için doğru izin düzeyine sahip olmayabilirsiniz. Size doğru erişim düzeyi verildiğini doğrulamak için lütfen Azure aboneliği yöneticinize başvurun. Daha fazla bilgi için bkz. Kullanıcıları ve rolleri yönetme.

Örnek işlem hatlarını kullanma

Tasarımcı örnek işlem hatlarının bir kopyasını stüdyo çalışma alanınıza kaydeder. İşlem hattını düzenleyerek gereksinimlerinize uyarlayabilir ve kendi ihtiyaçlarınıza göre kaydedebilirsiniz. Projelerinizi hızlı başlatmak için başlangıç noktası olarak kullanın.

Tasarımcı örneğini şu şekilde kullanabilirsiniz:

  1. ml.azure.com oturum açın ve çalışmak istediğiniz çalışma alanını seçin.

  2. Tasarımcı’yı seçin.

  3. Yeni işlem hattı bölümünün altında bir örnek işlem hattı seçin.

    Örneklerin tam listesi için Daha fazla örnek göster'i seçin.

  4. İşlem hattını çalıştırmak için önce işlem hattının üzerinde çalıştırılacak varsayılan işlem hedefini ayarlamanız gerekir.

    1. Tuvalin sağındaki Ayarlar bölmesinde İşlem hedefi seç'i seçin.

    2. Görüntülenen iletişim kutusunda mevcut bir işlem hedefini seçin veya yeni bir hedef oluşturun. Kaydet'i seçin.

    3. İşlem hattı işi göndermek için tuvalin üst kısmındaki Gönder'i seçin.

    Örnek işlem hattına ve işlem ayarlarına bağlı olarak işlerin tamamlanması biraz zaman alabilir. Varsayılan işlem ayarlarının en düşük düğüm boyutu 0'dır; bu da tasarımcının boşta olduktan sonra kaynakları ayırması gerektiği anlamına gelir. İşlem kaynakları zaten ayrıldığından yinelenen işlem hattı işleri daha az zaman alır. Ayrıca tasarımcı, verimliliği daha da artırmak için her bileşen için önbelleğe alınmış sonuçları kullanır.

  5. İşlem hattının çalışması tamamlandıktan sonra işlem hattını gözden geçirebilir ve daha fazla bilgi edinmek için her bileşenin çıkışını görüntüleyebilirsiniz. Bileşen çıkışlarını görüntülemek için aşağıdaki adımları kullanın:

    1. Çıktısını görmek istediğiniz tuvaldeki bileşene sağ tıklayın.
    2. Görselleştir'i seçin.

    En yaygın makine öğrenmesi senaryolarından bazıları için örnekleri başlangıç noktası olarak kullanın.

Regresyon

Bu yerleşik regresyon örneklerini keşfedin.

Örnek başlık Açıklama
Regresyon - Otomobil Fiyat Tahmini (Temel) Doğrusal regresyon kullanarak araba fiyatlarını tahmin edin.
Regresyon - Otomobil Fiyat Tahmini (Gelişmiş) Karar ormanı ve artırılmış karar ağacı regresörlerini kullanarak araba fiyatlarını tahmin edin. En iyi algoritmayı bulmak için modelleri karşılaştırın.

Sınıflandırma

Bu yerleşik sınıflandırma örneklerini keşfedin. Örnekleri açıp bileşen açıklamalarını tasarımcıda görüntüleyerek örnekler hakkında daha fazla bilgi edinebilirsiniz.

Örnek başlık Açıklama
Özellik Seçimi ile İkili Sınıflandırma - Gelir Tahmini İki sınıflık artırılmış bir karar ağacı kullanarak geliri yüksek veya düşük olarak tahmin edin. Özellikleri seçmek için Pearson bağıntısını kullanın.
Özel Python betiği ile İkili Sınıflandırma - Kredi Riski Tahmini Kredi uygulamalarını yüksek veya düşük riskli olarak sınıflandırma. Verilerinizin ağırlığını ayarlamak için Python Betiği Yürüt bileşenini kullanın.
İkili Sınıflandırma - Müşteri İlişkisi Tahmini İki sınıflık artırılmış karar ağaçlarını kullanarak müşteri değişim sıklığı hakkında tahminde bulunur. Yanlı verileri örneklemek için SMOTE kullanın.
Metin Sınıflandırması - Wikipedia SP 500 Veri Kümesi Wikipedia makalelerinden şirket türlerini çok sınıflı lojistik regresyonla sınıflandırabilirsiniz.
Çok Sınıflı Sınıflandırma - Harf Tanıma Yazılı harfleri sınıflandırmak için ikili sınıflandırıcılardan oluşan bir grup oluşturun.

Görüntü işleme

Bu yerleşik görüntü işleme örneklerini keşfedin. Örnekleri açıp bileşen açıklamalarını tasarımcıda görüntüleyerek örnekler hakkında daha fazla bilgi edinebilirsiniz.

Örnek başlık Açıklama
DenseNet kullanarak Görüntü Sınıflandırma PyTorch DenseNet tabanlı görüntü sınıflandırma modeli oluşturmak için görüntü işleme bileşenlerini kullanın.

Öneren

Bu yerleşik öneri örneklerini keşfedin. Örnekleri açıp bileşen açıklamalarını tasarımcıda görüntüleyerek örnekler hakkında daha fazla bilgi edinebilirsiniz.

Örnek başlık Açıklama
Geniş ve Derin Tabanlı Öneri - Restoran Derecelendirme Tahmini Restoran/kullanıcı özellikleri ve derecelendirmelerinden bir restoran öneri motoru oluşturun.
Öneri - Film Derecelendirme Tweetleri Film/kullanıcı özellikleri ve derecelendirmelerinden bir film öneri altyapısı oluşturun.

Yardımcı Program

Makine öğrenmesi yardımcı programlarını ve özelliklerini gösteren örnekler hakkında daha fazla bilgi edinin. Örnekleri açıp bileşen açıklamalarını tasarımcıda görüntüleyerek örnekler hakkında daha fazla bilgi edinebilirsiniz.

Örnek başlık Açıklama
Vowpal Wabbit Modeli Kullanarak İkili Sınıflandırma - Yetişkin Gelir Tahmini Vowpal Wabbit; çevrimiçi, karma oluşturma, sonuç, azaltma, öğrenme2 arama, etkin ve etkileşimli öğrenme gibi tekniklerle makine öğrenmesinin sınırlarını zorlayan bir makine öğrenmesi sistemidir. Bu örnek, ikili sınıflandırma modeli oluşturmak için Vowpal Wabbit modelinin nasıl kullanılacağını gösterir.
Özel R betiği kullanma - Uçuş Gecikme Tahmini Zamanlanmış yolcu uçuşlarının 15 dakikadan fazla gecikip ertelenmediğini tahmin etmek için özelleştirilmiş R betiğini kullanın.
İkili Sınıflandırma için Çapraz Doğrulama - Yetişkin Gelir Tahmini Yetişkin geliri için ikili sınıflandırıcı oluşturmak için çapraz doğrulamayı kullanın.
Permütasyon Özelliği Önem Derecesi Test veri kümesi için önem puanlarını hesaplamak için permütasyon özelliği önem derecesini kullanın.
İkili Sınıflandırma için Parametreleri Ayarlama - Yetişkin Gelir Tahmini İkili sınıflandırıcı oluşturmak için en uygun hiper parametreleri bulmak için Model Hiper Parametrelerini Ayarlama'yı kullanın.

Veri Kümeleri

Azure Machine Learning tasarımcısında yeni bir işlem hattı oluşturduğunuzda, varsayılan olarak bir dizi örnek veri kümesi eklenir. Bu örnek veri kümeleri, tasarımcı giriş sayfasındaki örnek işlem hatları tarafından kullanılır.

Örnek veri kümeleri, Veri Kümeleri-Örnekleri kategorisi altında kullanılabilir. Bunu tasarımcıdaki tuvalin solundaki bileşen paletinde bulabilirsiniz. Bu veri kümelerinden herhangi birini tuvale sürükleyerek kendi işlem hattınızda kullanabilirsiniz.

Veri kümesi adı Veri kümesi açıklaması
Yetişkin Nüfus Sayımı Gelir İkili Sınıflandırma veri kümesi 1994 Nüfus Sayımı veritabanının bir alt kümesi, 16 yaşın üzerindeki çalışan yetişkinlerin 100 ayarlanmış gelir endeksi > ile kullanılması.
Kullanım: Bir kişinin yılda 50 binden fazla kazanıp kazanmadığını tahmin etmek için demografik bilgileri kullanarak kişileri sınıflandırabilirsiniz.
İlgili Araştırma: Kohavi, R., Becker, B., (1996). UCI Machine Learning Deposu. Irvine, CA: University of California, School of Information and Computer Science
Otomobil fiyat verileri (Ham) Otomobiller hakkında fiyat, silindir sayısı ve MPG gibi özelliklerin yanı sıra sigorta risk puanı dahil olmak üzere, make ve modele göre bilgiler.
Risk puanı başlangıçta otomatik fiyatla ilişkilendirilir. Ardından, aktüerlerin sembol olarak bilinen bir süreçte gerçek risk için ayarlanır. +3 değeri otomatikin riskli olduğunu ve -3 değerinin büyük olasılıkla güvenli olduğunu gösterir.
Kullanım: Regresyon veya çok değişkenli sınıflandırma kullanarak özelliklere göre risk puanını tahmin edin.
İlgili Araştırma: Schlimmer, J.C. (1987). UCI Machine Learning Deposu. Irvine, CA: University of California, School of Information and Computer Science.
PAYLAŞıLAN CRM Appetency Etiketleri KDD Cup 2009 müşteri ilişkileri tahmin sınamasından etiketler (orange_small_train_appetency.labels).
PAYLAŞıLAN CRM Değişim Sıklığı Etiketleri KDD Cup 2009 müşteri ilişkileri tahmin sınamasından etiketler (orange_small_train_churn.labels).
CRM Veri Kümesi Paylaşılan Bu veriler KDD Cup 2009 müşteri ilişkileri tahmin sınamasından (orange_small_train.data.zip) gelir.
Veri kümesi, French Telecom şirketi Orange'dan 50.000 müşteri içerir. Her müşterinin 190'ı sayısal, 40'ı kategorik olmak üzere 230 anonimleştirilmiş özelliği vardır. Özellikler çok seyrek.
Paylaşılan CRM Satış Etiketleri KDD Cup 2009 müşteri ilişkileri tahmin sınamasından etiketler (orange_large_train_upselling.labels
Uçuş Gecikmeleri Verileri ABD Ulaştırma Bakanlığı'nın (Zamanında) TranStats veri koleksiyonundan alınan yolcu uçuşu zamanında performans verileri.
Veri kümesi Nisan-Ekim 2013 zaman aralığını kapsar. Tasarımcıya yüklenmeden önce veri kümesi aşağıdaki gibi işlendi:
- Veri kümesi, yalnızca kıta ABD'sindeki en yoğun 70 havaalanını kapsayacak şekilde filtrelendi
- İptal edilen uçuşlar 15 dakikadan uzun gecikmeli olarak etiketlendi
- Yönlendirilen uçuşlar filtrelendi
- Şu sütunlar seçildi: Year, Month, DayofMonth, DayOfWeek, Carrier, OriginAirportID, DestAirportID, CRSDepTime, DepDelay, DepDel15, CRSArrTime, ArrDelay, ArrDel15, Canceled
Alman Kredi Kartı UCI veri kümesi german.data dosyasını kullanan UCI Statlog (Alman Kredi Kartı) veri kümesi (Statlog+German+Credit+Data).
Veri kümesi, bir dizi öznitelikle açıklanan kişileri düşük veya yüksek kredi riskleri olarak sınıflandırır. Her örnek bir kişiyi temsil eder. Hem sayısal hem de kategorik olmak üzere 20 özellik ve ikili etiket (kredi riski değeri) vardır. Yüksek kredi riski girişlerinin etiketi = 2, düşük kredi riski girişlerinin etiketi = 1'i vardır. Düşük riskli bir örneği yüksek olarak yanlış sınıflandırmanın maliyeti 1 iken, yüksek riskli bir örneği düşük olarak yanlış sınıflandırmanın maliyeti 5'tir.
IMDB Film Başlıkları Veri kümesi, Twitter tweet'lerinde derecelendirilmiş filmler hakkında bilgi içerir: IMDB film kimliği, film adı, tarz ve üretim yılı. Veri kümesinde 17.000 film vardır. Veri kümesi "S. Dooms, T. De Pessemier ve L. Martens. MovieTweetings: Twitter'dan Toplanan Bir Film Derecelendirme Veri Kümesi. RecSys 2013'te CrowdRec, Recommender Systems için Crowdsourcing ve human Computation atölyesi."
Film Derecelendirmeleri Veri kümesi, Movie Tweetings veri kümesinin genişletilmiş bir sürümüdür. Veri kümesi, Twitter'da iyi yapılandırılmış tweet'lerden ayıklanan filmler için 170.000 derecelendirmeye sahiptir. Her örnek bir tweeti temsil eder ve bir tanımlama grubudur: kullanıcı kimliği, IMDB film kimliği, derecelendirme, zaman damgası, bu tweet için sık kullanılan sayısı ve bu tweetin retweet sayısı. Veri kümesi A. Said, S. Dooms, B. Loni ve D. Tikk for Recommender Systems Challenge 2014 tarafından kullanıma sunulmuştur.
Hava Durumu Veri Kümesi NOAA'dan saatlik kara tabanlı hava gözlemleri (201304 ile 201310 arasında birleştirilmiş veriler).
Hava durumu verileri, Nisan-Ekim 2013 dönemini kapsayan havaalanı hava durumu istasyonlarından yapılan gözlemleri kapsar. Tasarımcıya yüklenmeden önce veri kümesi aşağıdaki gibi işlendi:
- Hava istasyonu kimlikleri ilgili havaalanı kimlikleriyle eşlendi
- En yoğun 70 havaalanıyla ilişkilendirilmemiş hava istasyonları filtrelendi
- Tarih sütunu ayrı Yıl, Ay ve Gün sütunlarına bölünmüştür
- Şu sütunlar seçildi: AirportID, Year, Month, Day, Time, TimeZone, SkyCondition, Visibility, WeatherType, DryBulbFarenheit, DryBulbCelsius, WetBulbFarenheit, WetBulbCelsius, DewPointFarenheit, DewPointCelsius, RelativeHumidity, WindSpeed, WindDirection, ValueForWindCharacter, StationPressure, PressureTendency, PressureChange, SeaLevelPressure, RecordType, HourlyPrecip, Altimeter
Wikipedia SP 500 Veri Kümesi Veriler, xml verileri olarak depolanan her S&P 500 şirketinin makaleleri temelinde Wikipedia'dan (https://www.wikipedia.org/) türetilir.
Tasarımcıya yüklenmeden önce veri kümesi aşağıdaki gibi işlendi:
- Belirli bir şirket için metin içeriği ayıklama
- Wiki biçimlendirmesini kaldırma
- Alfasayısal olmayan karakterleri kaldırma
- Tüm metni küçük harfe dönüştürme
- Bilinen şirket kategorileri eklendi
Bazı şirketler için bir makale bulunamadığından kayıt sayısının 500'den az olduğunu unutmayın.
Restoran Özellik Verileri Restoranlar ve yemek türü, yemek stili ve konum gibi özellikleri hakkında bir dizi meta veri.
Kullanım: Önerilen bir sistemi eğitmek ve test etmek için bu veri kümesini diğer iki restoran veri kümesiyle birlikte kullanın.
İlgili Araştırma: Bache, K. and Lichman, M. (2013). UCI Machine Learning Deposu. Irvine, CA: University of California, School of Information and Computer Science.
Restoran Derecelendirmeleri Kullanıcılar tarafından restoranlara 0 ile 2 ölçeğinde verilen derecelendirmeleri içerir.
Kullanım: Önerilen bir sistemi eğitmek ve test etmek için bu veri kümesini diğer iki restoran veri kümesiyle birlikte kullanın.
İlgili Araştırma: Bache, K. and Lichman, M. (2013). UCI Machine Learning Deposu. Irvine, CA: University of California, School of Information and Computer Science.
Restoran Müşteri Verileri Demografik veriler ve tercihler de dahil olmak üzere müşterilerle ilgili bir dizi meta veri.
Kullanım: Önerilen bir sistemi eğitmek ve test etmek için bu veri kümesini diğer iki restoran veri kümesiyle birlikte kullanın.
İlgili Araştırma: Bache, K. and Lichman, M. (2013). UCI Machine Learning Deposu Irvine, CA: University of California, School of Information and Computer Science.

Kaynakları temizleme

Önemli

Oluşturduğunuz kaynakları diğer Azure Machine Learning öğreticileri ve nasıl yapılır makaleleri için önkoşul olarak kullanabilirsiniz.

Her şeyi sil

Oluşturduğunuz herhangi bir şeyi kullanmayı planlamıyorsanız ücret ödememek için kaynak grubunun tamamını silin.

  1. Azure portalında pencerenin sol tarafındaki Kaynak grupları'nı seçin.

    Delete resource group in the Azure portal

  2. Listede, oluşturduğunuz kaynak grubunu seçin.

  3. Kaynak grubunu sil'i seçin.

Kaynak grubu silindiğinde tasarımcıda oluşturduğunuz tüm kaynaklar da silinir.

Tek tek varlıkları silme

Denemenizi oluşturduğunuz tasarımcıda, varlıkları tek tek seçip Sil düğmesini seçerek tek tek silin.

Burada oluşturduğunuz işlem hedefi, kullanılmadığında otomatik olarak sıfır düğüme ölçeklenir . Bu işlem ücretleri en aza indirmek için gerçekleştirilen bir işlemdir. İşlem hedefini silmek istiyorsanız şu adımları izleyin:

Delete assets

Her veri kümesini seçip Kaydı Kaldır'ı seçerek veri kümelerinin kaydını çalışma alanınızdan kaldırabilirsiniz.

Unregister dataset

Veri kümesini silmek için Azure portalını kullanarak depolama hesabına gidin veya Azure Depolama Gezgini ve bu varlıkları el ile silin.

Sonraki adımlar

Öğretici: Tasarımcı ile otomobil fiyatını tahmin edin ile tahmine dayalı analiz ve makine öğrenmesinin temellerini öğrenin