Veri Akışı Sağlayıcılarından içeri aktarma

Bu makalede, OData biçiminde sağlanan verileri bir makine öğrenmesi denemesine içeri aktarma için Azure Machine Learning Studio'daki (klasik) Verileri İçeri Aktarma modülünün nasıl kullanımı açıklanmıştır.

Not

Uygulama hedefi: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgilidir. Benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısına eklenmiştir. Bu makalede iki sürümü karşılaştırandaha fazla bilgi edinin.

Bir veri kümesi için OData uç noktası oluşturmak, bir veri modelini URL aracılığıyla kullanılabilir hale toplamanın bir yolutur. Uç noktanın hangi OData işlemlerini destekleyeceklerini de belirtebilirsiniz. Uç nokta oluşturma hakkında daha Odata fazla bilgi için bkz. OData v4 (ASP.NET).

Akıştan veri içeri aktarma

Şemanın beklendiği gibi olduğundan emin olmak için içeri aktarmadan önce verilerinizin profilini oluşturmanızı kesinlikle öneririz. İçeri aktarma işlemi şemayı belirlemek için birkaç baş satırı tarar, ancak sonraki satırlarda ek sütunlar veya hatalara neden olan veriler olabilir.

Veri İçeri Aktarma Sihirbazı'nı kullanma

Modülde depolama seçeneği seçmenize yardımcı olacak yeni bir sihirbaz bulunur. Mevcut abonelikler ve hesaplar arasından seçim yapmak ve tüm seçenekleri hızla yapılandırmak için sihirbazı kullanın.

  1. Denemenize Veri İçeri Aktarma modülünü ekleyin. Modülü Studio'da (klasik) Veri Girişi ve Çıktı kategorisinde bulabilirsiniz.

  2. Verileri İçeri Aktarma Sihirbazı'nı Başlat'a tıklayın ve yönergeleri izleyin.

  3. Yapılandırma tamamlandığında, verileri denemenize gerçekten kopyalamak için modüle sağ tıklayın ve Seçili Çalıştır'ı seçin.

Mevcut bir veri bağlantısını düzenlemeniz gerekirse sihirbaz, sıfırdan yeniden başlamanız gerekmamak için önceki tüm yapılandırma ayrıntılarını yükler.

Verileri İçeri Aktarma modülünde özellikleri el ile ayarlama

İçeri aktarma kaynağını el ile de yapılandırabilirsiniz.

  1. Veri alma modülünü denemenize ekleyin. Bu modülü, veri girişi ve çıkış kategorisinde Studio 'da (klasik) bulabilirsiniz.

  2. Veri kaynağı Için veri akışı sağlayıcısı' nı seçin.

  3. Veri içerik türü için akış türünü seçin. Şu anda yalnızca OData uç noktaları destekleniyor.

  4. Kaynak URL 'si için, gerekli biçimde veri sağlayan bir sitenin URL 'sini yapıştırın.

    Örneğin, aşağıdaki ifade Northwind örnek veritabanındaki ürünlerin listesini alır:

    https://services.odata.org/northwind/northwind.svc/Products

    Daha fazla bilgi için bkz. OData sözdizimi.

  5. İlk zamandan sonra verileri yeniden yüklemeniz gerekmiyorsa önbelleğe alınmış sonuçları kullan seçeneğini belirleyin. Bu, deneme çalıştırmaları arasında verilerin değiştirilmesi beklenmiyorsa iyi bir seçenektir.

    Modül parametrelerinde başka bir değişiklik yoksa, deneme, verileri modül ilk kez çalıştırıldığında yükler ve bundan sonra veri kümesinin önbelleğe alınmış bir sürümünü kullanır.

    Verileri düzenli olarak yenilemeniz gerekiyorsa, bu seçeneğin seçimini kaldırın.

  6. Denemeyi çalıştırın.

Sonuçlar

Tamamlandığında, çıktı veri kümesine tıklayın ve verilerin başarıyla içeri aktarılmadığını görmek için Görselleştir ' i seçin.

Veri Içeri aktarma verileri, akış verilerini Studio 'ya (klasik) yüklediğinde, her bir sütunun veri türünü, sayısal veya kategorik, içerdiği değerlere göre alır.

  • Bir üst bilgi varsa, çıkış veri kümesinin sütunlarını adlandırmak için üst bilgi kullanılır.

  • Verilerde mevcut sütun başlıkları yoksa, yeni sütun adları biçim kullanılarak oluşturulur col1, col2,… ,coln .

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

OData sözdizimi

Sorgu düz bir tablo döndürmelidir. İç içe geçmiş OData kayıtlarını düzlükte yerleştirme desteklenmiyor.

OData akışlarına dahil edilen bazı sütunlarda, Studio'da (klasik) desteklenen ondalık gibi veri türleri olabilir. Verileri dize olarak alan ve daha sonra R Betiği veya Meta Veri Düzenleyicisi modüllerini kullanarak dönüştürebilirsiniz.

OData söz dizimi ve URL'leri hakkında daha fazla bilgi için bkz. Odata.org - uri kuralları

Sık sorulan sorular

Kaynaktan okunan verileri filtreleye miyim?

Verileri İçeri Aktarma modülü genellikle veriler okundu olarak filtrelemeyi desteklemez. Ancak, akış kaynağı URL'sinin bir parçası olarak bir filtre koşulu belirtebilirsiniz.

Akıştan verileri filtrelemek için OData protokolü tarafından desteklenen deyimlerini kullanın. Örneğin bu URL, yalnızca 1'e eşit bir kimlikle çalışanla $filter ilgili siparişleri almak için ifadesini kullanır.

https://services.odata.org/Northwind/Northwind.svc/Orders?$filter=Employee/EmployeeID eq 1

Filtre söz dizimi hakkında daha fazla örnek için bkz. OData URL'lerinde Filtre İfadeleri Kullanma.

Alternatif olarak, tüm verileri elde ediyor ve Azure Machine Learning Studio'ya (klasik) yükledikten sonra filtreleyebilirsiniz:

  • Yalnızca istediğiniz verileri almak için özel R betiği kullanın.

  • Verileri Bölme modülünü göreli bir ifadeyle veya normal ifadeyle kullanarak istediğiniz verileri yalıtıp veri kümesi olarak kaydedin.

Not

Size gerekenden daha fazla veri yüklemiş olduğunu bulursanız, yeni bir veri kümesi okuyarak ve daha eski ve daha büyük verilerle aynı adla kaydederek önbelleğe alınmış veri kümesi üzerine yazabilirsiniz.

OData kaynağına bağlanmak için kimlik bilgileri gerekiyor hatasını alıyorum. Devam etmek için lütfen yenileyin ve kimlik bilgilerini girin. Kimlik bilgilerini nasıl sağlarim?**

Verileri İçeri Aktarma modülü yalnızca anonim erişime sahip OData uç noktalarını destekler. OData hizmeti kimlik bilgileri gerektiriyorsa, verileri almak için OData seçeneğini kullanılamaz.

Ancak, hizmet aynı etki alanında ise, kimlik doğrulaması bazen herhangi bir kullanıcı girişi olmadan otomatik olarak olabilir.

Geçici bir çözüm olarak, akış verilerini okumak ve sonra verileri Excel 'den almak için PowerQuery veya PowerPivot kullanabilirsiniz.

Aynı verileri gereksiz yere yeniden yüklemeyi nasıl önleyebileceğiniz?

Kaynak verileriniz değişirse veri kümesini yenileyebilir ve Içeri aktarma verileriniyeniden çalıştırarak yeni veri ekleyebilirsiniz. Ancak, denemeyi her çalıştırdığınızda kaynaktan yeniden okumak istemiyorsanız, önbelleğe alınmış sonuçları kullan seçeneğini true olarak seçin. Bu seçenek TRUE olarak ayarlandığında, modül daha önce aynı kaynak ve aynı giriş seçeneklerini kullanarak çalıştırıldığını kontrol eder ve önceki bir çalıştırma bulunursa, verileri kaynaktan yeniden yüklemek yerine, önbellekteki veriler kullanılır.

Neden "tür Decimal desteklenmiyor" hata iletisiyle karşılaşıyorum?

decimalAzure Machine Learning veri türü desteklenmiyor. Bunun nedeni, Içeri aktarma verilerinin duyarlık kaybına neden olacak dönüştürmeleri otomatik olarak gerçekleştirememeidir.

Desteklenen veri türleri hakkında daha fazla bilgi için bkz. Modül veri türleri.

Geçici bir çözüm olarak, verileri bir dize veri türü olarak okuyabilir ve sonra verileri okumadan önce ondalık sayıları desteklenen bir verilere dönüştürmek için meta verileri Düzenle ' yi kullanabilirsiniz.

Akıştaki bazı karakterler doğru görüntülenmiyor mu?

Azure Machine Learning UTF-8 kodlamasını destekler. Kaynağınız başka bir kodlama türü kullanıyorsa, karakterler doğru şekilde içeri aktarılmayabilir.

Geçici bir çözüm olarak, verileri Azure Tablo depolama veya Azure Blob depolama alanındaki bir CSV dosyasına kaydedebilirsiniz. Daha sonra, özel sınırlayıcılar, kod sayfası ve benzeri parametreleri belirtmek için CSV seçeneğini kodlama ile birlikte kullanın.

Modül parametreleri

Name Aralık Tür Varsayılan Description
Veri kaynağı Liste Veri kaynağı veya havuz Azure Blob Depolama Veri kaynağı, Azure BLOB depolama, Azure tablosu, Azure SQL veritabanı, şirket içi SQL Server veritabanı, Hive tablosu veya bir OData uç noktası olmak üzere HTTP, FTP, anonim HTTPS veya FTPS olabilir.
Veri içerik türü Liste (alt küme) Url İçeriği OData Veri biçimi türü
Kaynak URL herhangi biri Dize Veri kaynağı Power Query URL'si
Önbelleğe alınmış sonuçları kullanma TRUE/FALSE Boole FALSE açıklama

Çıkışlar

Ad Tür Description
Sonuç veri kümesi Veri Tablosu İndirilen verileri olan veri kümesi

Özel durumlar

Özel durum Description
Hata 0003 Bir veya daha fazla giriş null veya boşsa özel durum oluşur.
Hata 0029 Geçersiz bir URI geçir geldiğinde özel durum oluşur.
Hata 0030 bir dosya indirilenemay olduğunda içinde bir özel durum oluşur.
Hata 0002 Bir veya daha fazla parametre ayrıştırılana veya belirtilen türden hedef yöntemin gerekli türüne dönüştürülememesi bir özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning kodları.

API özel durumlarının listesi için bkz. Machine Learning REST API Kodları.

Ayrıca bkz.

Verileri İçeri Aktarma
Verileri dışarı aktar
HTTP aracılığıyla Web URL 'sinden içeri aktarma
Hive sorgusundan içeri aktar
Azure SQL veritabanından içeri aktar
Azure tablosundan içeri aktar
Azure Blob depolamadan içeri aktarma
Şirket Içi SQL Server veritabanından içeri aktar