Veri Akışı Sağlayıcılarından içeri aktarma

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bu makalede, OData biçiminde sağlanan verileri bir makine öğrenmesi denemesine içeri aktarma için Machine Learning Studio'daki (klasik) Verileri İçeri Aktarma modülünün nasıl kullanımı açıklanmıştır.

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Bir veri kümesi için OData uç noktası oluşturmak, bir veri modelini URL aracılığıyla kullanılabilir hale toplamanın bir yolutur. Uç noktanın hangi OData işlemlerini destekleyeceklerini de belirtebilirsiniz. Uç nokta oluşturma hakkında daha fazla Odata bilgi için bkz. OData v4 (ASP.NET).

Akıştan veri içeri aktarma

Şemanın beklendiği gibi olduğundan emin olmak için içeri aktarmadan önce verilerinizin profilini oluşturmanızı kesinlikle öneririz. İçeri aktarma işlemi şemayı belirlemek için birkaç baş satırı tarar, ancak sonraki satırlarda ek sütunlar veya hatalara neden olan veriler olabilir.

Veri İçeri Aktarma Sihirbazı'nı kullanma

Modülde depolama seçeneği seçmenize yardımcı olacak yeni bir sihirbaz bulunur. Mevcut abonelikler ve hesaplar arasından seçim yapmak ve tüm seçenekleri hızla yapılandırmak için sihirbazı kullanın.

  1. Denemenize Veri İçeri Aktarma modülünü ekleyin. Modülü Studio'da (klasik) Veri Girişi ve Çıktı kategorisinde bulabilirsiniz.

  2. Verileri İçeri Aktarma Sihirbazı'nı Başlat'a tıklayın ve yönergeleri izleyin.

  3. Yapılandırma tamamlandığında, verileri denemenize gerçekten kopyalamak için modüle sağ tıklayın ve Seçili Çalıştır'ı seçin.

Mevcut bir veri bağlantısını düzenlemeniz gerekirse sihirbaz, sıfırdan yeniden başlamanız gerekmamak için önceki tüm yapılandırma ayrıntılarını yükler.

Verileri İçeri Aktarma modülünde özellikleri el ile ayarlama

İçeri aktarma kaynağını el ile de yapılandırabilirsiniz.

  1. Denemenize Veri İçeri Aktarma modülünü ekleyin. Bu modülü Studio'da (klasik) Veri Girişi ve Çıkışı kategorisinde bulabilirsiniz.

  2. Veri kaynağı için Veri Akışı Sağlayıcısı'ı seçin.

  3. Veri içerik türü için akış türünü seçin. Şu anda yalnızca OData uç noktaları derilmektedir.

  4. Kaynak URL için, gerekli biçimde veri sağlayan bir sitenin URL'sini yapıştırın.

    Örneğin, aşağıdaki deyim Northwind örnek veritabanından ürünlerin listesini alır:

    https://services.odata.org/northwind/northwind.svc/Products

    Daha fazla bilgi için bkz. OData söz dizimi.

  5. Verileri ilk kez yükledikten sonra yeniden yüklemek zorunda değilseniz Önbelleğe alınmış sonuçları kullan seçeneğini belirleyin. Denemenin çalıştırmaları arasında verilerin değişmesi beklenmiyorsa bu iyi bir seçenektir.

    Modül parametrelerinde başka değişiklik yoksa, deneme modül ilk kez çalıştırıldıklarında verileri yükler ve daha sonra veri kümesi önbelleğe alınmış bir sürümünü kullanır.

    Verileri düzenli olarak yenilemeniz gerekirse bu seçeneğin seçimini kaldırın.

  6. Denemeyi çalıştırın.

Sonuçlar

Tamamlandığında, çıktı veri kümesine tıklayın ve verilerin başarıyla içe aktarılmış olup olduğunu görmek için Görselleştir'i seçin.

Verileri İçeri Aktar , akış verilerini Studio'ya (klasik) yüklerken, içerdiği değerlere (sayısal veya kategorik) göre her sütunun veri türünü gösterir.

  • Bir üst bilgi varsa, çıkış veri kümesi sütunlarını ad olarak sunmak için üst bilgi kullanılır.

  • Verilerde mevcut sütun üst bilgileri yoksa, biçimi kullanılarak yeni sütun adları oluşturulur col1, col2,… ,coln.

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

OData söz dizimi

Sorgunun düz bir tablo oluşturması gerekir. İç içe geçmiş OData kayıtlarını düzlükte yerleştirme desteklenmiyor.

OData akışlarına dahil edilen bazı sütunlarda, Studio'da (klasik) desteklenen ondalık gibi veri türleri olabilir. Verileri dize olarak alan ve daha sonra R Betiği veya Meta Veri Düzenleyicisi modüllerini kullanarak dönüştürebilirsiniz.

OData söz dizimi ve URL'leri hakkında daha fazla bilgi için bkz . Odata.org - uri kuralları

Sık sorulan sorular

Kaynaktan okunan verileri filtreleye miyim?

Verileri İçeri Aktarma modülü genellikle veriler okundu olarak filtrelemeyi desteklemez. Ancak, akış kaynağı URL'sinin bir parçası olarak bir filtre koşulu belirtebilirsiniz.

Akıştan verileri filtrelemek için OData protokolü tarafından desteklenen deyimleri kullanın. Örneğin bu URL, yalnızca $filter 1'e eşit bir kimlikle çalışanla ilgili siparişleri almak için ifadesini kullanır.

https://services.odata.org/Northwind/Northwind.svc/Orders?$filter=Employee/EmployeeID eq 1

Filtre söz dizimi hakkında daha fazla örnek için bkz . OData URL'lerinde Filtre İfadeleri Kullanma.

Alternatif olarak, tüm verileri almak ve Machine Learning Studio'ya (klasik) yükledikten sonra filtreleyebilirsiniz:

  • Yalnızca istediğiniz verileri almak için özel R betiği kullanın.

  • Verileri Bölme modülünü göreli bir ifadeyle veya normal ifadeyle kullanarak istediğiniz verileri yalıtıp bir veri kümesi olarak kaydedin.

Not

Size gerekenden daha fazla veri yüklemiş olduğunu bulursanız, yeni bir veri kümesi okuyarak ve eski, daha büyük verilerle aynı adla kaydederek önbelleğe alınmış veri kümesi üzerine yazabilirsiniz.

OData kaynağına bağlanmak için kimlik bilgileri gerekiyor hatasını alıyorum. Devam etmek için lütfen yenileyin ve kimlik bilgilerini girin. Kimlik bilgilerini nasıl sağlarim?**

Verileri İçeri Aktarma modülü yalnızca anonim erişime sahip OData uç noktalarını destekler. OData hizmeti kimlik bilgileri gerektiriyorsa, verileri almak için OData seçeneğini kullanılamaz.

Ancak, hizmet aynı etki alanında ise, kimlik doğrulaması bazen herhangi bir kullanıcı girişi olmadan otomatik olarak olabilir.

Geçici bir çözüm olarak, akış verilerini okumak ve PowerPivot veri almak için PowerQuery veya Excel.

Aynı verileri gereksiz yere yeniden yüklemeden nasıl kaçınabilirsiniz?

Kaynak verileriniz değişirse, Verileri İçeri Aktar'ın yeniden çalıştırarak veri kümenizi yeniler ve yeni veriler eklersiniz. Ancak denemeyi her çalıştırsanız kaynaktan yeniden okumak istemiyorsanız Önbelleğe alınmış sonuçları kullan seçeneğini TRUE olarak belirleyin . Bu seçenek TRUE olarak ayarlanırsa modül, denemenin daha önce aynı kaynak ve aynı giriş seçeneklerini kullanarak çalıştırıp çalıştırma olmadığını kontrol eder ve önceki bir çalıştırma bulunursa verileri kaynaktan yeniden yükleme yerine önbellekte veriler kullanılır.

Neden "Tür Ondalık desteklenmiyor" hata iletisini alıyorum?

Veri decimal türü, veri türü Machine Learning. Bunun nedeni, Verileri İçeri Aktarma'nın otomatik olarak duyarlık kaybına neden olacak dönüştürmeleri gerçekleştire tıklamamasıdır.

Desteklenen veri türleri hakkında daha fazla bilgi için bkz. Modül Veri Türleri.

Geçici bir çözüm olarak, verileri bir dize veri türü olarak okuyabilir ve sonra verileri okumadan önce ondalık basamakları desteklenen verilere dönüştürmek için Meta Verileri Düzenle'yi kullanabilirsiniz.

Akışta bazı karakterler neden doğru görüntülenmiyor?

Machine Learning UTF-8 kodlamasını destekler. Kaynağınız başka bir kodlama türü kullanıyorsa karakterler doğru şekilde içe aktarılamay olabilir.

Geçici bir çözüm olarak, verileri Azure tablo depolama veya Azure blob depolamadaki bir CSV dosyasına kaydedebilirsiniz. Ardından csv seçeneğini kodlama ile birlikte kullanarak özel sınırlayıcılar, kod sayfası vb. parametrelerini belirtin.

Modül parametreleri

Name Aralık Tür Varsayılan Description
Veri kaynağı Liste Veri kaynağı veya havuz Azure Blob Depolama veri kaynağı, azure BLOB depolama, azure tablosu, Azure SQL Veritabanı, şirket içi SQL Server veritabanı, Hive tablosu veya bir OData uç noktası olmak üzere HTTP, FTP, anonim HTTPS veya ftps olabilir.
Veri içerik türü Liste (alt küme) URL Içeriği OData Veri biçimi türü
Kaynak URL 'SI herhangi biri Dize Power Query veri kaynağı URL 'si
Önbelleğe alınmış sonuçları kullan DOĞRU/YANLıŞ Boole FALSE açıklama

Çıkışlar

Ad Tür Description
Sonuç veri kümesi Veri tablosu İndirilen verileri içeren veri kümesi

Özel durumlar

Özel durum Description
Hata 0003 Bir veya daha fazla giriş null veya boşsa bir özel durum oluşur.
Hata 0029 Geçersiz bir URI geçirildiğinde bir özel durum oluşur.
Hata 0030 bir dosya indirmek mümkün olmadığında içinde bir özel durum oluşur.
Hata 0,0002 Bir veya daha fazla parametre ayrıştırılamadıysanız veya belirtilen türden hedef yöntem tarafından istenen türe dönüştürülemiyorsa bir özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.

apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.

Ayrıca bkz.

Verileri İçeri Aktarma
Verileri dışarı aktar
HTTP aracılığıyla Web URL’sinden içeri aktarma
Hive sorgusundan içeri aktar
Azure SQL Veritabanı’ndan içeri aktarma
Azure tablosundan içeri aktar
Azure Blob Depolama içeri aktar
şirket içi SQL Server veritabanından içeri aktar