Azure açık veri kümeleri nedir ve bunları nasıl kullanabilirsiniz?
Azure açık veri kümeleri, daha doğru modeller için makine öğrenimi çözümlerine senaryoya özgü özellikler eklemek için kullanabileceğiniz, seçkin ortak veri kümeleridir. Açık veri kümeleri bulutta Microsoft Azure ve Azure Machine Learning tümleşiktir ve Azure Databricks ve Machine Learning Studio (klasik) ile kolayca kullanılabilir. Ayrıca, veri kümelerine API 'Ler aracılığıyla erişebilir ve bunları Power BI ve Azure Data Factory gibi diğer ürünlerde kullanabilirsiniz.
Veri kümeleri, makine öğrenimi modellerini ve zenginleştirme çözümlerini eğitmenize yardımcı olan hava durumu, Census, tatiller, genel güvenlik ve konum için genel etki alanı verilerini içerir. Ayrıca, Azure açık veri kümelerinde ortak veri kümelerinizi de paylaşabilirsiniz.

Seçkin, hazırlanan veri kümeleri
Azure açık veri kümelerinde seçkin açık genel veri kümeleri, makine öğrenimi iş akışlarında tüketim için iyileştirilmiştir.
Kullanılabilir tüm veri kümelerini görmek için Azure açık veri kümeleri kataloğunagidin.
Veri bilimcileri, genellikle gelişmiş analizler için verileri temizleme ve hazırlama zamanının çoğunu harcamaktadır. Açık veri kümeleri Azure bulutuna kopyalanır ve zamandan tasarruf etmek için önceden işlenir. Düzenli aralıklarla veriler, Ulusal Okyanus ve atmosfer yönetimine (NOAA) FTP bağlantısı gibi kaynaklardan alınır. Ardından, veriler yapılandırılmış bir biçimde ayrıştırılır ve ardından ZIP kodu veya en yakın hava durumu istasyonun konumu gibi özelliklerle uygun şekilde zenginleştirir.
Veri kümeleri, Azure 'da erişim ve düzenleme daha kolay hale getirerek bulut işlem ile birlikte barındırılır.
Aşağıda, kullanılabilir veri kümeleri örnekleri verilmiştir.
Hava durumu verileri
| Veri kümesi | Notebooks | Açıklama |
|---|---|---|
| NOAA tümleşik yüzey verileri (ıSD) | Azure Notebooks Azure Databricks |
Kuzey Amerika, Avrupa, Avustralya ve Asya parçaları için en iyi uzamsal kapsama sahip NOAA 'den dünya çapındaki saatlik hava durumu verileri. Günlük olarak güncelleştirilir. |
| NOAA küresel tahmin sistemi (GFS) | Azure Notebooks Azure Databricks |
NOAA 'den 15 günlük ABD/saat hava durumu tahmin verileri. Günlük olarak güncelleştirilir. |
Takvim verileri
| Veri kümesi | Notebooks | Açıklama |
|---|---|---|
| Ortak tatiller | Azure Notebooks Azure Databricks |
41 ülke veya bölge ile 2099 1970 arasındaki dünya çapında ortak tatil verileri. Ülke ve insanların büyük bir süre kapalı olup olmadığını içerir. |
Veri kümelerine erişim
Azure hesabıyla, kod kullanarak veya Azure hizmet arabirimi aracılığıyla açık veri kümelerine erişebilirsiniz. Veriler, Machine Learning çözümünüzde kullanılmak üzere Azure bulut işlem kaynaklarıyla birlikte bulunur.
Açık veri kümeleri Azure Machine Learning kullanıcı arabirimi ve SDK aracılığıyla kullanılabilir. Açık veri kümeleri Ayrıca, Azure Machine Learning ve Azure Databricks veri bağlamak için kullanabileceğiniz Azure Notebooks ve Azure Databricks Not defterleri de sağlar. Veri kümelerine bir Python SDK üzerinden de erişilebilir.
Ancak açık veri kümelerine erişmeniz için bir Azure hesabınızın olması gerekmez; Bunlarla veya Spark olmadan herhangi bir Python ortamından erişebilirsiniz.
Veri kümeleri isteme veya katkıda bulunma
İstediğiniz verileri bulamazsanız, bir veri kümesi istemek veya bir veri kümesi ile katkıdabulunmak için bize e-posta gönderin.