Azure Açık Veri Kümeleri

Ortak kullanılabilir veri kümeleriyle makine öğrenimi modellerinizin doğruluğunu geliştirme. Makine öğrenimi projelerinde kullanıma hazırlanan seçkin veri kümelerini kullanarak veri bulma ve hazırlama sırasında zaman kazanın.

Ulaşım

Veri kümesi Açıklama
Yerananaır: AirSim simülasyon veri kümesi Eşzamanlı yerelleştirme ve eşlemeyi (SLA) çözümlemek için oluşturulan AirSim otonom araç verileri.
NYC TAXI & Limousine Komisyonu-sarı TAXI seyahat kayıtları Sarı TAXI seyahat kayıtları, seçme ve bırakma tarihleri/zamanları, alma ve bırakma/kapama konumları, seyahat mesafeleri, listelenen fareler, ücret türleri, ödeme türleri ve sürücü tarafından bildirilen yolcular sayıları içerir.
NYC TAXI & Limousine Komisyonu-yeşil TAXI seyahat kayıtları Yeşil TAXI seyahat kayıtları, seçme ve bırakma tarihleri/zamanları, alma ve bırakma/kapama konumları, seyahat mesafeleri, listelenen fareler, ücret türleri, ödeme türleri ve sürücü tarafından bildirilen yolcular sayımlarını içerir.
NYC TAXI & Limousine Commission-For-Hire araç (FHV) seyahat kayıtları For-Hire araç seyahat kayıtları, gönderme temeli lisans numarasını ve alma tarihi, saati ve TAXI bölgesi konum KIMLIĞINI içerir.

Sağlık ve Genomiks

Veri kümesi Açıklama
COVıD-19 Data Lake COVID-19 Data Lake koleksiyonu, COVID-19 ile ilgili olarak çeşitli kaynaklardan alınmış test ve hasta sonucu izleme verileri, sosyal mesafe ilkesi, hastane kapasitesi, hareketlilik gibi bilgileri içeren veri kümelerinin bir koleksiyondur.
COVıD-19 araştırma veri kümesini aç COVID-19 ve koronavirüs ile ilgili bilimsel makalelere ait tam metinleri ve meta verileri makine tarafından okunabilecek şekilde iyileştirilmiş olarak içeren ve küresel araştırma topluluğunun kullanımına sunulan veri kümesi.
Genomiks Data Lake Genomiks Data Lake, ücretsiz olarak erişebileceğiniz ve Genomiks analiz iş akışlarınızla ve uygulamalarınızla tümleştirilebilen çeşitli genel veri kümeleri sağlar. Veri kümelerinde BAM, FASTA, VCF ve CSV dosya biçimlerindeki genom dizileri, değişkenlik bilgisi ve konu/örnek meta verileri bulunur.

İşgücü ve ekonomisi

Veri kümesi Açıklama
ABD İş Gücü İstatistikleri ABD İşgücü İstatistikleri, ABD’deki yaş, cinsiyet, ırk ve etnik köken gruplarına göre İş Gücü İstatistiklerini, iş gücüne katılım oranlarını ve kurumsal olmayan sivil nüfus bilgilerini sunar. analiz eder.
ABD’de Ulusal Çalışma Saatleri ve Kazançlar Mevcut İstihdam İstatistikleri (CES) programı, ABD’deki tarım dışı istihdam, çalışma saatleri ve bordrolu çalışan kazançları hakkında ayrıntılı sektör tahminleri üretir.
ABD Eyaletlerinde Çalışma Saatleri ve Kazançlar Mevcut İstihdam İstatistikleri (CES) programı, ABD’deki tarım dışı istihdam, çalışma saatleri ve bordrolu çalışan kazançları hakkında ayrıntılı sektör tahminleri üretir.
ABD Yerel Bölgelerde İşsizlik İstatistikleri ABD Yerel Bölge İşsizlik İstatistikleri veri kümeleri; ABD’deki Sayım bölgeleri ile bölümleri, Eyaletler, vilayetler, metropol alanları ve birçok şehir için aylık ve yıllık istihdam, işsizlik ve işgücü verilerini sağlar.
ABD Tüketici Fiyat Endeksi Tüketici Fiyat Endeksi (CPI), şehirli tüketicilerin tüketici ürün ve hizmetlerinden oluşan bir market arabası için ödediği fiyatta zaman içinde meydana gelen değişikliğin ölçümüdür.
ABD Üretici Fiyat Endeksi - Endüstri Üretici Fiyat Endeksi (ÜFE), yurt içi üreticilerin çıktıları için aldığı satış fiyatlarında zaman içinde görülen ortalama değişikliğin ölçüsüdür.
ABD Üretici Fiyat Endeksi - Emtia Üretici Fiyat Endeksi (ÜFE), yurt içi üreticilerin malları için aldığı satış fiyatlarında zaman içinde görülen ortalama değişikliğin ölçüsüdür.

Popülasyon ve güvenlik

Veri kümesi Açıklama
Vilayete Göre ABD Nüfusu 2000 ve 2010 On Yıllık Sayımında her kullanılan her ABD vilayeti için cinsiyet ve ırka göre ABD nüfusu. Bu veri kümesinin kaynağı United States Census Bureau’dur.
Posta Koduna Göre ABD Nüfusu 2010 On Yıllık Sayımında her kullanılan her ABD posta kodu için cinsiyet ve ırka göre ABD nüfusu. Bu veri kümesinin kaynağı United States Census Bureau’dur.
Boston güvenliği verileri Boston şehrinde bildirilen 311 aramaları hakkındaki verileri okuyun. Bu veri kümesi Parquet biçiminde depolanır ve günlük olarak güncelleştirilir.
Chicago güvenliği verileri Chicago şehrinde bildirilen 311 aramaları hakkındaki verileri okuyun. Bu veri kümesi Parquet biçiminde depolanır ve günlük olarak güncelleştirilir.
New York City güvenlik verileri Bu veri kümesi 2010’dan günümüze kadar tüm New York City 311 hizmet aramalarını içerir. Iâ €™ s, Parquet biçiminde depolandı ve günlük olarak güncelleştirildi.
San Francisco güvenlik verileri San Francisco’daki itfaiye hizmet çağrıları ve 311 olayları. Bu veri kümesi 2015’ten bugüne kadar birikmiş geçmiş kayıtları içerir.
Seattle güvenlik verileri Seattle İtfaiyesi 911 görev dağıtımları. Bu veri kümesi günlük olarak güncelleştirilir ve 2010’den günümüze kadar birikmiş geçmiş kayıtları içerir

Ek ve ortak veri kümeleri

Veri kümesi Açıklama
Diabetes 10 özelliğe sahip 442 örnek içeren Diabetes (Diyabet) adlı veri kümesi, makine öğrenmesi algoritmalarıyla çalışmaya başlamak için idealdir.
OJ satışı benzetimli veriler Bu veri kümesi, Dominick 'ın OJ veri kümesinden türetilir ve Azure Machine Learning üzerinde binlerce modeli aynı anda eğitme olanağı sunan bir veri kümesi sağlama amacını içeren ekstra sanal veriler içerir.
El ile yazılan basamakların veri tabanı El yazısı rakamlardan oluşan MNIST veritabanı, 60.000 örnekli bir eğitim kümesi ve 10.000 örnekli bir test kümesi içerir. Rakamlar normal boyuttadır ve sabit boyutlu bir görüntüde ortalanmıştır.
Microsoft News önerisi veri kümesi Microsoft News veri kümesi (fıkır), haber önerisi araştırması için büyük ölçekli bir veri kümesidir. Haber önerisi için bir kıyaslama veri kümesi görevi görür ve haber önerisi ve öneren sistemlerinde araştırmayı kolaylaştırır.
Ortak tatiller 1970 ile 2099 yılları arasında 38 ülke veya bölgeyi kapsayan PyPI tatil paketi ve Wikipedia’dan alınan dünya genelindeki resmi tatil verileri.
Rusça konuşmayı metne açma Rusça açık STT, Rusça dil için büyük ölçekli bir açık konuşmadan metin veri kümesi