Öğretici: Makine Öğretimi (MT) veri kümesi oluşturma

Şunları öğrenmek için bu öğreticiyi izleyin:

  • Veri kümesi kullanmak mantıklıdır.
  • ile BonsaiMakine Öğretimi için verilerinizi yapılandırma.
  • MT verilerinizi ile Bonsaikullanmak üzere hazırlama.

Bu öğreticiyi izlemek için Bir Microsoft veya Azure hesabınız ve Azure'da sağlanan birBonsai çalışma alanınız olmalıdır. Bir hesaba veya Azure deneme sürümüne ihtiyacınız varsa devam etmeden önce için BonsaiMicrosoft hesabı kurulumu'ndaki yönergeleri izleyin.

Önemli

Bu öğreticiyi tamamlamak için mevcut bir Azure Machine Learning çalışma alanınız veya Azure portal'de kaynak oluşturma ve yönetme izniniz olmalıdır.

BonsaiAzure Machine Learning (AML) veri kümelerinden veri kümesi içeri aktarmayı destekler. Şu anda AML veri eklemenin en kolay yolu olduğundan verilerinizi temizlenmiş bir CSV dosyası olarak karşıya yüklemenizi öneririz, ancak AML içeri aktarma tarafından desteklenen tüm biçimler çalışır.

Makine Öğretimi veri kümesi nedir?

Makine Öğretimi (MT) veri kümesi, bir bilgisayarın analiz sırasında tek bir birim olarak değerlendirebileceği veri parçalarından oluşan bir koleksiyondur. Makine Öğretimi amacıyla veri kümeniz, her bölümün birden çok eğitim yinelemesi olduğu eğitim bölümlerinden oluşan bir koleksiyonu temsil eder.

Veri kümeleri özellikle önemli miktarda veriniz olduğunda ve yapay zeka eğitimi için uygun bir simülasyon oluşturmak pratik veya maliyet açısından engelleyici olduğunda kullanışlıdır. Ancak, etkili olması için MT veri kümelerinin tekdüzen, temizlenmiş, etiketlenmiş ve seçilmiş olması gerekir . ile Bonsaiçalışmak için MT veri kümeleri de aşağıda belirtilen veri şemasına uymalıdır.

Şemaya genel bakış

Veri kümesi, satır başına bir yineleme içeren en az bir bölüm için bilgi içermelidir. Bir bölümdeki yinelemeler kronolojik sırada listelenmelidir. Bonsai içeri aktarma sırasında veri kümelerini sıralamaz.

Veri sütunu Gerekli Desteklenen tür Description
config.FIELD EVET int Bölüm için yapılandırma değerlerini başlatma
state.FIELD EVET int Yineleme için simülasyon durumu değerleri
action.FIELD EVET int Yineleme için simülasyona geçirilen eylem
episode NO int, dize Bölüm için benzersiz bir kimlik
iteration NO int, dize Yineleme için bölüm içinde benzersiz bir kimlik
state.terminal NO int, bool Satırın terminal durumu olup olmadığını gösterir
state.reward NO int Yineleme için ödül değerini gösterir

Önemli

Bölümler arasındaki sınır aşağıdaki yollardan biriyle not edilmelidir :

  • Açıkça bir episode sütunla
  • Tek tek bir state.terminal sütunda örtük olarak her ikisi de isteğe bağlıdır, ancak en az biri sağlanmalıdır.

Gerekli sütunlar

Her satır, , ve SimAction alanlarının her birinde SimConfigSimStateaşağıdaki biçimde bir sütun içermelidir: type_keyword.FLATTENED_FIELD_NAME

Mürekkep oluşturma türü Tür anahtar sözcüğü Description
SimConfig config Bölüm için yapılandırma değerlerini başlatma
SimState state Yineleme için simülasyon durumu değerleri
SimAction action Yineleme için simülasyona geçirilen eylem

Örneğin, Mürekkep Oluşturma'da aşağıdaki durum ve eylem türleri göz önünde bulundurulduğunda, ilgili veri sütunları şöyle olacaktır:

Inkling Veri sütunları
type SimConfig {
  InitialX: number,
  InitialY: number[2],
  InitialZ: {
    W: number
  }
}
Config. InitialX Config. Initialy[0] Config. Initialy[1] Config. InitialZ.W
0.2349 0.3418 0.1336 0.3940
0.4119 1.9685 9.6974 0.7705
0.2216 0.8252 1.1027 0.3089
0.1416 1.0085 1.5780 0.2878
type SimState {
  X: number,
  Y: number[2],
  Z: {
    W: number
  }
}
Durum. X Durum. Y[0] Durum. Y[1] Durum. Z.W
0.0102 0.0001 -0.0116 0.0114
0.1783 1.4582 9.9742 0.7264
0.7123 0.4934 1.8133 0.6394
0.4119 1.9685 -1.3089 0.5780
type SimAction {
  A: number,
  B: {
    C: number[2],
    D: number
  }
}
Eylem. A Eylem. B.C[0] Eylem. B.C[1] Eylem. B.D
1 -5 1.5136 0.3333
7 3 1.4668 3.7353
3 6 0.6472 6.9262
2 0 5.9677 6.5553
9 1 4.2518 7.2479

İsteğe bağlı sütunlar

Veri kümesi satırları, yapay zeka eğitimine yardımcı Bonsai olacak ek sütunlar içerebilir.

episode

Bölüm için benzersiz bir kimlik. Bölüm kimlikleri, veri temizleme ve kürasyon sırasında sizin tarafınızdan atanır.

iteration

Yineleme için benzersiz bir kimlik. Yineleme kimlikleri belirli bir bölümde benzersiz olmalıdır ancak bölümler arasında tekrarlanabilir.

Örnek 1 Örnek 2
episode iteration
1 1
1 2
2 1
2 2
state.terminal iteration
0 1
1 2
0 1
1 2

Yineleme kimlikleri, veri temizleme ve kürasyon sırasında sizin tarafınızdan atanır.

state.reward

Ödül değerleri, bu yinelemede gerçekleştirilen eylemin ne kadar başarılı olduğunu gösteren sayısal puanlardır. Ödül değerleri genellikle hesaplanır ve veri temizleme ve kürasyon sırasında bir yinelemeye atanır.

state.terminal

Satırın terminal durumu olup olmadığını gösterir. state.terminal sütunu bölümler arasındaki sınırları örtük olarak işaretler.

  • 0, falseveya False yinelemenin terminal olmadığını gösterir.
  • 1, trueveya True yinelemenin terminal olduğunu gösterir.

Örnek veri kümesi

Kendi veri kümeniz yoksa , Moab örnek beyninin izlemesi için örnek bir CSV veri kümesi dosyası indirebilirsiniz .

1. Adım: AML çalışma alanı sağlama

  1. Azure Portal’ında oturum açın.
  2. Konumda adlı Bonsai-Datasets(US) West US 2 yeni bir kaynak grubu oluşturun.
  3. Yeni kaynak grubunuzun altında bir Machine Learning Çalışma Alanı oluşturun.

2. Adım: Verilerinizi AML Upload

  1. Azure portal AML kaynağınızı açın.
  2. Machine Learning çalışma alanınızı açmak için Studio'yu başlat'a tıklayın.
  3. + Yeni öğesine tıklayın.
  4. Seçenekler listesinden "Veri kümesi" öğesini seçin.
  5. + Veri kümesi oluştur'a tıklayın.
  6. Kullanılabilir seçeneklerden veri kaynağınızı seçin. ve
  7. Sekmeli veri kümesi oluşturmak için istemleri izleyin.

Veri kümeniz hazır olduğunda, içeri aktarma işleminin başarılı olduğunu doğrulamak için AML studio'daki bilgileri gözden geçirebilirsiniz.

Sonraki adımlar

Eğitim verilerinizi çalışma alanınıza Bonsai ekleme