Cartpole'a genel bakış

Bir bakışta örnek

Cartpole tile

Kartpole örneği, hareketli bir Bonsai tabandaki kararsız bir direği dengelemek için bir beyni eğitmektedir. Dışarı aktarıldığında, eğitilen yapay zeka mümkün olduğunca uzun süre direği dik tutar.

  • Eğitim yöntemi: Hedefler
  • Eğitim ortamları: Benzetimi
  • Kavram türleri: Öğrenildi
  • Kavramlar: BalancePole
  • Olası beyin eylemleri:
    • Üssü bir kuvvet düzeyiyle sola hareket ettirin
    • Üssü bir kuvvet düzeyiyle sağa doğru hareket ettirin
    • Tabana kuvvet uygulamayın

Örneği alma

Örnek beyin belirtimini (Mürekkep Oluşturma) ve simülatörün yönetilen bir sürümünü kullanıcı arabirimindeki çözüm döngüleri Bonsaiile BonsaiKullanmaya başlayın çalışma alanınıza Bonsai ekleyebilirsiniz.

Eğitim ortamı

Cartpole örneği, beyin eğitimi için bir simülasyon kullanır. Tek bir kutup, 0,5 metre uzunluğunda sürtünmesiz bir pistin ortasında başlayan hareketli bir tabanda dengelenir.

Simülasyon modeli, tabanın hızını ve konumunu ve zaman içinde direğin değişen açısını ve hareketini izler.

Her eğitim yinelemesinde, Bonsai simülatörden aşağıdaki durum bilgilerini içeren bir SimState nesne alır:

  • cart_position: sepetin metredeki geçerli konumu
  • cart_velocity: metresek/ cinsinden sepetin geçerli hızı
  • pole_angle: radyan cinsinden direğin geçerli açısı
  • pole_angular_velocity: radyans/cinsinden kutbun geçerli açısal hızı
type SimState {
  cart_position: number,
  cart_velocity: number,
  pole_angle: number,
  pole_angular_velocity: number,
}

Kavram listesi

BalancePole

BalancePole öğrenilen bir kavramdır.

BalancePole giriş olarak alır SimState , yani eğitim sırasında tüm kullanılabilir simülasyon durumu bilgilerine erişebilir.