Hızlı Başlangıç: Kutupları AI ile dengeleme (Cartpole)
- Toplam tamamlama süresi:50 dakika
- Etkin süre:5 dakika
- Makine eğitim süresi:45 dakika
Bir AI'ye hareketli bir tabanda kararsız bir kutupla, önceden tanımlanmış bir simülatörle ve örnek kodla Bonsai dengelemeyi öğretir.
Başlamadan önce
Bu tanıtıma tamamlamak için geçerli bir Microsoft veya Azure hesabınız ve Azure'da sağlanan geçerli bir Bonsai çalışma alanınız olmalıdır. Bir hesaba veya Azure deneme sürümüne ihtiyacınız varsa, 'daki yönergeleri Microsoft account setup for Bonsai izleyin.
1. Adım: Cartpole beyni yükleme
Bonsai , ters çevirmiş kalem sorunu (Cartpole) için önceden paketli bir simülatör ve örnek kod sağlar. Beyninizi oluşturmak için:
- Sign into the Bonsai UI.
- Aşağıdaki iletişim kutusundan tanıtım beyinleri listesinden Cartpole'Başlarken seçin.
- Yeni beyninizi ("Cartpole Demo" gibi) olarak adlandırılır.
- Örnek beyin ve simülatör yüklemek için Beyin Oluştur'a tıklayın.
Cartpole örnek beyni vurgulanmış "Beyin Oluştur" ekran görüntüsü.
2. Adım: Müfredatı inceleme
Bonsai tanıtım beyniniz yüklenirken öğretim kullanıcı arabirimini açar. Öğretim kullanıcı arabiriminde kodlama paneli ve grafik paneli bulunur. Kodlama panelinde, öğretim kodunuzu (müfredat) Inkling adlı özel bir dilde yazılmış olarak görüntüler. Grafik panelindeki grafik, Inkling kodu tarafından tanımlanan, iterative öğrenme işlemini temsil eder.
Bonsai
Teaching UI" (Bonsai Öğretimi Kullanıcı Arabirimi) "50-0" data-linktype="relative-path">
Üç panele ayrılmış (sol, orta ve sağ) Öğretim kullanıcı Bonsai arabiriminin açıklamalı ekran görüntüsü. Sol panelde kullanılabilir beyinler ve simülatörler görüntülenir. Orta panel 'Kodlama Paneli' ile ek açıklama içerir ve örnek Inkling kodunu görüntüler. Sağ panele 'Grafik Paneli' ek açıklama ek açıklamalı olarak gösterilir ve bir öğretim grafiği görüntülenir. Öğretim grafı dikey olarak düzenlenmiş üç düğüme (üst, orta, alt) sahip. Üst düğüm 'SimState' olarak etiketlenmiş. Ortadaki düğüm 'Concept BalancePole' olarak etiketlenmiş. Alttaki düğüm 'SimAction' olarak etiketlenmiş.
Öğretim grafındaki farklı düğümlere tıklarken örnek kodda ilgili bölüm vurgulanır:
- Durum düğümü:Simülasyon çalıştırıldık (gözlemlenebilir algılayıcı durumları) olarak beyinde bulunan bilgileri kapsüller. Cartpole için gözlemlenebilir algılayıcı durumları, tabanın geçerli konumu ve hızı ile kutupların geçerli açısıdır.
- Kavram düğümü:Beyinin eğitim hedefleriniz tarafından tanımlandığı şekilde öğrenmesi istediğiniz kavramı kapsüller. Cartpole için kavram, önceden tanımlanmış bir alanda belirli bir tolerans içinde bir kutup dengelemesidir. Karşılık gelen Inkling hedefleri, kutupun ( ) üzerine düşmelerini ve tabanın rayın kenarından taşınmalarını
avoid Fall Overönlemektir (avoid Out Of Range). - Eylem düğümü:Beyin gözlemlenen durumlara yanıt olarak gerçekleştire bir dizi geçerli eylemi kapsüller. Cartpole için kullanılabilir eylemler tabana sola veya sağa doğru iter.
3. Adım: Beyni eğitin
Önemli
Benzetimler çalıştırarak Azure kaynakları tüketir. Yazılan hızlı başlangıçtan sonra Azure aboneliğinize yaklaşık 1,00 ABD doları ücret tahsil edilecektir. Yinelenen eğitim veya eğitimin önerilenden daha uzun süre çalışması ek maliyete neden olur.
Eğitim kullanıcı arabirimini açın ve grafik panelindeki yeşil Eğit düğmesine tıklayarak beyin eğitimine başlayabilirsiniz.
Eğitim kullanıcı arabirimi, kodlama panelini boş bir veri paneliyle değiştirir ve güncelleştirilmiş bir öğretim grafiği gösterir. Eğitimi başlatırken otomatik Bonsai olarak bir simülatör örneği filosu başlatır. Filo, güncelleştirilmiş grafikte yeni bir Simülatör düğümü olarak görünür.
Simülatör düğümü şunları gösterir:
- simülatör adı, "BalancePoleSimulator".
- filodaki simülatör örneklerinin toplam sayısı.
- saniye başına yinelemelerde filonun genel hızı.
Bonsai
Eğitim Kullanıcı Arabirimi" veri-açıklaması="100-0" data-linktype="relative-path">
Eğitim kullanıcı Bonsai arabiriminin ekran görüntüsü. Kullanıcı arabiriminin veri panelinde yukarı doğru eğilim gösteren bir örnek performans çizimi görüntülenir. Kullanıcı arabiriminin grafik panelinde güncelleştirilmiş bir öğretim grafiği görüntülenir. Öğretim grafiği artık önceki düğümlerin sol tarafından bir simülatör düğümü içerir. Simülatör düğümü SimState düğümüne ve SimAction düğümüne bağlanır. Yeni düğüm 'Simulator BalancePoleSimulator' olarak etiketlenmiş ve iki bölüme ayrılmıştır. Sol bölümde bağlı simülatör örneklerinin sayısı (16) ve sağ bölümde geçerli hedef memnuniyeti düzeyi (%95,3) görüntülenir.
Her yinelemede, beyniniz sorunu ne kadar iyi çözdüğünü temel alarak bir performans puanı kazanır. Bonsai , veri panelinde bir Hedef Memnuniyeti çizimi olarak beyninizin eğitim Bonsai raporlar. Bireysel hedef memnuniyeti değerleri, beyninizin ilgili hedefe ulaşmak için ne kadar yakın olduğunu gösterir. En son genel hedef memnuniyeti değeri, öğretim grafiğinin kavram düğümünde de raporlandı.
Beyniniz kutup dengeleme konusunda daha iyiye geldiğinden memnuniyet çizimleri yukarı doğru eğilimli olacaktır.
4. Adım: Beyni iş içinde izleyin
Cartpole simülatöründe bir görselleştirici vardır, böylece beyninizi nasıl işlemde izleyebilirsiniz? belirli bir benzetim aracılığıyla çalışır. Görselleştirmeyi görmek için veri panelinde aşağı kaydırın.
Görselleştirici basit bir taban (sepet) ve kutup 3D modelini işler. Taban, kutupların değişen konumunun yanıt olarak ekranın üzerinde sola ve sağa hareket eder.
Eğitim kullanıcı Bonsai arabiriminin ekran görüntüsü. Veri paneli aşağı kaydırarak basit bir tekerlekli taban dengelemenin 3B işlemesi ile dik bir kutup olduğunu gösterir.
Görselleştirici, işlenen modelin altında durum değişkenlerini ve eylemleri değiştiren bir grafik de görüntüler. Ve değerlerine cart_positionpole_angle tıklayarak kutup tabanının konumunun ve açısının zaman içinde nasıl değiştiklerini takip etmeye çalışabilirsiniz.
5. Adım: Eğitimi durdurma
Bonsai aşağıdakilerden biri oluştuğunda eğitimi otomatik olarak durdurur:
- genel hedef memnuniyet değeri %100'e ulaştı
- Graf çizgileri, önceden tanımlanmış eğitim bölümleri için yatay çizgi haline geldi.
%100 memnuniyet değeri, beyninizin geçerli müfredatı tam olarak öğrendiği anlamına gelir. Yatay çizim çizgisi, beyinin artık geliştirilemeyecek olduğu anlamına gelir. Belirli sayıda bölüm (tarafından tanımlandığı gibi) sonra bir beyin geliştirilemezse, işlem kaynaklarını boşa harcanmaması NoProgressIterationLimitBonsai için eğitimi sonlandırılır.
İpucu
Cartpole demo beyni genellikle 750.000 yinelemede en iyi performansı elde ediyor.
Eğitimi erken durdurmak için grafik panelinin üst kısmında yer alan kırmızı Eğitimi Durdur düğmesine tıklayın.
Sonraki adımlar
Tebrikler! Bir beyni hareketli bir tabanda bir kutupla dengelemek için başarıyla eğittiniz.
Cartpole beyniyle ilgili temel bilgileri anlıyoruz. Eğitim hedeflerinizi değiştirmek için Inkling kodunu özelleştirmeyi deneyin.