Rychlý Start: vyvážení kuličky pomocí AI (Moab)


  • Celková doba dokončení: 20 minut
  • Aktivní čas: 5 minut
  • Čas školení počítače: 15 minut

Naučte se, aby se vyrovnala kulička ve středu talíře s Bonsai předdefinovaným simulátorem a ukázkovým kódem.

Než začnete

K dokončení této ukázky musíte mít platný účet Microsoft nebo Azure a platný Bonsai pracovní prostor zřízený v Azure. Pokud potřebujete účet nebo zkušební verzi Azure, postupujte podle pokynů v tématu Microsoft account setup for Bonsai .

Krok 1: načtení Moab mozek

Bonsai poskytuje předbalený simulátor a vzorový kód pro problém s vyrovnáváním kuličky (Moab). Sestavení mozek:

  1. Sign into the Bonsai UI.
  2. V dialogovém okně Začínáme vyberte Moab ze seznamu ukázkových mozku.
  3. Pojmenujte svůj nový mozek (například "Moab demo").
  4. Kliknutím na vytvořit mozek načtěte vzorový mozek a simulátor.

Obrazovka pro vytvoření mozku

Částečný snímek obrazovky "vytvořit mozek" se zvýrazněnou ukázkou mozku Moab Sample mozek.

Krok 2: Kontrola studijních programů

Bonsai Po načtení ukázkového mozku otevře uživatelské rozhraní výuky. Uživatelské rozhraní výuky obsahuje panel pro kódování a panel pro grafy. Panel kódování zobrazuje náš kód výuky (studijní plán) napsaný ve speciálním jazyce s názvem Inkling. Graf na panelu grafů představuje proces iterativního učení definovaný Inkling kódem.

<span class =<span class= Uživatelské rozhraní pro výuce bonsaje "Aria-describedby =" 50-0 "data-LINKTYPE =" relativní cestu ">

Snímek obrazovky s poznámkou Bonsai uživatelského rozhraní učebny rozdělený do tří horizontálních panelů (vlevo, na střed a doprava). Levý panel zobrazuje dostupné mozku a simulátory. Středový panel je opatřen poznámkami "panel kódování" a zobrazuje vzorový kód Inkling. Pravý panel je opatřen poznámkami pomocí panelu grafů a zobrazuje výukový graf. Výukový graf má tři uzly uspořádané svisle (nahoře, uprostřed, dole). Nejvyšší uzel je označený jako ' ObservableState '. Prostřední uzel je označený jako "MoveToCenter konceptu". Dolní uzel je označený jako ' SimAction '.

Kliknutím na různé uzly v výukovém grafu zvýrazníte příslušný oddíl v ukázkovém kódu:

  • Stavový uzel: zapouzdřuje informace, které jsou k dispozici pro mozek, jako spuštění simulace (pozorovatelné stavy senzorů). V případě Moab jsou pozorovatelné stavy senzorů aktuální polohou a rychlostí kuličky.
  • Uzel konceptu: zapouzdření konceptu, který má mozek, zjistit podle definice vašich školicích cílů. V případě Moab koncept přesouvá kuličku na konkrétní cíl. Odpovídající cíle Inkling řídí kuličku uprostřed desky a jejich uchování ( drive Center Of Plate ) a zabrání se tak, aby byl okraj desky ( avoid Fall Off Plate ).
  • Uzel akce: zapouzdřuje sadu platných akcí, které může mozek provést v reakci na pozorovaný stav. V případě Moab se k dostupným akcím upraví rozteč a náklon (sklon) desky.

Krok 3: výuka mozku

Důležité

Spuštění simulací spotřebovává prostředky Azure. Po zapsání rychlého startu se vám bude účtovat předplatné Azure přibližně 0,50 USD. Opakovaná školení nebo spuštění školení delší než doporučené budou mít za následek další náklady.

Otevřete uživatelské rozhraní pro školení a spusťte školení mozku kliknutím na zelený výukový tlačítko v panelu graf.

Uživatelské rozhraní pro školení nahrazuje panel kódování prázdným datovým panelem a zobrazuje aktualizovaný výukový graf. Při zahájení školení se Bonsai automaticky spustí loďstvo instancí simulátorů. Flotila se zobrazí v aktualizovaném grafu jako nový uzel simulátoru .

Uzel simulátoru vám ukáže:

  • název simulátoru "MoveToCenterSimulator".
  • Celkový počet instancí simulátoru v rámci loďstva.
  • celková rychlost loďstva v iteracích za sekundu.

<span class =<span class= Uživatelské rozhraní pro školení bonsaje "Aria-describedby =" 98-0 "data-LINKTYPE =" relativní cestu ">

Snímek obrazovky s Bonsai uživatelským rozhraním školení Na panelu data uživatelského rozhraní se zobrazuje příklad trendu trendu výkonu směrem nahoru. Panel grafu uživatelského rozhraní zobrazí aktualizovaný výukový graf. Výukový graf teď obsahuje uzel simulátoru nalevo od předchozích uzlů. Uzel simulátoru je připojen k uzlu ObservableState a uzlu SimAction. Nový uzel je označený jako simulátor MoabSim a rozdělený do dvou oddílů. V levé části se zobrazuje počet připojených instancí simulátoru (15) a pravá část zobrazuje aktuální úroveň spokojenosti cíle (90,8%).

U každé iterace váš mozek získává skóre výkonu na základě toho, jak dobře problém vyřešil. Bonsai sestavuje průběh školení pro mozek na datovém panelu jako vykreslení pro Bonsai . Hodnoty spokojenosti jednotlivých cílů označují, jak blízko mozku dosáhlo dosažení souvisejícího cíle pro danou iteraci. Nejnovější hodnota spokojenosti celkového cíle je také uvedena v uzlu koncept grafu učebny.

Vykreslení spokojenosti by mělo být v průběhu vyvážení kuličky uprostřed na desku lepší trend.

Krok 4: Sledujte mozek v akci

Simulátor Moab zahrnuje vizualizér, abyste mohli v praxi sledovat svůj mozek. Jak funguje přes konkrétní simulaci. Vizualizaci zobrazíte tak, že přejdete dolů na panelu data.

Vizualizér vykreslí 3D model Moab hardwaru a kuličky. Vizualizace také zobrazuje:

  • Odhadované trajektorii kuličky (modrá šipka, která je promítnuta na desku).
  • odhadovaný stín kuličky (modrý kroužek, který je na desku pod kuličkou).
  • graf v reálném čase měnící se proměnné stavu.

Vizualizace simulace

Snímek obrazovky s Bonsai uživatelským rozhraním školení Panel data se posune dolů, aby se zobrazil prostorové vykreslování Moab zařízení s vyrovnáváním malých oranžových kuličk. Zařízení Moab má kruhový text s opěrkami pohánějícího rukou nahoře. Deska s jasným vyrovnáváním zatížení se nachází nad opěrkami rukou.

Zkuste kliknout na ball_xball_y hodnoty a. Tyto dvě čáry by se měly sblíženy uprostřed grafu (0,00), když se kulička přesune do středu na desku.

Krok 5: zastavení školení

Bonsai automaticky zastaví školení, když nastane jedna z následujících možností:

  • Celková hodnota spokojenosti cíle dosáhne 100%.
  • čáry grafu se stanou vodorovnými řádky pro předdefinovaný počet epizod.

Hodnota spokojenosti 100% znamená, že váš mozek zcela získal aktuální studijní plán. Vodorovná křivka znamená, že mozek už nezlepšuje. V případě, že se mozek po určitém počtu epizody nedokáže zlepšit NoProgressIterationLimit , Bonsai ukončí školení, aby nedocházelo k plýtvání výpočetních prostředků.

Tip

Moab demo mozek obvykle dosahuje optimálního výkonu v rámci 200 tisíc iterací.

Pokud chcete ukončit školení v rané fázi, klikněte v horní části panelu grafu na tlačítko červené zastavení školení .

Další kroky

Gratulujeme! Úspěšně jste provedli výuku mozku k vyvážení kuličky uprostřed na desce.

Teď, když jste se seznámili se základy Moab mozek, zkuste přizpůsobit Inkling kód, abyste změnili své studijní záměry.