Rövid útmutató: Egy labdának az AI-val való kiegyensúlyozás (Moab)


  • Teljes idő: 20 perc
  • Aktív idő: 5 perc
  • Gép betanításának ideje: 15 perc

Megtaníthat egy AI-t, hogy egyensúlyba hoz egy labdát a lemez közepén a Bonsai,egy előre definiált szimulátorral és egy mintakóddal.

Előkészületek

A bemutató befejezéséhez rendelkeznie kell egy érvényes Microsoft- vagy Azure-fiókkal és egy, az Azure-ban kiépített érvényes Bonsai-munkaterülettel. Ha fiókra vagy Azure-próbaverzióra van szüksége, kövesse a BonsaiMicrosoft-fiók vonatkozó utasításokat.

1. lépés: A Moab-agy betöltése

A Bonsai előrecsomagolt szimulátort és mintakódot biztosít a labdával kapcsolatos egyensúlyozási problémához (Moab). Az agy felépítéséhez:

  1. Jelentkezzen be a Bonsai felhasználói felületére.
  2. Az Első lépések párbeszédpanelen válassza a Moab lehetőséget a bemutatók listájából.
  3. Nevezze el az új agyat (például "Moab Demo").
  4. Kattintson az Agy létrehozása elemre a minta agy és szimulátor betöltéséhez.

"Agy létrehozása" képernyő

Részleges képernyőkép az "Agy létrehozása" képernyőről a kiemelt Moab-minta agykal.

2. lépés: A tanterv vizsgálata

Bonsai megnyitja a tanítási felhasználói felületet a bemutató agy betöltésekor. A tanítási felhasználói felület tartalmaz egy kódolási panelt és egy grafikonpanelt. A kódolási panelen az Inkling nevű jogvédett nyelven írt tanítási kód (a tanterv) látható. A diagramdiagram panelen látható diagram a inkling kód által meghatározott iteratív tanulási folyamatot ábrázolja.

Bonsai-tanítási felhasználói felület

A Bonsai-tanítási felhasználói felület három vízszintes panelre (balra, középre és jobbra) osztott, jegyzetekkel feljegyzett képernyőképe. A bal oldali panelen az elérhető agy és szimulátorok érhetők el. A középső panel a "Coding Panel" (Kódolási panel) felirattal van feljegyzetve, és megjeleníti a példa inkling kódot. A jobb oldalon a "Graphing Panel" felirat látható, és egy tanítási gráfot jelenít meg. A tanítási gráf három csomópontot ábrázol függőlegesen (felül, középső, alsó). A felső csomópont neve "ObservableState". A középső csomópont neve "Concept MoveToCenter". Az alsó csomópont a "SimAction" (SimAction) címkét tartalmazza.

A tanítási gráf különböző csomópontjaira kattintva kiemelheti a mintakód megfelelő szakaszát:

  • Állapotcsomópont: a szimuláció futtatásakor az agy számára elérhető információkat (a megfigyelhető érzékelőállapotokat) tartalmazza. A Moabban a megfigyelhető érzékelői állapotok a labdának aktuális pozícióját és sebességét mérő állapotok.
  • Koncepciócsomópont: azt a fogalmat tartalmazza, amelyet az agynak meg kell tanulnia a betanítás céljaiban meghatározottak szerint. A Moab koncepciója szerint a labdákat egy adott célhoz kell mozgatni. A megfelelő inkling célok a labda a lemez közepére vezetnek, és ott tartják ( ), és elkerülik a lemez drive Center Of Plate szélét ( avoid Fall Off Plate ).
  • Műveletcsomópont: az agy által a megfigyelt állapotra adott válaszként használható műveleteket tartalmazza. A Moab esetén a rendelkezésre álló műveletek a lemez dobása és dobása (dőlése) alapján állíthatók be.

3. lépés: Az agy betanítás

Fontos

A szimulációk futtatása Azure-erőforrásokat használ fel. A megírt rövid útmutatót követően az Azure-előfizetés díja körülbelül 0,50 USD lesz. Az ismétlődő betanítás vagy a betanítás javasoltnál hosszabb futtatása további költségeket eredményez.

Nyissa meg a betanítás felhasználói felületét, és kezdje el betanítni az agyat a zöld Betanítás gombra kattintva a grafikonon.

A betanítási felhasználói felület lecseréli a kódolási panelt egy üres adatpanelre, és egy frissített tanítási grafikont mutat. A betanítás elkezdéskor a Bonsai automatikusan elindít egy szimulátorpéldány-flottát. A flotta új szimulátorcsomópontként jelenik meg a frissített gráfban.

A Szimulátor csomópont a következőt jeleníti meg:

  • a szimulátor neve, "MoveToCenterSimulator".
  • a szimulátorpéldányok teljes száma a flotta számára.
  • a flotta iterációk másodpercenkénti teljes sebessége.

Bonsai-képzési felhasználói felület

Képernyőkép a Bonsai betanítás felhasználói felületről. A felhasználói felület adatpanelje egy felfelé növekvő teljesítmény-ábrázolás példáját jeleníti meg. A felhasználói felület gráfdiagramja egy frissített tanítási gráfot jelenít meg. A tanítási gráf most már tartalmaz egy szimulátorcsomópontot az előző csomópontok bal oldali csomópontjaitól. A Szimulátor csomópont csatlakozik a ObservableState csomóponthoz és a SimAction csomóponthoz. Az új csomópont a "Simulator MoabSim" (Szimulátor MoabSim) címkét tartalmazza, és két szakaszra oszlik. A bal oldali szakasz a csatlakoztatott szimulátorpéldányok számát (15), a jobb oldali szakasz pedig az aktuális cél-elégedettségi szintet (90,8%).

Az egyes iterációk során az agy teljesítménypontszámokat kap az alapján, hogy mennyire jól oldotta meg a problémát. Bonsai cél-elégedettségi rajzként jelenti az agya betanításának előrehaladását az adatpanelen. Az egyéni célok elégedettségi értékei azt jelzik, hogy milyen közel kerül az agya egy adott iterációhoz kapcsolódó cél eléréséhez. A legújabb általános cél-elégedettségi érték a tanítási gráf koncepciócsomópontján is látható.

Az elégedettségi ábrázolásnak felfelé kell növekednie, ahogy az agya jobban egyensúlyba kerül a lemez közepén található labdával.

4. lépés: Az agy működésének figyele

A Moab-szimulátor tartalmaz egy vizualizációs figyelőt, így figyelheti az agyát. mivel egy adott szimuláción keresztül működik. A vizualizáció megjelenítéséhez görgessen le az adatpanelen.

A vizualizáció a Moab hardver 3D modelljét és egy labdát renderel. A vizualizáció a következő adatokat is megjeleníti:

  • a labdának a becsült pályája (a lemezre kivetített kék nyíl).
  • a labdának a becsült árnyéka (egy kék kör, amely a lemezre vetül a labda alatt).
  • az állapotváltozók módosításának valós idejű grafikonja.

Szimuláció vizualizációja

Képernyőkép a Bonsai betanítás felhasználói felületről. Az adatpanel lefelé görgetve egy 3D-s renderelést mutat a Moab-eszközről, amely egy kis narancssárga labdával egyensúlyoz. A Moab eszköz egy körkörös testtel rendelkezik, amely felül található a működtető karokkal. A karok tetején egy átlátszó egyensúlyi lemez található.

Kattintson a és az ball_x ball_y értékekre. A két vonalnak a diagram közepén (0,00) konvergálva kell lennie, ahogy a labda a lemez közepére kerül.

5. lépés: A betanítás leállítása

A Bonsai automatikusan leállítja a betanításokat, ha a következők bármelyike bekövetkezik:

  • a cél teljes elégedettségi értéke eléri a 100%-ot
  • A gráfvonalak vízszintes vonalakká válnak a betanítás sorának előre meghatározott számában.

A 100%-os elégedettségi érték azt jelenti, hogy az agya teljesen megtanulta az aktuális tantervet. A vízszintes rajzvonal azt jelenti, hogy az agy már nem fejlődik. Ha egy agy egy adott számú (a által meghatározott) mellőzést követően nem javul, a Bonsai megszakítja a betanítást, hogy elkerülje a számítási erőforrások NoProgressIterationLimit pazarlását.

Tipp

A Moab demo agy általában 200 ezer iteráción belül éri el az optimális teljesítményt.

Ha korábban le szeretné állítani a betanításokat, kattintson a grafikonpanel tetején található piros Betanítás leállítása gombra.

Következő lépések

Gratulálok! Sikeresen betanított egy agyat, hogy egyensúlyba hoz egy labda a lemez közepén.

Most, hogy már tisztában van a Moab-agy alapjaival, próbálja testre szabni a inkling kódot a betanítás céljainak módosítása érdekében.