Quickstart: Een bal in balans brengen met AI (Moab)


  • Totale tijd om te voltooien:20 minuten
  • Actieve tijd:5 minuten
  • Machinetrainingstijd:15 minuten

Een AI leren om een bal in het midden van een bord te balanceren met Bonsai , een vooraf gedefinieerde simulator en voorbeeldcode.

Voordat u begint

Als u deze demo wilt voltooien, moet u een geldig Microsoft- of Azure-account en een geldige Bonsai werkruimte hebben ingericht in Azure. Als u een account of proefversie van Azure nodig hebt, volgt u de instructies in Microsoft account setup for Bonsai .

Stap 1: het Moab-brein laden

Bonsai biedt een voorverpakte simulator en voorbeeldcode voor het probleem met de taakverdeling (Moab). Om uw brein te bouwen:

  1. Sign into the Bonsai UI.
  2. Selecteer Moab in de lijst met demo's in Aan de slag dialoogvenster.
  3. Noem uw nieuwe brein (bijvoorbeeld 'Moab Demo').
  4. Klik op Brain maken om het brein en de simulator van het voorbeeld te laden.

Scherm 'Brein maken'

Gedeeltelijke schermopname van het scherm 'Brein maken' met het Moab-voorbeeldbrein gemarkeerd.

Stap 2: Het curriculum inspecteren

Bonsai opent de gebruikersinterface van het onderwijs wanneer uw demo-brein wordt geladen. De gebruikersinterface van het onderwijs bevat een coderingspaneel en een grafiekpaneel. In het coderingspaneel wordt onze lescode (het curriculum) weergegeven die is geschreven in een eigen taal met de naam Inkling. De grafiek in het grafiekpaneel vertegenwoordigt het iteratieve leerproces dat is gedefinieerd door de Inkling-code.

<span class= Bonsai <span class= Teaching UI" aria-describedby="50-0" data-linktype="relative-path">

Schermopname met aantekeningen van de Bonsai gebruikersinterface van Teaching onderverdeeld in drie horizontale panelen (links, midden en rechts). In het linkerpaneel worden beschikbare hersenen en simulators weergegeven. Het middelste deelvenster is van aantekeningen gemaakt met 'Coderingspaneel' en geeft het voorbeeld van Inkling-code weer. Het rechterpaneel is van aantekeningen gemaakt met 'Graphing Panel' en geeft een lesgrafiek weer. De onderwijsgrafiek heeft drie knooppunten die verticaal zijn gerangschikt (boven, midden, onder). Het bovenste knooppunt heeft het label Waarneembarestate. Het middelste knooppunt heeft het label Concept MoveToCenter. Het onderste knooppunt heeft het label 'SimAction'.

Als u op de verschillende knooppunten in de onderwijsgrafiek klikt, ziet u de relevante sectie in de voorbeeldcode:

  • Status-knooppunt:kapselt de informatie in die beschikbaar is voor het brein terwijl de simulatie wordt uitgevoerd (de waarneembare sensortoestanden). Voor Moab zijn de waarneembare sensorposities de huidige positie en snelheid van de bal.
  • Concept-knooppunt:ingekapseld in het concept dat het brein moet leren zoals gedefinieerd door uw trainingsdoelen. Voor Moab is het concept het verplaatsen van een bal naar een specifiek doel. De bijbehorende Inkling-doelen zijn het rijden van de bal naar het midden van het bord en het daar houden () en het vermijden van de drive Center Of Plate rand van de bord ( avoid Fall Off Plate ).
  • Actie-knooppunt:kapselt de set geldige acties in die het brein kan uitvoeren als reactie op de waargenomen status. Voor Moab zijn de beschikbare acties het aanpassen van de kanteling (kanteling) van de bord.

Stap 3: het brein trainen

Belangrijk

Het uitvoeren van simulaties verbruikt Azure-resources. Als u de geschreven quickstart volgt, worden er kosten in rekening brengen voor uw Azure-abonnement van ongeveer USD 0,50. Herhaalde training of het langer uitvoeren van de training dan aanbevolen leidt tot extra kosten.

Open de trainings-UI en begin met het trainen van het brein door te klikken op de groene knop Trainen in het grafiekpaneel.

De trainings-UI vervangt het coderingspaneel door een leeg gegevenspaneel en toont een bijgewerkte lesgrafiek. Wanneer u begint met trainen, Bonsai wordt automatisch een vloot simulator-exemplaren gestart. Het vloot wordt in de bijgewerkte grafiek weergegeven als een nieuw Simulator-knooppunt.

In het knooppunt Simulator ziet u het volgende:

  • de simulatornaam MoveToCenterSimulator.
  • het totale aantal simulator-exemplaren in de vloot.
  • de totale snelheid van de vloot in iteraties per seconde.

<span class= Bonsai <span class= Training UI" aria-describedby="98-0" data-linktype="relative-path">

Schermopname van de Bonsai gebruikersinterface voor training. In het gegevenspaneel van de gebruikersinterface ziet u een voorbeeld van een opwaartse trend in de prestaties. In het grafiekpaneel van de gebruikersinterface wordt een bijgewerkte lesgrafiek weergegeven. De onderwijsgrafiek bevat nu een simulatorknooppunt links van de vorige knooppunten. Het knooppunt Simulator is verbonden met het knooppunt ObserveableState en het knooppunt SimAction. Het nieuwe knooppunt heeft het label Simulator MoabSim en is onderverdeeld in twee secties. In de linkersectie wordt het aantal verbonden simulatorexemens (15) weergegeven en in de rechtersectie wordt het huidige niveau van tevredenheid over het doel (90,8%) weergegeven.

Bij elke iteratie verdient uw brein een prestatiescore op basis van hoe goed het probleem is opgelost. Bonsairapporteert de voortgang van de training voor uw brein in het gegevenspaneel als een Bonsai De tevredenheidswaarden van het individuele doel geven aan hoe dicht uw brein bij het bereiken van het gerelateerde doel voor een bepaalde iteratie komt. De meest recente tevredenheidswaarde voor het algemene doel wordt ook vermeld in het concept-knooppunt van de onderwijsgrafiek.

De tevredenheidsplots zouden omhoog moeten gaan naarmate uw brein beter in staat is om de bal in het midden van de bord te balanceren.

Stap 4: het brein in actie zien

De Moab-simulator bevat een visualisatie, zodat u uw brein in actie kunt zien. zoals het werkt via een bepaalde simulatie. Als u de visualisatie wilt zien, schuift u omlaag in het gegevenspaneel.

De visualizer geeft een 3D-model van de Moab-hardware en een bal weer. In de visualisatie wordt ook het volgende weergegeven:

  • de geschatte traject van de bal (een blauwe pijl die op het bord is geprojecteerd).
  • de geschatte schaduw van de bal (een blauwe cirkel die op het bord onder de bal wordt geprojecteerd).
  • een realtimegrafiek van veranderende statusvariabelen.

Visualisatie van simulatie

Schermopname van de Bonsai gebruikersinterface voor training. Het gegevenspaneel wordt omlaag schuiven om een 3D-weergave van het Moab-apparaat weer te geven met een kleine oranje bal. Het Moab-apparaat heeft een ronde body met actuatorarmen erboven. Een duidelijk gebalanceerde bord bevindt zich boven op de arm.

Klik op de waarden ball_x en ball_y . De twee lijnen moeten worden geconvergeerd in het midden van de grafiek (0,00) wanneer de bal naar het midden van de bord wordt verplaatst.

Stap 5: Training stoppen

Bonsai stopt de training automatisch wanneer een van de volgende opties zich voordoet:

  • de tevredenheidswaarde van het algemene doel bereikt 100%
  • de grafieklijnen worden horizontale lijnen voor een vooraf gedefinieerd aantal trainingslijnen.

Een tevredenheidswaarde van 100% betekent dat uw brein het huidige curriculum volledig heeft geleerd. Een horizontale lijn betekent dat het brein niet meer wordt verbeterd. Wanneer het brein niet kan worden verbeterd na een bepaald aantal computers (zoals gedefinieerd door ), wordt de training beƫindigd om te voorkomen dat er NoProgressIterationLimitBonsai rekenbronnen worden verspild.

Tip

Het Moab-demobrein bereikt doorgaans optimale prestaties binnen 200.000 iteraties.

Als u de training vroegtijdig wilt stoppen, klikt u op de rode knop Training stoppen bovenaan het grafiekpaneel.

Volgende stappen

Gefeliciteerd! U hebt een brein getraind om een bal in het midden van de bord te balanceren.

Nu u de basisbeginselen van het Moab-brein begrijpt, kunt u de Inkling-code aanpassen om uw trainingsdoelen te wijzigen.