Självstudie: träna en maskin inlärnings modell utan kod

Du kan utöka dina data i Spark-tabeller med nya maskin inlärnings modeller som du tränar med hjälp av Automatisk maskin inlärning. I Azure Synapse Analytics kan du välja en spark-tabell i arbets ytan som ska användas som en utbildnings data uppsättning för att skapa maskin inlärnings modeller, och du kan göra detta i en kod fri upplevelse.

I den här självstudien får du lära dig hur du tränar maskin inlärnings modeller genom att använda en kod fri upplevelse i Synapse Studio. Synapse Studio är en funktion i Azure Synapse Analytics.

Du ska använda Automatisk maskin inlärning i Azure Machine Learning, i stället för att koda upplevelsen manuellt. Vilken typ av modell du tränar på beror på vilket problem du försöker lösa.

Om du inte har en Azure-prenumeration kan du skapa ett kostnads fritt konto innan du börjar.

Förutsättningar

Logga in på Azure Portal

Logga in på Azure-portalen.

Skapa en spark-tabell för träning-datauppsättningen

I den här självstudien behöver du en spark-tabell. Följande bärbara dator skapar en:

  1. Ladda ned antecknings boken create-Spark-Table-NYCTaxi-data. ipynb.

  2. Importera antecknings boken till Synapse Studio. Skärm bild av Azure Synapse Analytics med alternativet importera markerat.

  3. Välj den Spark-pool som du vill använda och välj sedan Kör alla. Det här steget hämtar New York taxi-data från den öppna data uppsättningen och sparar data till din standard Spark-databas. Skärm bild av Azure Synapse Analytics, där kör alla och Spark Database är markerat.

  4. När Notebook-körningen har slutförts visas en ny Spark-tabell under standard Spark-databasen. Från data hittar du tabellen med namnet nyc_taxi. Skärm bild av fliken Azure Synapse Analytics-data med den nya tabellen markerad.

Öppna guiden Automatisk maskin inlärning

Så här öppnar du guiden:

  1. Högerklicka på Spark-tabellen som du skapade i föregående steg. Välj Machine Learning > utöka med ny modell. Skärm bild av Spark-tabellen med Machine Learning och utöka med ny modell markerad.

  2. Ange konfigurations information för att skapa en automatiserad maskin inlärnings experiment som körs i Azure Machine Learning. Detta kör tågen flera modeller. Den bästa modellen från en lyckad körning registreras i Azure Machine Learning Model-registret.

    Skärm bild av konfigurations specifikationer för att träna en maskin inlärnings modell.

    • Azure Machine Learning arbets yta: en Azure Machine Learning arbets yta krävs för att skapa en automatiserad körning av Machine Learning-experiment. Du måste också länka din Azure Synapse Analytics-arbetsyta med Azure Machine Learning arbets ytan med hjälp av en länkad tjänst. När du har uppfyllt alla krav kan du ange den Azure Machine Learning arbets yta som du vill använda för den automatiska körningen.

    • Experiment namn: Ange experimentets namn. När du skickar en automatisk maskin inlärnings körning anger du ett experiment namn. Information för körningen lagras under experimentet i arbets ytan Azure Machine Learning. Den här upplevelsen skapar ett nytt experiment som standard och genererar ett föreslaget namn, men du kan också ange namnet på ett befintligt experiment.

    • Bästa modell namn: Ange namnet på den bästa modellen från den automatiserade körningen. Den bästa modellen får detta namn och sparas i Azure Machine Learning Model-registret automatiskt efter den här körningen. En automatiserad maskin inlärnings körning skapar många Machine Learning-modeller. Utifrån det primära mått som du väljer i ett senare steg kan dessa modeller jämföras och den bästa modellen kan väljas.

    • Mål kolumn: det här är det som modellen tränas för att förutsäga. Välj den kolumn som du vill förutsäga. (I den här självstudien väljer vi den numeriska kolumnen fareAmount som mål kolumn.)

    • Spark-pool: Ange den Spark-pool som du vill använda för den automatiserade experiment körningen. Beräkningarna körs på den pool som du anger.

    • Konfigurations information för Spark: förutom Spark-poolen har du möjlighet att tillhandahålla konfigurations information för sessionen.

  3. Välj Fortsätt.

Välj en uppgifts typ

Välj maskin inlärnings modell typ för experimentet, baserat på den fråga som du försöker besvara. Eftersom fareAmount är mål kolumnen och det är ett numeriskt värde rekommenderar vi att du väljer regression här. Välj sedan Fortsätt.

Skärm bild av utöka med ny modell med regression markerat.

Ytterligare konfigurationer

Om du har valt regression eller klassificering som modell typ i föregående avsnitt är följande konfigurationer tillgängliga:

  • Primärt mått: Ange måttet som mäter hur väl modellen fungerar. Du kan använda det här måttet för att jämföra olika modeller som skapats i den automatiserade körningen och avgöra vilken modell som utfördes bäst.

  • Utbildnings jobb tid (timmar): Ange den maximala tid i timmar som ett experiment ska köras och träna modeller. Observera att du också kan ange värden som är mindre än 1 (till exempel 0,5).

  • Max. antal samtidiga iterationer: Välj det maximala antalet iterationer som körs parallellt.

  • Kompatibilitet för ONNX-modell: om du aktiverar det här alternativet konverteras de modeller som tränas av automatisk maskin inlärning till ONNX-formatet. Detta är särskilt relevant om du vill använda modellen för poängsättning i Azure Synapse Analytics SQL-pooler.

Alla inställningar har ett standardvärde som du kan anpassa. Skärm bild av ytterligare konfigurationer för att konfigurera en Regressions modell.

När alla konfigurationer som krävs har slutförts kan du starta den automatiserade körningen. Du kan välja skapa körning, som startar din körning direkt, utan kod. Om du föredrar kod kan du också välja Öppna i Notebook. Med det här alternativet kan du se den kod som skapar körningen och sedan köra antecknings boken.

Anteckning

Om du har valt tids serie prognoser som modell typ i föregående avsnitt måste du göra ytterligare konfigurationer. Prognoser stöder inte heller ONNX-modellens kompatibilitet.

Skapa en körning direkt

Starta din automatiserade Machine Learning-körning direkt genom att välja Starta körning. Du ser ett meddelande som anger att körningen startar. Sedan visas ett annat meddelande som anger att det lyckades. Du kan också kontrol lera statusen i Azure Machine Learning genom att välja länken i meddelandet. Skärm bild av lyckad avisering.

Skapa en körning med en bärbar dator

Om du vill skapa en antecknings bok väljer du Öppna i Notebook. Välj sedan Kör alla. Det ger dig också möjlighet att lägga till inställningar till din automatiserade Machine Learning-körning.

Skärm bild av en bärbar dator med kör alla markerat.

När du har skickat körningen visas en länk till experimentet i arbets ytan Azure Machine Learning i antecknings bokens utdata. Välj länken för att övervaka den automatiserade körningen i Azure Machine Learning. Skärm bild av Azure Synapse Analytics med en länk markerad. )

Nästa steg