Självstudie: Guide för modellbedömning för maskininlärning (förhandsversion) för dedikerade SQL pooler

Lär dig hur du enkelt kan utöka dina data i dedikerade SQL pooler med förutsägande maskininlärningsmodeller. De modeller som dina dataexperter skapar är nu lättillgängliga för datatekniker för förutsägelseanalys. En dataproffs i Azure Synapse Analytics kan helt enkelt välja en modell från Azure Machine Learning-modellregistret för distribution i Azure Synapse SQL-pooler och starta förutsägelser för att utöka data.

I den här självstudien får du lära dig att:

  • Träna en förutsägande maskininlärningsmodell och registrera modellen i Azure Machine Learning modellregistret.
  • Använd guiden SQL för att starta förutsägelser i en dedikerad SQL pool.

Om du inte har en Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.

Förutsättningar

Logga in på Azure Portal

Logga in på Azure-portalen.

Träna en modell i Azure Machine Learning

Innan du börjar kontrollerar du att din version av sklearn är 0.20.3.

Innan du kör alla celler i anteckningsboken kontrollerar du att beräkningsinstansen körs.

Skärmbild som visar verifiering av Azure Machine Learning beräkning.

  1. Gå till Azure Machine Learning arbetsyta.

  2. Ladda ned Predict NYC Taxi Tips.ipynb.

  3. Öppna arbetsytan Azure Machine Learning i Azure Machine Learning Studio.

  4. Gå till Notebooks > Upload files. Välj sedan filen Predict NYC Taxi Tips.ipynb som du laddade ned och ladda upp den. Skärmbild av knappen för att ladda upp en fil.

  5. När notebook-filen har laddats upp och öppnats väljer du Kör alla celler.

    En av cellerna kan misslyckas och du uppmanas att autentisera till Azure. Håll utkik efter detta i cellutdata och autentisera i webbläsaren genom att följa länken och ange koden. Kör sedan notebook-anteckningsboken på ett annat sätt.

  6. Notebook-datorn tränar en ONNX-modell och registrerar den med MLflow. Gå till Modeller för att kontrollera att den nya modellen har registrerats korrekt. Skärmbild som visar modellen i registret.

  7. När du kör notebook-filen exporteras även testdata till en CSV-fil. Ladda ned CSV-filen till ditt lokala system. Senare importerar du CSV-filen till en dedikerad SQL och använder data för att testa modellen.

    CSV-filen skapas i samma mapp som notebook-filen. Välj Uppdatera Utforskaren om du inte ser det direkt.

    Skärmbild som visar C S V-filen.

Starta förutsägelser med SQL med bedömningsguiden

  1. Öppna arbetsytan Azure Synapse med Synapse Studio.

  2. Gå till Data > linked > Storage Accounts. test_data.csvUpload till standardlagringskontot.

    Skärmbild som visar val för att ladda upp data.

  3. Gå till Utveckla > SQL skript. Skapa ett nytt SQL för inläsning test_data.csv i din dedikerade SQL pool.

    Anteckning

    Uppdatera fil-URL:en i det här skriptet innan du kör det.

    IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U')
    CREATE TABLE dbo.nyc_taxi
    (
        tipped int,
        fareAmount float,
        paymentType int,
        passengerCount int,
        tripDistance float,
        tripTimeSecs bigint,
        pickupTimeBin nvarchar(30)
    )
    WITH
    (
        DISTRIBUTION = ROUND_ROBIN,
        CLUSTERED COLUMNSTORE INDEX
    )
    GO
    
    COPY INTO dbo.nyc_taxi
    (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7)
    FROM '<URL to linked storage account>/test_data.csv'
    WITH
    (
        FILE_TYPE = 'CSV',
        ROWTERMINATOR='0x0A',
        FIELDQUOTE = '"',
        FIELDTERMINATOR = ',',
        FIRSTROW = 2
    )
    GO
    
    SELECT TOP 100 * FROM nyc_taxi
    GO
    

    Läsa in data till dedikerad SQL pool

  4. Gå till Dataarbetsyta. > Öppna guiden SQL genom att högerklicka på den dedikerade SQL-pooltabellen. Välj Machine Learning Predict with a model > (Förutse med en modell).

    Anteckning

    Maskininlärningsalternativet visas inte om du inte har en länkad tjänst som skapats för Azure Machine Learning. (Se Förutsättningar i början av den här självstudien.)

    Skärmbild som visar Learning dator.

  5. Välj en Azure Machine Learning arbetsyta i listrutan. Det här steget läser in en lista över maskininlärningsmodeller från modellregistret för Azure Machine Learning arbetsyta. För närvarande stöds endast ONNX-modeller, så det här steget visar endast ONNX-modeller.

  6. Välj den modell som du precis har tränat och välj sedan Fortsätt.

    Skärmbild som visar val av Azure Machine Learning modell.

  7. Mappa tabellkolumnerna till modellens indata och ange modellens utdata. Om modellen sparas i MLflow-format och modellsignaturen fylls i, görs mappningen automatiskt åt dig med hjälp av en logik som baseras på likheterna mellan namn. Gränssnittet stöder också manuell mappning.

    Välj Fortsätt.

    Skärmbild som visar mappning från tabell till modell.

  8. Den genererade T-SQL-koden omsluts i en lagrad procedur. Det är därför du måste ange ett namn på den lagrade proceduren. Modell-binärfil, inklusive metadata (version, beskrivning och annan information), kopieras fysiskt från Azure Machine Learning till en dedikerad SQL-pooltabell. Därför måste du ange vilken tabell som modellen ska sparas i.

    Du kan välja antingen Befintlig tabell eller Skapa ny. När du är klar väljer du Distribuera modell + öppet skript för att distribuera modellen och generera ett T-SQL-förutsägelseskript.

    Skärmbild som visar val för att skapa en lagrad procedur.

  9. När skriptet har genererats väljer du Kör för att köra bedömning och hämta förutsägelser.

    Skärmbild som visar bedömning och förutsägelser.

Nästa steg