Självstudie: Guide för modellbedömning för maskininlärning (förhandsversion) för dedikerade SQL pooler
Lär dig hur du enkelt kan utöka dina data i dedikerade SQL pooler med förutsägande maskininlärningsmodeller. De modeller som dina dataexperter skapar är nu lättillgängliga för datatekniker för förutsägelseanalys. En dataproffs i Azure Synapse Analytics kan helt enkelt välja en modell från Azure Machine Learning-modellregistret för distribution i Azure Synapse SQL-pooler och starta förutsägelser för att utöka data.
I den här självstudien får du lära dig att:
- Träna en förutsägande maskininlärningsmodell och registrera modellen i Azure Machine Learning modellregistret.
- Använd guiden SQL för att starta förutsägelser i en dedikerad SQL pool.
Om du inte har en Azure-prenumeration kan du skapa ett kostnadsfritt konto innan du börjar.
Förutsättningar
- Azure Synapse Analytics med ett Azure Data Lake Storage Gen2-lagringskonto konfigurerat som standardlagring. Du måste vara den Storage Blob Data-deltagaren i Data Lake Storage Gen2-filsystemet som du arbetar med.
- Dedikerad SQL i din Azure Synapse Analytics arbetsyta. Mer information finns i Skapa en dedikerad SQL pool.
- Azure Machine Learning länkad tjänst i Azure Synapse Analytics arbetsyta. Mer information finns i Skapa en Azure Machine Learning länkad tjänst i Azure Synapse.
Logga in på Azure Portal
Logga in på Azure-portalen.
Träna en modell i Azure Machine Learning
Innan du börjar kontrollerar du att din version av sklearn är 0.20.3.
Innan du kör alla celler i anteckningsboken kontrollerar du att beräkningsinstansen körs.

Gå till Azure Machine Learning arbetsyta.
Öppna arbetsytan Azure Machine Learning i Azure Machine Learning Studio.
Gå till Notebooks > Upload files. Välj sedan filen Predict NYC Taxi Tips.ipynb som du laddade ned och ladda upp den.

När notebook-filen har laddats upp och öppnats väljer du Kör alla celler.
En av cellerna kan misslyckas och du uppmanas att autentisera till Azure. Håll utkik efter detta i cellutdata och autentisera i webbläsaren genom att följa länken och ange koden. Kör sedan notebook-anteckningsboken på ett annat sätt.
Notebook-datorn tränar en ONNX-modell och registrerar den med MLflow. Gå till Modeller för att kontrollera att den nya modellen har registrerats korrekt.

När du kör notebook-filen exporteras även testdata till en CSV-fil. Ladda ned CSV-filen till ditt lokala system. Senare importerar du CSV-filen till en dedikerad SQL och använder data för att testa modellen.
CSV-filen skapas i samma mapp som notebook-filen. Välj Uppdatera Utforskaren om du inte ser det direkt.

Starta förutsägelser med SQL med bedömningsguiden
Öppna arbetsytan Azure Synapse med Synapse Studio.
Gå till Data > linked > Storage Accounts.
test_data.csvUpload till standardlagringskontot.
Gå till Utveckla > SQL skript. Skapa ett nytt SQL för inläsning
test_data.csvi din dedikerade SQL pool.Anteckning
Uppdatera fil-URL:en i det här skriptet innan du kör det.
IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U') CREATE TABLE dbo.nyc_taxi ( tipped int, fareAmount float, paymentType int, passengerCount int, tripDistance float, tripTimeSecs bigint, pickupTimeBin nvarchar(30) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX ) GO COPY INTO dbo.nyc_taxi (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7) FROM '<URL to linked storage account>/test_data.csv' WITH ( FILE_TYPE = 'CSV', ROWTERMINATOR='0x0A', FIELDQUOTE = '"', FIELDTERMINATOR = ',', FIRSTROW = 2 ) GO SELECT TOP 100 * FROM nyc_taxi GO
Gå till Dataarbetsyta. > Öppna guiden SQL genom att högerklicka på den dedikerade SQL-pooltabellen. Välj Machine Learning Predict with a model > (Förutse med en modell).
Anteckning
Maskininlärningsalternativet visas inte om du inte har en länkad tjänst som skapats för Azure Machine Learning. (Se Förutsättningar i början av den här självstudien.)

Välj en Azure Machine Learning arbetsyta i listrutan. Det här steget läser in en lista över maskininlärningsmodeller från modellregistret för Azure Machine Learning arbetsyta. För närvarande stöds endast ONNX-modeller, så det här steget visar endast ONNX-modeller.
Välj den modell som du precis har tränat och välj sedan Fortsätt.

Mappa tabellkolumnerna till modellens indata och ange modellens utdata. Om modellen sparas i MLflow-format och modellsignaturen fylls i, görs mappningen automatiskt åt dig med hjälp av en logik som baseras på likheterna mellan namn. Gränssnittet stöder också manuell mappning.
Välj Fortsätt.

Den genererade T-SQL-koden omsluts i en lagrad procedur. Det är därför du måste ange ett namn på den lagrade proceduren. Modell-binärfil, inklusive metadata (version, beskrivning och annan information), kopieras fysiskt från Azure Machine Learning till en dedikerad SQL-pooltabell. Därför måste du ange vilken tabell som modellen ska sparas i.
Du kan välja antingen Befintlig tabell eller Skapa ny. När du är klar väljer du Distribuera modell + öppet skript för att distribuera modellen och generera ett T-SQL-förutsägelseskript.

När skriptet har genererats väljer du Kör för att köra bedömning och hämta förutsägelser.
