Zelfstudie: Wizard voor scoren van het Machine learning-model voor toegewezen SQL-pools
Meer informatie over hoe u uw gegevens in toegewezen SQL-pools eenvoudig kunt verrijken met voorspellende Machine Learning-modellen. De modellen die uw gegevensanalisten maken, zijn nu eenvoudig toegankelijk voor gegevensprofessionals voor predictive analytics. Een gegevensprofessional in Azure Synapse Analytics kan gewoon een model selecteren in het Azure Machine Learning-modelregister voor implementatie in Azure Synapse SQL-pools en voorspellingen starten om de gegevens te verrijken.
In deze zelfstudie leert u het volgende:
- Train een voorspellend machine learning model en registreer het model in het Azure Machine Learning modelregister.
- Gebruik de SQL om voorspellingen te starten in een toegewezen SQL groep.
Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.
Vereisten
- Azure Synapse Analytics werkruimte met een Azure Data Lake Storage Gen2-opslagaccount geconfigureerd als de standaardopslag. U moet de bijdrager Storage blobgegevens zijn van het Data Lake Storage Gen2-bestandssysteem dat u gebruikt.
- Toegewezen SQL-pool in uw Azure Synapse Analytics-werkruimte. Zie Een toegewezen SQL-pool maken voor meer informatie.
- Met Azure Machine Learning gekoppelde service in uw Azure Synapse Analytics-werkruimte. Raadpleeg Een met Azure Machine Learning gekoppelde service maken in Azure Synapse voor meer informatie.
Aanmelden bij Azure Portal
Meld u aan bij de Azure-portal.
Een model trainen in Azure Machine Learning
Controleer voordat u begint of uw versie van sklearn 0.20.3 is.
Voordat u alle cellen in het notebook gaat uitvoeren, controleert u of het reken-exemplaar wordt uitgevoerd.

Ga naar uw Azure Machine Learning werkruimte.
Download Voorspellen NYC Taxi Tips.ipynb.
Open de Azure Machine Learning in Azure Machine Learning Studio.
Ga naar Notebooks > Upload bestanden. Selecteer vervolgens het bestand Predict NYC Taxi Tips.ipynb dat u hebt gedownload en geüpload.

Nadat het notebook is geüpload en geopend, selecteert u Alle cellen uitvoeren.
Een van de cellen kan mislukken en u vragen om te verifiëren bij Azure. Kijk hier naar in de uitvoer van de cel en verifieert u in uw browser door de koppeling te volgen en de code in te voeren. Voer het notebook vervolgens opnieuw uit.
Het notebook traint een ONNX-model en registreert het bij MLflow. Ga naar Modellen om te controleren of het nieuwe model correct is geregistreerd.

Als u het notebook uitvoert, worden de testgegevens geëxporteerd naar een CSV-bestand. Download het CSV-bestand naar uw lokale systeem. Later importeert u het CSV-bestand in een SQL pool en gebruikt u de gegevens om het model te testen.
Het CSV-bestand wordt gemaakt in dezelfde map als het notebook-bestand. Selecteer Vernieuwen in Verkenner als u deze niet meteen ziet.

Start voorspellingen met de wizard SQL scoren
Open de Azure Synapse werkruimte met Synapse Studio.
Ga naar > Gekoppelde > gegevens Storage Accounts. Upload
test_data.csvnaar de standaard opslagaccount.
Ga naar Ontwikkel > SQL-scripts. Maak een nieuw SQL-script om
test_data.csvin uw toegewezen SQL-pool te laden.Notitie
Werk de bestands-URL in dit script bij voordat u deze uitvoert.
IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U') CREATE TABLE dbo.nyc_taxi ( tipped int, fareAmount float, paymentType int, passengerCount int, tripDistance float, tripTimeSecs bigint, pickupTimeBin nvarchar(30) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX ) GO COPY INTO dbo.nyc_taxi (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7) FROM '<URL to linked storage account>/test_data.csv' WITH ( FILE_TYPE = 'CSV', ROWTERMINATOR='0x0A', FIELDQUOTE = '"', FIELDTERMINATOR = ',', FIRSTROW = 2 ) GO SELECT TOP 100 * FROM nyc_taxi GO
Ga naar Gegevens > Werkruimte. Open de SQL wizard voor scoren door met de rechtermuisknop te klikken op de tabel van de toegewezen SQL-pool. Selecteer Machine Learning > Voorspellen met een model.
Notitie
De machine learning wordt niet weergegeven, tenzij u een gekoppelde service hebt gemaakt voor Azure Machine Learning. (Zie Vereisten aan het begin van deze zelfstudie.)

Selecteer een gekoppelde Azure Machine Learning-werkruimte in de vervolgkeuzelijst. In deze stap wordt een lijst met machine learning modellen geladen uit het modelregister van de gekozen Azure Machine Learning werkruimte. Op dit moment worden alleen ONNX-modellen ondersteund, dus in deze stap worden alleen ONNX-modellen weergegeven.
Selecteer het model dat u zojuist hebt getraind en selecteer vervolgens Doorgaan.

Wijs de tabelkolommen toe aan de modelinvoer en geef de modeluitvoer op. Als het model wordt opgeslagen in de MLflow-indeling en de modelhandtekening wordt ingevuld, wordt de toewijzing automatisch voor u uitgevoerd met behulp van een logica op basis van de gelijkenis van namen. De interface ondersteunt ook handmatige toewijzing.
Selecteer Doorgaan.

De gegenereerde T-SQL code wordt verpakt in een opgeslagen procedure. Daarom moet u een opgeslagen procedurenaam verstrekken. Het binaire model, inclusief metagegevens (versie, beschrijving en andere informatie), wordt fysiek gekopieerd van Azure Machine Learning naar een SQL pooltabel. U moet dus opgeven in welke tabel u het model wilt opslaan.
U kunt bestaande tabel of Nieuwe maken kiezen. Wanneer u klaar bent, selecteert u Model implementeren + script openen om het model te implementeren en een T-SQL voorspellingsscript te genereren.

Nadat het script is gegenereerd, selecteert u Uitvoeren om het scoren uit te voeren en voorspellingen te krijgen.
