Zelfstudie: Wizard voor scoren van het Machine learning-model voor toegewezen SQL-pools

Meer informatie over hoe u uw gegevens in toegewezen SQL-pools eenvoudig kunt verrijken met voorspellende Machine Learning-modellen. De modellen die uw gegevensanalisten maken, zijn nu eenvoudig toegankelijk voor gegevensprofessionals voor predictive analytics. Een gegevensprofessional in Azure Synapse Analytics kan gewoon een model selecteren in het Azure Machine Learning-modelregister voor implementatie in Azure Synapse SQL-pools en voorspellingen starten om de gegevens te verrijken.

In deze zelfstudie leert u het volgende:

  • Train een voorspellend machine learning model en registreer het model in het Azure Machine Learning modelregister.
  • Gebruik de SQL om voorspellingen te starten in een toegewezen SQL groep.

Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.

Vereisten

Aanmelden bij Azure Portal

Meld u aan bij de Azure-portal.

Een model trainen in Azure Machine Learning

Controleer voordat u begint of uw versie van sklearn 0.20.3 is.

Voordat u alle cellen in het notebook gaat uitvoeren, controleert u of het reken-exemplaar wordt uitgevoerd.

Schermopname van de verificatie van Azure Machine Learning compute.

  1. Ga naar uw Azure Machine Learning werkruimte.

  2. Download Voorspellen NYC Taxi Tips.ipynb.

  3. Open de Azure Machine Learning in Azure Machine Learning Studio.

  4. Ga naar Notebooks > Upload bestanden. Selecteer vervolgens het bestand Predict NYC Taxi Tips.ipynb dat u hebt gedownload en geüpload. Schermopname van de knop voor het uploaden van een bestand.

  5. Nadat het notebook is geüpload en geopend, selecteert u Alle cellen uitvoeren.

    Een van de cellen kan mislukken en u vragen om te verifiëren bij Azure. Kijk hier naar in de uitvoer van de cel en verifieert u in uw browser door de koppeling te volgen en de code in te voeren. Voer het notebook vervolgens opnieuw uit.

  6. Het notebook traint een ONNX-model en registreert het bij MLflow. Ga naar Modellen om te controleren of het nieuwe model correct is geregistreerd. Schermopname van het model in het register.

  7. Als u het notebook uitvoert, worden de testgegevens geëxporteerd naar een CSV-bestand. Download het CSV-bestand naar uw lokale systeem. Later importeert u het CSV-bestand in een SQL pool en gebruikt u de gegevens om het model te testen.

    Het CSV-bestand wordt gemaakt in dezelfde map als het notebook-bestand. Selecteer Vernieuwen in Verkenner als u deze niet meteen ziet.

    Schermopname van het C S V-bestand.

Start voorspellingen met de wizard SQL scoren

  1. Open de Azure Synapse werkruimte met Synapse Studio.

  2. Ga naar > Gekoppelde > gegevens Storage Accounts. Upload test_data.csv naar de standaard opslagaccount.

    Schermopname met selecties voor het uploaden van gegevens.

  3. Ga naar Ontwikkel > SQL-scripts. Maak een nieuw SQL-script om test_data.csv in uw toegewezen SQL-pool te laden.

    Notitie

    Werk de bestands-URL in dit script bij voordat u deze uitvoert.

    IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U')
    CREATE TABLE dbo.nyc_taxi
    (
        tipped int,
        fareAmount float,
        paymentType int,
        passengerCount int,
        tripDistance float,
        tripTimeSecs bigint,
        pickupTimeBin nvarchar(30)
    )
    WITH
    (
        DISTRIBUTION = ROUND_ROBIN,
        CLUSTERED COLUMNSTORE INDEX
    )
    GO
    
    COPY INTO dbo.nyc_taxi
    (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7)
    FROM '<URL to linked storage account>/test_data.csv'
    WITH
    (
        FILE_TYPE = 'CSV',
        ROWTERMINATOR='0x0A',
        FIELDQUOTE = '"',
        FIELDTERMINATOR = ',',
        FIRSTROW = 2
    )
    GO
    
    SELECT TOP 100 * FROM nyc_taxi
    GO
    

    Gegevens opladen naar een toegewezen SQL-pool

  4. Ga naar Gegevens > Werkruimte. Open de SQL wizard voor scoren door met de rechtermuisknop te klikken op de tabel van de toegewezen SQL-pool. Selecteer Machine Learning > Voorspellen met een model.

    Notitie

    De machine learning wordt niet weergegeven, tenzij u een gekoppelde service hebt gemaakt voor Azure Machine Learning. (Zie Vereisten aan het begin van deze zelfstudie.)

    Schermopname met de Learning machine.

  5. Selecteer een gekoppelde Azure Machine Learning-werkruimte in de vervolgkeuzelijst. In deze stap wordt een lijst met machine learning modellen geladen uit het modelregister van de gekozen Azure Machine Learning werkruimte. Op dit moment worden alleen ONNX-modellen ondersteund, dus in deze stap worden alleen ONNX-modellen weergegeven.

  6. Selecteer het model dat u zojuist hebt getraind en selecteer vervolgens Doorgaan.

    Schermopname van het selecteren van Azure Machine Learning model.

  7. Wijs de tabelkolommen toe aan de modelinvoer en geef de modeluitvoer op. Als het model wordt opgeslagen in de MLflow-indeling en de modelhandtekening wordt ingevuld, wordt de toewijzing automatisch voor u uitgevoerd met behulp van een logica op basis van de gelijkenis van namen. De interface ondersteunt ook handmatige toewijzing.

    Selecteer Doorgaan.

    Schermopname van de toewijzing van tabel naar model.

  8. De gegenereerde T-SQL code wordt verpakt in een opgeslagen procedure. Daarom moet u een opgeslagen procedurenaam verstrekken. Het binaire model, inclusief metagegevens (versie, beschrijving en andere informatie), wordt fysiek gekopieerd van Azure Machine Learning naar een SQL pooltabel. U moet dus opgeven in welke tabel u het model wilt opslaan.

    U kunt bestaande tabel of Nieuwe maken kiezen. Wanneer u klaar bent, selecteert u Model implementeren + script openen om het model te implementeren en een T-SQL voorspellingsscript te genereren.

    Schermopname met selecties voor het maken van een opgeslagen procedure.

  9. Nadat het script is gegenereerd, selecteert u Uitvoeren om het scoren uit te voeren en voorspellingen te krijgen.

    Schermopname met scores en voorspellingen.

Volgende stappen