Kurz: Průvodce bodováním modelu strojového učení (Preview) pro vyhrazené SQL fondy

Naučte se snadno rozšiřovat data ve vyhrazených fondech SQL s prediktivními modely strojového učení. Modely, které vaši datoví vědci vytvářejí, jsou teď pro odborníky na data snadno přístupné pro prediktivní analýzu. Odborník na data v Azure Synapse Analytics jednoduše vybrat model z registru modelů Azure Machine Learning pro nasazení ve Azure Synapse SQL fondech a spustit předpovědi pro obohacení dat.

V tomto kurzu se naučíte:

  • Vytrénujete prediktivní model strojového učení a zaregistrujete ho v registru Azure Machine Learning modelu.
  • Pomocí průvodce SQL bodování můžete spouštět předpovědi ve vyhrazeném SQL fondu.

Pokud ještě nemáte předplatné Azure, vytvořte si bezplatný účet před tím, než začnete.

Požadavky

Přihlášení k webu Azure Portal

Přihlaste se na Azure Portal.

Trénovat model v Azure Machine Learning

Než začnete, ověřte, že vaše verze sklearn je 0.20.3.

Před spuštěním všech buněk v poznámkovém bloku zkontrolujte, že je výpočetní instance spuštěná.

Snímek obrazovky znázorňuje ověření Azure Machine Learning výpočetních prostředků

  1. Přejděte do svého Azure Machine Learning pracovního prostoru.

  2. Stáhněte si predict nyc taxi Tipy.ipynb.

  3. Otevřete pracovní Azure Machine Learning v Azure Machine Learning Studiu.

  4. Přejděte do poznámkového bloku > Upload soubory. Pak vyberte soubor Predict NYC Taxi Tipy.ipynb, který jste stáhli, a nahrajte ho. Snímek obrazovky s tlačítkem pro nahrání souboru

  5. Po nahrání a otevření poznámkového bloku vyberte Spustit všechny buňky.

    Jedna z buněk může selhat a požádat vás o ověření v Azure. Sledujte to ve výstupech buňky a ověřte se v prohlížeči pomocí odkazu a zadáním kódu. Pak poznámkový blok spusťte znovu.

  6. Poznámkový blok vytrénoval model ONNX a zaregistroval ho v MLflow. Přejděte na Modely a zkontrolujte, že je nový model správně zaregistrovaný. Snímek obrazovky znázorňuje model v registru

  7. Spuštění poznámkového bloku také exportuje testovací data do souboru CSV. Stáhněte si soubor CSV do místního systému. Později soubor CSV naimportujete do vyhrazeného fondu SQL a data použijete k otestování modelu.

    Soubor CSV se vytvoří ve stejné složce jako soubor poznámkového bloku. Pokud ji hned Průzkumník souborů, vyberte Aktualizovat v aplikaci.

    Snímek obrazovky znázorňuje soubor CS V

Spouštění předpovědí pomocí SQL bodování

  1. Otevřete pracovní Azure Synapse s Synapse Studio.

  2. Přejděte na data > propojená > Storage účty. test_data.csvUpload na výchozí účet úložiště.

    Snímek obrazovky znázorňující výběry pro nahrání dat

  3. Přejděte na stránku Vývoj > SQL skriptů. Vytvořte nový skript SQL, který se načte test_data.csv do vyhrazeného SQL fondu.

    Poznámka

    Před spuštěním aktualizujte adresu URL souboru v tomto skriptu.

    IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U')
    CREATE TABLE dbo.nyc_taxi
    (
        tipped int,
        fareAmount float,
        paymentType int,
        passengerCount int,
        tripDistance float,
        tripTimeSecs bigint,
        pickupTimeBin nvarchar(30)
    )
    WITH
    (
        DISTRIBUTION = ROUND_ROBIN,
        CLUSTERED COLUMNSTORE INDEX
    )
    GO
    
    COPY INTO dbo.nyc_taxi
    (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7)
    FROM '<URL to linked storage account>/test_data.csv'
    WITH
    (
        FILE_TYPE = 'CSV',
        ROWTERMINATOR='0x0A',
        FIELDQUOTE = '"',
        FIELDTERMINATOR = ',',
        FIRSTROW = 2
    )
    GO
    
    SELECT TOP 100 * FROM nyc_taxi
    GO
    

    Načtení dat do vyhrazeného SQL fondu

  4. Přejděte do pracovního > prostoru dat. Otevřete průvodce SQL bodováním kliknutím pravým tlačítkem na vyhrazenou tabulku SQL fondu. Vyberte Machine Learning Predict with a model > (Predikovat pomocí modelu).

    Poznámka

    Možnost strojového učení se nezobrazí, pokud nemáte vytvořenou propojenou službu pro Azure Machine Learning. (Viz Požadavky na začátku tohoto kurzu.)

    Snímek obrazovky znázorňuje možnost Učení počítače

  5. V rozevíracím Azure Machine Learning pracovní prostor propojeného pracovního prostoru. Tento krok načte seznam modelů strojového učení z registru modelů zvoleného pracovního Azure Machine Learning pracovním prostoru. V současné době se podporují pouze modely ONNX, takže v tomto kroku se zobrazí pouze modely ONNX.

  6. Vyberte model, který jste právě natrénoval, a pak vyberte Pokračovat.

    Snímek obrazovky znázorňuje výběr Azure Machine Learning modelu

  7. Namapujte sloupce tabulky na vstupy modelu a zadejte výstupy modelu. Pokud je model uložený ve formátu MLflow a podpis modelu se naplní, mapování se automaticky vytvoří za vás pomocí logiky založené na podobnosti názvů. Rozhraní podporuje také ruční mapování.

    Vyberte Pokračovat.

    Snímek obrazovky znázorňuje mapování tabulky na model

  8. Vygenerovaný kód T-SQL zabalený do uložené procedury. Proto je potřeba zadat název uložené procedury. Binární soubor modelu, včetně metadat (verze, popis a další informace), se fyzicky zkopíruje z Azure Machine Learning do vyhrazené tabulky SQL fondu. Proto musíte určit, do které tabulky se má model uložit.

    Můžete zvolit buď Existující tabulku, nebo Vytvořit novou. Až budete hotovi, vyberte Deploy model + open script (Nasadit model a otevřít skript), abyste nasadili model a SQL skript pro predikci.

    Snímek obrazovky znázorňuje výběry pro vytvoření uložené procedury

  9. Po vygenerování skriptu vyberte Spustit, aby se spouštěly vyhodnocování a získání předpovědí.

    Snímek obrazovky znázorňuje bodování a predikce

Další kroky