Kurz: Průvodce bodováním modelu strojového učení (Preview) pro vyhrazené SQL fondy
Naučte se snadno rozšiřovat data ve vyhrazených fondech SQL s prediktivními modely strojového učení. Modely, které vaši datoví vědci vytvářejí, jsou teď pro odborníky na data snadno přístupné pro prediktivní analýzu. Odborník na data v Azure Synapse Analytics jednoduše vybrat model z registru modelů Azure Machine Learning pro nasazení ve Azure Synapse SQL fondech a spustit předpovědi pro obohacení dat.
V tomto kurzu se naučíte:
- Vytrénujete prediktivní model strojového učení a zaregistrujete ho v registru Azure Machine Learning modelu.
- Pomocí průvodce SQL bodování můžete spouštět předpovědi ve vyhrazeném SQL fondu.
Pokud ještě nemáte předplatné Azure, vytvořte si bezplatný účet před tím, než začnete.
Požadavky
- Azure Synapse Analytics s účtem úložiště Azure Data Lake Storage Gen2 nakonfigurovaný jako výchozí úložiště. Musíte být přispěvatelem dat Storage objektů blob služby Data Lake Storage Gen2, se kterou pracujete.
- Vyhrazený SQL ve vašem Azure Synapse Analytics pracovním prostoru. Podrobnosti najdete v tématu Vytvoření vyhrazeného SQL fondu.
- Azure Machine Learning propojené služby ve vašem Azure Synapse Analytics pracovním prostoru. Podrobnosti najdete v tématu Vytvoření propojené Azure Machine Learning služby v Azure Synapse.
Přihlášení k webu Azure Portal
Přihlaste se na Azure Portal.
Trénovat model v Azure Machine Learning
Než začnete, ověřte, že vaše verze sklearn je 0.20.3.
Před spuštěním všech buněk v poznámkovém bloku zkontrolujte, že je výpočetní instance spuštěná.

Přejděte do svého Azure Machine Learning pracovního prostoru.
Stáhněte si predict nyc taxi Tipy.ipynb.
Otevřete pracovní Azure Machine Learning v Azure Machine Learning Studiu.
Přejděte do poznámkového bloku > Upload soubory. Pak vyberte soubor Predict NYC Taxi Tipy.ipynb, který jste stáhli, a nahrajte ho.

Po nahrání a otevření poznámkového bloku vyberte Spustit všechny buňky.
Jedna z buněk může selhat a požádat vás o ověření v Azure. Sledujte to ve výstupech buňky a ověřte se v prohlížeči pomocí odkazu a zadáním kódu. Pak poznámkový blok spusťte znovu.
Poznámkový blok vytrénoval model ONNX a zaregistroval ho v MLflow. Přejděte na Modely a zkontrolujte, že je nový model správně zaregistrovaný.

Spuštění poznámkového bloku také exportuje testovací data do souboru CSV. Stáhněte si soubor CSV do místního systému. Později soubor CSV naimportujete do vyhrazeného fondu SQL a data použijete k otestování modelu.
Soubor CSV se vytvoří ve stejné složce jako soubor poznámkového bloku. Pokud ji hned Průzkumník souborů, vyberte Aktualizovat v aplikaci.

Spouštění předpovědí pomocí SQL bodování
Otevřete pracovní Azure Synapse s Synapse Studio.
Přejděte na data > propojená > Storage účty.
test_data.csvUpload na výchozí účet úložiště.
Přejděte na stránku Vývoj > SQL skriptů. Vytvořte nový skript SQL, který se načte
test_data.csvdo vyhrazeného SQL fondu.Poznámka
Před spuštěním aktualizujte adresu URL souboru v tomto skriptu.
IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U') CREATE TABLE dbo.nyc_taxi ( tipped int, fareAmount float, paymentType int, passengerCount int, tripDistance float, tripTimeSecs bigint, pickupTimeBin nvarchar(30) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX ) GO COPY INTO dbo.nyc_taxi (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7) FROM '<URL to linked storage account>/test_data.csv' WITH ( FILE_TYPE = 'CSV', ROWTERMINATOR='0x0A', FIELDQUOTE = '"', FIELDTERMINATOR = ',', FIRSTROW = 2 ) GO SELECT TOP 100 * FROM nyc_taxi GO
Přejděte do pracovního > prostoru dat. Otevřete průvodce SQL bodováním kliknutím pravým tlačítkem na vyhrazenou tabulku SQL fondu. Vyberte Machine Learning Predict with a model > (Predikovat pomocí modelu).
Poznámka
Možnost strojového učení se nezobrazí, pokud nemáte vytvořenou propojenou službu pro Azure Machine Learning. (Viz Požadavky na začátku tohoto kurzu.)

V rozevíracím Azure Machine Learning pracovní prostor propojeného pracovního prostoru. Tento krok načte seznam modelů strojového učení z registru modelů zvoleného pracovního Azure Machine Learning pracovním prostoru. V současné době se podporují pouze modely ONNX, takže v tomto kroku se zobrazí pouze modely ONNX.
Vyberte model, který jste právě natrénoval, a pak vyberte Pokračovat.

Namapujte sloupce tabulky na vstupy modelu a zadejte výstupy modelu. Pokud je model uložený ve formátu MLflow a podpis modelu se naplní, mapování se automaticky vytvoří za vás pomocí logiky založené na podobnosti názvů. Rozhraní podporuje také ruční mapování.
Vyberte Pokračovat.

Vygenerovaný kód T-SQL zabalený do uložené procedury. Proto je potřeba zadat název uložené procedury. Binární soubor modelu, včetně metadat (verze, popis a další informace), se fyzicky zkopíruje z Azure Machine Learning do vyhrazené tabulky SQL fondu. Proto musíte určit, do které tabulky se má model uložit.
Můžete zvolit buď Existující tabulku, nebo Vytvořit novou. Až budete hotovi, vyberte Deploy model + open script (Nasadit model a otevřít skript), abyste nasadili model a SQL skript pro predikci.

Po vygenerování skriptu vyberte Spustit, aby se spouštěly vyhodnocování a získání předpovědí.
