Registry služby Machine Learning pro MLOps

V tomto článku se dozvíte, jak škálovat MLOps napříč vývojovými, testovacími a produkčními prostředími. Vaše prostředí se může lišit od několika po mnoho v závislosti na složitosti prostředí IT a jsou ovlivněna faktory, jako jsou:

  • Zásady zabezpečení a dodržování předpisů – musí být produkční prostředí izolovaná od vývojových prostředí z hlediska řízení přístupu, síťové architektury, vystavení dat atd.?
  • Předplatná – jsou vaše vývojová prostředí v jednom předplatném a produkční prostředí v jiném předplatném? Pro účely fakturace, rozpočtování a správy nákladů se často používají samostatná předplatná.
  • Oblasti – Potřebujete nasazení do různých oblastí Azure, aby se podporovaly požadavky na latenci a redundanci?

V takových scénářích můžete pro vývoj, testování a produkci používat různé pracovní prostory služby Azure Machine Learning. Tato konfigurace představuje následující výzvy při trénování a nasazení modelu:

  • Model potřebujete vytrénovat ve vývojovém pracovním prostoru, ale nasadit ho jako koncový bod v produkčním pracovním prostoru, případně v jiném předplatném nebo oblasti Azure. V takovém případě musíte být schopni zpětně vysledovat trénovací úlohu. Pokud například narazíte na problémy s přesností nebo výkonem produkčního nasazení, můžete analyzovat metriky, protokoly, kód, prostředí a data použitá k trénování modelu.
  • Ve vývojovém pracovním prostoru potřebujete vyvinout trénovací kanál s testovacími daty nebo anonymizovanými daty, ale model znovu natrénovat s produkčními daty v produkčním pracovním prostoru. V takovém případě možná budete muset porovnat metriky trénování u ukázkových a produkčních dat, abyste zajistili, že optimalizace trénování fungují dobře se skutečnými daty.

MLOps napříč pracovními prostory a registry

Registry, podobně jako úložiště Git, oddělují prostředky ML od pracovních prostorů a hostují je v centrálním umístění, takže jsou dostupné pro všechny pracovní prostory ve vaší organizaci.

Pokud chcete zvýšit úroveň modelů napříč prostředími (vývoj, testování, prod), začněte iterativně vyvíjet model ve vývojovém prostředí. Pokud máte dobrý kandidátní model, můžete ho publikovat do registru. Pak můžete model nasadit z registru do koncových bodů v různých pracovních prostorech.

Tip

Pokud už máte modely zaregistrované v pracovním prostoru, můžete je povýšit na registr. Model můžete také zaregistrovat přímo v registru z výstupu trénovací úlohy.

Pokud chcete vytvořit kanál v jednom pracovním prostoru a pak ho spustit v jiných, začněte registrací komponent a prostředí, která tvoří stavební bloky kanálu. Když úlohu kanálu odešlete, pracovní prostor, ve kterém se spouští, se vybere podle výpočetních a trénovacích dat, která jsou pro každý pracovní prostor jedinečná.

Následující diagram znázorňuje povýšení kanálů mezi průzkumné a vývojové pracovní prostory a potom povýšení modelu mezi vývojem, testováním a produkčním prostředím.

Diagram využití kanálu a modelu napříč prostředími

Další kroky