Mi- és gépi tanulási számítástechnika üzembe helyezése a helyszínen és a peremhálózaton

Azure Container Registry
Azure IoT Edge
Azure Machine Learning
Azure Stack Edge

Ez a referenciaarchitektúra bemutatja, hogyan terjeszthető ki a gyors gépi tanulási következtetés a felhőből a helyszíni vagy peremhálózati forgatókönyvekbe az Azure Stack Edge használatával. Az Azure Stack Hub olyan Azure-képességeket biztosít, mint a számítás, a tárolás, a hálózatkezelés és a hardveresen gyorsított gépi tanulás bármilyen peremhálózati helyre.

Architektúra

Architecture diagram: on-premises data training a model in Azure Machine Learning, with model deployed back to the edge for inference.

Töltse le az architektúra Visio-fájlját.

Munkafolyamat

Az architektúra a következő lépésekből áll:

  • Azure Machine Tanulás. A gépi Tanulás lehetővé teszi gépi tanulási modellek felhőalapú környezetben történő összeállítását, betanítása, üzembe helyezését és kezelését. Ezek a modellek ezután üzembe helyezhetők az Azure-szolgáltatásokban, beleértve (de nem kizárólag) az Azure Container Instances, az Azure Kubernetes Service (AKS) és az Azure Functions szolgáltatást.
  • Azure Container Registry. A Tárolóregisztrációs adatbázis egy szolgáltatás, amely létrehozza és kezeli a Docker-beállításjegyzéket. A Tárolóregisztrációs adatbázis létrehozza, tárolja és kezeli a Docker-tárolólemezképeket, és tárolóalapú gépi tanulási modelleket is tárolhat.
  • Azure Stack Edge. Az Azure Stack Edge egy peremhálózati számítástechnikai eszköz, amely a peremhálózati gépi tanulási következtetésekre lett tervezve. Az adatok előfeldolgozása a peremhálózaton történik az Azure-ba való átvitel előtt. Az Azure Stack Edge olyan számítási gyorsítási hardvereket tartalmaz, amelyek célja az AI-következtetés teljesítményének javítása a peremhálózaton.
  • Helyi adatok. A helyi adatok a gépi tanulási modell betanításához használt adatokra hivatkoznak. Az adatok bármely helyi tárolási megoldásban lehetnek, beleértve az Azure Arc üzembe helyezését is.

Összetevők

Forgatókönyv részletei

Lehetséges használati esetek

Ez a megoldás ideális a távközlési iparág számára. A következtetés kiterjesztésének tipikus felhasználási módjai a következők:

  • Futtasson helyi, gyors gépi tanulási következtetést az adatokkal, miközben betölti azokat, és jelentős helyszíni hardverigényrel rendelkezik.
  • Hosszú távú kutatási megoldások létrehozása, ahol a meglévő helyszíni adatok törlődnek, és egy modell létrehozásához használhatók. A modell ezután a helyszínen és a felhőben is használható; az új adatok érkezésekor rendszeresen újratanulják.
  • Olyan szoftveralkalmazásokat hozhat létre, amelyekből következtethet a felhasználókra mind fizikai helyen, mind online.

Javaslatok

Helyileg tárolt adatok betöltése, átalakítása és átvitele

Az Azure Stack Edge átalakíthatja a helyi tárolóból származó adatokat, mielőtt az adatokat az Azure-ba továbbítanák. Ezt az átalakítást egy Azure Stack Edge-eszközön üzembe helyezett Azure IoT Edge-eszköz végzi. Ezek az IoT Edge-eszközök egy Azure IoT Hub-erőforráshoz vannak társítva az Azure-felhőplatformon.

Minden IoT Edge-modul egy Docker-tároló, amely egy adott feladatot hajt végre egy betöltési, átalakítási és átviteli munkafolyamatban. Egy IoT Edge-modul például adatokat gyűjthet egy Helyi Azure Stack Edge-megosztásból, és az adatokat gépi tanulásra kész formátummá alakíthatja. Ezután a modul az átalakított adatokat egy Azure Stack Edge-felhőmegosztásba továbbítja. Hozzáadhat egyéni vagy beépített modulokat az IoT Edge-eszközhöz, vagy egyéni IoT Edge-modulokat fejleszthet.

Megjegyzés:

Az IoT Edge-modulok Docker-tárolólemezképekként vannak regisztrálva a Container Registryben.

Az Azure-felhőplatform Azure Stack Edge-erőforrásában a felhőmegosztást egy Azure Blob Storage-fiókerőforrás végzi. A felhőmegosztásban lévő összes adat automatikusan feltöltődik a társított tárfiókba. Az adatok átalakítását és átvitelét a helyi vagy a felhőbeli megosztás csatlakoztatásával, vagy az Azure Storage-fiók bejárásával ellenőrizheti.

Modell betanítása és üzembe helyezése

Miután előkészítette és tárolta az adatokat a Blob Storage-ban, létrehozhat egy gépi Tanulás adatkészletet, amely az Azure Storage-hoz csatlakozik. Az adatkészletek az adatok egyetlen példányát jelölik a tárolóban, amelyet közvetlenül a Machine Tanulás hivatkoznak.

A gépi Tanulás parancssori felület (CLI), az R SDK, a Python SDK, a tervező vagy a Visual Studio Code használatával létrehozhatja a modell betanítása érdekében szükséges szkripteket.

A modell üzembe helyezésének betanítása és előkészítése után üzembe helyezheti a különböző Azure-szolgáltatásokban, többek között a következőkre:

Megjegyzés:

Ebben a referenciaarchitektúrában a modell üzembe helyezve az Azure Stack Edge-ben, hogy a modell a helyszínen is elérhető legyen. A modell a Tárolóregisztrációs adatbázisban is üzembe helyezve biztosítja, hogy a modell az Azure-szolgáltatások legszélesebb körében következtethető legyen.

Következtetés egy újonnan üzembe helyezett modellel

Az Azure Stack Edge beépített számítási gyorsítási hardverének használatával gyorsan futtathat gépi tanulási modelleket a helyszíni adatokon. Ez a számítás teljes egészében a peremhálózaton történik. Az eredmény gyors adatelemzés, olyan hardver használatával, amely közelebb van az adatforráshoz, mint egy nyilvános felhőrégió.

Emellett az Azure Stack Edge továbbra is átviszi az adatokat a Machine Tanulás a folyamatos újratanításhoz és fejlesztéshez egy olyan gépi tanulási folyamat használatával, amely a helyileg tárolt adatokon már futó modellhez van társítva.

Megfontolandó szempontok

Ezek a szempontok implementálják az Azure Well-Architected Framework alappilléreit, amely a számítási feladatok minőségének javítására használható vezérelvek halmaza. További információ: Microsoft Azure Well-Architected Framework.

Elérhetőség

  • Érdemes lehet az Azure Stack Edge-erőforrást ugyanabban az Azure-régióban elhelyezni, mint más Azure-szolgáltatások, amelyek hozzáférhetnek hozzá. A feltöltési teljesítmény optimalizálása érdekében érdemes lehet az Azure Blob Storage-fiókot abban a régióban elhelyezni, ahol a berendezés a legjobb hálózati kapcsolattal rendelkezik.
  • Fontolja meg az Azure ExpressRoute-t az eszköz és az Azure közötti stabil, redundáns kapcsolat érdekében.

Kezelhetőség

  • Rendszergazda istratorok ellenőrizhetik, hogy a helyi tárolóból származó adatforrás megfelelően került-e át az Azure Stack Edge-erőforrásba. A kiszolgálói üzenetblokk (SMB)/hálózati fájlrendszer (NFS) fájlmegosztás csatlakoztatásával vagy a társított Blob Storage-fiókhoz való csatlakozással ellenőrizhetik az Azure Storage Explorer használatával.
  • A gépi Tanulás adatkészletekkel hivatkozhat a Blob Storage-ban tárolt adatokra a modell betanítása során. A hivatkozó tárterület szükségtelenné teszi a titkos kulcsok, adatelérési utak vagy kapcsolati sztring beágyazását a betanítási szkriptekbe.
  • A Gép Tanulás munkaterületen regisztrálja és nyomon követi az ML-modelleket, hogy nyomon kövesse a modellek közötti különbségeket különböző időpontokban. Hasonlóképpen tükrözheti a verziószámozási és nyomkövetési metaadatokat a Tárolóregisztrációs adatbázisban üzembe helyezett Docker-tárolólemezképekhez használt címkékben.

DevOps

  • Tekintse át a Gépi Tanulás MLOps életciklus-kezelési megközelítését. A GitHub vagy az Azure Pipelines használatával például létrehozhat egy folyamatos integrációs folyamatot, amely automatikusan betanít és újratanít egy modellt. A betanítás akkor aktiválható, ha új adatok töltik fel az adathalmazt, vagy módosítják a betanítási szkripteket.
  • Az Azure Machine Tanulás munkaterület automatikusan regisztrálja és kezeli a Docker-tárolólemezképeket a gépi tanulási modellekhez és az IoT Edge-modulokhoz.

Költségoptimalizálás

A költségoptimalizálás a szükségtelen kiadások csökkentésének és a működési hatékonyság javításának módjairól szól. További információ: A költségoptimalizálási pillér áttekintése.

További lépések

Termékdokumentáció

Microsoft Learn-modulok: