Modellek betanítása az Azure Machine Learninggel

A KÖVETKEZŐKRE VONATKOZIK: Python SDK azure-ai-ml v2 (aktuális)

Az Azure Machine Tanulás többféle módon taníthatja be a modelleket, az SDK-t használó kódelső megoldásoktól az olyan alacsony kódszámú megoldásokig, mint az automatizált gépi tanulás és a vizuális tervező. Az alábbi lista segítségével állapítsa meg, hogy melyik betanítási módszer megfelelő Önnek:

  • Azure Machine Tanulás SDK for Python: A Python SDK számos módszert kínál a modellek betanítása, mindegyik különböző képességekkel rendelkezik.

    Betanítási módszer Leírás
    command() A modellek betanításának tipikus módja egy betanítási szkriptet, környezetet és számítási információkat tartalmazó parancs(ok) elküldése.
    Automatizált gépi tanulás Az automatizált gépi tanulás lehetővé teszi modellek betanítása széles körű adatelemzési vagy programozási ismeretek nélkül. Az adatelemzési és programozási háttérrel rendelkező felhasználók számára az algoritmusok kiválasztásának és a hiperparaméterek finomhangolásának automatizálásával időt és erőforrásokat takaríthat meg. Az automatizált gépi tanulás használatakor nem kell aggódnia a feladatkonfiguráció definiálása miatt.
    Gépi tanulási folyamat A folyamatok nem egy másik betanítási módszer, hanem egy munkafolyamat moduláris, újrafelhasználható lépések használatával történő definiálásának módja, amely magában foglalhatja a munkafolyamat részét képező betanítást is. A gépi tanulási folyamatok támogatják az automatizált gépi tanulást, és futtatják a konfigurációt a modellek betanításához. Mivel a folyamatok nem kifejezetten a betanításra összpontosítanak, a folyamat használatának okai változatosabbak, mint a többi betanítási módszer. Általában a következő esetekben használhat folyamatokat:
    * Felügyelet nélküli folyamatokat szeretne ütemezni, például hosszú ideig futó betanítási feladatokat vagy adatelőkészítést.
    * Használjon több lépést , amelyek heterogén számítási erőforrások és tárolási helyek között vannak koordinálva.
    * Használja a folyamatot újrafelhasználható sablonként bizonyos forgatókönyvekhez, például újratanításhoz vagy kötegelt pontozáshoz.
    * Nyomon követheti és verziószámozhatja a munkafolyamat adatforrásait, bemeneteit és kimeneteit .
    * A munkafolyamatot különböző csapatok implementálják , amelyek egymástól függetlenül dolgoznak bizonyos lépéseken. Ezután a munkafolyamat implementálásához a lépések összekapcsolhatók egy folyamaton belül.
  • Tervező: Az Azure Machine Tanulás tervezője egyszerű belépési pontot biztosít a gépi tanulásba az alapfogalmak készítéséhez, vagy a kevés kódolási tapasztalattal rendelkező felhasználók számára. Lehetővé teszi a modellek betanítása webes felhasználói felület húzással és húzással. A Python-kódot a tervezés részeként használhatja, vagy kódírás nélkül taníthat be modelleket.

  • Azure CLI: A gépi tanulási parancssori felület parancsokat biztosít az Azure Machine Tanulás gyakori feladataihoz, és gyakran használják szkriptek és feladatok automatizálására. Ha például létrehozott egy betanítási szkriptet vagy folyamatot, az Azure CLI használatával elindíthat egy betanítási feladatot ütemezés szerint, vagy ha a betanításhoz használt adatfájlok frissülnek. A betanítási modellekhez olyan parancsokat biztosít, amelyek betanítási feladatokat küldenek. Futtatási konfigurációk vagy folyamatok használatával küldhet be feladatokat.

Ezek a betanítási módszerek különböző típusú számítási erőforrásokat használhatnak a betanításhoz. Ezeket az erőforrásokat együttesen számítási céloknak nevezzük. A számítási cél lehet helyi gép vagy felhőerőforrás, például Azure Machine Tanulás Compute, Azure HDInsight vagy távoli virtuális gép.

Python SDK

A Pythonhoz készült Azure Machine Tanulás SDK lehetővé teszi gépi tanulási munkafolyamatok készítését és futtatását az Azure Machine Tanulás használatával. A szolgáltatás interaktív Python-munkamenetből, Jupyter Notebookból, Visual Studio Code-ból vagy más IDE-ből is használható.

Parancs elküldése

Az Azure Machine-Tanulás általános betanítási feladat a() paranccsal határozható meg. Ezt követően a rendszer a betanítási szkript(ek) használatával betanít egy modellt a megadott számítási célon.

A helyi számítógép parancsával kezdheti, majd szükség szerint válthat egy felhőalapú számítási célhoz. A számítási cél módosításakor csak a használt parancsban módosíthatja a számítási paramétert. A futtatás a betanítási feladat adatait is naplózza, például a bemeneteket, kimeneteket és naplókat.

Automatizált gépi tanulás

Határozza meg az iterációkat, a hiperparaméter-beállításokat, a featurizációt és az egyéb beállításokat. A betanítás során az Azure Machine Tanulás különböző algoritmusokat és paramétereket próbál ki párhuzamosan. A betanítás leáll, amint eléri a megadott kilépési feltételeket.

Tipp.

A Python SDK mellett az Automatizált gépi tanulást is használhatja az Azure Machine Tanulás Studióban.

Gépi tanulási folyamat

A gépi tanulási folyamatok használhatják a korábban említett betanítási módszereket. A folyamatok sokkal inkább a munkafolyamatok létrehozásáról szólnak, így nem csupán a modellek betanítására terjednek ki.

A betanítási feladat beküldésekor megjelenő teendők ismertetése

Az Azure képzési életciklusa a következőkből áll:

  1. Tömörítse a fájlokat a projektmappában, és töltse fel a felhőbe.

    Tipp.

    Ha meg szeretné akadályozni, hogy a szükségtelen fájlok bekerüljenek a pillanatképbe, hozzon létre egy figyelmen kívül hagyott fájlt (.gitignore vagy .amlignore) a könyvtárban. Adja hozzá a kizárni kívánt fájlokat és könyvtárakat ehhez a fájlhoz. A fájlban használandó szintaxissal kapcsolatos további információkért lásd a szintaxist és a minták helyét .gitignore. A .amlignore fájl ugyanazt a szintaxist használja. Ha mindkét fájl létezik, a rendszer a .amlignore fájlt használja, és a .gitignore fájl nincs használatban.

  2. A számítási fürt (vagy kiszolgáló nélküli számítás) vertikális felskálázása

  3. A dockerfile létrehozása vagy letöltése a számítási csomópontra

    1. A rendszer a következő kivonatot számítja ki:
    2. A rendszer ezt a kivonatot használja kulcsként az Azure Container Registry (ACR) munkaterület keresésében
    3. Ha nem található, egyezést keres a globális ACR-ben
    4. Ha nem található, a rendszer létrehoz egy új rendszerképet (amelyet gyorsítótáraz és regisztrál a munkaterület ACR-jével)
  4. Tömörített projektfájl letöltése ideiglenes tárolóba a számítási csomóponton

  5. A projektfájl kibontása

  6. A számítási csomópont végrehajtása python <entry script> <arguments>

  7. Naplók, modellfájlok és a munkaterülethez társított tárfiókba ./outputs írt egyéb fájlok mentése

  8. Számítási kapacitás vertikális leskálázása, beleértve az ideiglenes tárterület eltávolítását is

Azure Machine Learning Designer

A tervező lehetővé teszi modellek betanítása egy húzási felület használatával a webböngészőben.

Azure CLI

A gépi tanulási parancssori felület az Azure CLI bővítménye. Platformfüggetlen CLI-parancsokat biztosít az Azure Machine Tanulás használatához. Általában a parancssori felülettel automatizálja a feladatokat, például betanít egy gépi tanulási modellt.

VS Code

A VS Code bővítmény használatával futtathatja és kezelheti a betanítási feladatokat. További információért tekintse meg a VS Code erőforrás-kezelési útmutatóját.

Következő lépések

Útmutató: Éles gépi tanulási folyamatok létrehozása Python SDK v2-vel Jupyter-jegyzetfüzetben.