Mi az az Azure Machine Learning számítási példány?
Az Azure Machine Tanulás számítási példány egy felügyelt felhőalapú munkaállomás adatelemzők számára. Minden számítási példánynak csak egy tulajdonosa van, bár több számítási példány között is megoszthat fájlokat.
A számítási példányok megkönnyítik az Azure Machine Tanulás fejlesztésének megkezdését, valamint felügyeleti és vállalati felkészültségi képességeket biztosítanak az informatikai rendszergazdák számára.
Használjon számítási példányt teljes mértékben konfigurált és felügyelt fejlesztési környezetként a felhőben gépi tanuláshoz. Számítási célként is használhatók fejlesztési és tesztelési célokra való betanításhoz és következtetéshez.
A számítási példány Jupyter-funkcióinak működéséhez győződjön meg arról, hogy a webes szoftvercsatornák közötti kommunikáció nincs letiltva. Győződjön meg róla, hogy a hálózat engedélyezi a websocket-kapcsolatokat a *.instances.azureml.net és *.instances.azureml.ms címekre.
Fontos
A cikkben megjelölt (előzetes verziójú) elemek jelenleg nyilvános előzetes verzióban érhetők el. Az előzetes verzió szolgáltatásszint-szerződés nélkül érhető el, és éles számítási feladatokhoz nem ajánlott. Előfordulhat, hogy néhány funkció nem támogatott, vagy korlátozott képességekkel rendelkezik. For more information, see Supplemental Terms of Use for Microsoft Azure Previews.
Miért érdemes számítási példányt használni?
A számítási példány egy teljes mértékben felügyelt felhőalapú munkaállomás, amely a gépi tanulási fejlesztési környezethez van optimalizálva. A következő előnyöket nyújtja:
Fő előnyök | Leírás |
---|---|
Termelékenység | Az Azure Machine Tanulás Studióban integrált jegyzetfüzetek és a következő eszközök használatával hozhat létre és helyezhet üzembe modelleket: - Jupyter - JupyterLab - VS Code (előzetes verzió) A számítási példány teljes mértékben integrálva van az Azure Machine Tanulás munkaterülettel és stúdióval. Jegyzetfüzeteket és adatokat oszthat meg a munkaterület más adatelemzőivel. |
Felügyelt > biztonságos | Csökkentse a biztonsági lábnyomot, és adja hozzá a vállalati biztonsági követelményeknek való megfelelést. A számítási példányok robusztus felügyeleti szabályzatokat és biztonságos hálózati konfigurációkat biztosítanak, például: – Automatikus leépítés Resource Manager-sablonokból vagy Azure Machine Tanulás SDK-ból - Azure szerepköralapú hozzáférés-vezérlés (Azure RBAC) - Virtual network support – Azure-szabályzat az SSH-hozzáférés letiltásához – Azure-szabályzat a virtuális hálózaton való létrehozás kikényszerítéséhez - Automatikus leállítás/automatikus indítás ütemezés szerint - TLS 1.2 engedélyezve |
Gépi tanuláshoz előre konfigurálva | Időt takaríthat meg a feladatok beállításához előre konfigurált és naprakész ML-csomagokkal, mélytanulási keretrendszerekkel és GPU-illesztőprogramokkal. |
Teljesen testre szabható | Az Azure-beli virtuálisgép-típusok, köztük a GPU-k széles körű támogatása és a tartósan alacsony szintű testreszabás, például a csomagok és illesztőprogramok telepítése megkönnyíti a speciális forgatókönyveket. A testreszabás automatizálásához beállítási szkripteket is használhat |
- A számítási példány védelme nyilvános IP-cím nélkül.
- A számítási példány a számítási fürtökhöz hasonló biztonságos betanítási számítási cél is, de egyetlen csomópont.
- Létrehozhat egy számítási példányt saját maga, vagy a rendszergazda létrehozhat egy számítási példányt az Ön nevében.
- A beállítási szkript használatával automatikusan testre szabhatja és konfigurálhatja a számítási példányt az igényeinek megfelelően.
- A költségek csökkentése érdekében hozzon létre egy ütemezést a számítási példány automatikus indításához és leállításához, vagy engedélyezze az üresjárati leállítást
Eszközök és környezetek
Az Azure Machine Tanulás számítási példány lehetővé teszi modellek készítését, betanítása és üzembe helyezését egy teljesen integrált jegyzetfüzetben a munkaterületen.
Az Azure Machine Tanulás-munkaterületről, a Jupyterből, a JupyterLabből vagy a Visual Studio Code-ból is futtathat jegyzetfüzeteket. A VS Code Desktop konfigurálható a számítási példány eléréséhez. Vagy használja a VS Code-ot a weben, közvetlenül a böngészőből, a szükséges telepítések és függőségek nélkül.
Javasoljuk, hogy próbálja ki a WEBES VS Code-ot, hogy kihasználhassa az általa biztosított egyszerű integrációs és gazdag fejlesztési környezetet. A VS Code for the Web számos olyan funkciót kínál a VS Code Desktopban, amelyet szeret, beleértve a keresés és a szintaxis kiemelését a böngészés és a szerkesztés során. A VS Code Desktop és a VS Code webes használatáról további információt az Azure Machine Tanulás (előzetes verzió) integrált Visual Studio Code indítása és a számítási példányhoz távolról csatlakoztatott VS Code-ban (előzetes verzió) című témakörben talál.
Csomagokat telepíthet, és kerneleket adhat hozzá a számítási példányhoz.
A következő eszközök és környezetek már telepítve vannak a számítási példányon:
Általános eszközök és környezetek | Részletek |
---|---|
Illesztőprogramok | CUDA cuDNN NVIDIA Blob FUSE |
Intel MPI-kódtár | |
Azure CLI | |
Azure Machine-Tanulás-minták | |
Docker | |
Nginx | |
NCCL 2.0 | |
Protobuf |
R-eszközök és környezetek | Részletek |
---|---|
R kernel |
PYTHON-eszközök > környezetek | Részletek |
---|---|
Anaconda Python | |
Jupyter és bővítmények | |
Jupyterlab és bővítmények | |
Azure Machine Tanulás SDK Pythonhoz a PyPI-ból |
Tartalmazza az azure-ai-ml-t és számos gyakori azure extra csomagot. A teljes lista megtekintéséhez nyisson meg egy terminálablakot a számítási példányon , és futtassa conda list -n azureml_py310_sdkv2 ^azure |
Egyéb PyPI-csomagok | jupytext tensorboard nbconvert notebook Pillow |
Conda-csomagok | cython numpy ipykernel scikit-learn matplotlib tqdm joblib nodejs |
Mélytanulási csomagok | PyTorch TensorFlow Keras Horovod MLFlow pandas-ml scrapbook |
ONNX-csomagok | keras2onnx onnx onnxconverter-common skl2onnx onnxmltools |
Azure Machine-Tanulás Python-minták |
A számítási példány alap operációs rendszere az Ubuntu.
Fájlok elérése
A jegyzetfüzeteket és a Python-szkripteket a rendszer a munkaterület alapértelmezett tárfiókjában tárolja az Azure-fájlmegosztásban. Ezek a fájlok a "Felhasználói fájlok" könyvtár alatt találhatók. Ez a tárterület megkönnyíti a jegyzetfüzetek számítási példányok közötti megosztását. A tárfiók emellett biztonságosan megőrzi a jegyzetfüzeteket, amikor leállítja vagy törli a számítási példányokat.
A munkaterület Azure-fájlmegosztási fiókja meghajtóként van csatlakoztatva a számítási példányhoz. Ez a meghajtó a Jupyter, a Jupyter Labs, az RStudio és a Posit Workbench alapértelmezett munkakönyvtára. Ez azt jelenti, hogy a Jupyter, a JupyterLab, a VS Code for Web, az RStudio vagy a Posit alkalmazásban létrehozott jegyzetfüzetek és egyéb fájlok automatikusan a fájlmegosztáson vannak tárolva, és más számítási példányokban is használhatók.
A fájlmegosztás fájljai az ugyanazon a munkaterületen található összes számítási példányból elérhetők. A számítási példányon található fájlok módosításai megbízhatóan megmaradnak a fájlmegosztásban.
A legújabb Azure Machine-Tanulás-mintákat a munkaterület fájlmegosztás felhasználói fájlkönyvtárában lévő mappába is klónozhatja.
A kis fájlok írása a hálózati meghajtókon lassabb lehet, mint a számítási példány helyi lemezére való írás. Ha sok kis fájlt ír, próbáljon meg közvetlenül a számítási példányon könyvtárat használni, például egy könyvtárat /tmp
. Vegye figyelembe, hogy ezek a fájlok nem lesznek elérhetők más számítási példányokból.
Ne tárolja a betanítási adatokat a jegyzetfüzetek fájlmegosztásán. Az adatok tárolásának különböző lehetőségeiről további információt az Access-adatok egy feladatban című témakörben talál.
Az ideiglenes adatok tárolásához használhatja a számítási példány /tmp
könyvtárát. Ne írjon azonban nagy adatfájlokat a számítási példány operációsrendszer-lemezére. A számítási példány operációsrendszer-lemeze 128 GB kapacitással rendelkezik. Az ideiglenes betanítási adatokat az /mnt-en csatlakoztatott ideiglenes lemezen is tárolhatja. Az ideiglenes lemez mérete a kiválasztott virtuálisgép-méreten alapul, és nagyobb mennyiségű adatot tud tárolni, ha nagyobb méretű virtuális gépet választ. Any software packages you install are saved on the OS disk of compute instance. Vegye figyelembe, hogy az ügyfél által felügyelt kulcstitkosítás jelenleg nem támogatott az operációsrendszer-lemezen. The OS disk for compute instance is encrypted with Microsoft-managed keys.
You can also mount datastores and datasets.
Létrehozás
Az alapszintű számítási példány létrehozásához kövesse az Erőforrások létrehozása című témakörben leírt lépéseket.
További lehetőségekért lásd egy új számítási példány létrehozását.
Rendszergazdaként létrehozhat egy számítási példányt a munkaterület többi tagja számára.
A számítási példány testreszabásához és konfigurálásához egy beállítási szkriptet is használhat.
Számítási példányok létrehozásának egyéb módjai:
- Közvetlenül az integrált jegyzetfüzetek felületéről.
- Az Azure Resource Manager-sablonból. Példasablonért tekintse meg az Azure Machine Tanulás számítási példány sablonjának létrehozását.
- Az Azure Machine Tanulás SDK-val
- Az Azure Machine Tanulás parancssori felületének bővítményéből
A virtuális gép családkvóta szerinti régiónkénti dedikált magok és a számítási példányok létrehozására vonatkozó teljes regionális kvóta egységesítve van, és meg van osztva az Azure Machine Tanulás betanítási számítási fürtkvótával. A számítási példány leállítása nem ad ki kvótát, hogy biztosan újraindíthassa a számítási példányt. Ne állítsa le a számítási példányt az operációsrendszer-terminálon sudo leállítással.
Compute instance comes with P10 OS disk. Temp disk type depends on the VM size chosen. Currently, it isn't possible to change the OS disk type.
Számítási cél
A számítási példányok az Azure Machine Tanulás számítási betanítási fürtjeihez hasonló betanítási számítási célként használhatók. A számítási példányok azonban csak egyetlen csomópontot tartalmazhatnak, míg a számítási fürtök több csomópontot is tartalmazhatnak.
Számítási példány:
- Van egy feladatsor.
- Virtuális hálózati környezetben biztonságosan futtatja a feladatokat anélkül, hogy a vállalatoknak SSH-portot kellene megnyitniuk. A feladat tárolóalapú környezetben fut, és a modell függőségeit egy Docker-tárolóba csomagolja.
- Több kis feladatot is futtathat párhuzamosan. A vCPU-nként egy feladat párhuzamosan futtatható, miközben a többi feladat várólistára kerül.
- Támogatja az egycsomópontos több GPU-s elosztott betanítási feladatokat
A számítási példányt helyi következtetéses üzembehelyezési célként használhatja tesztelési/hibakeresési forgatókönyvekhez.
Tipp.
The compute instance has 120GB OS disk. Ha elfogy a lemezterület, és használhatatlan állapotba kerül, törölje legalább 5 GB lemezterületét az operációsrendszer-lemezen (/ra csatlakoztatva) a számítási példány terminálján a fájlok/mappák eltávolításával, majd tegye sudo reboot
. Az ideiglenes lemezt az újraindítás után szabadítjuk fel; nem kell manuálisan törölnie a lemezterületet. A terminál eléréséhez nyissa meg a számítási lista vagy a számítási példány részleteit tartalmazó lapot, és kattintson a Terminál hivatkozásra. A rendelkezésre álló lemezterületet a terminálon futtatva df -h
ellenőrizheti. Clear at least 5 GB space before doing sudo reboot
. Ne állítsa le vagy indítsa újra a számítási példányt a Studióban, amíg el nem törli az 5 GB lemezterületet. Az automatikus leállítások, beleértve az ütemezett indítást vagy leállítást, valamint az inaktív leállításokat, nem fognak működni, ha a CI-lemez megtelt.
További lépések
- Az első lépésekhez szükséges erőforrások létrehozása.
- Oktatóanyag: Az első gépi tanulási modell betanítása bemutatja, hogyan használható számítási példány egy integrált jegyzetfüzettel.