Mi az az Azure Machine Learning számítási példány?

Az Azure Machine Tanulás számítási példány egy felügyelt felhőalapú munkaállomás adatelemzők számára. Minden számítási példánynak csak egy tulajdonosa van, bár több számítási példány között is megoszthat fájlokat.

A számítási példányok megkönnyítik az Azure Machine Tanulás fejlesztésének megkezdését, valamint felügyeleti és vállalati felkészültségi képességeket biztosítanak az informatikai rendszergazdák számára.

Használjon számítási példányt teljes mértékben konfigurált és felügyelt fejlesztési környezetként a felhőben gépi tanuláshoz. Számítási célként is használhatók fejlesztési és tesztelési célokra való betanításhoz és következtetéshez.

A számítási példány Jupyter-funkcióinak működéséhez győződjön meg arról, hogy a webes szoftvercsatornák közötti kommunikáció nincs letiltva. Győződjön meg róla, hogy a hálózat engedélyezi a websocket-kapcsolatokat a *.instances.azureml.net és *.instances.azureml.ms címekre.

Fontos

A cikkben megjelölt (előzetes verziójú) elemek jelenleg nyilvános előzetes verzióban érhetők el. Az előzetes verzió szolgáltatásszint-szerződés nélkül érhető el, és éles számítási feladatokhoz nem ajánlott. Előfordulhat, hogy néhány funkció nem támogatott, vagy korlátozott képességekkel rendelkezik. For more information, see Supplemental Terms of Use for Microsoft Azure Previews.

Miért érdemes számítási példányt használni?

A számítási példány egy teljes mértékben felügyelt felhőalapú munkaállomás, amely a gépi tanulási fejlesztési környezethez van optimalizálva. A következő előnyöket nyújtja:

Fő előnyök Leírás
Termelékenység Az Azure Machine Tanulás Studióban integrált jegyzetfüzetek és a következő eszközök használatával hozhat létre és helyezhet üzembe modelleket:
- Jupyter
- JupyterLab
- VS Code (előzetes verzió)
A számítási példány teljes mértékben integrálva van az Azure Machine Tanulás munkaterülettel és stúdióval. Jegyzetfüzeteket és adatokat oszthat meg a munkaterület más adatelemzőivel.
Felügyelt > biztonságos Csökkentse a biztonsági lábnyomot, és adja hozzá a vállalati biztonsági követelményeknek való megfelelést. A számítási példányok robusztus felügyeleti szabályzatokat és biztonságos hálózati konfigurációkat biztosítanak, például:

– Automatikus leépítés Resource Manager-sablonokból vagy Azure Machine Tanulás SDK-ból
- Azure szerepköralapú hozzáférés-vezérlés (Azure RBAC)
- Virtual network support
– Azure-szabályzat az SSH-hozzáférés letiltásához
– Azure-szabályzat a virtuális hálózaton való létrehozás kikényszerítéséhez
- Automatikus leállítás/automatikus indítás ütemezés szerint
- TLS 1.2 engedélyezve
Gépi tanuláshoz előre konfigurálva Időt takaríthat meg a feladatok beállításához előre konfigurált és naprakész ML-csomagokkal, mélytanulási keretrendszerekkel és GPU-illesztőprogramokkal.
Teljesen testre szabható Az Azure-beli virtuálisgép-típusok, köztük a GPU-k széles körű támogatása és a tartósan alacsony szintű testreszabás, például a csomagok és illesztőprogramok telepítése megkönnyíti a speciális forgatókönyveket. A testreszabás automatizálásához beállítási szkripteket is használhat

Eszközök és környezetek

Az Azure Machine Tanulás számítási példány lehetővé teszi modellek készítését, betanítása és üzembe helyezését egy teljesen integrált jegyzetfüzetben a munkaterületen.

Az Azure Machine Tanulás-munkaterületről, a Jupyterből, a JupyterLabből vagy a Visual Studio Code-ból is futtathat jegyzetfüzeteket. A VS Code Desktop konfigurálható a számítási példány eléréséhez. Vagy használja a VS Code-ot a weben, közvetlenül a böngészőből, a szükséges telepítések és függőségek nélkül.

Javasoljuk, hogy próbálja ki a WEBES VS Code-ot, hogy kihasználhassa az általa biztosított egyszerű integrációs és gazdag fejlesztési környezetet. A VS Code for the Web számos olyan funkciót kínál a VS Code Desktopban, amelyet szeret, beleértve a keresés és a szintaxis kiemelését a böngészés és a szerkesztés során. A VS Code Desktop és a VS Code webes használatáról további információt az Azure Machine Tanulás (előzetes verzió) integrált Visual Studio Code indítása és a számítási példányhoz távolról csatlakoztatott VS Code-ban (előzetes verzió) című témakörben talál.

Csomagokat telepíthet, és kerneleket adhat hozzá a számítási példányhoz.

A következő eszközök és környezetek már telepítve vannak a számítási példányon:

Általános eszközök és környezetek Részletek
Illesztőprogramok CUDA
cuDNN
NVIDIA
Blob FUSE
Intel MPI-kódtár
Azure CLI
Azure Machine-Tanulás-minták
Docker
Nginx
NCCL 2.0
Protobuf
R-eszközök és környezetek Részletek
R kernel

A példány létrehozásakor hozzáadhatja az RStudio vagy a Posit Workbench (korábbi nevén RStudio Workbench) elemet.

PYTHON-eszközök > környezetek Részletek
Anaconda Python
Jupyter és bővítmények
Jupyterlab és bővítmények
Azure Machine Tanulás SDK
Pythonhoz
a PyPI-ból
Tartalmazza az azure-ai-ml-t és számos gyakori azure extra csomagot. A teljes lista megtekintéséhez
nyisson meg egy terminálablakot a számítási példányon , és futtassa
conda list -n azureml_py310_sdkv2 ^azure
Egyéb PyPI-csomagok jupytext
tensorboard
nbconvert
notebook
Pillow
Conda-csomagok cython
numpy
ipykernel
scikit-learn
matplotlib
tqdm
joblib
nodejs
Mélytanulási csomagok PyTorch
TensorFlow
Keras
Horovod
MLFlow
pandas-ml
scrapbook
ONNX-csomagok keras2onnx
onnx
onnxconverter-common
skl2onnx
onnxmltools
Azure Machine-Tanulás Python-minták

A számítási példány alap operációs rendszere az Ubuntu.

Fájlok elérése

A jegyzetfüzeteket és a Python-szkripteket a rendszer a munkaterület alapértelmezett tárfiókjában tárolja az Azure-fájlmegosztásban. Ezek a fájlok a "Felhasználói fájlok" könyvtár alatt találhatók. Ez a tárterület megkönnyíti a jegyzetfüzetek számítási példányok közötti megosztását. A tárfiók emellett biztonságosan megőrzi a jegyzetfüzeteket, amikor leállítja vagy törli a számítási példányokat.

A munkaterület Azure-fájlmegosztási fiókja meghajtóként van csatlakoztatva a számítási példányhoz. Ez a meghajtó a Jupyter, a Jupyter Labs, az RStudio és a Posit Workbench alapértelmezett munkakönyvtára. Ez azt jelenti, hogy a Jupyter, a JupyterLab, a VS Code for Web, az RStudio vagy a Posit alkalmazásban létrehozott jegyzetfüzetek és egyéb fájlok automatikusan a fájlmegosztáson vannak tárolva, és más számítási példányokban is használhatók.

A fájlmegosztás fájljai az ugyanazon a munkaterületen található összes számítási példányból elérhetők. A számítási példányon található fájlok módosításai megbízhatóan megmaradnak a fájlmegosztásban.

A legújabb Azure Machine-Tanulás-mintákat a munkaterület fájlmegosztás felhasználói fájlkönyvtárában lévő mappába is klónozhatja.

A kis fájlok írása a hálózati meghajtókon lassabb lehet, mint a számítási példány helyi lemezére való írás. Ha sok kis fájlt ír, próbáljon meg közvetlenül a számítási példányon könyvtárat használni, például egy könyvtárat /tmp . Vegye figyelembe, hogy ezek a fájlok nem lesznek elérhetők más számítási példányokból.

Ne tárolja a betanítási adatokat a jegyzetfüzetek fájlmegosztásán. Az adatok tárolásának különböző lehetőségeiről további információt az Access-adatok egy feladatban című témakörben talál.

Az ideiglenes adatok tárolásához használhatja a számítási példány /tmp könyvtárát. Ne írjon azonban nagy adatfájlokat a számítási példány operációsrendszer-lemezére. A számítási példány operációsrendszer-lemeze 128 GB kapacitással rendelkezik. Az ideiglenes betanítási adatokat az /mnt-en csatlakoztatott ideiglenes lemezen is tárolhatja. Az ideiglenes lemez mérete a kiválasztott virtuálisgép-méreten alapul, és nagyobb mennyiségű adatot tud tárolni, ha nagyobb méretű virtuális gépet választ. Any software packages you install are saved on the OS disk of compute instance. Vegye figyelembe, hogy az ügyfél által felügyelt kulcstitkosítás jelenleg nem támogatott az operációsrendszer-lemezen. The OS disk for compute instance is encrypted with Microsoft-managed keys.

You can also mount datastores and datasets.

Létrehozás

Az alapszintű számítási példány létrehozásához kövesse az Erőforrások létrehozása című témakörben leírt lépéseket.

További lehetőségekért lásd egy új számítási példány létrehozását.

Rendszergazdaként létrehozhat egy számítási példányt a munkaterület többi tagja számára.

A számítási példány testreszabásához és konfigurálásához egy beállítási szkriptet is használhat.

Számítási példányok létrehozásának egyéb módjai:

A virtuális gép családkvóta szerinti régiónkénti dedikált magok és a számítási példányok létrehozására vonatkozó teljes regionális kvóta egységesítve van, és meg van osztva az Azure Machine Tanulás betanítási számítási fürtkvótával. A számítási példány leállítása nem ad ki kvótát, hogy biztosan újraindíthassa a számítási példányt. Ne állítsa le a számítási példányt az operációsrendszer-terminálon sudo leállítással.

Compute instance comes with P10 OS disk. Temp disk type depends on the VM size chosen. Currently, it isn't possible to change the OS disk type.

Számítási cél

A számítási példányok az Azure Machine Tanulás számítási betanítási fürtjeihez hasonló betanítási számítási célként használhatók. A számítási példányok azonban csak egyetlen csomópontot tartalmazhatnak, míg a számítási fürtök több csomópontot is tartalmazhatnak.

Számítási példány:

  • Van egy feladatsor.
  • Virtuális hálózati környezetben biztonságosan futtatja a feladatokat anélkül, hogy a vállalatoknak SSH-portot kellene megnyitniuk. A feladat tárolóalapú környezetben fut, és a modell függőségeit egy Docker-tárolóba csomagolja.
  • Több kis feladatot is futtathat párhuzamosan. A vCPU-nként egy feladat párhuzamosan futtatható, miközben a többi feladat várólistára kerül.
  • Támogatja az egycsomópontos több GPU-s elosztott betanítási feladatokat

A számítási példányt helyi következtetéses üzembehelyezési célként használhatja tesztelési/hibakeresési forgatókönyvekhez.

Tipp.

The compute instance has 120GB OS disk. Ha elfogy a lemezterület, és használhatatlan állapotba kerül, törölje legalább 5 GB lemezterületét az operációsrendszer-lemezen (/ra csatlakoztatva) a számítási példány terminálján a fájlok/mappák eltávolításával, majd tegye sudo reboot. Az ideiglenes lemezt az újraindítás után szabadítjuk fel; nem kell manuálisan törölnie a lemezterületet. A terminál eléréséhez nyissa meg a számítási lista vagy a számítási példány részleteit tartalmazó lapot, és kattintson a Terminál hivatkozásra. A rendelkezésre álló lemezterületet a terminálon futtatva df -h ellenőrizheti. Clear at least 5 GB space before doing sudo reboot. Ne állítsa le vagy indítsa újra a számítási példányt a Studióban, amíg el nem törli az 5 GB lemezterületet. Az automatikus leállítások, beleértve az ütemezett indítást vagy leállítást, valamint az inaktív leállításokat, nem fognak működni, ha a CI-lemez megtelt.

További lépések