Co je výpočetní instance služby Azure Machine Learning?

Výpočetní instance Azure Machine Učení je spravovaná cloudová pracovní stanice pro datové vědce. Každá výpočetní instance má pouze jednoho vlastníka, i když můžete sdílet soubory mezi několika výpočetními instancemi.

Výpočetní instance usnadňují začátky vývoje Učení azure machine a poskytují správcům IT možnosti správy a podnikové připravenosti.

Jako plně nakonfigurované a spravované vývojové prostředí v cloudu pro strojové učení použijte výpočetní instanci. Dají se také použít jako cílový výpočetní objekt pro trénování a odvozování pro účely vývoje a testování.

Aby funkce Jupyter výpočetní instance fungovala, ujistěte se, že komunikace s webovým soketem není zakázaná. Ujistěte se, že vaše síť umožňuje připojení přes protokol WebSocket k doménám *.instances.azureml.net a *.instances.azureml.ms.

Důležité

Položky označené (Preview) v tomto článku jsou aktuálně ve verzi Public Preview. Verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučuje se pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Proč používat výpočetní instanci?

Výpočetní instance je plně spravovaná cloudová pracovní stanice optimalizovaná pro vývojové prostředí strojového učení. Přináší to tyto výhody:

Klíčové výhody Popis
Produktivita Modely můžete vytvářet a nasazovat pomocí integrovaných poznámkových bloků a následujících nástrojů v studio Azure Machine Learning:
- Jupyter
- JupyterLab
– VS Code (Preview)
Výpočetní instance je plně integrovaná s pracovním prostorem a studio azure Machine Učení. Poznámkové bloky a data můžete sdílet s dalšími datovými vědci v pracovním prostoru.
Spravované a zabezpečené Snižte nároky na zabezpečení a přidejte dodržování předpisů s podnikovými požadavky na zabezpečení. Výpočetní instance poskytují robustní zásady správy a zabezpečené síťové konfigurace, jako jsou:

– Automatické zřizování ze šablon Resource Manageru nebo sady Azure Machine Učení SDK
- Řízení přístupu na základě role v Azure (Azure RBAC)
- Podpora virtuální sítě
– Zásady Azure pro zakázání přístupu SSH
– Zásady Azure pro vynucení vytváření ve virtuální síti
- Automatické vypnutí/automatické spuštění na základě plánu
– Povolený protokol TLS 1.2
Předkonfigurováno pro ML Ušetřete čas na úlohách nastavení pomocí předem nakonfigurovaných a aktuálních balíčků ML, architektur hlubokého učení, ovladačů GPU.
Plně přizpůsobitelné Široká podpora typů virtuálních počítačů Azure, včetně GRAFICKÝch procesorů a trvalých přizpůsobení nízké úrovně, jako je instalace balíčků a ovladačů, usnadňuje pokročilé scénáře. K automatizaci přizpůsobení můžete použít také instalační skripty.

Nástroje a prostředí

Výpočetní instance Azure Machine Učení umožňuje vytvářet, trénovat a nasazovat modely v plně integrovaném prostředí poznámkového bloku ve vašem pracovním prostoru.

Poznámkové bloky můžete spouštět z pracovního prostoru Azure Machine Učení, Jupyteru, JupyterLabu nebo editoru Visual Studio Code. VS Code Desktop je možné nakonfigurovat pro přístup k výpočetní instanci. Nebo použijte VS Code pro web přímo z prohlížeče a bez požadovaných instalací nebo závislostí.

Doporučujeme vyzkoušet VS Code pro web, abyste mohli využít výhod snadné integrace a bohatého vývojového prostředí, které poskytuje. VS Code pro web nabízí řadu funkcí VS Code Desktopu, které máte rádi, včetně vyhledávání a zvýrazňování syntaxe při procházení a úpravách. Další informace o používání služby VS Code Desktop a VS Code pro web najdete v tématu Spuštění editoru Visual Studio Code integrovaného se službou Azure Machine Učení (Preview) a práce ve VS Code vzdáleně připojené k výpočetní instanci (Preview).

Do výpočetní instance můžete nainstalovat balíčky a přidat jádra.

V výpočetní instanci jsou už nainstalované následující nástroje a prostředí:

Obecné nástroje a prostředí Detaily
Ovladače CUDA
cuDNN
NVIDIA
Blob FUSE
Knihovna Intel MPI
Azure CLI
Ukázky služby Azure Machine Učení
Docker
Nginx
NCCL 2.0
Protobuf
Nástroje R a prostředí Detaily
Jádro R

Při vytváření instance můžete přidat RStudio nebo Posit Workbench (dříve RStudio Workbench ).

Nástroje a prostředí PYTHONu Detaily
Anaconda Python
Jupyter a rozšíření
Jupyterlab a rozšíření
Azure Machine Učení SDK
pro Python
z PyPI
Zahrnuje azure-ai-ml a řadu běžných balíčků azure navíc. Úplný seznam zobrazíte tak, že
Otevření okna terminálu ve výpočetní instanci a spuštění
conda list -n azureml_py310_sdkv2 ^azure
Další balíčky PyPI jupytext
tensorboard
nbconvert
notebook
Pillow
Balíčky Conda cython
numpy
ipykernel
scikit-learn
matplotlib
tqdm
joblib
nodejs
Balíčky hlubokého učení PyTorch
TensorFlow
Keras
Horovod
MLFlow
pandas-ml
scrapbook
Balíčky ONNX keras2onnx
onnx
onnxconverter-common
skl2onnx
onnxmltools
Ukázky Azure Machine Učení Pythonu

Výpočetní instance má jako základní operační systém Ubuntu.

Přístup k souborům

Poznámkové bloky a skripty Pythonu se ukládají do výchozího účtu úložiště vašeho pracovního prostoru ve sdílené složce Azure. Tyto soubory se nacházejí v adresáři User Files (Uživatelské soubory). Toto úložiště usnadňuje sdílení poznámkových bloků mezi výpočetními instancemi. Účet úložiště také udržuje poznámkové bloky bezpečně zachované při zastavení nebo odstranění výpočetní instance.

Účet sdílené složky Azure vašeho pracovního prostoru se připojí jako jednotka ve výpočetní instanci. Tato jednotka je výchozím pracovním adresářem pro Jupyter, Jupyter Labs, RStudio a Posit Workbench. To znamená, že poznámkové bloky a další soubory, které vytvoříte v Jupyteru, JupyterLabu, VS Code pro web, RStudio nebo Posit, se automaticky ukládají do sdílené složky a jsou k dispozici i v jiných výpočetních instancích.

Soubory ve sdílené složce jsou přístupné ze všech výpočetních instancí ve stejném pracovním prostoru. Všechny změny těchto souborů ve výpočetní instanci budou spolehlivě zachovány zpět do sdílené složky.

Nejnovější ukázky služby Azure Machine Učení můžete také naklonovat do složky v adresáři uživatelských souborů ve sdílené složce pracovního prostoru.

Zápis malých souborů může být na síťových jednotkách pomalejší než zápis na samotný místní disk výpočetní instance. Pokud píšete mnoho malých souborů, zkuste použít adresář přímo na výpočetní instanci, například /tmp adresář. Mějte na paměti, že tyto soubory nebudou přístupné z jiných výpočetních instancí.

Neukládejte trénovací data ve sdílené složce poznámkových bloků. Informace o různých možnostech ukládání dat najdete v tématu Access data v úloze.

Pro dočasná data můžete použít adresář /tmp ve výpočetní instanci. Na disk operačního systému výpočetní instance ale nezapisujte velké soubory dat. Disk s operačním systémem na výpočetní instanci má kapacitu 128 GB. Dočasné trénovací data můžete uložit také na dočasném disku připojeném na /mnt. Velikost dočasného disku je závislá na zvolené velikosti virtuálního počítače a umožňuje ukládat větší množství dat, pokud je zvolena větší velikost virtuálního počítače. Všechny softwarové balíčky, které nainstalujete, se uloží na disk výpočetní instance s operačním systémem. Poznámka: Šifrování klíče spravovaného zákazníkem se v současné době nepodporuje pro disk s operačním systémem. Disk s operačním systémem pro výpočetní instanci je šifrovaný pomocí klíčů spravovaných Microsoftem.

Můžete také připojit úložiště dat a datové sady.

Vytvoření

Postupujte podle kroků v tématu Vytvoření prostředků, které potřebujete, abyste mohli začít vytvářet základní výpočetní instanci.

Další možnosti najdete v tématu Vytvoření nové výpočetní instance.

Jako správce můžete vytvořit výpočetní instanci pro ostatní uživatele v pracovním prostoru.

Můžete také použít instalační skript pro automatizovaný způsob přizpůsobení a konfigurace výpočetní instance.

Další způsoby vytvoření výpočetní instance:

Vyhrazená jádra pro každou oblast na řadu virtuálních počítačů a celková kvóta pro oblast, která se vztahuje na vytvoření výpočetní instance, je jednotná a sdílená se službou Azure Machine Učení trénovací kvótou výpočetního clusteru. Zastavení výpočetní instance nevyvolá kvótu, abyste měli jistotu, že výpočetní instanci budete moct restartovat. Nevystavujte výpočetní instanci prostřednictvím terminálu operačního systému vypnutím sudo.

Výpočetní instance se dodává s diskem s operačním systémem P10. Typ dočasného disku závisí na zvolené velikosti virtuálního počítače. V současné době není možné měnit typ disku s operačním systémem.

Cílový výpočetní objekt

Výpočetní instance se dají použít jako trénovací cílový výpočetní objekt podobný výpočetnímu clusteru Azure Učení výpočetních clusterů. Výpočetní instance má ale jenom jeden uzel, zatímco výpočetní cluster může mít více uzlů.

Výpočetní instance:

  • Má frontu úloh.
  • Spouští úlohy bezpečně v prostředí virtuální sítě, aniž by podniky musely otevírat port SSH. Úloha se spustí v kontejnerizovaném prostředí a zabalí závislosti modelu do kontejneru Dockeru.
  • Může paralelně spouštět několik malých úloh. Jedna úloha na vCPU se může spustit paralelně, zatímco ostatní úlohy se zařadí do fronty.
  • Podporuje distribuované trénovací úlohy s více uzly s více uzly

Výpočetní instanci můžete použít jako místní cíl odvozování nasazení pro scénáře testování/ladění.

Tip

Výpočetní instance má 120GB disk s operačním systémem. Pokud vám dojde místo na disku a dostanete se do nepoužitelného stavu, vymažte alespoň 5 GB místa na disku s operačním systémem (připojeném na /) prostřednictvím terminálu výpočetní instance odebráním souborů nebo složek a pak proveďte sudo reboot. Po restartování se uvolní dočasný disk; Nemusíte ručně vymazat místo na dočasném disku. Pokud chcete získat přístup k terminálu, přejděte na stránku se seznamem výpočetních prostředků nebo na stránku podrobností výpočetní instance a klikněte na odkaz Terminál . Spuštěním příkazu df -h v terminálu můžete zkontrolovat dostupné místo na disku. Před provedením sudo reboot vymažte alespoň 5 GB místa. Nezastavujte ani nerestartujte výpočetní instanci prostřednictvím studia, dokud se nevyčisí 5 GB místa na disku. Automatická vypnutí, včetně plánovaného spuštění nebo zastavení a vypnutí při nečinnosti nebudou fungovat, pokud je disk CI plný.

Další kroky