Nastavení vývojového prostředí v Pythonu pro Azure Machine Learning

Naučte se konfigurovat vývojové prostředí Python pro Azure Machine Learning.

Následující tabulka uvádí každé vývojové prostředí popsané v tomto článku spolu s odborníky a nevýhody.

Prostředí Výhody Nevýhody
Místní prostředí Úplná kontrola nad vývojovým prostředím a závislostmi. Spusťte s libovolným nástrojem sestavení, prostředím nebo IDE dle vašeho výběru. Začne trvat déle. Musí být nainstalované potřebné balíčky sady SDK a prostředí, pokud ho ještě nemáte, musí být nainstalované i v případě, že ho ještě nemáte.
Data Science Virtual Machine (DSVM) Podobně jako u cloudové výpočetní instance (Python a SDK jsou předem nainstalované), ale mají předem nainstalované i další oblíbené datové vědy a nástroje pro strojové učení. Snadné škálování a kombinování s dalšími vlastními nástroji a pracovními postupy. V porovnání s cloudovou výpočetní instancí je pomalejší prostředí Začínáme.
Výpočetní instance Azure Machine Learningu Nejjednodušší způsob, jak začít. Celá sada SDK je už ve vašem VIRTUÁLNÍm počítači pracovního prostoru nainstalovaná a kurzy poznámkových bloků jsou předem naklonované a připravené ke spuštění. Nedostatečná kontrola nad vývojovým prostředím a závislostmi. Dodatečné náklady vzniklé pro virtuální počítač Linux (virtuální počítač se dá zastavit, pokud se nepoužívá), aby se předešlo poplatkům. Podívejte se na Podrobnosti o cenách.
Azure Databricks Ideální pro spouštění vysoce škálovatelných pracovních postupů strojového učení na škálovatelné Apache Spark platformě. Přílišné dovednosti pro experimentální strojové učení nebo menší experimenty a pracovní postupy. Další náklady na Azure Databricks. Podrobnosti o cenách najdete na stránce.

Tento článek obsahuje také další tipy k použití pro následující nástroje:

  • Poznámkové bloky Jupyter: Pokud už používáte poznámkové bloky Jupyter, sada SDK obsahuje několik dalších, které byste měli nainstalovat.

  • Visual Studio Code: Pokud používáte Visual Studio Code, rozšíření Azure Machine Learning zahrnuje rozsáhlou jazykovou podporu Pro Python a také funkce, které práci s Azure Machine Learning mnohem pohodlnější a produktivnější.

Požadavky

Jenom místní počítač a počítač DSVM: Vytvoření konfiguračního souboru pracovního prostoru

Konfigurační soubor pracovního prostoru je soubor JSON, který sadě SDK říká, jak komunikovat s pracovním Azure Machine Learning pracovním prostorem. Soubor má název config.jsna a má následující formát:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Tento soubor JSON musí být v adresářové struktuře, která obsahuje vaše skripty Pythonu nebo poznámkové bloky Jupyter. Může být ve stejném adresáři, v podadresáři s názvem .azureml nebo v nadřazeném adresáři.

Chcete-li použít tento soubor z kódu, použijte Workspace.from_config metodu . Tento kód načte informace ze souboru a připojí se k vašemu pracovnímu prostoru.

Vytvořte konfigurační soubor pracovního prostoru pomocí jedné z následujících metod:

  • portál Azure

    Stáhněte si soubor: V Azure Portalv části Přehled vašeho pracovního prostoru config.jsstáhnout soubor ke stažení.

    portál Azure

  • Azure Machine Learning Python SDK

    Vytvořte skript pro připojení k pracovnímu prostoru Azure Machine Learning a pomocí metody vygenerujte soubor a uložte ho jako write_config .azureml/config.jsna . Nezapomeňte nahradit subscription_id , resource_group a workspace_name vlastními.

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

Místní počítač nebo prostředí vzdáleného virtuálního počítače

Prostředí můžete nastavit v místním počítači nebo vzdáleném virtuálním počítači, jako je například Azure Machine Learning výpočetní instance nebo Data Science VM.

Konfigurace místního vývojového prostředí nebo vzdáleného virtuálního počítače:

  1. Vytvořte virtuální prostředí Python (virtualenv, conda).

    Poznámka

    I když to není nutné, doporučujeme pro správu virtuálních prostředí Pythonu a instalaci balíčků používat Anaconda nebo Miniconda .

    Důležité

    Pokud pracujete v systému Linux nebo macOS a používáte jiné prostředí než bash (například ZSH), může dojít k chybám při spuštění některých příkazů. Pokud chcete tento problém obejít, pomocí bash příkazu spusťte nové prostředí bash a spusťte příkazy tam.

  2. Aktivujte nově vytvořené virtuální prostředí Python.

  3. Nainstalujte sadu Azure Machine Learning Python SDK.

  4. Pokud chcete nakonfigurovat místní prostředí tak, aby používalo pracovní prostor Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující.

Teď, když máte nastavené místní prostředí, jste připraveni začít pracovat s Azure Machine Learning. Začínáme najdete v příručce Začínáme v Azure Machine Learning Pythonu .

Jupyter poznámkové bloky

Pokud používáte místní Jupyter Notebook Server, doporučujeme pro své virtuální prostředí Pythonu vytvořit jádro IPython. To pomáhá zajistit očekávané chování při importu jádra a balíčku.

  1. Povolit jádra IPython konkrétního prostředí

    conda install notebook ipykernel
    
  2. Vytvořte jádro pro virtuální prostředí Pythonu. Ujistěte se, že jste nahradili <myenv> názvem vašeho virtuálního prostředí Python.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Spustit Jupyter Notebook Server

Pokud chcete začít pracovat s poznámkovým blokem Azure Machine Learning a Jupyter, podívejte se do úložiště poznámkových bloků Azure Machine Learning .

Poznámka

Komunitní úložiště příkladů najdete na adrese https://github.com/Azure/azureml-examples .

Visual Studio Code

Použití Visual Studio Code pro vývoj:

  1. Nainstalujte Visual Studio Code.
  2. Nainstalujte Azure Machine Learning Visual Studio Code (Preview).

Jakmile máte nainstalované Visual Studio Code, použijte ho k:

Výpočetní instance Azure Machine Learningu

Výpočetní Azure Machine Learning je zabezpečená cloudová pracovní stanice Azure, která datovým vědcům poskytuje server Jupyter Notebook, JupyterLab a plně spravované prostředí strojového učení.

Pro výpočetní instanci není nic k instalaci ani konfiguraci.

V pracovním prostoru si ho můžete Azure Machine Learning kdykoli. Zadejte jenom název a zadejte typ virtuálního počítače Azure. Vyzkoušejte si to teď v tomto kurzu: Nastavení prostředí a pracovního prostoru.

Další informace o výpočetních instancích, včetně postupu instalace balíčků, najdete v tématu Vytvoření a správa Azure Machine Learning výpočetní instance.

Tip

Pokud chcete zabránit poplatkům za nepoužívanou výpočetní instanci, zastavte výpočetní instanci.

Kromě serveru Jupyter Notebook a JupyterLabu můžete používat výpočetní instance v integrované funkci poznámkového bloku uvnitř studio Azure Machine Learning.

Můžete také použít rozšíření Azure Machine Learning Visual Studio Code pro připojení ke vzdálené výpočetní instanci pomocí VS Code.

Virtuální počítač pro datové vědy

Tato Data Science VM přizpůsobená image virtuálního počítače, kterou můžete použít jako vývojové prostředí. Je určená pro práci v oblasti datových věd, která obsahuje předkonfigurované nástroje a software, jako jsou:

  • Balíčky jako TensorFlow, PyTorch, Scikit-učení, XGBoost a sada SDK pro Azure Machine Learning
  • Oblíbené nástroje pro datové vědy, jako je Spark Standalone a procházení
  • Nástroje Azure, jako jsou Azure CLI, AzCopy a Průzkumník služby Storage
  • Integrovaná vývojová prostředí (IDEs), například Visual Studio Code a PyCharm
  • Server Jupyter Notebook

Komplexnější seznam nástrojů najdete v příručce k nástrojům pro data Science VM.

Důležité

Pokud plánujete použít Data Science VM jako výpočetní cíl pro úlohy školení nebo Inferencing, podporuje se jenom Ubuntu.

Použití Data Science VM jako vývojového prostředí:

  1. Vytvořte Data Science VM pomocí jedné z následujících metod:

    • K vytvoření Ubuntu nebo Windows DSVM použijte Azure Portal.

    • Vytvořte data Science VM pomocí šablon ARM.

    • Použití Azure CLI

      Pokud chcete vytvořit Data Science VM Ubuntu, použijte následující příkaz:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Chcete-li vytvořit Windows DSVM, použijte následující příkaz:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Aktivujte prostředí conda obsahující sadu SDK Azure Machine Learning.

    • Pro Ubuntu Data Science VM:

      conda activate py36
      
    • Pro Windows Data Science VM:

      conda activate AzureML
      
  3. Chcete-li nakonfigurovat Data Science VM k používání pracovního prostoru Azure Machine Learning, vytvořte konfigurační soubor pracovního prostoru nebo použijte existující.

Podobně jako u místních prostředí můžete k interakci s Azure Machine Learning používat Visual Studio Code a rozšíření Azure Machine Learning Visual Studio Code .

Další informace najdete v tématu Virtual Machines pro datové vědy.

Další kroky