Een Python-ontwikkelomgeving instellen voor Azure Machine Learning

Meer informatie over het configureren van een Python-ontwikkelomgeving voor Azure Machine Learning.

In de volgende tabel ziet u elke ontwikkelomgeving die in dit artikel wordt behandeld, samen met voor- en nadelen.

Omgeving Voordelen Nadelen
Lokale omgeving Volledige controle over uw ontwikkelomgeving en afhankelijkheden. Voer uit met elk build-hulpprogramma, elke omgeving of IDE van uw keuze. Het duurt langer om aan de slag te gaan. De benodigde SDK-pakketten moeten worden geïnstalleerd en er moet ook een omgeving worden geïnstalleerd als u er nog geen hebt.
De Data Science Virtual Machine (DSVM) Vergelijkbaar met de cloudgebaseerde reken-instantie (Python en de SDK zijn vooraf geïnstalleerd), maar met extra populaire hulpprogramma's voor data science en machine learning vooraf geïnstalleerd. Eenvoudig te schalen en te combineren met andere aangepaste hulpprogramma's en werkstromen. Een langzamere aan de slag-ervaring vergeleken met de cloudgebaseerde reken-instantie.
Azure Machine Learning-rekeninstantie De eenvoudigste manier om aan de slag te gaan. De volledige SDK is al geïnstalleerd in uw werkruimte-VM en notebook-zelfstudies zijn vooraf gekloond en klaar om te worden uitgevoerd. Geen controle over uw ontwikkelomgeving en afhankelijkheden. Extra kosten voor Linux-VM (VM kan worden gestopt wanneer deze niet wordt gebruikt om kosten te voorkomen). Zie prijsinformatie.
Azure Databricks Ideaal voor het uitvoeren van grootschalige intensieve machine learning op het schaalbare Apache Spark platform. Overkill voor experimentele machine learning of experimenten en werkstromen op kleinere schaal. Extra kosten voor Azure Databricks. Zie prijsinformatie.

Dit artikel bevat ook aanvullende gebruikstips voor de volgende hulpprogramma's:

  • Jupyter Notebooks: als u Jupyter Notebooks al gebruikt, heeft de SDK enkele extra's die u moet installeren.

  • Visual Studio Code: Als u Visual Studio Code gebruikt, bevat de Azure Machine Learning-extensie uitgebreide taalondersteuning voor Python en functies om het werken met de Azure Machine Learning veel handiger en productiever te maken.

Vereisten

  • Azure Machine Learning werkruimte. Als u nog geen werkruimte hebt, kunt u een Azure Machine Learning maken via de Azure Portal, Azure CLIen Azure Resource Manager maken.

Alleen lokale en DSVM: een configuratiebestand voor de werkruimte maken

Het configuratiebestand van de werkruimte is een JSON-bestand dat de SDK vertelt hoe deze moet communiceren met Azure Machine Learning werkruimte. Het bestand heeft de config.jsop en heeft de volgende indeling:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Dit JSON-bestand moet zich in de mapstructuur met uw Python-scripts of Jupyter Notebooks. Deze kan zich in dezelfde map, een submap met de naam .azureml of in een bovenliggende map.

Als u dit bestand uit uw code wilt gebruiken, gebruikt u de Workspace.from_config methode . Met deze code wordt de informatie uit het bestand geladen en wordt verbinding met uw werkruimte.

Maak een configuratiebestand voor de werkruimte op een van de volgende manieren:

  • Azure Portal

    Download het bestand: selecteer in Azure Portalde optie config.js downloaden in de sectie Overzicht van uw werkruimte.

    Azure Portal

  • Azure Machine Learning Python SDK

    Maak een script om verbinding te maken met uw Azure Machine Learning werkruimte en gebruik de methode om uw bestand te genereren en op te slaan als write_config .azureml/config.jsop. Zorg ervoor dat u subscription_id , en vervangt door uw resource_group workspace_name eigen.

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

Lokale computer of externe VM-omgeving

U kunt een omgeving instellen op een lokale computer of externe virtuele machine, zoals een Azure Machine Learning compute-exemplaar of Data Science VM.

Een lokale ontwikkelomgeving of externe VM configureren:

  1. Maak een virtuele Python-omgeving (virtualenv, conda).

    Notitie

    Hoewel dit niet vereist is, is het raadzaam anaconda of Miniconda te gebruiken om virtuele Python-omgevingen te beheren en pakketten te installeren.

    Belangrijk

    Als u linux of macOS gebruikt en een andere shell gebruikt dan bash (bijvoorbeeld zsh), kunnen er fouten optreden wanneer u een aantal opdrachten uit te voeren. U kunt dit probleem oplossen door de opdracht te bash gebruiken om een nieuwe bash-shell te starten en daar de opdrachten uit te voeren.

  2. Activeer de zojuist gemaakte virtuele Python-omgeving.

  3. Installeer de Azure Machine Learning Python SDK.

  4. Als u uw lokale omgeving wilt configureren voor het gebruik van Azure Machine Learning werkruimte, maakt u een configuratiebestand voor de werkruimte of gebruikt u een bestaand configuratiebestand.

Nu u uw lokale omgeving hebt ingesteld, kunt u aan de slag met Azure Machine Learning. Zie de Azure Machine Learning aan de slag met Python om aan de slag te gaan.

Jupyter Notebooks

Wanneer u een lokale Jupyter Notebook server, is het raadzaam om een IPython-kernel te maken voor uw virtuele Python-omgeving. Dit zorgt ervoor dat het verwachte gedrag voor het importeren van kernels en pakketten wordt gegarandeerd.

  1. Omgevingsspecifieke IPython-kernels inschakelen

    conda install notebook ipykernel
    
  2. Maak een kernel voor uw virtuele Python-omgeving. Zorg ervoor dat u vervangt <myenv> door de naam van uw virtuele Python-omgeving.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Start de Jupyter Notebook server

Zie de Azure Machine Learning notebooks om aan de slag te gaan met Azure Machine Learning en Jupyter Notebooks.

Notitie

Een door de community gestuurde opslagplaats met voorbeelden vindt u op https://github.com/Azure/azureml-examples.

Visual Studio Code

Als u Visual Studio Code wilt gebruiken voor ontwikkeling:

  1. Installeer Visual Studio Code.
  2. Installeer de Azure Machine Learning Visual Studio Code-extensie (preview).

Nadat u de Visual Studio Code-extensie hebt geïnstalleerd, gebruikt u deze voor het volgende:

Azure Machine Learning compute-exemplaar

De Azure Machine Learning compute-instantie is een beveiligd, cloudgebaseerd Azure-werkstation dat gegevenswetenschappers een Jupyter Notebook-server, JupyterLab en een volledig beheerde machine learning biedt.

Er is niets om te installeren of configureren voor een reken-exemplaar.

Maak er altijd een vanuit uw Azure Machine Learning werkruimte. Geef alleen een naam op en geef een azure-VM-type op. Probeer het nu met deze zelfstudie: Omgeving en werkruimte instellen.

Zie Create and manage an Azure Machine Learning compute instance (Een reken-exemplaar maken Azure Machine Learning beheren) voor meer informatie over reken-exemplaren, waaronder het installeren van pakketten.

Tip

Als u wilt voorkomen dat er kosten in rekening worden gebracht voor een ongebruikt rekenin exemplaar, stopt u het rekenin exemplaar.

Naast een Jupyter Notebook-server en JupyterLab kunt u reken-exemplaren gebruiken in de geïntegreerde notebookfunctie in Azure Machine Learning-studio.

U kunt ook de code-extensie Azure Machine Learning Visual Studio gebruiken om verbinding te maken met een extern rekenexe exemplaar met behulp van VS Code.

Data Science Virtual Machine

De Data Science VM is een aangepaste VM-afbeelding (virtuele machine) die u als ontwikkelomgeving kunt gebruiken. Het is ontworpen voor data science-werk met vooraf geconfigureerde hulpprogramma's en software, zoals:

  • Pakketten zoals TensorFlow, PyTorch, Scikit-learn, XGBoost en de Azure Machine Learning SDK
  • Populaire data science-hulpprogramma's, zoals spark standalone en drill
  • Azure-hulpprogramma's zoals de Azure CLI, AzCopy en Storage Explorer
  • Geïntegreerde ontwikkelomgevingen (IDE's) zoals Visual Studio Code en PyCharm
  • Jupyter Notebook Server

Zie de handleiding Data Science VM hulpprogramma's voor een uitgebreidere lijst met hulpprogramma's.

Belangrijk

Als u van plan bent om de Data Science VM als rekendoel te gebruiken voor uw trainings- of deferencingtaken, wordt alleen Ubuntu ondersteund.

De Data Science VM als een ontwikkelomgeving gebruiken:

  1. Maak een Data Science VM een van de volgende methoden:

    • Gebruik de Azure Portal om een Ubuntu- of Windows-DSVM te maken.

    • Maak een Data Science VM met arm-sjablonen.

    • Azure CLI gebruiken

      Als u een Ubuntu-Data Science VM, gebruikt u de volgende opdracht:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Gebruik de volgende opdracht om een Windows-DSVM te maken:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Activeer de Conda-omgeving met de Azure Machine Learning SDK.

    • Voor Ubuntu Data Science VM:

      conda activate py36
      
    • Voor Windows Data Science VM:

      conda activate AzureML
      
  3. Als u de Data Science VM wilt configureren voor het gebruik van Azure Machine Learning werkruimte, maakt u een configuratiebestand voor de werkruimte of gebruikt u een bestaand configuratiebestand.

Net als bij lokale omgevingen kunt u Visual Studio Code en de Azure Machine Learning Visual Studio Code-extensie gebruiken om te communiceren met Azure Machine Learning.

Zie Data Science Virtual Machines voor meer informatie.

Volgende stappen