Konfigurera en Python-utvecklingsmiljö för Azure Machine Learning

Lär dig hur du konfigurerar en Python-utvecklingsmiljö för Azure Machine Learning.

I följande tabell visas varje utvecklingsmiljö som beskrivs i den här artikeln, tillsammans med för- och nackdelar.

Miljö Fördelar Nackdelar
Lokal miljö Fullständig kontroll över utvecklingsmiljön och beroenden. Kör med val annat byggverktyg, miljö eller IDE. Det tar längre tid att komma igång. Nödvändiga SDK-paket måste installeras och en miljö måste också installeras om du inte redan har en.
Den Data Science Virtual Machine (DSVM) Liknar den molnbaserade beräkningsinstansen (Python och SDK är förinstallerade), men med ytterligare populära verktyg för datavetenskap och maskininlärning förinstallerade. Enkelt att skala och kombinera med andra anpassade verktyg och arbetsflöden. En långsammare upplevelse jämfört med den molnbaserade beräkningsinstansen.
Azure Machine Learning-beräkningsinstans Det enklaste sättet att komma igång. Hela SDK:n har redan installerats på den virtuella arbetsytan och självstudierna för notebook-filer är för klonade och redo att köras. Brist på kontroll över din utvecklingsmiljö och dina beroenden. Ytterligare kostnader för virtuella Linux-datorer (vm kan stoppas när de inte används för att undvika kostnader). Se prisinformation.
Azure Databricks Perfekt för att köra storskaliga intensiva maskininlärningsarbetsflöden på den skalbara Apache Spark plattformen. Övernivå för experimentell maskininlärning eller experiment och arbetsflöden i mindre skala. Ytterligare kostnader för Azure Databricks. Se prisinformation.

Den här artikeln innehåller även ytterligare användningstips för följande verktyg:

  • Jupyter Notebooks: Om du redan använder Jupyter Notebooks har SDK:n vissa tillägg som du bör installera.

  • Visual Studio Code: Om du använder Visual Studio Code innehåller Azure Machine Learning-tillägget omfattande språkstöd för Python samt funktioner för att göra arbetet med Azure Machine Learning mycket mer praktiskt och produktivt.

Förutsättningar

Endast lokal och DSVM: Skapa en konfigurationsfil för arbetsytan

Konfigurationsfilen för arbetsytan är en JSON-fil som talar om för SDK hur den ska kommunicera Azure Machine Learning arbetsytan. Filen har namnet config.jspå och har följande format:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Den här JSON-filen måste finnas i katalogstrukturen som innehåller dina Python-skript eller Jupyter Notebooks. Den kan finnas i samma katalog, en underkatalog med namnet .azureml eller i en överordnad katalog.

Om du vill använda den här filen från koden använder du Workspace.from_config metoden . Den här koden läser in informationen från filen och ansluter till din arbetsyta.

Skapa en konfigurationsfil för arbetsytan på någon av följande metoder:

  • Azure Portal

    Ladda ned filen: I Azure Portalväljer du Hämta config.jspå i avsnittet Översikt på din arbetsyta.

    Azure Portal

  • Azure Machine Learning Python SDK

    Skapa ett skript för att ansluta till Azure Machine Learning-arbetsytan och använd metoden för att generera filen och spara den som write_config .azureml/config.jspå. Ersätt , subscription_id resource_group och med dina workspace_name egna.

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

Lokal dator eller fjärrmiljö för virtuell dator

Du kan konfigurera en miljö på en lokal dator eller en fjärransluten virtuell dator, till exempel en Azure Machine Learning beräkningsinstans eller Data Science VM.

Så här konfigurerar du en lokal utvecklingsmiljö eller en fjärransluten virtuell dator:

  1. Skapa en virtuell Python-miljö (virtualenv, conda).

    Anteckning

    Även om det inte krävs rekommenderar vi att du använder Anaconda eller Miniconda för att hantera virtuella Python-miljöer och installera paket.

    Viktigt

    Om du använder Linux eller macOS och använder ett annat gränssnitt än bash (till exempel zsh) kan du få fel när du kör vissa kommandon. Du kan komma runt det här problemet genom att bash använda kommandot för att starta ett nytt bash-gränssnitt och köra kommandona där.

  2. Aktivera din nyligen skapade virtuella Python-miljö.

  3. Installera Azure Machine Learning Python SDK.

  4. Om du vill konfigurera din lokala miljö så att den Azure Machine Learning arbetsytan skapar du en konfigurationsfil för arbetsytan eller använder en befintlig.

Nu när du har ställt in din lokala miljö är du redo att börja arbeta med Azure Machine Learning. Se guiden Azure Machine Learning komma igång med Python för att komma igång.

Jupyter Notebooks

När du kör en Jupyter Notebook server rekommenderar vi att du skapar en IPython-kernel för din virtuella Python-miljö. Detta säkerställer det förväntade kernel- och paketimportbeteendet.

  1. Aktivera miljöspecifika IPython-kernels

    conda install notebook ipykernel
    
  2. Skapa en kernel för din virtuella Python-miljö. Ersätt med namnet <myenv> på din virtuella Python-miljö.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. Starta Jupyter Notebook servern

Se lagringsplatsen Azure Machine Learning notebooks för att komma igång med Azure Machine Learning och Jupyter Notebooks.

Anteckning

En community-driven lagringsplats med exempel finns på https://github.com/Azure/azureml-examples .

Visuell Studio-kod

Så här använder Visual Studio Code för utveckling:

  1. Installera Visual Studio Code.
  2. Installera Azure Machine Learning Visual Studio Code (förhandsversion).

När du har installerat Visual Studio Code använder du det för att:

Azure Machine Learning-beräkningsinstans

Den Azure Machine Learning beräkningsinstansen är en säker, molnbaserad Azure-arbetsstation som ger dataexperter en Jupyter Notebook-server, JupyterLab och en fullständigt hanterad maskininlärningsmiljö.

Det finns inget att installera eller konfigurera för en beräkningsinstans.

Skapa en när som helst från din Azure Machine Learning arbetsyta. Ange bara ett namn och ange en typ av virtuell Azure-dator. Prova nu med den här självstudien: Konfigurera miljö och arbetsyta.

Mer information om beräkningsinstanser, inklusive hur du installerar paket, finns i Skapa och hantera en Azure Machine Learning beräkningsinstans.

Tips

Stoppa beräkningsinstansen för att förhindra kostnader för en oanvänd beräkningsinstans.

Förutom en server Jupyter Notebook och JupyterLab kan du använda beräkningsinstanser i den integrerade notebook-funktioneni Azure Machine Learning-studio .

Du kan också använda Azure Machine Learning Visual Studio Code för att ansluta till en fjärrbearbetningsinstans med hjälp av VS Code.

Virtuell dator för datavetenskap

Den Data Science VM är en anpassad VM-avbildning som du kan använda som utvecklingsmiljö. Den är utformad för datavetenskapsarbete som är förkonfigurerade verktyg och programvara som:

  • Paket som TensorFlow, PyTorch, Scikit-learn, XGBoost och Azure Machine Learning SDK
  • Populära datavetenskapsverktyg som Fristående Spark och Drill
  • Azure-verktyg som Azure CLI, AzCopy och Storage Explorer
  • Integrerade utvecklingsmiljöer (IDE:er) som Visual Studio Code och PyCharm
  • Jupyter Notebook Server

En mer omfattande lista över verktygen finns i guiden Data Science VM verktyg.

Viktigt

Om du planerar att använda Data Science VM som beräkningsmål för dina tränings- eller inferensjobb stöds endast Ubuntu.

Så här använder Data Science VM som en utvecklingsmiljö:

  1. Skapa en Data Science VM med någon av följande metoder:

    • Använd Azure Portal för att skapa en Ubuntu- eller Windows DSVM.

    • Skapa en Data Science VM arm-mallar.

    • Använda Azure CLI

      Använd följande kommando för Data Science VM skapa en Ubuntu-Data Science VM:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      Använd följande kommando för att skapa en Windows DSVM:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. Aktivera conda-miljön som innehåller Azure Machine Learning SDK.

    • För Ubuntu Data Science VM:

      conda activate py36
      
    • För Windows Data Science VM:

      conda activate AzureML
      
  3. Om du vill Data Science VM att använda arbetsytan Azure Machine Learning skapar du en konfigurationsfil för arbetsytan eller använder en befintlig.

På samma sätt som i lokala miljöer kan du använda Visual Studio Code och Azure Machine Learning Visual Studio Code-tillägget för att interagera med Azure Machine Learning.

Mer information finns i Data Science Virtual Machines.

Nästa steg