Konfigurace vývojového prostředí pro Azure Machine LearningConfigure a development environment for Azure Machine Learning

platí pro:  Ano , Basic edice  Yes Enterprise Edition                               (upgrade na Enterprise Edition) APPLIES TO: yesBasic edition yesEnterprise edition                    (Upgrade to Enterprise edition)

V tomto článku se dozvíte, jak nakonfigurovat vývojové prostředí pro práci s Azure Machine Learning.In this article, you learn how to configure a development environment to work with Azure Machine Learning. Azure Machine Learning nezávislá platformy.Azure Machine Learning is platform agnostic. Jediným z požadavků pro vaše vývojové prostředí je Python 3.The only hard requirement for your development environment is Python 3. Doporučuje se také izolované prostředí, jako je Anaconda nebo virtualenv.An isolated environment like Anaconda or Virtualenv is also recommended.

Následující tabulka uvádí každé vývojové prostředí popsané v tomto článku spolu s odborníky a nevýhody.The following table shows each development environment covered in this article, along with pros and cons.

ProstředíEnvironment VýhodyPros NevýhodyCons
Cloudová Azure Machine Learning COMPUTE – instance (Preview)Cloud-based Azure Machine Learning compute instance (preview) Nejjednodušší způsob, jak začít.Easiest way to get started. Celá sada SDK je už ve vašem VIRTUÁLNÍm počítači pracovního prostoru nainstalovaná a kurzy poznámkových bloků jsou předem naklonované a připravené ke spuštění.The entire SDK is already installed in your workspace VM, and notebook tutorials are pre-cloned and ready to run. Nedostatečná kontrola nad vývojovým prostředím a závislostmi.Lack of control over your development environment and dependencies. Dodatečné náklady vzniklé pro virtuální počítač Linux (virtuální počítač se dá zastavit, pokud se nepoužívá), aby se předešlo poplatkům.Additional cost incurred for Linux VM (VM can be stopped when not in use to avoid charges). Podívejte se na Podrobnosti o cenách.See pricing details.
Místní prostředíLocal environment Úplná kontrola nad vývojovým prostředím a závislostmi.Full control of your development environment and dependencies. Spusťte s libovolným nástrojem sestavení, prostředím nebo IDE dle vašeho výběru.Run with any build tool, environment, or IDE of your choice. Začne trvat déle.Takes longer to get started. Musí být nainstalované potřebné balíčky sady SDK a prostředí, pokud ho ještě nemáte, musí být nainstalované i v případě, že ho ještě nemáte.Necessary SDK packages must be installed, and an environment must also be installed if you don't already have one.
Azure DatabricksAzure Databricks Ideální pro spouštění vysoce škálovatelných pracovních postupů strojového učení na škálovatelné Apache Spark platformě.Ideal for running large-scale intensive machine learning workflows on the scalable Apache Spark platform. Přehnaně důkladné se na experimentální strojové učení nebo experimenty s menším rozsahem a pracovní postupy.Overkill for experimental machine learning, or smaller-scale experiments and workflows. Dodatečné náklady vzniklé za Azure Databricks.Additional cost incurred for Azure Databricks. Podívejte se na Podrobnosti o cenách.See pricing details.
Data Science Virtual Machine (DSVM)The Data Science Virtual Machine (DSVM) Podobně jako u cloudové výpočetní instance (Python a SDK jsou předem nainstalované), ale mají předem nainstalované i další oblíbené datové vědy a nástroje pro strojové učení.Similar to the cloud-based compute instance (Python and the SDK are pre-installed), but with additional popular data science and machine learning tools pre-installed. Snadné škálování a kombinování s dalšími vlastními nástroji a pracovními postupy.Easy to scale and combine with other custom tools and workflows. V porovnání s cloudovou výpočetní instancí je pomalejší prostředí Začínáme.A slower getting started experience compared to the cloud-based compute instance.

Tento článek také nabízí další tipy k používání následujících nástrojů:This article also provides additional usage tips for the following tools:

  • Jupyter poznámkové bloky: pokud už Jupyter notebook používáte, sada SDK obsahuje několik dalších doplňků, které byste měli nainstalovat.Jupyter Notebooks: If you're already using the Jupyter Notebook, the SDK has some extras that you should install.

  • Visual Studio Code: Používáte-li Visual Studio Code, zahrnuje rozšíření Azure Machine Learning rozsáhlou jazykovou podporu Pythonu a také funkce, které umožňují pracovat s Azure Machine Learning mnohem pohodlnější a produktivní.Visual Studio Code: If you use Visual Studio Code, the Azure Machine Learning extension includes extensive language support for Python as well as features to make working with the Azure Machine Learning much more convenient and productive.

PožadavkyPrerequisites

Pracovní prostor služby Azure Machine Learning.An Azure Machine Learning workspace. Pokud chcete vytvořit pracovní prostor, přečtěte si téma vytvoření Azure Machine Learningho pracovního prostoru.To create the workspace, see Create an Azure Machine Learning workspace. Pracovní prostor je vše, co potřebujete, abyste mohli začít s vlastním cloudovým notebookem, DSVMnebo Azure Databricks.A workspace is all you need to get started with your own cloud-based notebook server, a DSVM, or Azure Databricks.

Pokud chcete nainstalovat prostředí SDK pro svůj místní počítač, Jupyter Notebook Server nebo Visual Studio Code budete také potřebovat:To install the SDK environment for your local computer, Jupyter Notebook server or Visual Studio Code you also need:

  • Buď správce balíčků Anaconda nebo Miniconda .Either the Anaconda or Miniconda package manager.

  • V systému Linux nebo macOS potřebujete prostředí bash.On Linux or macOS, you need the bash shell.

    Tip

    Pokud pracujete v systému Linux nebo macOS a používáte jiné prostředí než bash (například ZSH), může dojít k chybám při spuštění některých příkazů.If you're on Linux or macOS and use a shell other than bash (for example, zsh) you might receive errors when you run some commands. Pokud chcete tento problém obejít, pomocí bash příkazu spusťte nové prostředí bash a spusťte příkazy tam.To work around this problem, use the bash command to start a new bash shell and run the commands there.

  • V systému Windows potřebujete příkazový řádek nebo Anacondaový dotaz (instalovaný Anaconda a Miniconda).On Windows, you need the command prompt or Anaconda prompt (installed by Anaconda and Miniconda).

Vaše vlastní cloudová instance COMPUTEYour own cloud-based compute instance

Instance služby compute Azure Machine Learning (Preview) je zabezpečená cloudová pracovní stanice Azure, která poskytuje odborníky na data pomocí serveru Jupyter notebook, JupyterLab a plně připraveného prostředí ml.The Azure Machine Learning compute instance (preview) is a secure, cloud-based Azure workstation that provides data scientists with a Jupyter notebook server, JupyterLab, and a fully prepared ML environment.

Pro výpočetní instanci není nic k instalaci ani konfiguraci.There is nothing to install or configure for a compute instance. Vytvořte si ji kdykoli v pracovním prostoru Azure Machine Learning.Create one anytime from within your Azure Machine Learning workspace. Zadejte jenom název a zadejte typ virtuálního počítače Azure.Provide just a name and specify an Azure VM type. Vyzkoušejte si to hned v tomto kurzu: nastavení prostředí a pracovního prostoru.Try it now with this Tutorial: Setup environment and workspace.

Přečtěte si další informace o výpočetních instancích.Learn more about compute instances.

Pokud chcete zastavit náklady na výpočetní výkon, zastavte výpočetní instanci.To stop incurring compute charges, stop the compute instance.

Virtuální počítač pro datové vědyData Science Virtual Machine

DSVM je přizpůsobená image virtuálního počítače (VM).The DSVM is a customized virtual machine (VM) image. Je navržená pro práci v oblasti datové vědy, která je předem nakonfigurovaná:It's designed for data science work that's pre-configured with:

  • Balíčky jako TensorFlow, PyTorch, Scikit-učení, XGBoost a sada SDK pro Azure Machine LearningPackages such as TensorFlow, PyTorch, Scikit-learn, XGBoost, and the Azure Machine Learning SDK
  • Oblíbené nástroje pro datové vědy, jako je Spark Standalone a procházeníPopular data science tools such as Spark Standalone and Drill
  • Nástroje Azure, jako jsou Azure CLI, AzCopy a Průzkumník služby StorageAzure tools such as the Azure CLI, AzCopy, and Storage Explorer
  • Integrovaná vývojová prostředí (IDEs), například Visual Studio Code a PyCharmIntegrated development environments (IDEs) such as Visual Studio Code and PyCharm
  • Server Jupyter NotebookJupyter Notebook Server

Sada SDK pro Azure Machine Learning funguje v DSVM ve verzi Ubuntu nebo Windows.The Azure Machine Learning SDK works on either the Ubuntu or Windows version of the DSVM. Ale pokud plánujete používat DSVM jako cíl výpočtů, podporuje se jenom Ubuntu.But if you plan to use the DSVM as a compute target as well, only Ubuntu is supported.

Použití DSVM jako vývojového prostředí:To use the DSVM as a development environment:

  1. Vytvořte DSVM v jednom z následujících prostředí:Create a DSVM in either of the following environments:

    • Azure Portal:The Azure portal:

    • Rozhraní příkazového řádku Azure:The Azure CLI:

      Důležité

      • Když použijete rozhraní příkazového řádku Azure, musíte se nejdřív přihlásit k předplatnému Azure pomocí az login příkazu.When you use the Azure CLI, you must first sign in to your Azure subscription by using the az login command.

      • Když použijete příkazy v tomto kroku, musíte zadat název skupiny prostředků, název virtuálního počítače, uživatelské jméno a heslo.When you use the commands in this step, you must provide a resource group name, a name for the VM, a username, and a password.

      • Pokud chcete vytvořit Data Science Virtual Machine Ubuntu, použijte následující příkaz:To create an Ubuntu Data Science Virtual Machine, use the following command:

        # create a Ubuntu DSVM in your resource group
        # note you need to be at least a contributor to the resource group in order to execute this command successfully
        # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
        az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
        
      • Chcete-li vytvořit Data Science Virtual Machine Windows, použijte následující příkaz:To create a Windows Data Science Virtual Machine, use the following command:

        # create a Windows Server 2016 DSVM in your resource group
        # note you need to be at least a contributor to the resource group in order to execute this command successfully
        az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
        
  2. Sada Azure Machine Learning SDK je už na DSVM nainstalovaná.The Azure Machine Learning SDK is already installed on the DSVM. Chcete-li použít prostředí Conda, které obsahuje sadu SDK, použijte jeden z následujících příkazů:To use the Conda environment that contains the SDK, use one of the following commands:

    • Pro Ubuntu DSVM:For Ubuntu DSVM:

      conda activate py36
      
    • Pro Windows DSVM:For Windows DSVM:

      conda activate AzureML
      
  3. Pokud chcete ověřit, že máte přístup k sadě SDK, a podívejte se na verzi, použijte následující kód Pythonu:To verify that you can access the SDK and check the version, use the following Python code:

    import azureml.core
    print(azureml.core.VERSION)
    
  4. Pokud chcete nakonfigurovat DSVM pro použití vašeho pracovního prostoru Azure Machine Learning, přečtěte si část vytvoření konfiguračního souboru pracovního prostoru .To configure the DSVM to use your Azure Machine Learning workspace, see the Create a workspace configuration file section.

Další informace najdete v tématu Virtual Machines pro datové vědy.For more information, see Data Science Virtual Machines.

Místní počítačLocal computer

Pokud používáte místní počítač (který může být také vzdáleným virtuálním počítačem), vytvořte prostředí Anaconda a nainstalujte sadu SDK.When you're using a local computer (which might also be a remote virtual machine), create an Anaconda environment and install the SDK. Tady je příklad:Here's an example:

  1. Stáhněte a nainstalujte Anaconda (verze Python 3,7), pokud ji ještě nemáte.Download and install Anaconda (Python 3.7 version) if you don't already have it.

  2. Otevřete příkazový řádek Anaconda a vytvořte prostředí pomocí následujících příkazů:Open an Anaconda prompt and create an environment with the following commands:

    Spuštěním následujícího příkazu vytvořte prostředí.Run the following command to create the environment.

    conda create -n myenv python=3.7.7
    

    Pak aktivujte prostředí.Then activate the environment.

    conda activate myenv
    

    Tento příklad vytvoří prostředí pomocí Python 3.7.7, ale lze zvolit jakékoli konkrétní podverze.This example creates an environment using python 3.7.7, but any specific subversions can be chosen. Kompatibilita sady SDK nemusí být zaručená u určitých hlavních verzí (doporučuje se 3,5 +) a při spuštění chyb se doporučuje vyzkoušet jinou verzi/podverzi v prostředí Anaconda.SDK compatibility may not be guaranteed with certain major versions (3.5+ is recommended), and it's recommended to try a different version/subversion in your Anaconda environment if you run into errors. Vytvoření prostředí během stahování komponent a balíčků bude trvat několik minut.It will take several minutes to create the environment while components and packages are downloaded.

  3. Spuštěním následujících příkazů v novém prostředí povolíte jádra IPython pro konkrétní prostředí.Run the following commands in your new environment to enable environment-specific IPython kernels. Tím se zajistí očekávané chování při importu jádra a balíčku při práci s poznámkovým blokům Jupyter v prostředích Anaconda:This will ensure expected kernel and package import behavior when working with Jupyter Notebooks within Anaconda environments:

    conda install notebook ipykernel
    

    Pak spuštěním následujícího příkazu vytvořte jádro:Then run the following command to create the kernel:

    ipython kernel install --user --name myenv --display-name "Python (myenv)"
    
  4. K instalaci balíčků použijte následující příkazy:Use the following commands to install packages:

    Tento příkaz nainstaluje základní sadu Azure Machine Learning SDK pomocí poznámkového bloku a automl dalších.This command installs the base Azure Machine Learning SDK with notebook and automl extras. automlExtra je velká instalace a je možné ji odebrat z závorek, pokud nechcete spouštět automatizované experimenty strojového učení.The automl extra is a large install, and can be removed from the brackets if you don't intend to run automated machine learning experiments. automlNavíc zahrnuje také Azure Machine Learning sadu SDK pro přípravu dat jako závislost.The automl extra also includes the Azure Machine Learning Data Prep SDK by default as a dependency.

    pip install azureml-sdk[notebooks,automl]
    

    Poznámka

    • Pokud se zobrazí zpráva, že PyYAML nelze odinstalovat, použijte místo toho následující příkaz:If you get a message that PyYAML can't be uninstalled, use the following command instead:

      pip install --upgrade azureml-sdk[notebooks,automl] --ignore-installed PyYAML

    • Počínaje macOS Catalina, zsh (prostředí Z) je výchozí prostředí pro přihlášení a interaktivní prostředí.Starting with macOS Catalina, zsh (Z shell) is the default login shell and interactive shell. V ZSH použijte následující příkaz, který řídí hranaté závorky " \ " (zpětné lomítko):In zsh, use the following command which escapes brackets with "\" (backslash):

      pip install --upgrade azureml-sdk\[notebooks,automl\]

    Instalace sady SDK bude trvat několik minut.It will take several minutes to install the SDK. Další informace o možnostech instalace najdete v příručce pro instalaci.For more information on installation options, see the install guide.

  5. Nainstalujte další balíčky pro experimentování ve službě Machine Learning.Install other packages for your machine learning experimentation.

    Použijte některý z následujících příkazů a nahraďte <new package> ho balíčkem, který chcete nainstalovat.Use either of the following commands and replace <new package> with the package you want to install. Instalace balíčků přes conda install vyžaduje, aby byl balíček součástí současných kanálů (nové kanály je možné přidat do Anaconda cloudu).Installing packages via conda install requires that the package is part of the current channels (new channels can be added in Anaconda Cloud).

    conda install <new package>
    

    Alternativně můžete balíčky instalovat prostřednictvím nástroje pip .Alternatively, you can install packages via pip.

    pip install <new package>
    

Poznámkové bloky JupyterJupyter Notebooks

Jupyter poznámkové bloky jsou součástí projektu Jupyter.Jupyter Notebooks are part of the Jupyter Project. Poskytují interaktivní kódování při vytváření dokumentů, které přinášejí živý kód pomocí mluveného textu a grafiky.They provide an interactive coding experience where you create documents that mix live code with narrative text and graphics. Jupyter poznámkové bloky jsou také skvělým způsobem, jak sdílet výsledky s ostatními, protože výstup částí kódu v dokumentu můžete uložit.Jupyter Notebooks are also a great way to share your results with others, because you can save the output of your code sections in the document. Poznámkové bloky Jupyter můžete nainstalovat na celou řadu platforem.You can install Jupyter Notebooks on a variety of platforms.

Postup v části místní počítač nainstaluje potřebné komponenty pro spouštění notebooků Jupyter v prostředí Anaconda.The procedure in the Local computer section installs necessary components for running Jupyter Notebooks in an Anaconda environment.

Postup povolení těchto součástí v prostředí Jupyter Notebook:To enable these components in your Jupyter Notebook environment:

  1. Otevřete příkazový řádek Anaconda a aktivujte své prostředí.Open an Anaconda prompt and activate your environment.

    conda activate myenv
    
  2. Naklonujte úložiště GitHub pro sadu ukázkových poznámkových bloků.Clone the GitHub repository for a set of sample notebooks.

    git clone https://github.com/Azure/MachineLearningNotebooks.git
    
  3. Spusťte Jupyter Notebook Server pomocí následujícího příkazu:Launch the Jupyter Notebook server with the following command:

    jupyter notebook
    
  4. Chcete-li ověřit, zda Jupyter Notebook může použít sadu SDK, vytvořte Nový Poznámkový blok, jako jádro vyberte Python 3 a potom v buňce poznámkového bloku spusťte následující příkaz:To verify that Jupyter Notebook can use the SDK, create a New notebook, select Python 3 as your kernel, and then run the following command in a notebook cell:

    import azureml.core
    azureml.core.VERSION
    
  5. Pokud narazíte na problémy s importem modulů a přijmete ModuleNotFoundError , ujistěte se, že je váš Jupyter jádro připojený ke správné cestě pro vaše prostředí, a to spuštěním následujícího kódu v buňce poznámkového bloku.If you encounter issues importing modules and receive a ModuleNotFoundError, ensure your Jupyter kernel is connected to the correct path for your environment by running the following code in a Notebook cell.

    import sys
    sys.path
    
  6. Pokud chcete nakonfigurovat Jupyter Notebook k používání pracovního prostoru Azure Machine Learning, přečtěte si část vytvoření konfiguračního souboru pracovního prostoru .To configure the Jupyter Notebook to use your Azure Machine Learning workspace, go to the Create a workspace configuration file section.

Visual Studio CodeVisual Studio Code

Visual Studio Code je velmi oblíbený editor kódu pro různé platformy, který podporuje rozsáhlou sadu programovacích jazyků a nástrojů prostřednictvím rozšíření dostupných na webu Visual Studio Marketplace.Visual Studio Code is a very popular cross platform code editor that supports an extensive set of programming languages and tools through extensions available in the Visual Studio marketplace. Rozšíření Azure Machine Learning nainstaluje rozšíření Python pro kódování ve všech typech prostředí Pythonu (Virtual, Anaconda atd.).The Azure Machine Learning extension installs the Python extension for coding in all types of Python environments (virtual, Anaconda, etc.). Kromě toho poskytuje praktické funkce pro práci s Azure Machine Learning prostředky a spouštění Azure Machine Learning experimentů bez nutnosti opustit Visual Studio Code.In addition, it provides convenience features for working with Azure Machine Learning resources and running Azure Machine Learning experiments all without leaving Visual Studio Code.

Použití Visual Studio Code pro vývoj:To use Visual Studio Code for development:

  1. Instalaci rozšíření Azure Machine Learning pro Visual Studio Code najdete v tématu Azure Machine Learning.Install the Azure Machine Learning extension for Visual Studio Code, see Azure Machine Learning.

    Další informace najdete v tématu použití Azure Machine Learning pro Visual Studio Code.For more information, see Use Azure Machine Learning for Visual Studio Code.

  2. Naučte se používat Visual Studio Code pro jakýkoliv typ vývoje v Pythonu, přečtěte si téma Začínáme s Pythonem v VSCode.Learn how to use Visual Studio Code for any type of Python development, see Get started with Python in VSCode.

    • Pokud chcete vybrat prostředí SDK Pythonu obsahující sadu SDK, otevřete VS Code a pak vyberte CTRL + SHIFT + P (Linux a Windows) nebo Command + Shift + P (Mac).To select the SDK Python environment containing the SDK, open VS Code, and then select Ctrl+Shift+P (Linux and Windows) or Command+Shift+P (Mac).

      • Otevře se paleta příkazů .The Command Palette opens.
    • Zadejte __Python: vyberte Interpret__a pak vyberte příslušné prostředí.Enter Python: Select Interpreter, and then select the appropriate environment

  3. Chcete-li ověřit, zda můžete použít sadu SDK, vytvořte nový soubor Pythonu (. py), který obsahuje následující kód:To validate that you can use the SDK, create a new Python file (.py) that contains the following code:

    #%%
    import azureml.core
    azureml.core.VERSION
    

    Spusťte tento kód tak, že kliknete na "spustit buňku" CodeLens nebo jednoduše stisknete klávesu SHIFT + ENTER.Run this code by clicking the "Run cell" CodeLens or simply press shift-enter.

Azure DatabricksAzure Databricks

Azure Databricks je prostředí založené na Apache Spark v cloudu Azure.Azure Databricks is an Apache Spark-based environment in the Azure cloud. Poskytuje prostředí pro spolupráci na bázi poznámkového bloku s PROCESORem nebo výpočetním clusterem založeným na GPU.It provides a collaborative Notebook-based environment with CPU or GPU-based compute cluster.

Jak Azure Databricks pracuje s Azure Machine Learning:How Azure Databricks works with Azure Machine Learning:

Nastavení clusteru datacihlySet up your Databricks cluster

Vytvořte cluster datacihly.Create a Databricks cluster. Některá nastavení platí jenom v případě, že nainstalujete sadu SDK pro automatizované Machine Learning na datacihly.Some settings apply only if you install the SDK for automated machine learning on Databricks. Vytvoření clusteru bude trvat několik minut.It will take few minutes to create the cluster.

Použijte tato nastavení:Use these settings:

NastaveníSetting Platí proApplies to HodnotaValue
Název clusteruCluster name stálalways yourclusternameyourclustername
Modul runtime DatabricksDatabricks Runtime stálalways Běhový modul bez ML 6,5 (Scala 2,11, Spark 2.4.3)Non-ML Runtime 6.5 (scala 2.11, spark 2.4.3)
Verze PythonuPython version stálalways 33
PracovníkůWorkers stálalways 2 nebo vyšší2 or higher
Typy virtuálních počítačů uzlu pracovního procesuWorker node VM types
(určuje maximální počet souběžných iterací)(determines max # of concurrent iterations)
Automatizované strojové učeníAutomated ML
pouzeonly
Preferovaný virtuální počítač pro optimalizaci pamětiMemory optimized VM preferred
Povolit automatické škálováníEnable Autoscaling Automatizované strojové učeníAutomated ML
pouzeonly
Zrušte zaškrtnutí políčka Uncheck

Než budete pokračovat, počkejte, dokud cluster neběží.Wait until the cluster is running before proceeding further.

Nainstalujte správnou sadu SDK do knihovny datacihly.Install the correct SDK into a Databricks library

Po spuštění clusteru vytvořte knihovnu , která připojí příslušný balíček sady Azure Machine Learning SDK k vašemu clusteru.Once the cluster is running, create a library to attach the appropriate Azure Machine Learning SDK package to your cluster.

  1. Klikněte pravým tlačítkem na složku aktuální pracovní prostor, kam chcete uložit knihovnu.Right-click the current Workspace folder where you want to store the library. Vyberte vytvořit > knihovnu.Select Create > Library.

  2. Zvolit jenom jednu možnost (žádná jiná instalace sady SDK není podporovaná)Choose only one option (no other SDK installation are supported)

     Doplňky balíčku sady SDK  SDK package extras ZdrojSource  Název PyPI      PyPi Name      
    Pro datacihlyFor Databricks Nahrát vejce Pythonu nebo PyPIUpload Python Egg or PyPI AzureML-SDK [datacihly]azureml-sdk[databricks]
    Pro datacihly – with-For Databricks -with-
    Automatické možnosti MLautomated ML capabilities
    Nahrát vejce Pythonu nebo PyPIUpload Python Egg or PyPI AzureML-SDK [automl]azureml-sdk[automl]

    Upozornění

    Nelze nainstalovat žádné další doplňky sady SDK.No other SDK extras can be installed. Vyberte jenom jednu z předchozích možností [datacihly] nebo [automl].Choose only one of the preceding options [databricks] or [automl].

    • Nevybírejte možnost Připojit automaticky ke všem clusterům.Do not select Attach automatically to all clusters.
    • Vedle názvu clusteru vyberte připojit .Select Attach next to your cluster name.
  3. Monitoruje chyby, dokud se změny stavu nepřipojí, což může trvat několik minut.Monitor for errors until status changes to Attached, which may take several minutes. Pokud tento krok neproběhne úspěšně:If this step fails:

    Zkuste cluster restartovat pomocí:Try restarting your cluster by:

    1. V levém podokně vyberte clustery.In the left pane, select Clusters.
    2. V tabulce vyberte název vašeho clusteru.In the table, select your cluster name.
    3. Na kartě knihovny vyberte restartovat.On the Libraries tab, select Restart.

    Zvažte také:Also consider:

    • V AutoML config při použití Azure Databricks přidejte následující parametry:In AutoML config, when using Azure Databricks add the following parameters:
      1. max_concurrent_iterationsvychází z počtu pracovních uzlů v clusteru.max_concurrent_iterations is based on number of worker nodes in your cluster.
      2. spark_context=scje založen na výchozím kontextu Sparku.spark_context=sc is based on the default spark context.
    • Nebo, pokud máte starou verzi sady SDK, zrušte výběr z nainstalovaného knihovny clusteru a přesuňte se do koše.Or, if you have an old SDK version, deselect it from cluster's installed libs and move to trash. Nainstalujte novou verzi sady SDK a restartujte cluster.Install the new SDK version and restart the cluster. Pokud po restartování dojde k problému, odpojte a znovu připojte svůj cluster.If there is an issue after the restart, detach and reattach your cluster.

Pokud byla instalace úspěšná, importovaná knihovna by měla vypadat jako jedna z následujících:If install was successful, the imported library should look like one of these:

Sada SDK pro datacihly bez automatizovaného strojového učení  Azure Machine Learning SDK pro datacihlySDK for Databricks without automated machine learning Azure Machine Learning SDK for Databricks

Sada SDK pro datacihly pomocí automatizovaného strojového učení  sady SDK s nainstalovanou službou Automated Machine Learning pro datacihlySDK for Databricks WITH automated machine learning SDK with automated machine learning installed on Databricks

Zahájení průzkumuStart exploring

Vyzkoušet:Try it out:

Vytvoření konfiguračního souboru pracovního prostoruCreate a workspace configuration file

Konfigurační soubor pracovního prostoru je soubor JSON, který oznamuje sadě SDK, jak komunikovat s vaším pracovním prostorem Azure Machine Learning.The workspace configuration file is a JSON file that tells the SDK how to communicate with your Azure Machine Learning workspace. Soubor má název config. JSONa má následující formát:The file is named config.json, and it has the following format:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Tento soubor JSON musí být ve struktuře adresáře, která obsahuje vaše skripty Pythonu nebo Jupyter Poznámkový blok.This JSON file must be in the directory structure that contains your Python scripts or Jupyter Notebooks. Může být ve stejném adresáři, v podadresáři s názvem . AzureMLnebo v nadřazeném adresáři.It can be in the same directory, a subdirectory named .azureml, or in a parent directory.

Chcete-li použít tento soubor ze svého kódu, použijte ws=Workspace.from_config() .To use this file from your code, use ws=Workspace.from_config(). Tento kód načte informace ze souboru a připojí se k vašemu pracovnímu prostoru.This code loads the information from the file and connects to your workspace.

Konfigurační soubor můžete vytvořit třemi způsoby:You can create the configuration file in three ways:

  • Použijte ws. write_config: pro zápis souboru config. JSON .Use ws.write_config: to write a config.json file. Soubor obsahuje informace o konfiguraci pro váš pracovní prostor.The file contains the configuration information for your workspace. Config. JSON si můžete stáhnout nebo zkopírovat do jiných vývojových prostředí.You can download or copy the config.json to other development environments.

  • Stažení souboru: v Azure Portalv části Přehled pracovního prostoru vyberte Stáhnout soubor config. JSON .Download the file: In the Azure portal, select Download config.json from the Overview section of your workspace.

    portál Azure

  • Vytvořte soubor programově: v následujícím fragmentu kódu se připojíte k pracovnímu prostoru ZADÁNÍm ID předplatného, skupiny prostředků a názvu pracovního prostoru.Create the file programmatically: In the following code snippet, you connect to a workspace by providing the subscription ID, resource group, and workspace name. Pak uloží konfiguraci pracovního prostoru do souboru:It then saves the workspace configuration to the file:

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

    Tento kód zapíše konfigurační soubor do souboru . AzureML/config. JSON .This code writes the configuration file to the .azureml/config.json file.

Další krokyNext steps