Настройка среды разработки для Машинного обучения AzureConfigure a development environment for Azure Machine Learning

В этой статье описано, как настроить среду разработки для работы со Службой машинного обучения Azure.In this article, you learn how to configure a development environment to work with Azure Machine Learning service. Служба машинного обучения не зависит от платформы.Machine Learning service is platform agnostic.

Единственное требование для среды разработки — Python 3, Anaconda (для изолированных средах) и файл конфигурации, который содержит сведения о рабочей области машинного обучения Azure.The only requirements for your development environment are Python 3, Anaconda (for isolated environments), and a configuration file that contains your Azure Machine Learning workspace information.

В этой статье описаны следующие среды и средства.This article focuses on the following environments and tools:

  • Записные книжки Azure. Служба Jupyter Notebook, размещенная в облаке Azure.Azure Notebooks: A Jupyter Notebooks service that's hosted in the Azure cloud. Это самый простой способ начать работу, так как пакет SDK для Машинного обучения Azure уже установлен.It's the easiest way to get started, because the Azure Machine Learning SDK is already installed.

  • Виртуальная машина для обработки и анализа данных (DSVM). Предварительно настроенная среда для разработки и экспериментов в облаке Azure, которая предназначена для обработки и анализа данных и может быть развернута как на экземплярах виртуальных машин на основе ЦП, так и на экземплярах виртуальных машин на основе GPU.The Data Science Virtual Machine (DSVM): A pre-configured development or experimentation environment in the Azure cloud that's designed for data science work and can be deployed to either CPU only VM instances or GPU-based instances. Установленные Python 3, Conda, приложения Jupyter Notebook и пакет SDK для Машинного обучения Azure.Python 3, Conda, Jupyter Notebooks, and the Azure Machine Learning SDK are already installed. Виртуальная машина предоставляется с популярными платформами машинного или глубокого обучения, а также с инструментами и редакторами для разработки решений машинного обучения.The VM comes with popular machine learning and deep learning frameworks, tools, and editors for developing machine learning solutions. Это, вероятно, самая многофункциональная среда разработки для машинного обучения на платформе Azure.It's probably the most complete development environment for machine learning on the Azure platform.

  • Jupyter Notebook. Если вы уже используете Jupyter Notebook, вам нужно установить некоторые вспомогательные компоненты, которые содержит пакет SDK.The Jupyter Notebook: If you're already using the Jupyter Notebook, the SDK has some extras that you should install.

  • Visual Studio Code. Если вы используете Visual Studio Code, то вы можете установить некоторые полезные расширения.Visual Studio Code: If you use Visual Studio Code, it has some useful extensions that you can install.

  • Azure Databricks. Популярная платформа для аналитики данных на основе Apache Spark.Azure Databricks: A popular data analytics platform that's based on Apache Spark. Узнайте, как установить пакет SDK для Машинного обучения Azure в кластере, чтобы получить возможность развертывать модели.Learn how to get the Azure Machine Learning SDK onto your cluster so that you can deploy models.

Если у вас уже есть среда Python 3, или вам нужно выполнить основные шаги для установки пакета SDK, см. инструкции, предназначенные для локального компьютера.If you already have a Python 3 environment, or just want the basic steps for installing the SDK, see the Local computer section.

Технические условияPrerequisites

  • Рабочая область службы машинного обучения Azure.An Azure Machine Learning service workspace. Чтобы создать рабочую область, обратитесь к статье Краткое руководство. Начало работы со Службой машинного обучения Azure с помощью портала Azure.To create the workspace, see Get started with Azure Machine Learning service.

  • Либо Anaconda или Miniconda диспетчера пакетов.Either the Anaconda or Miniconda package manager.

    Важно!

    Anaconda и Miniconda не являются обязательными компонентами при работе с Записными книжками Azure.Anaconda and Miniconda are not required when you're using Azure Notebooks.

  • В Linux или macOS вам понадобится оболочка bash.On Linux or macOS, you need the bash shell.

    Совет

    Если в Linux или macOS вы используете оболочку, отличающуюся от bash (например, zsh), при выполнении некоторых команд могут возникнуть ошибки.If you're on Linux or macOS and use a shell other than bash (for example, zsh) you might receive errors when you run some commands. Чтобы решить эту проблему, используйте команду bash, чтобы запустить bash и выполните там нужные команды.To work around this problem, use the bash command to start a new bash shell and run the commands there.

  • В Windows вам понадобится командная строка по умолчанию или командная строка Anaconda (устанавливается вместе с Anaconda и Miniconda).On Windows, you need the command prompt or Anaconda prompt (installed by Anaconda and Miniconda).

Записные книжки AzureAzure Notebooks

Записные книжки Azure (предварительная версия) — это интерактивная среда разработки в облаке Azure.Azure Notebooks (preview) is an interactive development environment in the Azure cloud. Это самый простой способ начать разработку с использованием Машинного обучения Azure.It's the easiest way to get started with Azure Machine Learning development.

  • Пакет SDK для Машинного обучения Azure уже установлен.The Azure Machine Learning SDK is already installed.
  • Создав рабочую область Службы машинного обучения Azure на портале Azure, можно нажать кнопку, чтобы автоматически настроить среду Записных книжек Azure для работы с рабочей областью.After you create an Azure Machine Learning service workspace in the Azure portal, you can click a button to automatically configure your Azure Notebook environment to work with the workspace.

Чтобы начать разработку с помощью Записных книжек Azure, обратитесь к статье Краткое руководство. Начало работы со Службой машинного обучения Azure с помощью портала Azure.To get started developing with Azure Notebooks, see Get started with Azure Machine Learning service.

По умолчанию Записные книжки Azure используют бесплатный уровень обслуживания, который ограничен 4 ГБ памяти и 1 ГБ данных.By default, Azure Notebooks uses a free service tier that is limited to 4GB of memory and 1GB of data. Однако вы можете снять эти ограничения, подключив экземпляр Виртуальной машины для обработки и анализа данных к проекту Записных книжек Azure.You can, however, remove these limits by attaching a Data Science Virtual Machine instance to the Azure Notebooks project. Дополнительные сведения см. в статье Manage and configure Azure Notebooks projects — Compute tier (Управление и настройка проектов Записных книжек Azure — уровень вычислений).For more information, see Manage and configure Azure Notebooks projects - Compute tier.

Виртуальная машина для обработки и анализа данныхData Science Virtual Machine

DSVM — это настраиваемый образ виртуальной машины.The DSVM is a customized virtual machine (VM) image. Он предназначен для обработки и анализа данных, и на нем предварительно настроены:It's designed for data science work that's pre-configured with:

  • пакеты TensorFlow, PyTorch, Scikit-learn, XGBoost и пакет SDK для Машинного обучения Azure;Packages such as TensorFlow, PyTorch, Scikit-learn, XGBoost, and the Azure Machine Learning SDK
  • популярные инструменты для обработки и анализа данных, в том числе изолированная среда Spark и Drill;Popular data science tools such as Spark Standalone and Drill
  • инструменты Azure, такие как интерфейс командной строки Azure, AzCopy и Обозреватель службы хранилища;Azure tools such as the Azure CLI, AzCopy, and Storage Explorer
  • интегрированные среды разработки, например Visual Studio Code и PyCharm;Integrated development environments (IDEs) such as Visual Studio Code and PyCharm
  • Сервер Jupyter Notebook.Jupyter Notebook Server

Пакет SDK для Машинного обучения Azure работает с версией DSVM для Ubuntu или Windows.The Azure Machine Learning SDK works on either the Ubuntu or Windows version of the DSVM. Но если вы также планируете использовать Виртуальную машину для обработки и анализа данных в качестве цели для вычислений, это возможно только на Ubuntu.But if you plan to use the DSVM as a compute target as well, only Ubuntu is supported.

Чтобы использовать DSVM в качестве среды разработки, выполните следующие действия.To use the DSVM as a development environment, do the following:

  1. Создайте DSVM в любой из следующих сред:Create a DSVM in either of the following environments:

    • На портале Azure:The Azure portal:

    • Интерфейс командной строки Azure:The Azure CLI:

      Важно!

      • Чтобы использовать Azure CLI, нужно сначала войти в подписку Azure с помощью команды az login.When you use the Azure CLI, you must first sign in to your Azure subscription by using the az login command.

      • При использовании команд на этом шаге необходимо указать имя группы ресурсов, имя виртуальной машины, имя пользователя и пароль.When you use the commands in this step, you must provide a resource group name, a name for the VM, a username, and a password.

      • Чтобы создать DSVM на платформе Ubuntu, воспользуйтесь приведенной ниже командой.To create an Ubuntu Data Science Virtual Machine, use the following command:

        # create a Ubuntu DSVM in your resource group
        # note you need to be at least a contributor to the resource group in order to execute this command successfully
        # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
        az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
        
      • Чтобы создать DSVM на платформе Windows, воспользуйтесь приведенной ниже командой.To create a Windows Data Science Virtual Machine, use the following command:

        # create a Windows Server 2016 DSVM in your resource group
        # note you need to be at least a contributor to the resource group in order to execute this command successfully
        az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
        
  2. Пакет SDK для Машинного обучения Azure уже установлен в DSVM.The Azure Machine Learning SDK is already installed on the DSVM. Чтобы использовать среду Conda, которая содержит пакет SDK, используйте одну из следующих команд:To use the Conda environment that contains the SDK, use one of the following commands:

    • Виртуальная машина для обработки и анализа данных под управлением Ubuntu:For Ubuntu DSVM:

      conda activate py36
      
    • Виртуальная машина для обработки и анализа данных под управлением Windows:For Windows DSVM:

      conda activate AzureML
      
  3. Чтобы убедиться, у вас есть доступ к пакету SDK и проверить версию, используйте следующий код Python:To verify that you can access the SDK and check the version, use the following Python code:

    import azureml.core
    print(azureml.core.VERSION)
    
  4. Дополнительные сведения о настройке Виртуальной машины для обработки и анализа данных для роботы с рабочей областью Службы машинного обучения Azure см. в разделе Создание файла конфигурации рабочей области.To configure the DSVM to use your Azure Machine Learning service workspace, see the Create a workspace configuration file section.

Дополнительные сведения о Виртуальных машинах для обработки и анализа данных см. здесь.For more information, see Data Science Virtual Machines.

Локальный компьютерLocal computer

При использовании локального компьютера (который также может быть удаленной виртуальной машине), создать среду Anaconda и установить пакет SDK, сделав следующее:When you're using a local computer (which might also be a remote virtual machine), create an Anaconda environment and install the SDK by doing the following:

  1. Скачайте и установите Anaconda (версии Python 3.7) Если у вас еще нет.Download and install Anaconda (Python 3.7 version) if you don't already have it.

  2. Откройте командную строку с Anaconda и создать среду, выполнив следующие команды:Open an Anaconda prompt and create an environment with the following commands:

    Выполните следующую команду для создания среды.Run the following command to create the environment.

    conda create -n myenv python=3.6.5
    

    Затем активируйте среду.Then activate the environment.

    conda activate myenv
    

    В этом примере создается окружение с помощью python 3.6.5, но можно выбрать любой определенной subversions.This example creates an environment using python 3.6.5, but any specific subversions can be chosen. Совместимости пакета SDK может не гарантируется, с помощью некоторых основных версий (3.5 + рекомендуется), и мы рекомендуем попробовать разные версии/subversion в вашей среде Anaconda, при возникновении ошибки.SDK compatibility may not be guaranteed with certain major versions (3.5+ is recommended), and it's recommended to try a different version/subversion in your Anaconda environment if you run into errors. Скачивание компонентов и пакетов и последующее создание среды займет несколько минут.It will take several minutes to create the environment while components and packages are downloaded.

  3. Выполните следующие команды в новой среде для конкретной среды ipython ядра.Run the following commands in your new environment to enable environment-specific ipython kernels. Это обеспечит ожидаемый ядра и пакет импорта поведение, при работе с записными книжками Jupyter в средах Anaconda:This will ensure expected kernel and package import behavior when working with Jupyter Notebooks within Anaconda environments:

    conda install notebook ipykernel
    

    Затем выполните следующую команду, чтобы создать ядра:Then run the following command to create the kernel:

    ipython kernel install --user
    
  4. Чтобы установить пакеты, используйте следующие команды:Use the following commands to install packages:

    Эта команда устанавливает базовый пакет SDK Azure машины обучения с помощью записной книжки и automl дополнения.This command installs the base Azure Machine Learning SDK with notebook and automl extras. automl Очень больших установку и может быть удален из квадратные скобки, если вы не собираетесь запустить автоматические эксперименты.The automl extra is a large install, and can be removed from the brackets if you don't intend to run automated machine learning experiments. automl Дополнительных также включает пакет SDK Azure машины обучения данные подготовки по умолчанию как зависимость.The automl extra also includes the Azure Machine Learning Data Prep SDK by default as a dependency.

    pip install azureml-sdk[notebooks,automl]
    

    Используйте следующую команду для установки пакета SDK Azure Machine Learning данных подготовки сам по себе:Use this command to install the Azure Machine Learning Data Prep SDK on its own:

    pip install azureml-dataprep
    

    Примечание

    Если появится сообщение о том, что не удается удалить PyYAML, попробуйте использовать другую команду:If you get a message that PyYAML can't be uninstalled, use the following command instead:

    pip install --upgrade azureml-sdk[notebooks,automl] azureml-dataprep --ignore-installed PyYAML

    Он займет несколько минут, чтобы установить пакет SDK.It will take several minutes to install the SDK. См. в разделе руководство по установке Дополнительные сведения о вариантах установки.See the install guide for more information on installation options.

  5. Установите другие пакеты для машинного обучения "Экспериментирование".Install other packages for your machine learning experimentation.

    Используйте одну из приведенных ниже команд и замените <новый пакет > с пакет, который требуется установить.Use either of the following commands and replace <new package> with the package you want to install. Установка пакетов с помощью conda install требует, что пакет является частью текущего каналов (новые каналы могут добавляться в облаке Anaconda).Installing packages via conda install requires that the package is part of the current channels (new channels can be added in Anaconda Cloud).

    conda install <new package>
    

    Кроме того, вы можете установить пакеты через pip.Alternatively, you can install packages via pip.

    pip install <new package>
    

Приложения Jupyter NotebookJupyter Notebooks

Приложения Jupyter Notebook предоставляются компанией Project Jupyter.Jupyter Notebooks are part of the Jupyter Project. Это решение предназначено для реализации интерактивного процесса кодирования, в котором создаются документы с динамическим кодом, описательным текстом и графикой.They provide an interactive coding experience where you create documents that mix live code with narrative text and graphics. Приложения Jupyter Notebook также позволяют использовать результаты вашей работы совместно с другими пользователями, так как вы можете сохранять выходные данные разделов кода в документе.Jupyter Notebooks are also a great way to share your results with others, because you can save the output of your code sections in the document. Jupyter Notebook можно устанавливать на различных платформах.You can install Jupyter Notebooks on a variety of platforms.

Процедуру, описанную в локального компьютера раздел устанавливает необходимые компоненты для с записными книжками Jupyter в среде Anaconda.The procedure in the Local computer section installs necessary components for running Jupyter Notebooks in an Anaconda environment. Чтобы включить эти компоненты в вашей среде Jupyter Notebook, следуйте инструкциям, приведенным ниже.To enable these components in your Jupyter Notebook environment, do the following:

  1. Откройте командную строку с Anaconda и активации вашей среды.Open an Anaconda prompt and activate your environment.

    conda activate myenv
    
  2. Запустите сервер Jupyter Notebook с помощью следующей команды:Launch the Jupyter Notebook server with the following command:

    jupyter notebook
    
  3. Чтобы убедиться, что записная книжка Jupyter можно использовать пакет SDK, создайте New записной книжки выберите Python 3 качестве ядра и затем выполните следующую команду в ячейку записной книжки:To verify that Jupyter Notebook can use the SDK, create a New notebook, select Python 3 as your kernel, and then run the following command in a notebook cell:

    import azureml.core
    azureml.core.VERSION
    
  4. При возникновении проблем с импортом модулей и получать ModuleNotFoundError, ядро Jupyter должна быть подключена на правильный путь для вашей среды, выполнив следующий код в ячейку записной книжки.If you encounter issues importing modules and receive a ModuleNotFoundError, ensure your Jupyter kernel is connected to the correct path for your environment by running the following code in a Notebook cell.

    import sys
    sys.path
    
  5. Дополнительные сведения о настройке Jupyter Notebook для роботы с рабочей областью Службы машинного обучения Azure см. в разделе Создание файла конфигурации рабочей области.To configure the Jupyter Notebook to use your Azure Machine Learning service workspace, go to the Create a workspace configuration file section.

Visual Studio CodeVisual Studio Code

Visual Studio Code — это кроссплатформенный редактор кода.Visual Studio Code is a cross platform code editor. Для его использования требуется локальная установка Python 3 и Conda для поддержки Python, но он также предоставляет дополнительные средства для работы с искусственным интеллектом.It relies on a local Python 3 and Conda installation for Python support, but it provides additional tools for working with AI. Кроме того, этот редактор предоставляет поддержку для выбора среды Conda в редакторе кода.It also provides support for selecting the Conda environment from within the code editor.

Чтобы использовать Visual Studio Code для разработки, сделайте следующее:To use Visual Studio Code for development, do the following:

  1. Дополнительные сведения об использовании Visual Studio Code для разработки с помощью Python см. в руководстве по началу работы с Python в VSCode.To learn how to use Visual Studio Code for Python development, see Get started with Python in VSCode.

  2. Чтобы выбрать среду Conda, откройте VS Code и используйте клавиши CTRL+SHIFT+P (Linux и Windows) или COMMAND+SHIFT+P (Mac).To select the Conda environment, open VS Code, and then select Ctrl+Shift+P (Linux and Windows) or Command+Shift+P (Mac). После этого откроется палитра команд.The Command Pallet opens.

  3. Введите Python: Select Interpreter (Python: выбор интерпретатора) и выберите среду Conda.Enter Python: Select Interpreter, and then select the Conda environment.

  4. Чтобы убедиться, что вы можете использовать пакет SDK, создайте и запустите новый файл Python (PY), содержащий следующий код.To validate that you can use the SDK, create and then run a new Python file (.py) that contains the following code:

    import azureml.core
    azureml.core.VERSION
    
  5. Чтобы установить расширение Машинного обучения Azure для Visual Studio Code, перейдите на страницу Azure Machine Learning for Visual Studio Code (Машинное обучения Azure для Visual Studio Code).To install the Azure Machine Learning extension for Visual Studio Code, see Tools for AI.

    Дополнительные сведения см. в статье Приступая к работе с Azure Machine Learning for Visual Studio Code.For more information, see Use Azure Machine Learning for Visual Studio Code.

Azure DatabricksAzure Databricks

Azure Databricks — это среда на основе Apache Spark, в облаке Azure.Azure Databricks is an Apache Spark-based environment in the Azure cloud. Он предоставляет среде записной книжки на базе совместной работы с кластером на основе вычислительных ресурсов ЦП или GPU.It provides a collaborative Notebook based environment with CPU or GPU based compute cluster.

Как Azure Databricks работает со службой машинного обучения Azure:How Azure Databricks works with Azure Machine Learning service:

Настройка кластера DatabricksSet up your Databricks cluster

Создание кластера Databricks.Create a Databricks cluster. Некоторые параметры применяются только в том случае, если вы установите пакет SDK для автоматических машинное обучение в Databricks.Some settings apply only if you install the SDK for automated machine learning on Databricks. Может занять несколько минут для создания кластера.It will take few minutes to create the cluster.

Используйте следующие параметры:Use these settings:

ПараметрSetting Применяется кApplies to ЗначениеValue
Имя кластераCluster name всегдаalways yourclusternameyourclustername
Среда выполнения DatabricksDatabricks Runtime всегдаalways Любая среда выполнения, не относящаяся к Машинному обучению (версии 4.x, 5.x)Any non ML runtime (non ML 4.x, 5.x)
Версия PythonPython version всегдаalways 33
Рабочие ролиWorkers всегдаalways 2 или больше2 or higher
Типы виртуальных машин узла рабочей ролиWorker node VM types
(определяет максимальное количество параллельных итераций)(determines max # of concurrent iterations)
Автоматическое Машинное обучениеAutomated ML
Толькоonly
Предпочитается виртуальная машина, оптимизированная для операций в памятиMemory optimized VM preferred
Включение автомасштабированияEnable Autoscaling Автоматическое Машинное обучениеAutomated ML
Толькоonly
Снять пометкуUncheck

Дождитесь запуска кластера, прежде чем продолжать.Wait until the cluster is running before proceeding further.

Установка правильного пакета SDK в библиотеке DatabricksInstall the correct SDK into a Databricks library

После запуска кластера создать библиотеку для присоединения к кластеру соответствующий пакет SDK для Azure Machine Learning пакет.Once the cluster is running, create a library to attach the appropriate Azure Machine Learning SDK package to your cluster.

  1. Выберите только один параметр (другие Установка пакета SDK не поддерживаются)Choose only one option (no other SDK installation are supported)

    Пакет SDK для пакета дополненияSDK package extras ИсточникSource PyPi имя      PyPi Name      
    Для DatabricksFor Databricks Отправка Python Egg или PyPIUpload Python Egg or PyPI azureml-sdk[databricks]azureml-sdk[databricks]
    Для Databricks - with-For Databricks -with-
    возможности автоматического машинного Обученияautomated ML capabilities
    Отправка Python Egg или PyPIUpload Python Egg or PyPI azureml-sdk[automl_databricks]azureml-sdk[automl_databricks]

    Предупреждение

    Нет других дополнения пакета SDK можно установить.No other SDK extras can be installed. Выберите только один из перечисленных параметров [databricks] или [automl_databricks].Choose only one of the preceding options [databricks] or [automl_databricks].

    • Не устанавливайте автоматически присоединяются к всех кластеров.Do not select Attach automatically to all clusters.
    • Выберите Attach рядом с именем кластера.Select Attach next to your cluster name.
  2. Отслеживание ошибок, пока состояние не изменится на Attached, которая может занять несколько минут.Monitor for errors until status changes to Attached, which may take several minutes. Если этот шаг завершается ошибкой, проверьте следующее:If this step fails, check the following:

    Попробуйте перезапустить кластера путем:Try restarting your cluster by:

    1. В левой области щелкните Кластеры.In the left pane, select Clusters.
    2. Выберите имя кластера в таблице.In the table, select your cluster name.
    3. На вкладке Библиотеки щелкните Перезапустить.On the Libraries tab, select Restart.

    Также рассмотрите возможность:Also consider:

    • Некоторые пакеты, такие как psutil, может приводить к конфликтам Databricks во время установки.Some packages, such as psutil, can cause Databricks conflicts during installation. Чтобы избежать подобных ошибок, установите пакеты, закрепление версии lib, такие как pstuil cryptography==1.5 pyopenssl==16.0.0 ipython==2.2.0.To avoid such errors, install packages by freezing lib version, such as pstuil cryptography==1.5 pyopenssl==16.0.0 ipython==2.2.0.
    • Или, если у вас есть более старые версии SDK, отменить его выбор из установленных библиотек кластера и переместить в корзину.Or, if you have an old SDK version, deselect it from cluster’s installed libs and move to trash. Установите новую версию пакета SDK и перезапустите кластер.Install the new SDK version and restart the cluster. Если после этого возникнет проблема, отсоедините и заново присоедините кластер.If there is an issue after this, detach and reattach your cluster.

Если установка выполнена успешно, импортированную библиотеку должна выглядеть как одна из них:If install was successful, the imported library should look like one of these:

Пакет SDK для Databricks без автоматической машинного обучения машины обучения пакет SDK Azure для DatabricksSDK for Databricks without automated machine learning Azure Machine Learning SDK for Databricks

Пакет SDK для Databricks WITH автоматической машинного обучения пакет SDK с автоматической машинного обучения, которые установлены в DatabricksSDK for Databricks WITH automated machine learning SDK with automated machine learning installed on Databricks

Начать просмотрStart exploring

Попробуйте продукт:Try it out:

Создание файла конфигурации рабочей областиCreate a workspace configuration file

Файл конфигурации рабочей области — это JSON-файл, который используется пакетом SDK для обмена данными с рабочей областью Службы машинного обучения Azure.The workspace configuration file is a JSON file that tells the SDK how to communicate with your Azure Machine Learning service workspace. В этого файла config.json следующий формат:The file is named config.json, and it has the following format:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Этот JSON-файл должен находиться в структуре каталогов, которые содержат сценарии Python или приложения Jupyter Notebook.This JSON file must be in the directory structure that contains your Python scripts or Jupyter Notebooks. Он может находиться в том же каталоге, подкаталоге с именем aml_config или родительском каталоге.It can be in the same directory, a subdirectory named aml_config, or in a parent directory.

Чтобы использовать этот файл в коде, выполните ws=Workspace.from_config().To use this file from your code, use ws=Workspace.from_config(). Этот код загружает данные из файла и подключается к рабочей области.This code loads the information from the file and connects to your workspace.

Существует три способа создать файл конфигурации.You can create the configuration file in three ways:

  • Следуйте указаниям в статье Краткое руководство. Начало работы со Службой машинного обучения Azure с помощью портала Azure. Файл config.json создается в вашей библиотеке Записных книжек Azure.Follow the Azure Machine Learning quickstart: A config.json file is created in your Azure Notebooks library. Файл содержит сведения о конфигурации вашей рабочей области.The file contains the configuration information for your workspace. Вы можете скачать или скопировать файл config.json в другие среды разработки.You can download or copy the config.json to other development environments.

  • Создайте файл вручную. В этом случае используйте текстовый редактор.Create the file manually: With this method, you use a text editor. Для этого найдите значения, передаваемые в файл конфигурации, перейдя в рабочую область на портале Azure.You can find the values that go into the configuration file by visiting your workspace in the Azure portal. Скопируйте имя рабочей области, группу ресурсов и идентификатор подписки, чтобы использовать в файле конфигурации.Copy the workspace name, resource group, and subscription ID values and use them in the configuration file.

    Портал Azure

  • Создайте файл программными средствами. С помощью следующего фрагмента кода вы подключаетесь к рабочей области, указав идентификатор подписки, группу ресурсов и имя рабочей области.Create the file programmatically: In the following code snippet, you connect to a workspace by providing the subscription ID, resource group, and workspace name. Затем конфигурация рабочей области будет сохранена в файле.It then saves the workspace configuration to the file:

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

    Этот код записывает файл конфигурации в файл aml_config/config.json.This code writes the configuration file to the aml_config/config.json file.

Дальнейшие действияNext steps