Настройка среды разработки для Машинного обучения AzureConfigure a development environment for Azure Machine Learning

Применимо к: даБазовый выпуск даКорпоративный выпуск                    (Обновление до выпуска "Корпоративный")APPLIES TO: yesBasic edition yesEnterprise edition                    (Upgrade to Enterprise edition)

Из этой статьи вы узнаете, как настроить среду разработки для работы с Машинное обучение Azure.In this article, you learn how to configure a development environment to work with Azure Machine Learning. Машинное обучение Azure не зависит от платформы.Azure Machine Learning is platform agnostic. Единственным жестким требованием для среды разработки является Python 3.The only hard requirement for your development environment is Python 3. Также рекомендуется использовать изолированную среду, например Anaconda или Virtualenv.An isolated environment like Anaconda or Virtualenv is also recommended.

В следующей таблице показаны все среды разработки, описываемые в этой статье, а также достоинства и недостатки.The following table shows each development environment covered in this article, along with pros and cons.

СредаEnvironment ПреимуществаPros НедостаткиCons
Облачная виртуальная машина Машинное обучение Azure NotebookCloud-based Azure Machine Learning Notebook VM Самый простой способ начать работу.Easiest way to get started. В виртуальной машине рабочей области уже установлен весь пакет SDK, а учебные материалы для записных книжек предварительно клонированы и готовы к выполнению.The entire SDK is already installed in your workspace VM, and notebook tutorials are pre-cloned and ready to run. Отсутствие контроля над средой разработки и зависимостями.Lack of control over your development environment and dependencies. Дополнительные затраты на виртуальную машину Linux (виртуальную машину можно остановить, когда она не используется, чтобы избежать расходов).Additional cost incurred for Linux VM (VM can be stopped when not in use to avoid charges). См. сведения о ценах.See pricing details.
Локальная средаLocal environment Полный контроль над средой разработки и зависимостями.Full control of your development environment and dependencies. Запустите с любым инструментом сборки, средой или интегрированной средой разработки.Run with any build tool, environment, or IDE of your choice. Приступая к работе, занимает больше времени.Takes longer to get started. Необходимо установить необходимые пакеты SDK, а также установить среду, если у вас ее еще нет.Necessary SDK packages must be installed, and an environment must also be installed if you don't already have one.
Azure DatabricksAzure Databricks Идеально подходит для выполнения крупномасштабных рабочих процессов машинного обучения на масштабируемой Apache Sparkной платформе.Ideal for running large-scale intensive machine learning workflows on the scalable Apache Spark platform. Избыточное для экспериментального машинного обучения, а также экспериментов и рабочих процессов с меньшим масштабом.Overkill for experimental machine learning, or smaller-scale experiments and workflows. Дополнительные затраты, вызванные Azure Databricks.Additional cost incurred for Azure Databricks. См. сведения о ценах.See pricing details.
Виртуальная машина для обработки и анализа данных (DSVM)The Data Science Virtual Machine (DSVM) Аналогично облачной виртуальной машине записной книжки (Python и пакет SDK предварительно установлены), но с предварительно установленными дополнительными популярными средствами обработки и анализа данных и машинного обучения.Similar to the cloud-based Notebook VM (Python and the SDK are pre-installed), but with additional popular data science and machine learning tools pre-installed. Простота масштабирования и объединения с другими пользовательскими инструментами и рабочими процессами.Easy to scale and combine with other custom tools and workflows. Более медленный запуск по сравнению с виртуальной машиной записной книжки на основе облака.A slower getting started experience compared to the cloud-based Notebook VM.

В этой статье также приводятся дополнительные советы по использованию следующих средств:This article also provides additional usage tips for the following tools:

  • Записные книжки Jupyter. Если вы уже используете Jupyter Notebook, пакет SDK будет иметь несколько дополнительных средств, которые следует установить.Jupyter Notebooks: If you're already using the Jupyter Notebook, the SDK has some extras that you should install.

  • Visual Studio Code. при использовании Visual Studio Code расширение машинное обучение Azure включает расширенную языковую поддержку для Python, а также функции, позволяющие работать с машинное обучение Azure гораздо более удобной и продуктивной.Visual Studio Code: If you use Visual Studio Code, the Azure Machine Learning extension includes extensive language support for Python as well as features to make working with the Azure Machine Learning much more convenient and productive.

Предварительные требованияPrerequisites

Рабочая область машинного обучения Azure.An Azure Machine Learning workspace. Сведения о создании рабочей области см. в статье создание машинное обучение Azure рабочей области.To create the workspace, see Create an Azure Machine Learning workspace. Рабочая область — это все, что нужно для начала работы с вашим собственным облачным сервером записных книжек, DSVMили Azure Databricks.A workspace is all you need to get started with your own cloud-based notebook server, a DSVM, or Azure Databricks.

Чтобы установить среду пакета SDK для локального компьютера, необходимо также Jupyter Notebook сервер или Visual Studio Code :To install the SDK environment for your local computer, Jupyter Notebook server or Visual Studio Code you also need:

  • Диспетчер пакетов Anaconda или Miniconda .Either the Anaconda or Miniconda package manager.

  • В Linux или macOS вам понадобится оболочка bash.On Linux or macOS, you need the bash shell.

    Совет

    Если в Linux или macOS вы используете оболочку, отличающуюся от bash (например, zsh), при выполнении некоторых команд могут возникнуть ошибки.If you're on Linux or macOS and use a shell other than bash (for example, zsh) you might receive errors when you run some commands. Чтобы решить эту проблему, используйте команду bash, чтобы запустить bash и выполните там нужные команды.To work around this problem, use the bash command to start a new bash shell and run the commands there.

  • В Windows вам понадобится командная строка по умолчанию или командная строка Anaconda (устанавливается вместе с Anaconda и Miniconda).On Windows, you need the command prompt or Anaconda prompt (installed by Anaconda and Miniconda).

Ваша собственная облачная виртуальная машина записной книжкиYour own cloud-based Notebook VM

Виртуальная машина Машинное обучение Azure Notebook — это безопасная облачная Рабочая станция Azure, которая предоставляет специалистам по обработке и анализу данных Jupyter портативный компьютер, JupyterLab и полностью подготовленную среду машинного обучения.The Azure Machine Learning Notebook VM is a secure, cloud-based Azure workstation that provides data scientists with a Jupyter notebook server, JupyterLab, and a fully prepared ML environment.

Виртуальная машина записной книжки:The Notebook VM is:

Нет ничего для установки или настройки для вычислительного экземпляра.There is nothing to install or configure for a compute instance. Создайте его в рабочей области Машинное обучение Azure в любое время.Create one anytime from within your Azure Machine Learning workspace. Укажите только имя и укажите тип виртуальной машины Azure.Provide just a name and specify an Azure VM type. Попробуйте сейчас с помощью этого учебника: Настройка среды и рабочей области.Try it now with this Tutorial: Setup environment and workspace.

Чтобы предотвратить выплату за использование, необходимо отключить виртуальную машину записной книжки.To stop incurring compute charges, stop the Notebook VM.

Виртуальная машина для обработки и анализа данныхData Science Virtual Machine

DSVM — это настраиваемый образ виртуальной машины.The DSVM is a customized virtual machine (VM) image. Он предназначен для обработки и анализа данных, и на нем предварительно настроены:It's designed for data science work that's pre-configured with:

  • пакеты TensorFlow, PyTorch, Scikit-learn, XGBoost и пакет SDK для Машинного обучения Azure;Packages such as TensorFlow, PyTorch, Scikit-learn, XGBoost, and the Azure Machine Learning SDK
  • популярные инструменты для обработки и анализа данных, в том числе изолированная среда Spark и Drill;Popular data science tools such as Spark Standalone and Drill
  • инструменты Azure, такие как интерфейс командной строки Azure, AzCopy и Обозреватель службы хранилища;Azure tools such as the Azure CLI, AzCopy, and Storage Explorer
  • интегрированные среды разработки, например Visual Studio Code и PyCharm;Integrated development environments (IDEs) such as Visual Studio Code and PyCharm
  • Сервер Jupyter Notebook.Jupyter Notebook Server

Пакет SDK для Машинного обучения Azure работает с версией DSVM для Ubuntu или Windows.The Azure Machine Learning SDK works on either the Ubuntu or Windows version of the DSVM. Но если вы также планируете использовать Виртуальную машину для обработки и анализа данных в качестве цели для вычислений, это возможно только на Ubuntu.But if you plan to use the DSVM as a compute target as well, only Ubuntu is supported.

Чтобы использовать DSVM в качестве среды разработки:To use the DSVM as a development environment:

  1. Создайте DSVM в любой из следующих сред:Create a DSVM in either of the following environments:

    • На портале Azure:The Azure portal:

    • Интерфейс командной строки Azure:The Azure CLI:

      Важно!

      • Чтобы использовать Azure CLI, нужно сначала войти в подписку Azure с помощью команды az login.When you use the Azure CLI, you must first sign in to your Azure subscription by using the az login command.

      • При использовании команд на этом шаге необходимо указать имя группы ресурсов, имя виртуальной машины, имя пользователя и пароль.When you use the commands in this step, you must provide a resource group name, a name for the VM, a username, and a password.

      • Чтобы создать DSVM на платформе Ubuntu, воспользуйтесь приведенной ниже командой.To create an Ubuntu Data Science Virtual Machine, use the following command:

        # create a Ubuntu DSVM in your resource group
        # note you need to be at least a contributor to the resource group in order to execute this command successfully
        # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
        az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
        
      • Чтобы создать DSVM на платформе Windows, воспользуйтесь приведенной ниже командой.To create a Windows Data Science Virtual Machine, use the following command:

        # create a Windows Server 2016 DSVM in your resource group
        # note you need to be at least a contributor to the resource group in order to execute this command successfully
        az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
        
  2. Пакет SDK для Машинного обучения Azure уже установлен в DSVM.The Azure Machine Learning SDK is already installed on the DSVM. Чтобы использовать среду Conda, которая содержит пакет SDK, используйте одну из следующих команд:To use the Conda environment that contains the SDK, use one of the following commands:

    • Виртуальная машина для обработки и анализа данных под управлением Ubuntu:For Ubuntu DSVM:

      conda activate py36
      
    • Виртуальная машина для обработки и анализа данных под управлением Windows:For Windows DSVM:

      conda activate AzureML
      
  3. Чтобы убедиться, у вас есть доступ к пакету SDK и проверить версию, используйте следующий код Python:To verify that you can access the SDK and check the version, use the following Python code:

    import azureml.core
    print(azureml.core.VERSION)
    
  4. Сведения о настройке DSVM для использования рабочей области Машинное обучение Azure см. в разделе Создание файла конфигурации рабочей области .To configure the DSVM to use your Azure Machine Learning workspace, see the Create a workspace configuration file section.

Дополнительные сведения о Виртуальных машинах для обработки и анализа данных см. здесь.For more information, see Data Science Virtual Machines.

Локальный компьютерLocal computer

Если вы используете локальный компьютер (который может также быть удаленной виртуальной машиной), создайте среду Anaconda и установите пакет SDK.When you're using a local computer (which might also be a remote virtual machine), create an Anaconda environment and install the SDK. Ниже приведен пример:Here's an example:

  1. Скачайте и установите Anaconda (версия Python 3,7), если у вас ее еще нет.Download and install Anaconda (Python 3.7 version) if you don't already have it.

  2. Откройте командную строку Anaconda и создайте среду с помощью следующих команд:Open an Anaconda prompt and create an environment with the following commands:

    Выполните следующую команду, чтобы создать среду.Run the following command to create the environment.

    conda create -n myenv python=3.6.5
    

    Затем активируйте среду.Then activate the environment.

    conda activate myenv
    

    В этом примере создается среда с помощью Python 3.6.5, но можно выбрать любые конкретные версии.This example creates an environment using python 3.6.5, but any specific subversions can be chosen. Совместимость с пакетом SDK может быть не гарантирована с определенными основными версиями (рекомендуется 3.5). при возникновении ошибок рекомендуется попробовать другую версию или подверсию в среде Anaconda.SDK compatibility may not be guaranteed with certain major versions (3.5+ is recommended), and it's recommended to try a different version/subversion in your Anaconda environment if you run into errors. Скачивание компонентов и пакетов и последующее создание среды займет несколько минут.It will take several minutes to create the environment while components and packages are downloaded.

  3. Выполните следующие команды в новой среде, чтобы включить зависящие от среды ядра IPython Notebook.Run the following commands in your new environment to enable environment-specific ipython kernels. Это обеспечит ожидаемое поведение при импорте ядра и пакета при работе с записными книжками Jupyter в средах Anaconda:This will ensure expected kernel and package import behavior when working with Jupyter Notebooks within Anaconda environments:

    conda install notebook ipykernel
    

    Затем выполните следующую команду, чтобы создать ядро:Then run the following command to create the kernel:

    ipython kernel install --user
    
  4. Для установки пакетов используйте следующие команды:Use the following commands to install packages:

    Эта команда устанавливает базовый пакет SDK Машинное обучение Azure с записной книжкой и automl дополнительными данными.This command installs the base Azure Machine Learning SDK with notebook and automl extras. automl дополнительный — это большая установка, которую можно удалить из квадратных скобок, если вы не планируете выполнять автоматические эксперименты машинного обучения.The automl extra is a large install, and can be removed from the brackets if you don't intend to run automated machine learning experiments. automl дополнительно включает в себя Машинное обучение Azure пакет SDK для подготовки данных по умолчанию в качестве зависимости.The automl extra also includes the Azure Machine Learning Data Prep SDK by default as a dependency.

    pip install azureml-sdk[notebooks,automl]
    

    Примечание

    • Если появится сообщение о том, что не удается удалить PyYAML, попробуйте использовать другую команду:If you get a message that PyYAML can't be uninstalled, use the following command instead:

      pip install --upgrade azureml-sdk[notebooks,automl] --ignore-installed PyYAML

    • Начиная с macOS Catalina, ЗШ (оболочка Z) является оболочкой входа по умолчанию и интерактивной оболочкой.Starting with macOS Catalina, zsh (Z shell) is the default login shell and interactive shell. В ЗШ используйте следующую команду, управляющую скобками с "\" (обратная косая черта):In zsh, use the following command which escapes brackets with "\" (backslash):

      pip install --upgrade azureml-sdk\[notebooks,automl\]

    Установка пакета SDK займет несколько минут.It will take several minutes to install the SDK. Дополнительные сведения о параметрах установки см. в разделе руководства по установке.For more information on installation options, see the install guide.

  5. Установите другие пакеты для экспериментов машинного обучения.Install other packages for your machine learning experimentation.

    Используйте одну из следующих команд и замените <новый пакет > пакетом, который необходимо установить.Use either of the following commands and replace <new package> with the package you want to install. Установка пакетов с помощью conda install требует, чтобы пакет был частью текущих каналов (новые каналы можно добавить в Anaconda Cloud).Installing packages via conda install requires that the package is part of the current channels (new channels can be added in Anaconda Cloud).

    conda install <new package>
    

    Кроме того, пакеты можно устанавливать с помощью pip.Alternatively, you can install packages via pip.

    pip install <new package>
    

Приложения Jupyter NotebookJupyter Notebooks

Приложения Jupyter Notebook предоставляются компанией Project Jupyter.Jupyter Notebooks are part of the Jupyter Project. Это решение предназначено для реализации интерактивного процесса кодирования, в котором создаются документы с динамическим кодом, описательным текстом и графикой.They provide an interactive coding experience where you create documents that mix live code with narrative text and graphics. Приложения Jupyter Notebook также позволяют использовать результаты вашей работы совместно с другими пользователями, так как вы можете сохранять выходные данные разделов кода в документе.Jupyter Notebooks are also a great way to share your results with others, because you can save the output of your code sections in the document. Jupyter Notebook можно устанавливать на различных платформах.You can install Jupyter Notebooks on a variety of platforms.

Процедура, описанная в разделе локальный компьютер , устанавливает необходимые компоненты для запуска записных книжек Jupyter в среде Anaconda.The procedure in the Local computer section installs necessary components for running Jupyter Notebooks in an Anaconda environment.

Чтобы включить эти компоненты в среде Jupyter Notebook, выполните следующие действия.To enable these components in your Jupyter Notebook environment:

  1. Откройте запрос Anaconda и активируйте среду.Open an Anaconda prompt and activate your environment.

    conda activate myenv
    
  2. Клонирование репозитория GitHub для набора примеров записных книжек.Clone the GitHub repository for a set of sample notebooks.

    git clone https://github.com/Azure/MachineLearningNotebooks.git
    
  3. Запустите сервер Jupyter Notebook с помощью следующей команды:Launch the Jupyter Notebook server with the following command:

    jupyter notebook
    
  4. Чтобы убедиться, что Jupyter Notebook может использовать пакет SDK, создайте новую записную книжку, выберите Python 3 в качестве ядра, а затем выполните следующую команду в ячейке записной книжки:To verify that Jupyter Notebook can use the SDK, create a New notebook, select Python 3 as your kernel, and then run the following command in a notebook cell:

    import azureml.core
    azureml.core.VERSION
    
  5. Если возникли проблемы при импорте модулей и получении ModuleNotFoundError, убедитесь, что ядро Jupyter подключено к правильному пути для вашей среды, выполнив следующий код в ячейке записной книжки.If you encounter issues importing modules and receive a ModuleNotFoundError, ensure your Jupyter kernel is connected to the correct path for your environment by running the following code in a Notebook cell.

    import sys
    sys.path
    
  6. Чтобы настроить Jupyter Notebook для использования рабочей области Машинное обучение Azure, перейдите к разделу Создание файла конфигурации рабочей области .To configure the Jupyter Notebook to use your Azure Machine Learning workspace, go to the Create a workspace configuration file section.

Visual Studio CodeVisual Studio Code

Visual Studio Code — очень популярный редактор межплатформенного кода, поддерживающий обширный набор языков программирования и средств с помощью расширений, доступных в Visual Studio Marketplace.Visual Studio Code is a very popular cross platform code editor that supports an extensive set of programming languages and tools through extensions available in the Visual Studio marketplace. Расширение машинное обучение Azure устанавливает расширение Python для кодирования во всех типах окружений Python (Virtual, Anaconda и т. д.).The Azure Machine Learning extension installs the Python extension for coding in all types of Python environments (virtual, Anaconda, etc.). Кроме того, он предоставляет удобные возможности для работы с Машинное обучение Azure ресурсами и выполнения Машинное обучение Azure экспериментов, не открывая Visual Studio Code.In addition, it provides convenience features for working with Azure Machine Learning resources and running Azure Machine Learning experiments all without leaving Visual Studio Code.

Использование Visual Studio Code для разработки:To use Visual Studio Code for development:

  1. Установка расширения Машинное обучение Azure для Visual Studio Code см. в разделе машинное обучение Azure.Install the Azure Machine Learning extension for Visual Studio Code, see Azure Machine Learning.

    Дополнительные сведения см. в статье Приступая к работе с Azure Machine Learning for Visual Studio Code.For more information, see Use Azure Machine Learning for Visual Studio Code.

  2. Сведения об использовании Visual Studio Code для любого типа разработки на Python см. в статье Начало работы с Python в VSCode.Learn how to use Visual Studio Code for any type of Python development, see Get started with Python in VSCode.

    • Чтобы выбрать среду пакета SDK Python, содержащую пакет SDK, откройте VS Code, а затем нажмите клавиши CTRL + SHIFT + P (Linux и Windows) или Command + Shift + P (Mac).To select the SDK Python environment containing the SDK, open VS Code, and then select Ctrl+Shift+P (Linux and Windows) or Command+Shift+P (Mac).

      • Откроется Палитра команд .The Command Palette opens.
    • Введите Python: выберите интерпретатор, а затем выберите соответствующую среду.Enter Python: Select Interpreter, and then select the appropriate environment

  3. Чтобы проверить, можно использовать пакет SDK, создайте новый файл Python (. Копировать), содержащий следующий код:To validate that you can use the SDK, create a new Python file (.py) that contains the following code:

    #%%
    import azureml.core
    azureml.core.VERSION
    

    Запустите этот код, щелкнув CodeLens "выполнить ячейку" или просто нажмите клавиши SHIFT + ВВОД.Run this code by clicking the "Run cell" CodeLens or simply press shift-enter.

Azure DatabricksAzure Databricks

Azure Databricks — это среда на основе Apache Spark в облаке Azure.Azure Databricks is an Apache Spark-based environment in the Azure cloud. Она предоставляет среду для совместной работы на основе записных книжек с вычислительным кластером на основе ЦП или GPU.It provides a collaborative Notebook-based environment with CPU or GPU-based compute cluster.

Как Azure Databricks работает с Машинное обучение Azure:How Azure Databricks works with Azure Machine Learning:

Настройка кластера кирпичей данныхSet up your Databricks cluster

Создание кластера кирпичей.Create a Databricks cluster. Некоторые параметры применяются только в том случае, если пакет SDK устанавливается для автоматического машинного обучения в модулях.Some settings apply only if you install the SDK for automated machine learning on Databricks. Создание кластера займет несколько минут.It will take few minutes to create the cluster.

Используйте следующие параметры:Use these settings:

НастройкаSetting Применяется кApplies to ЗначениеValue
Имя кластераCluster name Постоянноalways yourclusternameyourclustername
Среда выполнения DatabricksDatabricks Runtime Постоянноalways Среда выполнения, не поддерживающая ML 6,0 (Scala 2,11, Spark 2.4.3)Non-ML Runtime 6.0 (scala 2.11, spark 2.4.3)
Версия PythonPython version Постоянноalways 33
Рабочие ролиWorkers Постоянноalways 2 или больше2 or higher
Типы виртуальных машин узла рабочей ролиWorker node VM types
(определяет максимальное число одновременных итераций)(determines max # of concurrent iterations)
Автоматическое Машинное обучениеAutomated ML
толькоonly
Предпочитается виртуальная машина, оптимизированная для операций в памятиMemory optimized VM preferred
Включение автомасштабированияEnable Autoscaling Автоматическое Машинное обучениеAutomated ML
толькоonly
Снять пометкуUncheck

Дождитесь запуска кластера, прежде чем продолжать.Wait until the cluster is running before proceeding further.

Установка правильного пакета SDK в библиотеке кирпичейInstall the correct SDK into a Databricks library

После запуска кластера Создайте библиотеку , чтобы присоединить соответствующий пакет SDK машинное обучение Azure к кластеру.Once the cluster is running, create a library to attach the appropriate Azure Machine Learning SDK package to your cluster.

  1. Щелкните правой кнопкой мыши текущую папку рабочей области, в которой нужно сохранить библиотеку.Right-click the current Workspace folder where you want to store the library. Выберите создать библиотеку > .Select Create > Library.

  2. Выберите только один вариант (другие установки пакета SDK не поддерживаются).Choose only one option (no other SDK installation are supported)

    Дополнительный пакет SDK  SDK package extras ИсточникSource PyPi имя      PyPi Name      
    Для кирпичейFor Databricks Отправка Python Egg или PyPIUpload Python Egg or PyPI azureml-sdk[databricks]azureml-sdk[databricks]
    Для кирпичей с-For Databricks -with-
    возможности автоматического MLautomated ML capabilities
    Отправка Python Egg или PyPIUpload Python Egg or PyPI azureml-SDK [аутомл]azureml-sdk[automl]

    Предупреждение

    Другие дополнительные компоненты SDK устанавливаться не могут.No other SDK extras can be installed. Выберите только один из указанных выше параметров [кирпичы данных] или [аутомл].Choose only one of the preceding options [databricks] or [automl].

    • Не выбирайте Автоматическое присоединение ко всем кластерам.Do not select Attach automatically to all clusters.
    • Выберите присоединить рядом с именем кластера.Select Attach next to your cluster name.
  3. Отслеживать ошибки до тех пор, пока состояние не изменится на " подключено", что может занять несколько минут.Monitor for errors until status changes to Attached, which may take several minutes. Если этот шаг завершается ошибкой:If this step fails:

    Попробуйте перезапустить кластер, выполнив следующие действия.Try restarting your cluster by:

    1. В левой области щелкните Кластеры.In the left pane, select Clusters.
    2. Выберите имя кластера в таблице.In the table, select your cluster name.
    3. На вкладке Библиотеки щелкните Перезапустить.On the Libraries tab, select Restart.

    Также учитывайте следующее.Also consider:

    • В Аутомл config при использовании Azure Databricks добавьте следующие параметры:In AutoML config, when using Azure Databricks add the following parameters:
      1. max_concurrent_iterations зависит от количества рабочих узлов в кластере.max_concurrent_iterations is based on number of worker nodes in your cluster.
      2. spark_context=sc основан на контексте Spark по умолчанию.spark_context=sc is based on the default spark context.
    • Если у вас старая версия пакета SDK, отмените ее выбор из установленных библиотек кластера и перейдите в корзину.Or, if you have an old SDK version, deselect it from cluster’s installed libs and move to trash. Установите новую версию пакета SDK и перезапустите кластер.Install the new SDK version and restart the cluster. Если после перезагрузки возникла ошибка, отключите и повторно подключите кластер.If there is an issue after the restart, detach and reattach your cluster.

Если установка прошла успешно, Импортированная библиотека должна выглядеть следующим образом:If install was successful, the imported library should look like one of these:

Пакет SDK для блоков  без автоматического машинного обучения машинное обучение Azure SDK для кирпичейSDK for Databricks without automated machine learning Azure Machine Learning SDK for Databricks

Пакет SDK для кирпичей с автоматическим машинным обучением SDK с автоматическим машинным обучением, установленным на модуляхSDK for Databricks WITH automated machine learning SDK with automated machine learning installed on Databricks

Начать изучениеStart exploring

Попробуйте:Try it out:

Создание файла конфигурации рабочей областиCreate a workspace configuration file

Файл конфигурации рабочей области — это JSON-файл, который сообщает пакету SDK, как взаимодействовать с рабочей областью Машинное обучение Azure.The workspace configuration file is a JSON file that tells the SDK how to communicate with your Azure Machine Learning workspace. В этого файла config.json следующий формат:The file is named config.json, and it has the following format:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Этот JSON-файл должен находиться в структуре каталогов, которые содержат сценарии Python или приложения Jupyter Notebook.This JSON file must be in the directory structure that contains your Python scripts or Jupyter Notebooks. Он может находиться в том же каталоге, подкаталоге с именем .azureml или родительском каталоге.It can be in the same directory, a subdirectory named .azureml, or in a parent directory.

Чтобы использовать этот файл в коде, выполните ws=Workspace.from_config().To use this file from your code, use ws=Workspace.from_config(). Этот код загружает данные из файла и подключается к рабочей области.This code loads the information from the file and connects to your workspace.

Существует три способа создать файл конфигурации.You can create the configuration file in three ways:

  • Используйте WS. write_config : для записи файла config. JSON .Use ws.write_config: to write a config.json file. Файл содержит сведения о конфигурации вашей рабочей области.The file contains the configuration information for your workspace. Вы можете скачать или скопировать файл config.json в другие среды разработки.You can download or copy the config.json to other development environments.

  • Скачайте файл: в портал Azureвыберите скачать config. JSON в разделе Обзор рабочей области.Download the file: In the Azure portal, select Download config.json from the Overview section of your workspace.

    Портал Azure

  • Создайте файл программно: в следующем фрагменте кода подключитесь к рабочей области, указав идентификатор подписки, группу ресурсов и имя рабочей области.Create the file programmatically: In the following code snippet, you connect to a workspace by providing the subscription ID, resource group, and workspace name. Затем конфигурация рабочей области будет сохранена в файле.It then saves the workspace configuration to the file:

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

    Этот код записывает файл конфигурации в файл . azureml/config. JSON .This code writes the configuration file to the .azureml/config.json file.

Дальнейшие действияNext steps