Настройка среды разработки для Машинного обучения AzureConfigure a development environment for Azure Machine Learning

В этой статье описано, как настроить среду разработки для работы со Службой машинного обучения Azure.In this article, you learn how to configure a development environment to work with Azure Machine Learning service. Служба машинного обучения не зависит от платформы.Machine Learning service is platform agnostic.

Единственное требование для среды разработки — Python 3, Anaconda (для изолированных средах) и файл конфигурации, который содержит сведения о рабочей области машинного обучения Azure.The only requirements for your development environment are Python 3, Anaconda (for isolated environments), and a configuration file that contains your Azure Machine Learning workspace information.

В этой статье описаны следующие среды и средства.This article focuses on the following environments and tools:

  • Собственные записной книжки на основе облака виртуальной Машины: Используйте вычислительных ресурсов в рабочей станции для запуска записные книжки Jupyter.Your own cloud-based notebook VM: Use a compute resource in your workstation to run Jupyter notebooks. Это самый простой способ начать работу, так как пакет SDK для Машинного обучения Azure уже установлен.It's the easiest way to get started, because the Azure Machine Learning SDK is already installed.

  • Виртуальная машина для обработки и анализа данных (DSVM). Предварительно настроенная среда для разработки и экспериментов в облаке Azure, которая предназначена для обработки и анализа данных и может быть развернута как на экземплярах виртуальных машин на основе ЦП, так и на экземплярах виртуальных машин на основе GPU.The Data Science Virtual Machine (DSVM): A pre-configured development or experimentation environment in the Azure cloud that's designed for data science work and can be deployed to either CPU only VM instances or GPU-based instances. Установленные Python 3, Conda, приложения Jupyter Notebook и пакет SDK для Машинного обучения Azure.Python 3, Conda, Jupyter Notebooks, and the Azure Machine Learning SDK are already installed. Виртуальная машина предоставляется с популярными платформами машинного или глубокого обучения, а также с инструментами и редакторами для разработки решений машинного обучения.The VM comes with popular machine learning and deep learning frameworks, tools, and editors for developing machine learning solutions. Это, вероятно, самая многофункциональная среда разработки для машинного обучения на платформе Azure.It's probably the most complete development environment for machine learning on the Azure platform.

  • Jupyter Notebook. Если вы уже используете Jupyter Notebook, вам нужно установить некоторые вспомогательные компоненты, которые содержит пакет SDK.The Jupyter Notebook: If you're already using the Jupyter Notebook, the SDK has some extras that you should install.

  • Visual Studio Code. Если вы используете Visual Studio Code, то вы можете установить некоторые полезные расширения.Visual Studio Code: If you use Visual Studio Code, it has some useful extensions that you can install.

  • Azure Databricks. Популярная платформа для аналитики данных на основе Apache Spark.Azure Databricks: A popular data analytics platform that's based on Apache Spark. Узнайте, как установить пакет SDK для Машинного обучения Azure в кластере, чтобы получить возможность развертывать модели.Learn how to get the Azure Machine Learning SDK onto your cluster so that you can deploy models.

  • Записные книжки Azure. Служба Jupyter Notebook, размещенная в облаке Azure.Azure Notebooks: A Jupyter Notebooks service that's hosted in the Azure cloud. Также легко приступить к работе, так как уже установлен пакет SDK Azure Machine Learning.Also an easy way to get started, because the Azure Machine Learning SDK is already installed.

Если у вас уже есть среда Python 3, или вам нужно выполнить основные шаги для установки пакета SDK, см. инструкции, предназначенные для локального компьютера.If you already have a Python 3 environment, or just want the basic steps for installing the SDK, see the Local computer section.

Технические условияPrerequisites

Рабочая область службы машинного обучения Azure.An Azure Machine Learning service workspace. Чтобы создать рабочую область, см. в разделе создать рабочую область службы машинного обучения Azure.To create the workspace, see Create an Azure Machine Learning service workspace. Рабочая область — все что нужно приступить к работе с собственным сервер записных книжек на основе облака, DSVM, Azure Databricks, или записных книжек Azure.A workspace is all you need to get started with your own cloud-based notebook server, a DSVM, Azure Databricks, or Azure Notebooks.

Для установки пакета SDK для среды для вашего локального компьютера, сервер записных книжек Jupyter или Visual Studio Code необходимо также:To install the SDK environment for your local computer, Jupyter Notebook server or Visual Studio Code you also need:

  • Либо Anaconda или Miniconda диспетчера пакетов.Either the Anaconda or Miniconda package manager.

  • В Linux или macOS вам понадобится оболочка bash.On Linux or macOS, you need the bash shell.

    Совет

    Если в Linux или macOS вы используете оболочку, отличающуюся от bash (например, zsh), при выполнении некоторых команд могут возникнуть ошибки.If you're on Linux or macOS and use a shell other than bash (for example, zsh) you might receive errors when you run some commands. Чтобы решить эту проблему, используйте команду bash, чтобы запустить bash и выполните там нужные команды.To work around this problem, use the bash command to start a new bash shell and run the commands there.

  • В Windows вам понадобится командная строка по умолчанию или командная строка Anaconda (устанавливается вместе с Anaconda и Miniconda).On Windows, you need the command prompt or Anaconda prompt (installed by Anaconda and Miniconda).

Собственные облачные записной книжки виртуальной МашиныYour own cloud-based notebook VM

Виртуальная машина записной книжки (Предварительная версия) — Azure безопасные, облачной рабочей станции, предоставляются по обработке и анализу данных на сервере записной книжки Jupyter, JupyterLab и полностью подготовленные среде машинного Обучения.The notebook virtual machine (Preview) is a secure, cloud-based Azure workstation that provides data scientists with a Jupyter notebook server, JupyterLab, and a fully prepared ML environment.

Записная книжка виртуальной Машины:The notebook VM is:

  • Безопасность.Secure. Так как доступ к виртуальной Машине и записной книжки защищен HTTPS и Azure Active Directory по умолчанию, ИТ-специалисты могут легко обеспечивать единого входа и другие функции безопасности, такие как многофакторная проверка подлинности.Since VM and notebook access is secured with HTTPS and Azure Active Directory by default, IT Pros can easily enforce single sign-on and other security features such as multi-factor authentication.

  • Предварительно настроенные.Preconfigured. Эта полностью подготовиться среда машинного Обучения Python рисует его pedigree из популярных Data Science VM IaaS и включает в себя:This fully prepared Python ML environment draws its pedigree from the popular IaaS Data Science VM and includes:

    • Azure ML пакет SDK для Python (последняя версия)Azure ML Python SDK (latest)
    • Автоматическая настройка для работы с рабочей областьюAutomatic configuration to work with your workspace
    • На сервере записной книжки JupyterA Jupyter notebook server
    • Записная книжка JupyterLab интегрированной среды разработкиJupyterLab notebook IDE
    • Предварительно настроенные драйверы GPUPreconfigured GPU drivers
    • Выбор платформ глубокого обученияA selection of deep learning frameworks

    Если в код, виртуальная машина включает в себя учебники и образцы, которые облегчают изучение и узнайте, как использовать службы машинного обучения Azure.If you are into code, the VM includes tutorials and samples to help you explore and learn how to use Azure Machine Learning service. Примеры записных книжек хранятся в учетной записи хранилища BLOB-объектов Azure к рабочей области, что делает их совместного использования на виртуальных машинах.The sample notebooks are stored in the Azure Blob Storage account of your workspace making them shareable across VMs. При запуске, они также иметь доступ к хранилищам данных и вычислительные ресурсы рабочей области.When run, they also have access to the data stores and compute resources of your workspace.

  • Простая установка: Создайте в любое время с в рабочей области машинного обучения Azure.Simple setup: Create one anytime from within your Azure Machine Learning workspace. Укажите только имя и укажите тип виртуальной Машины Azure.Provide just a name and specify a Azure VM type. Попробуйте прямо сейчас с этим краткое руководство: Использование облачного сервера записных книжек для начала работы с Машинным обучением Azure.Try it now with this Quickstart: Use a cloud-based notebook server to get started with Azure Machine Learning.

  • Настраиваемые.Customizable. Во время управляемого и безопасного виртуальная машина, которая вы сохраняете полный доступ к возможностям оборудования и настройте его в ваше сердце желания.While a managed and secure VM offering, you retain full access to the hardware capabilities and customize it to your heart’s desire. Например быстро создайте последнюю версию NVidia V100 на базе виртуальной Машины, чтобы выполнить отладку пошаговые novel архитектуры нейронных сетей.For example, quickly create the latest NVidia V100 powered VM to perform step-by-step debugging of novel Neural Network architecture.

В противном случае плата за ВМ записной книжки, остановка виртуальной Машины записную книжку.To stop incurring notebook VM charges, stop the notebook VM.

Виртуальная машина для обработки и анализа данныхData Science Virtual Machine

DSVM — это настраиваемый образ виртуальной машины.The DSVM is a customized virtual machine (VM) image. Он предназначен для обработки и анализа данных, и на нем предварительно настроены:It's designed for data science work that's pre-configured with:

  • пакеты TensorFlow, PyTorch, Scikit-learn, XGBoost и пакет SDK для Машинного обучения Azure;Packages such as TensorFlow, PyTorch, Scikit-learn, XGBoost, and the Azure Machine Learning SDK
  • популярные инструменты для обработки и анализа данных, в том числе изолированная среда Spark и Drill;Popular data science tools such as Spark Standalone and Drill
  • инструменты Azure, такие как интерфейс командной строки Azure, AzCopy и Обозреватель службы хранилища;Azure tools such as the Azure CLI, AzCopy, and Storage Explorer
  • интегрированные среды разработки, например Visual Studio Code и PyCharm;Integrated development environments (IDEs) such as Visual Studio Code and PyCharm
  • Сервер Jupyter Notebook.Jupyter Notebook Server

Пакет SDK для Машинного обучения Azure работает с версией DSVM для Ubuntu или Windows.The Azure Machine Learning SDK works on either the Ubuntu or Windows version of the DSVM. Но если вы также планируете использовать Виртуальную машину для обработки и анализа данных в качестве цели для вычислений, это возможно только на Ubuntu.But if you plan to use the DSVM as a compute target as well, only Ubuntu is supported.

Чтобы использовать DSVM в качестве среды разработки, выполните следующие действия.To use the DSVM as a development environment, do the following:

  1. Создайте DSVM в любой из следующих сред:Create a DSVM in either of the following environments:

    • На портале Azure:The Azure portal:

    • Интерфейс командной строки Azure:The Azure CLI:

      Важно!

      • Чтобы использовать Azure CLI, нужно сначала войти в подписку Azure с помощью команды az login.When you use the Azure CLI, you must first sign in to your Azure subscription by using the az login command.

      • При использовании команд на этом шаге необходимо указать имя группы ресурсов, имя виртуальной машины, имя пользователя и пароль.When you use the commands in this step, you must provide a resource group name, a name for the VM, a username, and a password.

      • Чтобы создать DSVM на платформе Ubuntu, воспользуйтесь приведенной ниже командой.To create an Ubuntu Data Science Virtual Machine, use the following command:

        # create a Ubuntu DSVM in your resource group
        # note you need to be at least a contributor to the resource group in order to execute this command successfully
        # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
        az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
        
      • Чтобы создать DSVM на платформе Windows, воспользуйтесь приведенной ниже командой.To create a Windows Data Science Virtual Machine, use the following command:

        # create a Windows Server 2016 DSVM in your resource group
        # note you need to be at least a contributor to the resource group in order to execute this command successfully
        az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
        
  2. Пакет SDK для Машинного обучения Azure уже установлен в DSVM.The Azure Machine Learning SDK is already installed on the DSVM. Чтобы использовать среду Conda, которая содержит пакет SDK, используйте одну из следующих команд:To use the Conda environment that contains the SDK, use one of the following commands:

    • Виртуальная машина для обработки и анализа данных под управлением Ubuntu:For Ubuntu DSVM:

      conda activate py36
      
    • Виртуальная машина для обработки и анализа данных под управлением Windows:For Windows DSVM:

      conda activate AzureML
      
  3. Чтобы убедиться, у вас есть доступ к пакету SDK и проверить версию, используйте следующий код Python:To verify that you can access the SDK and check the version, use the following Python code:

    import azureml.core
    print(azureml.core.VERSION)
    
  4. Дополнительные сведения о настройке Виртуальной машины для обработки и анализа данных для роботы с рабочей областью Службы машинного обучения Azure см. в разделе Создание файла конфигурации рабочей области.To configure the DSVM to use your Azure Machine Learning service workspace, see the Create a workspace configuration file section.

Дополнительные сведения о Виртуальных машинах для обработки и анализа данных см. здесь.For more information, see Data Science Virtual Machines.

Локальный компьютерLocal computer

При использовании локального компьютера (который также может быть удаленной виртуальной машине), создать среду Anaconda и установить пакет SDK, сделав следующее:When you're using a local computer (which might also be a remote virtual machine), create an Anaconda environment and install the SDK by doing the following:

  1. Скачайте и установите Anaconda (версии Python 3.7) Если у вас еще нет.Download and install Anaconda (Python 3.7 version) if you don't already have it.

  2. Откройте командную строку с Anaconda и создать среду, выполнив следующие команды:Open an Anaconda prompt and create an environment with the following commands:

    Выполните следующую команду для создания среды.Run the following command to create the environment.

    conda create -n myenv python=3.6.5
    

    Затем активируйте среду.Then activate the environment.

    conda activate myenv
    

    В этом примере создается окружение с помощью python 3.6.5, но можно выбрать любой определенной subversions.This example creates an environment using python 3.6.5, but any specific subversions can be chosen. Совместимости пакета SDK может не гарантируется, с помощью некоторых основных версий (3.5 + рекомендуется), и мы рекомендуем попробовать разные версии/subversion в вашей среде Anaconda, при возникновении ошибки.SDK compatibility may not be guaranteed with certain major versions (3.5+ is recommended), and it's recommended to try a different version/subversion in your Anaconda environment if you run into errors. Скачивание компонентов и пакетов и последующее создание среды займет несколько минут.It will take several minutes to create the environment while components and packages are downloaded.

  3. Выполните следующие команды в новой среде для конкретной среды ipython ядра.Run the following commands in your new environment to enable environment-specific ipython kernels. Это обеспечит ожидаемый ядра и пакет импорта поведение, при работе с записными книжками Jupyter в средах Anaconda:This will ensure expected kernel and package import behavior when working with Jupyter Notebooks within Anaconda environments:

    conda install notebook ipykernel
    

    Затем выполните следующую команду, чтобы создать ядра:Then run the following command to create the kernel:

    ipython kernel install --user
    
  4. Чтобы установить пакеты, используйте следующие команды:Use the following commands to install packages:

    Эта команда устанавливает базовый пакет SDK Azure машины обучения с помощью записной книжки и automl дополнения.This command installs the base Azure Machine Learning SDK with notebook and automl extras. automl Очень больших установку и может быть удален из квадратные скобки, если вы не собираетесь запустить автоматические эксперименты.The automl extra is a large install, and can be removed from the brackets if you don't intend to run automated machine learning experiments. automl Дополнительных также включает пакет SDK Azure машины обучения данные подготовки по умолчанию как зависимость.The automl extra also includes the Azure Machine Learning Data Prep SDK by default as a dependency.

    pip install azureml-sdk[notebooks,automl]
    

    Используйте следующую команду для установки пакета SDK Azure Machine Learning данных подготовки сам по себе:Use this command to install the Azure Machine Learning Data Prep SDK on its own:

    pip install azureml-dataprep
    

    Примечание

    Если появится сообщение о том, что не удается удалить PyYAML, попробуйте использовать другую команду:If you get a message that PyYAML can't be uninstalled, use the following command instead:

    pip install --upgrade azureml-sdk[notebooks,automl] azureml-dataprep --ignore-installed PyYAML

    Он займет несколько минут, чтобы установить пакет SDK.It will take several minutes to install the SDK. См. в разделе руководство по установке Дополнительные сведения о вариантах установки.See the install guide for more information on installation options.

  5. Установите другие пакеты для машинного обучения "Экспериментирование".Install other packages for your machine learning experimentation.

    Используйте одну из приведенных ниже команд и замените <новый пакет > с пакет, который требуется установить.Use either of the following commands and replace <new package> with the package you want to install. Установка пакетов с помощью conda install требует, что пакет является частью текущего каналов (новые каналы могут добавляться в облаке Anaconda).Installing packages via conda install requires that the package is part of the current channels (new channels can be added in Anaconda Cloud).

    conda install <new package>
    

    Кроме того, вы можете установить пакеты через pip.Alternatively, you can install packages via pip.

    pip install <new package>
    

Приложения Jupyter NotebookJupyter Notebooks

Приложения Jupyter Notebook предоставляются компанией Project Jupyter.Jupyter Notebooks are part of the Jupyter Project. Это решение предназначено для реализации интерактивного процесса кодирования, в котором создаются документы с динамическим кодом, описательным текстом и графикой.They provide an interactive coding experience where you create documents that mix live code with narrative text and graphics. Приложения Jupyter Notebook также позволяют использовать результаты вашей работы совместно с другими пользователями, так как вы можете сохранять выходные данные разделов кода в документе.Jupyter Notebooks are also a great way to share your results with others, because you can save the output of your code sections in the document. Jupyter Notebook можно устанавливать на различных платформах.You can install Jupyter Notebooks on a variety of platforms.

Процедуру, описанную в локального компьютера раздел устанавливает необходимые компоненты для с записными книжками Jupyter в среде Anaconda.The procedure in the Local computer section installs necessary components for running Jupyter Notebooks in an Anaconda environment. Чтобы включить эти компоненты в вашей среде Jupyter Notebook, следуйте инструкциям, приведенным ниже.To enable these components in your Jupyter Notebook environment, do the following:

  1. Откройте командную строку с Anaconda и активации вашей среды.Open an Anaconda prompt and activate your environment.

    conda activate myenv
    
  2. Запустите сервер Jupyter Notebook с помощью следующей команды:Launch the Jupyter Notebook server with the following command:

    jupyter notebook
    
  3. Чтобы убедиться, что записная книжка Jupyter можно использовать пакет SDK, создайте New записной книжки выберите Python 3 качестве ядра и затем выполните следующую команду в ячейку записной книжки:To verify that Jupyter Notebook can use the SDK, create a New notebook, select Python 3 as your kernel, and then run the following command in a notebook cell:

    import azureml.core
    azureml.core.VERSION
    
  4. При возникновении проблем с импортом модулей и получать ModuleNotFoundError, ядро Jupyter должна быть подключена на правильный путь для вашей среды, выполнив следующий код в ячейку записной книжки.If you encounter issues importing modules and receive a ModuleNotFoundError, ensure your Jupyter kernel is connected to the correct path for your environment by running the following code in a Notebook cell.

    import sys
    sys.path
    
  5. Дополнительные сведения о настройке Jupyter Notebook для роботы с рабочей областью Службы машинного обучения Azure см. в разделе Создание файла конфигурации рабочей области.To configure the Jupyter Notebook to use your Azure Machine Learning service workspace, go to the Create a workspace configuration file section.

Visual Studio CodeVisual Studio Code

Visual Studio Code — это кроссплатформенный редактор кода.Visual Studio Code is a cross platform code editor. Для его использования требуется локальная установка Python 3 и Conda для поддержки Python, но он также предоставляет дополнительные средства для работы с искусственным интеллектом.It relies on a local Python 3 and Conda installation for Python support, but it provides additional tools for working with AI. Кроме того, этот редактор предоставляет поддержку для выбора среды Conda в редакторе кода.It also provides support for selecting the Conda environment from within the code editor.

Чтобы использовать Visual Studio Code для разработки, сделайте следующее:To use Visual Studio Code for development, do the following:

  1. Дополнительные сведения об использовании Visual Studio Code для разработки с помощью Python см. в руководстве по началу работы с Python в VSCode.To learn how to use Visual Studio Code for Python development, see Get started with Python in VSCode.

  2. Чтобы выбрать среду Conda, откройте VS Code и используйте клавиши CTRL+SHIFT+P (Linux и Windows) или COMMAND+SHIFT+P (Mac).To select the Conda environment, open VS Code, and then select Ctrl+Shift+P (Linux and Windows) or Command+Shift+P (Mac). После этого откроется палитра команд.The Command Pallet opens.

  3. Введите Python: Select Interpreter (Python: выбор интерпретатора) и выберите среду Conda.Enter Python: Select Interpreter, and then select the Conda environment.

  4. Чтобы убедиться, что вы можете использовать пакет SDK, создайте и запустите новый файл Python (PY), содержащий следующий код.To validate that you can use the SDK, create and then run a new Python file (.py) that contains the following code:

    import azureml.core
    azureml.core.VERSION
    
  5. Чтобы установить расширение Машинного обучения Azure для Visual Studio Code, перейдите на страницу Azure Machine Learning for Visual Studio Code (Машинное обучения Azure для Visual Studio Code).To install the Azure Machine Learning extension for Visual Studio Code, see Tools for AI.

    Дополнительные сведения см. в статье Приступая к работе с Azure Machine Learning for Visual Studio Code.For more information, see Use Azure Machine Learning for Visual Studio Code.

Azure DatabricksAzure Databricks

Azure Databricks — это среда на основе Apache Spark, в облаке Azure.Azure Databricks is an Apache Spark-based environment in the Azure cloud. Он предоставляет среде записной книжки на базе совместной работы с кластером на основе вычислительных ресурсов ЦП или GPU.It provides a collaborative Notebook based environment with CPU or GPU based compute cluster.

Как Azure Databricks работает со службой машинного обучения Azure:How Azure Databricks works with Azure Machine Learning service:

Настройка кластера DatabricksSet up your Databricks cluster

Создание кластера Databricks.Create a Databricks cluster. Некоторые параметры применяются только в том случае, если вы установите пакет SDK для автоматических машинное обучение в Databricks.Some settings apply only if you install the SDK for automated machine learning on Databricks. Может занять несколько минут для создания кластера.It will take few minutes to create the cluster.

Используйте следующие параметры:Use these settings:

ПараметрSetting Применимо кApplies to ValueValue
Имя кластераCluster name всегдаalways yourclusternameyourclustername
Среда выполнения DatabricksDatabricks Runtime всегдаalways Любая среда выполнения, не относящаяся к Машинному обучению (версии 4.x, 5.x)Any non ML runtime (non ML 4.x, 5.x)
Версия PythonPython version всегдаalways 33
Рабочие ролиWorkers всегдаalways 2 или больше2 or higher
Типы виртуальных машин узла рабочей ролиWorker node VM types
(определяет максимальное количество параллельных итераций)(determines max # of concurrent iterations)
Автоматическое Машинное обучениеAutomated ML
Толькоonly
Предпочитается виртуальная машина, оптимизированная для операций в памятиMemory optimized VM preferred
Включение автомасштабированияEnable Autoscaling Автоматическое Машинное обучениеAutomated ML
Толькоonly
Снять пометкуUncheck

Дождитесь запуска кластера, прежде чем продолжать.Wait until the cluster is running before proceeding further.

Установка правильного пакета SDK в библиотеке DatabricksInstall the correct SDK into a Databricks library

После запуска кластера создать библиотеку для присоединения к кластеру соответствующий пакет SDK для Azure Machine Learning пакет.Once the cluster is running, create a library to attach the appropriate Azure Machine Learning SDK package to your cluster.

  1. Выберите только один параметр (другие Установка пакета SDK не поддерживаются)Choose only one option (no other SDK installation are supported)

    Пакет SDK для пакета дополненияSDK package extras ИсточникSource PyPi имя      PyPi Name      
    Для DatabricksFor Databricks Отправка Python Egg или PyPIUpload Python Egg or PyPI azureml-sdk[databricks]azureml-sdk[databricks]
    Для Databricks - with-For Databricks -with-
    возможности автоматического машинного Обученияautomated ML capabilities
    Отправка Python Egg или PyPIUpload Python Egg or PyPI azureml-sdk[automl_databricks]azureml-sdk[automl_databricks]

    Предупреждение

    Нет других дополнения пакета SDK можно установить.No other SDK extras can be installed. Выберите только один из перечисленных параметров [databricks] или [automl_databricks].Choose only one of the preceding options [databricks] or [automl_databricks].

    • Не устанавливайте автоматически присоединяются к всех кластеров.Do not select Attach automatically to all clusters.
    • Выберите Attach рядом с именем кластера.Select Attach next to your cluster name.
  2. Отслеживание ошибок, пока состояние не изменится на Attached, которая может занять несколько минут.Monitor for errors until status changes to Attached, which may take several minutes. Если этот шаг завершается ошибкой, проверьте следующее:If this step fails, check the following:

    Попробуйте перезапустить кластера путем:Try restarting your cluster by:

    1. В левой области щелкните Кластеры.In the left pane, select Clusters.
    2. Выберите имя кластера в таблице.In the table, select your cluster name.
    3. На вкладке Библиотеки щелкните Перезапустить.On the Libraries tab, select Restart.

    Также рассмотрите возможность:Also consider:

    • В файле конфигурации Automl, при использовании Azure Databricks, добавьте следующие параметры:In Automl config, when using Azure Databricks please add the following parameters:
      1. max_concurrent_iterations основан на количество рабочих узлов в кластере.max_concurrent_iterations is based on number of worker nodes in your cluster.
      2. spark_context=sc основан на контекст spark по умолчанию.spark_context=sc is based on the default spark context.
    • Или, если у вас есть более старые версии SDK, отменить его выбор из установленных библиотек кластера и переместить в корзину.Or, if you have an old SDK version, deselect it from cluster’s installed libs and move to trash. Установите новую версию пакета SDK и перезапустите кластер.Install the new SDK version and restart the cluster. Если после этого возникнет проблема, отсоедините и заново присоедините кластер.If there is an issue after this, detach and reattach your cluster.

Если установка выполнена успешно, импортированную библиотеку должна выглядеть как одна из них:If install was successful, the imported library should look like one of these:

Пакет SDK для Databricks без автоматической машинного обучения машины обучения пакет SDK Azure для DatabricksSDK for Databricks without automated machine learning Azure Machine Learning SDK for Databricks

Пакет SDK для Databricks WITH автоматической машинного обучения пакет SDK с автоматической машинного обучения, которые установлены в DatabricksSDK for Databricks WITH automated machine learning SDK with automated machine learning installed on Databricks

Начать просмотрStart exploring

Попробуйте продукт:Try it out:

Записные книжки AzureAzure Notebooks

Записные книжки Azure (предварительная версия) — это интерактивная среда разработки в облаке Azure.Azure Notebooks (preview) is an interactive development environment in the Azure cloud. Это простой способ приступить к работе с разработки машинного обучения Azure.It's an easy way to get started with Azure Machine Learning development.

  • Пакет SDK для Машинного обучения Azure уже установлен.The Azure Machine Learning SDK is already installed.
  • Создав рабочую область Службы машинного обучения Azure на портале Azure, можно нажать кнопку, чтобы автоматически настроить среду Записных книжек Azure для работы с рабочей областью.After you create an Azure Machine Learning service workspace in the Azure portal, you can click a button to automatically configure your Azure Notebook environment to work with the workspace.

Начните работу с Записными книжками Azure с помощью портала Azure.Use the Azure portal to get started with Azure Notebooks. Откройте рабочую область и из Обзор выберите приступить к работе в записных книжках Azure.Open your workspace and from the Overview section, select Get Started in Azure Notebooks.

По умолчанию Записные книжки Azure используют бесплатный уровень служб, который ограничен 4 ГБ памяти и 1 ГБ данных.By default, Azure Notebooks uses a free service tier that is limited to 4GB of memory and 1GB of data. Однако вы можете снять эти ограничения, подключив экземпляр Виртуальной машины для обработки и анализа данных к проекту Записных книжек Azure.You can, however, remove these limits by attaching a Data Science Virtual Machine instance to the Azure Notebooks project. Дополнительные сведения см. в статье Manage and configure Azure Notebooks projects — Compute tier (Управление и настройка проектов Записных книжек Azure — уровень вычислений).For more information, see Manage and configure Azure Notebooks projects - Compute tier.

Создание файла конфигурации рабочей областиCreate a workspace configuration file

Файл конфигурации рабочей области — это JSON-файл, который используется пакетом SDK для обмена данными с рабочей областью Службы машинного обучения Azure.The workspace configuration file is a JSON file that tells the SDK how to communicate with your Azure Machine Learning service workspace. В этого файла config.json следующий формат:The file is named config.json, and it has the following format:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

Этот JSON-файл должен находиться в структуре каталогов, которые содержат сценарии Python или приложения Jupyter Notebook.This JSON file must be in the directory structure that contains your Python scripts or Jupyter Notebooks. Он может быть в том же каталоге, подкаталог с именем .azureml, или в родительском каталоге.It can be in the same directory, a subdirectory named .azureml, or in a parent directory.

Чтобы использовать этот файл в коде, выполните ws=Workspace.from_config().To use this file from your code, use ws=Workspace.from_config(). Этот код загружает данные из файла и подключается к рабочей области.This code loads the information from the file and connects to your workspace.

Существует три способа создать файл конфигурации.You can create the configuration file in three ways:

  • Выполните действия, описанные в создать рабочую область службы машинного обучения Azure : Файл config.json создается в вашей библиотеке Записных книжек Azure.Follow the steps in Create an Azure Machine Learning service workspace: A config.json file is created in your Azure Notebooks library. Файл содержит сведения о конфигурации вашей рабочей области.The file contains the configuration information for your workspace. Вы можете скачать или скопировать файл config.json в другие среды разработки.You can download or copy the config.json to other development environments.

  • Загрузите файл: На портале Azure выберите Скачать config.json в разделе Обзор рабочей области.Download the file: In the Azure portal, select Download config.json from the Overview section of your workspace.

    Портал Azure

  • Создайте файл программными средствами. С помощью следующего фрагмента кода вы подключаетесь к рабочей области, указав идентификатор подписки, группу ресурсов и имя рабочей области.Create the file programmatically: In the following code snippet, you connect to a workspace by providing the subscription ID, resource group, and workspace name. Затем конфигурация рабочей области будет сохранена в файле.It then saves the workspace configuration to the file:

    from azureml.core import Workspace
    
    subscription_id = '<subscription-id>'
    resource_group  = '<resource-group>'
    workspace_name  = '<workspace-name>'
    
    try:
        ws = Workspace(subscription_id = subscription_id, resource_group = resource_group, workspace_name = workspace_name)
        ws.write_config()
        print('Library configuration succeeded')
    except:
        print('Workspace not found')
    

    Этот код записывает файл конфигурации, .azureml/config.json файла.This code writes the configuration file to the .azureml/config.json file.

Дальнейшие действияNext steps